トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 48

 
Dr.トレーダー

RNeatをしばらく試してみて、従来のニューラルネットワークと同じようには扱えないという結論に達しました。

あなたの発見を教えてくれてありがとう、とても面白いわ...。

アヤメの例を私のデータに合うように書き直したところ、エラーが発生しました。虹彩だけでなく、自分のデータも使ってみた場合、通常のグリッドと比較してどのような結果になったのか知りたいです。

 
分類モデルの評価に関する興味深い記事 です。
 
Dr.トレーダー

RNeatをもう少し実験してみたところ、従来のニューラルネットワークと同じようには扱えないという結論に達しました。

1) 従来のモデルと異なり、RNeatの学習では生データを使用しない。モデルはランダムに生成され、改良され、最後に生データでテストされるといった感じです。通常、モデルは生データを使用し、その上でロジックを構築します。そして、モデルのロジックが正しいか、あるいは単に生データを学習しただけなのかを確認するために、検証サンプリングを使用します。他のモデルと違って、RNeatは生データを記憶する能力は全くありません。なぜなら、RNeatが知っているのは、要求された結果とそれにどれだけ近いかということだけだからです。

2) クロスバリデーションはフロントテストの結果改善には役立たない。我々は、通常のモデルを訓練し、いくつかのクロスバリデーションを実行し、最終的なモデルの適合度スコアのためにすべてのサンプルの誤差を処理することが可能であるということに同意しているようです。RNeatは生データを知らないので、データがトレーニングサンプルであろうとテストサンプルであろうと関係なく、どのような場合でも望ましい結果になるようにロジックを調整する。理論的には、フィットネス関数に使用されるすべてのサンプルから「学習」(より正確には突然変異 :) します。できることは、モデルを適切な精度に訓練し、過剰訓練にならないことを祈るだけです。FXではかなりリスクの高いアプローチです。クロスバリデーションは、学習後にフロントテストの結果を最終的に推定するためにのみ使用することができ、決してこの検証サンプルをフィットネス関数の中で使用することはできません。

クロスバリデーションでは、学習パラメータがピックアップされる。このNSにパラメータはあるのでしょうか?あるはずです。
 
mytarmailS:

アイリスに加えて独自のデータで代用しようとした場合、通常のネットと比較してどのような結果になったのか、具体的に教えてください。

FXのデータ(eurusd d1、1年分)を使いました。モデルはすでに1日学習しており、自身の最良推定値=0.017(多ければ多いほど良い、アイリスの場合は0.7)を示しました。今のところ成果は出ていません。モデルは学習データでも50%の誤差を示しており、あと数日学習させなければなりません。

アレクセイ・ブルナコフ
クロスバリデーションにより、学習パラメータがピックアップされる。このNSにパラメータはあるのでしょうか?あるはずなんです。

モデルはどんどん複雑になっていき、神経細胞も増えていきます。ニューロンの成長を制限するために、ニューロンの最大数を定義するパラメータがあります。そして、遺伝子の個体数を定義する2つ目のパラメータ。通常、どちらも多ければ多いほど良いのですが、制限はむしろメモリと時間を節約するために導入されており、ピックアップするのではなく、自分自身に許される最大値を使用する方が良いでしょう。

このモデルは、記述から判断すると、各ニューロンとニューロン間の接続に値段がついているので、できるだけ少ないニューロンを使おうとしているのです。学習がうまくいけば、モデルはニューロンの最大数に達する前に必要な精度を達成することができる。

 
Dr.トレーダー

FXのデータ(eurusd d1、1年間)を追加しました。モデルはすでに1日学習しており、自身の最適推定値 = 0.017 (多ければ多いほど良い、Irisの場合は0.7でした)を示しています。学習データでも50%の誤差が出るので、あと数日学習させないといけない。

は、予測因子が多いのでしょうか?
 
サンサニッチ・フォメンコ
分類モデルの推定に関する興味深い記事 です。

予測変数のサブセットでモデルを推定するために3つの異なるメトリックを試してみました:この記事のように精度、R^2モデル、そして単なる平均モデルエラー平均(abs(y-x)/(max(y)-min(y))、ここでXは予測結果のベクトルとYは必要結果です)です。

フィットネス関数の精度は問題なかったのですが、サンプル数が少ないと精度にばらつきが出るのが難点でした。同じような品質の2つのモデルが、同じ結果を出しただけです。しかし、トレーニングサンプルとバリデーションサンプルがたくさんあれば、良い指標になるのではないでしょうか。記事に書かれているその他の指標については、何とも言えません。

R^2 は一般に奇妙な振る舞いをし、50%以上の結果が正しいのに、マイナスになることさえあり、一般に好きではありませんでした。

平均的な誤差が一番しっくりきました。0か1のクラスに丸める前でも、回帰の結果を式に代入するので、精度のようなステップワイズは存在しないのです。クラスに対して2つのモデルが同じ結果を出しても、回帰結果がどれだけ目的の結果に「近いか」という観点から、最適なモデルを判断することができるんです。

mytarmailS:
予測因子はたくさんあるのでしょうか?

約400名

 
フーリエ・スペクトル解析についてご存知の方はいらっしゃいますか?助けてほしい。
 
mytarmailS:
フーリエ・スペクトル解析について少しでも知っている人。助けてほしい。
何がはっきりしないのか?周期関数を高調波に分解し、スペクトルを得る。
 
ユーリー・レシェトフ
なぜ、明確でないのか?周期的な関数を高調波に分解し、スペクトルを得ます。

それはそうなんですが、私のタスクは違うんです...。

BPの中で、互いに近接している部分の類似性を見つける必要があります。近接性は、相関関係やユークリッドメトリックなどで測定できます。私の実験によると、このようなメトリックは私のタスクに適していないことを理解した。私は非常によく、振幅、位相、周波数を通じて近接の検索に適していると思う...。しかし、そのような考えは行われないので、私はどのように、何を知っている人に尋ねる、何が正しいか、何がそうでないか、それは一般的にどのようにあるべきかを知っている。

P.S.あなたは、プライベートではなく、オフポイントに、原則として、会話はこのブランチの主題にされていないと面白い誰かにすることはほとんどありませんすることができます。

 
ユーリー・レシェトフ
何がクリアになっていないのか?周期的な関数を高調波に分解し、スペクトルを得ます。
なぜ周期的なのか?
また、全く周期的でない単一パルスを分解することもできる)
理由: