トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Mihail Marchukajtes 2016.08.02 10:08 #831

5年先のマーケットを予測するのは現実的ではない、と言い続けています。少なくとも1〜2週間は十分なモデルを作って満足したいが、5年は使えるモデルを作りたいということです。これぞユートピア。全知全能のアレクセイに質問です。2つの全く同じクラスが定義され、それらの市場の修正が正反対である場合、モデルはどのように動作するのか教えてください。いわば矛盾したデータ...。このような場合、モデルはどのような挙動を示すのでしょうか？結局のところ、パターンそのものは重要ではなく、重要なのはこのパターンに対する市場の反応なのだが......。

Yury Reshetov 2016.08.02 11:38 #832

ミハイル・マルキュカイツ
また、5年先のマーケットを予測するのは現実的ではない、と言い続けているのですが...。

話しても無駄、叱っても無駄。多くの人は認知の歪みを抱えており、その中には「世界観に合わない情報は、全く認識されないか、唾棄すべき反応を引き起こす」といった情報のフィルターも存在します。

つまり、ここの住人のほとんどは、あなたの会話にまったく関心を示さないか、あるいは不平不満を言って、あなたを荒らし呼ばわりするようになるのです。

でも、そんなことはどうでもいいんです。ポイントは、バージョン7以降のjPredictionでは、予測変数の有意性を評価する可能性が出てきたことです。これを行うには、新しいモデルを作成（トレーニング）した後、または以前に保存したモデルをファイルからロードした後、「予測変数の有意な値を表示」メニュー項目を呼び出すか、「ホット」キーF5を押す必要があります。

そして、予測因子の重要度のグラフを見ることができます。

最良の予測因子とは、最も有意な予測因子である。このサンプルから「競争力」の列を削除すると、トレーニング後に「Garbage in, Garbage out」というメッセージが表示される。

最悪の予測因子とは、最も重要度の低い予測因子のことである。オペレーティング・リスク」列をサンプルから取り除いても、一般化能力は悪化しない。

説明文中で「-」と表記されている残りの予測変数は、中程度の有意性を有している。このサンプルからそれらを取り除くと、汎化能力が著しく低下する。

Mihail Marchukajtes 2016.08.02 13:01 #833

ユーリー・レシェトフ

話しても無駄、叱っても無駄。多くの人が認知の歪みを抱えており、その中には「自分の世界観に合わない情報は、全く認識しないか、唾棄すべき反応を引き起こす」といった情報フィルターも存在する。

つまり、ここの住人のほとんどは、あなたの会話に全く耳を貸さないか、不機嫌になってあなたを荒らし呼ばわりするようになるのです。

でも、そんなことはどうでもいいんです。ポイントは、バージョン7以降のjPredictionでは、予測変数の有意性を評価する可能性が出てきたことです。これを行うには、新しいモデルを作成（トレーニング）した後、または以前に保存したモデルをファイルからロードした後、"View a significant of predictors" メニュー項目を呼び出すか、F5ホットキーを押す必要があります。

そして、予測因子の重要度のグラフを見ることができます。

最良の予測因子とは、最も有意な予測因子である。このサンプルから「競争力」の列を削除すると、トレーニング後に「Garbage in, Garbage out」というメッセージが表示される。

最悪の予測因子とは、最も重要度の低い予測因子のことである。このサンプルから「オペレーティング・リスク」の欄を削除しても、一般化可能性が悪化することはない。

説明文中で「-」と表記されている残りの予測変数は、中程度の有意性を有している。このサンプルからそれらを取り除くと、汎化能力が著しく低下する。

ありがとうございます!!!非常に便利な追加機能です。回転を続ける...。回...

СанСаныч Фоменко 2016.08.02 13:18 #834

ユーリー・レシェトフ

話しても無駄、叱っても無駄。多くの人が認知の歪みを抱えており、その中には「自分の世界観に合わない情報は、全く認識しないか、唾棄すべき反応を引き起こす」といった情報フィルターも存在する。

つまり、ここの住人のほとんどは、あなたの会話にまったく注意を払わないか、あるいは不平を言い始め、あなたを荒らしと呼ぶようになるのです。

でも、そんなことはどうでもいいんです。ポイントは、バージョン7以降のjPredictionでは、予測変数の有意性を評価する可能性が出てきたことです。これを行うには、新しいモデルを作成（トレーニング）した後、または以前に保存したモデルをファイルからロードした後、「予測変数の有意な値の表示」メニュー項目を呼び出すか、「ホット」キーF5を押す必要があります。

そして、予測因子の重要度のグラフを見ることができます。

最良の予測因子とは、最も有意な予測因子である。このサンプルから「競争力」の列を削除すると、トレーニング後に「Garbage in, Garbage out」というメッセージが表示される。

最悪の予測因子とは、最も重要度の低い予測因子のことである。このサンプルから「オペレーティング・リスク」の欄を削除しても、一般化可能性が悪化することはない。

説明文中で「-」と表記されている残りの予測変数は、中程度の有意性を有している。このサンプルからそれらを取り除くと、汎化能力が著しく低下する。

予測変数の有意性はどのように計算するのですか？

Yury Reshetov 2016.08.02 13:30 #835

サンサンフォーメンコ。
予測変数の有意性はどのように計算するのですか？

簡単に言うと（あまり明確ではありませんが）、予測器の有意性は学習後に得られた係数を重み付けして計算します。

詳細は、jPredictionのソースコードにある予測変数の有意性の計算アルゴリズムを参照してください。あるいは、もっとわかりやすく説明するために、一本の記事を書かなければならないでしょう。

Yury Reshetov 2016.08.02 13:48 #836

ミハイル・マルキュカイツ
ありがとうございます!!!非常に便利な追加機能です。回転を続ける...。....

主な点は、価値の低い予測因子を非常に迅速に計算し、他の予測因子に置き換えることができるようになったことです。入れ替えた後、一般性が高まったかどうかを確認することが肝要です。もし、増加していないのであれば、その変更は間違っている、つまり、より有意な予測因子がより有意でないものに置き換えられていることになります。

昨日は、引用の実験をしてみました。最も重要なTAオシレーターを素早く発見。しかし、その数はわずか5個であることが判明した。そしてさらに一般化能力が伸びない、何を入れても伸びない。だからそれはあなたがTA指標やオシレーターを通して見るものは何でも、実際には、彼らはすべて同じデータに基づいていることが判明 - 彼らはこのデータを少し異なって処理するが、以前の歴史の小さなセグメント（いくつかのバー）。TA指標やオシレーターはすべて同じ「卵」ですが、横から見ると。どのようにシャッフルしても、同じカードが入っている。すべての指標とオシレーターは互いに相関しすぎていて、未来との相関はほとんどない。

一般化能力を高めるためには、引用文に影響を与えるが、引用文から派生しない他のデータをどこかから取り込む必要がある。つまり、何か追加の情報源が必要なのです。どこで手に入りますか？もちろん、月の満ち欠けや黒点の量、ストリートサッカーチームの試合結果、ウォンチカ川の水位、犬のトゥジークの1平方センチメートルあたりのノミの数などを予測材料にしてみることもできる。しかし、それらは有意義なものとなりそうでしょうか？

Yuri Evseenkov 2016.08.02 14:26 #837

ユーリー・レシェトフ

主な点は、価値の低い予測因子を非常に迅速に計算し、他の予測因子に置き換えることができるようになったことです。入れ替えた後、汎化性が高まったかどうかを確認することが肝要です。もし増加していなければ、置換が正しく行われなかったことになり、より有意な予測変数がより有意でないものに置き換えられてしまったことになります。

昨日は、引用の実験をしてみました。最も重要なTAオシレーターを素早く発見。でも、5人しかいなかったんですよ。そしてさらに一般化能力が伸びない、何を入れてもダメだ。だからそれはあなたがTA指標やオシレーターを通して見るものは何でも、実際には、彼らはすべて同じデータに基づいていることが判明 - 彼らはこのデータを少し異なって処理するが、以前の歴史の小さなセグメント（いくつかのバー）。TA指標やオシレーターはすべて同じ「卵」ですが、横から見ると。どのようにシャッフルしても、同じカードが入っている。すべての指標とオシレーターは互いに相関しすぎていて、未来との相関はほとんどない。

一般化能力を高めるためには、引用文に影響を与えるが、引用文から派生しない他のデータをどこかから取り込む必要がある。つまり、何か追加の情報源が必要なのです。どこで手に入りますか？もちろん、月の満ち欠けや黒点の量、ストリートサッカーチームの試合結果、ウォンチカ川の水位、犬のトゥジークの1平方センチメートルあたりのノミの数などを予測材料にしてみることもできる。しかし、それらは大きな意味を持ちそうにない？

贔屓のチームがいなくなると、生産性に悪影響が出るのは、ファンとして言えることだ。フライオーバータウンがノルニッケルのような資源独占企業のモノシティであれば、ヴォニュチカ川の水位低下が間接的に示すように、生産性が下がるかもしれない。

いつ、どこで、どの蝶が羽ばたき、津波を起こすか、想像することは不可能である。

Mihail Marchukajtes 2016.08.02 14:38 #838

ユーリー・レシェトフ

主な点は、価値の低い予測因子を非常に迅速に計算し、他の予測因子に置き換えることができるようになったことです。入れ替えた後、一般性が高まったかどうかを確認することが肝要です。もし，増加していなければ，置換が正しく行われなかった，すなわち，より有意な予測変数がより有意でないものに置換されたことになる．

昨日は、引用の実験をしてみました。最も重要なTAオシレーターを素早く発見。でも、5人しかいなかったんですよ。そしてさらに一般化能力が伸びない、何を入れてもダメだ。だからそれはあなたがTA指標やオシレーターを通して見るものは何でも、実際には、彼らはすべて同じデータに基づいていることが判明 - 彼らはこのデータを少し異なって処理するが、以前の歴史の小さなセグメント（いくつかのバー）。TA指標やオシレーターはすべて同じ「卵」ですが、横から見ると。どのようにシャッフルしても、同じカードが入っている。すべての指標とオシレーターは互いに相関しすぎていて、未来との相関はほとんどない。

一般化能力を高めるためには、引用文に影響を与えるが、引用文から派生しない他のデータをどこかから取り込む必要がある。つまり、何か追加の情報源が必要なのです。どこで手に入りますか？もちろん、月の満ち欠けや黒点の量、ストリートサッカーチームの試合結果、ウォンチカ川の水位、犬のトゥジックの1平方センチメートルあたりのノミの量などを予測材料にしてみることもできる。しかし、それらは大きな意味を持ちそうにない？

累積デルタを試してみてください。実数値による累積分布..............................Zscore system/ Ye cjjndtcndtyj dc` 'nj c hfpys[ gfh? vj;yj lf;t 'rpjnbxtcrb[?nfv rjhhtkzwbz ljk;yf jncencndjdfnm ^-)

Mihail Marchukajtes 2016.08.02 14:39 #839

ミハイル・マルキュカイツ
累積デルタを試してみてください。実数値による累積分布..............................Zscore system/ Ye cjjndtcndtyj dc` 'nj c hfpys[ gfh? vj;yj lf;t 'rpjnbxtcrb[?nfv rjhhtkzwbz ljk;yf jncencndjdfnm ^-)

もちろん他のペアのデータも、予報とは関係ないエキゾチックなものも...。

mytarmailS 2016.08.02 15:16 #840

多分、誰かが興味を持つだろう、私はquantstratという 取引のシミュレーションと取引システムを構築できるパッケージを見つけた。

http://www.rinfinance.com/agenda/2013/workshop/Humme+Peterson.pdf

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 84