トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Dr. Trader 2016.10.20 21:43 #1691

アレクセイ・ブルナコフ

もう一度言いますが、私も何十種類ものモデルを持っており、予測因子やパラメータをごまかしています。そして、これらのモデルは、それぞれ8年という期間、しっかりと利益を上げて行くのですそして、それがテスト期間です。しかし、テストによって選ばれた「ベスト」なモデルを遅延サンプリングでテストすると、驚きがある。そして、これを「モデルフィッティングクロスバリデーション」と呼びます。

例えば、遅延したサンプルでバリデーションを行ったとします。延期されたデータのモデルが統合されたとする。この場合、どうするのですか？保留サンプルのバリデーションをパスするために再度パラメータをいじり始めると、本来は保留サンプルのデータもクロスバリデーションに含めることになり、クロスバリデーションも調整されたものになります。これは、新たに延期したサンプルを追加することで修正可能です。もし、そのモデルも失敗したら？新しい遅延サンプリングも渡すようにパラメータを調整する必要がありますか？終わりのないレースです。

クロスバリデーションに繰延べられたサンプルを含め、新たに繰延べられたサンプルを作成することは、答えではなく、運良くモデルが繰延べられたバリデーションに合格するまで、無限ループとなります。しかし、これはFXの解決策ではなく、運が自分に微笑んでいるだけであり、しかし統計的に見れば、それは消耗品である。

そこで質問なのですが、仮に保留データのモデルが急落したとします。この場合、どうするのですか？

Dr. Trader 2016.10.20 22:04 #1692

Dr.Trader（ドクタートレーダー）

そこで質問なのですが、仮に保留データのモデルが統合されたとします。その場合、どうするのですか？

その質問は個人的すぎるのではと思いました :)

もし、保留サンプルでモデルがテストに失敗した場合、その保留サンプルをクロスバリデーションに含め、新しい保留サンプルを作成するのでしょうか？それとも違う方法で？

例えば、私は、サン・サンチがすでに1000回繰り返していることを基本に考えています。"品質 "という言葉は伸縮自在です。私などは、このようなクロスバリデーションで行っており、むしろモデルパラメータよりも予測因子の選択です。
私のアプローチでは、アンサンブルを交換しなければならないのが嫌なのです。依存関係が一定であれば、最後に選択された予測変数に対して1つのモデルを学習させるだけで、再び同じ依存関係を発見し、自己売買することができます。しかし、予測変数の選択で何かが足りず、1つのモデルが失敗しています。

Vizard_ 2016.10.20 23:03 #1693

Dr.Trader：予測因子の質......。

原始的な例から、ターゲットの特性も同様に重要であることがわかります......。

Mihail Marchukajtes 2016.10.21 05:08 #1694

さらにその上をいくターゲット関数は、モデルを構築する際に非常に重要なポイントです。なぜなら、ターゲット関数は、アルゴリズムが分割を行う際に役立つからです。私はこの問題に何度も直面しましたが、まだ解決していませんので、目標値を50pipsのままにしています。スプレッドのすぐ上...

mytarmailS 2016.10.21 05:45 #1695

アレクセイ・ブルナコフ

もう一度言いますが、私も何十個もモデルを持っていて、予測因子やパラメータもいじっています。そして、これらのモデルは、それぞれ8年かけてソリッドプラスに移行していくのですそして、それがテスト期間です。しかし、テストによって選ばれた「ベスト」なモデルを遅延サンプリングでテストすると、驚きがある。そ して、これを「モデル適合クロスバリデーション」と呼びます。

晴れていれば、純粋な実験が続く。クリアでなければ、現実の世界では何倍も品質が 落ちることになります。というのが、99％の確率で見受けられます。

このようなことが起こるのは、市場が自らの統計に逆らうことがメガに多いからである...。

1）まず、そう思う理由を示し、それを証明する。

2）次に、なぜそうなるのか、そのメカニズムを説明します。

2、3時間待ってくれ...

私自身は何も持っていないので、既成の解答は与えませんが、そのプロセスを理解することそのものが何か......。

1)

==================================================================

最初にやったことは、確率的な出力を持つ2つのディープネットをトレーニングすることでした。実際には、どんなネットワークでも構いませんが、重要なのは、ネットワークの出力が「1」「0」という明確なクラスの答えではないということです。つまり、出力は例えば「0,13」となり、現在のデータは「0,13%」の確率でクラス「1」に属することを意味する。

1つのネットワークは買い専用、もう1つは売り専用に訓練しています。

売りのシグナル（目標ポンド）は、価格の0 .2％以上の下落があった時点とする。

ターゲットは「000000000010000000000」のように見え、「1」は弱気の反転、「0」はそうでないことを示しています。

上方反転の場合はすべてが同じで、それぞれ ...

過去3回の OHLCローソク足の全ての価格が予測因子として用いられ、それらの差の全ての可能な組み合わせが構築されました。

そこで、ネットの学習を行い、ネットワークの予測（出力）を取り、価格の下にチャートを描きます。下のグラフは、2つのネットワークの出力を買い、売りの両方について示しています。例えば、ネットワークの出力は、次のローソク足で反転する確率を表しています。図参照。1、Buyも同様です。

緑色は買い、赤色は売りの出口を示します。

よく見ると、FIG.2 価格表がこれらの確率に反していることに気づくかもしれません。反転上昇の確率が反転下降の確率より高いとき（緑のグラフが赤より高い）、価格は常に下落します。まず、売り買い出力の累積値を作ってみましょう。

Cumsum(buy.neural); Cumsum (sell.neural)

fig.3

そして、今度は買いネットワークの累積和と売りネットワークの累積和の差を構築してみましょう。

Cumsum(buy.neural)- Cumsum (sell.neural)です。

図からわかるように4 ブルーチャートと価格チャートから、価格はネットワーク予測（ブルーチャート）と完全に逆相関していることがわかります。さらにわかりやすくするために、青いチャートの符号を反転（インバート）させてみる。

Cumsum(buy.neural)- Cumsum (sell.neural)/- 1

FIGを見ながら。また、ニューラルネットワークとその統計的確率を使用すると、次のロウソクで反転するかどうかの確率の知識に基づいて、価格を完全に再構築することができるという興味深い結論が得られるかもしれません。

とてもかっこいいのですが、実は私たちの青チャートには予測能力がなく、価格を上回ることはなく、価格についていくだけなので意味がありません。実際には価格を見ても青チャートを見ても違いはないのですが、「下がる確率が上がる確率より高ければ価格は上がる」という市場の仕組みがはっきりしているということです......。

=========================================================================

移動する...。

隠れマルコフモデル SMM または HMM - hidden markov model を学習していました。

特に非定常データに適用される確率モデルで、噂では市場にも適用できるとか...。

同じように2つのモデルを構築したが、対象となるものは反転を示さず、単にトレンドを捉えるだけなので、一方のモデルは上昇トレンドを識別して確率的に推定し、他方のモデルは下降トレンドの確率を示す。

トレードは気にしないでください、実験してましたから...。

下の図は、上昇トレンドの確率が緑、下降トレンドの確率が赤の 2つのベクトルで、黒い線はモデルが出したピーク確率で、単なる標準偏差、もっとシンプルなのがボリンジャーです。

だから、見てください。モデルがある事象のピーク確率を出し始めると（黒い線を超えて下方に行く）、逆のことをするんです......。
だから、ここでも実質的には、自分たちの統計に反する値動きをしたことになる......。

では、もしマーケットが獣だとしたら）そのような振る舞いをするMOアルゴリズムがマーケットを予測できるのか？もし、実際にRF、ネットワーク、SMMなどが統計的に一方的に予測をするのであれば......。

3回遺伝子を導入し、4回プロクロスバリデーションを行ったにもかかわらず、最適化から2日目で壊れてしまうのは、基本的にこれが答えです 。

どうすればいいのか？まだ分からない

BlackTomcat 2016.10.21 06:32 #1696

mytarmailS:

1)

==================================================================

実際、どのようなネットワークでもかまいません。重要なのは、ネットワークの出力が、"1"、"0 "といったクラスの明確な答えであってはならないことです。つまり、出力は例えば「0,13」となり、現在のデータは「0,13%」の確率でクラス「1」に属することを意味する。

1つのネットワークは買い専用、もう1つは売り専用に訓練しています。

売りのシグナル（目標ポンド）は、価格の0 .2％以上の下落があった時点とする。

ターゲットは「000000000010000000000」のように見え、「1」は弱気の反転、「0」はそうでないことを示しています。

上方反転の場合はすべてが同じで、それぞれ ...

過去3回の OHLCローソク足の全ての価格が予測因子として用いられ、それらの差の全ての可能な組み合わせが構築されました。

そこで、ネットを学習させ、ネットワークの予測値（その出力）を取り、価格の下にチャートを描きます。

よく見ると、FIG.2、価格グラフがこれらの確率に反していることがわかる。

FIGを見ながら。また、ニューラルネットワークとその統計的確率を使用すると、次のキャンドルで反転が予想されるかどうかの確率の知識に基づいて、価格を完全に再構築することができます面白いです。

私は、あらゆる種類のニューラルネットワークを開発し、訓練している頭のいい人間ですが、それでも単純なことは見えません。あなたの投稿を読み、かなり驚きました。大雑把に言うと、ある高値の後に0.2%ずつ価格が下がっていくのを全部見つけて、その高値付近のローソク足3本を取り出して価格操作をして、最後にニューラルネットワークを使って確率に落とし込んでいるのですね。しかし、失礼ながら、そのようなやり方は原始的過ぎると思いませんか？:)あなたは間違った場所を掘っています。だから、現実とは逆の結果になってしまうのです。フルHDの写真から3ピクセルを取り出し、その3ピクセルを基に全体像を把握しようとするものです。なるほど、全体像ではありませんが、画像領域の10％以上を正しく予測できる確率はどのくらいでしょうか？私の例がわかりやすければいいのですが。画素を見なくとも、絵が見える。つまり、グラフを理解するためには、個々の棒を見る必要はなく、グラフ全体を見る必要があるのです。そして、この問題の解決は、代数学や物理学、生物学などよりも、幾何学の領域にある。でも、ここの人たちの研究を読んでいると、人間の構造を地理学で理解しようとしている感じが強いんです。:)

mytarmailS 2016.10.21 06:47 #1697

BlackTomcat です。
1）あなたの投稿を読み、かなり驚きました。私が正しく理解していれば

2）最終的にはニューラルネットワークの力を借りて、一定の確率に持っていく。しかし、失礼ながら、あなた自身はそのようなアプローチは原始的すぎると思いませんか？:)掘る場所を間違えてる。だから、現実とはまったく逆の結果になってしまうのです。

3）あなたのアプローチは、FullHDの画像から3ピクセルを取り出し、その3ピクセルから画像全体のイメージを作り出そうとしている、ということです。なるほど、全体像ではありませんが、画像領域の10％以上を正しく予測できる確率はどのくらいでしょうか？私の例がわかりやすければいいのですが。画素を見なくとも、絵が見える。

4）つまり、グラフを理解するためには、個々の棒を見る必要はなく、グラフ全体を見る必要があるのです。そして、この問題の解決は、代数学や物理学、生物学などよりも、幾何学の領域にある。でも、ここの人たちの研究を読んでいると、人間の構造を地理学で理解しようとしている感じが強いんです。:)

1）そうですね...。

2)なるほど、しかし、ではなぜ確率が逆なのか。単純なランダムであって、逆相関ではないはずだ。

3) そうですね、最大限の情報を最大限の圧縮された形で取り込む必要がありますから、最近はボリュームプロファイルとか、それに代わるものについて話しているのですが......。

ネットワークデータの表示方法について、何かご提案があればお聞かせください。

4)私も全く同感です。例えば、現在の価格の範囲内にあるすべてのレベルを記憶する必要がありますが、どのようにそれを行うのですか？どのように私はネットにレベルをフィードするのですか？それに、それぞれのキャンドルにその数は異なるだろう、それは些細な作業ではありません、私にとってそれはちょうどです......

p.s. 私の投稿をまるごと引用しないでください。

Andrey Dik 2016.10.21 06:57 #1698

BlackTomcat:
頭のいい人たちは、ニューラルネットワークを開発したり訓練したりしますが、単純なことは見えません。あなたの投稿を読み、かなり驚きました。大雑把に言うと、ある高値の後に0.2%の値下がりを全て見つけ出し、その高値付近のローソク足3本を取り出して価格操作をして、最後にニューラルネットワークを使って一定の確率に落とし込んだということですね。しかし、失礼ながら、そのようなやり方は原始的過ぎると思いませんか？:)あなたは間違った場所を掘っています。だから、現実とは逆の結果になってしまうのです。フルHDの画像から3ピクセルを取り出し、その3ピクセルを基に全体像を把握する、ということですね。なるほど、全体像ではありませんが、画像領域の10％以上を正しく予測できる確率はどのくらいでしょうか？私の例がわかりやすければいいのですが。画素を見なくとも、絵が見える。つまり、グラフを理解するためには、個々の棒を見る必要はなく、グラフ全体を見る必要があるのです。そして、この問題の解決は、代数学や物理学、生物学などよりも、幾何学の領域にある。でも、ここの人たちの研究を読んでいると、人間の構造を地理学で理解しようとしている感じが強いんです。:)

私もそう思います。全体を見渡す必要があるのです。

しかし、それでは静止画にしかならない。つまり、条件付きで全体を100のパーツに分け、70のパーツから学び、30のパーツから優れた予測能力を得ることができるのです。市場での予測はおおよそそのようなものです。では、何が問題なのでしょうか？なぜ、すでにリアルタイムで問題が発生しているのか？

そして、その絵は静止しているわけではないというのが、キャッチのポイントです。映画である。もちろん、勉強して映画の1コマで予測できるようになったからといって、現実の写真で隣の部分を予測しても無駄だ--次のコマはもう違うのだから!また、フィルムのどのコマも絶対的なコピーはなく、過去にあったように未来に似たコマがあったとしても、そのコマには他のコマが続いており、過去に似たコマに続いていたコマとは違うのです。それが問題なのです。

したがって、映画の個々のコマを見れば、コマはランダムであると結論づけることさえできる。ちょうど、多くの人が、市場は100％ランダムではないにしても、非常にランダムであると確信しているのと同じである。私たちは、映画を見て意味があることを知り、映画の最後に何が起こるかを予測することさえできます。で、何が言いたいの？- たぶん、もっと広く見て、決して変わらないグローバルなパターンを調査しなければならないからでしょう。例えば、価格が平均何％戻るか調べたことがありますが、まあ、約30％（私の記憶が正しければ）であることがわかりました。しかし、ポイントは、この数字はすべてのTFとすべての商品（通貨ペアと金属、CFDと他の商品はチェックしていませんが、同じようです）でほとんど同じだということですこれはすごいことです。これはまさに一定のパターンを使うことなのですが、ニューラルネットワークや足場などを使わない方がやりやすい場合が多いです。MOを使うためには、映画の中の意味を特定できる必要がありますが、それは全くできないにせよ、簡単なことではありませんから。

Andrey Dik 2016.10.21 07:10 #1699

アンドレイ・ディク

そして、その絵は静止しているわけではないというのが、キャッチのポイントです。映画なんです。

もうひとつ、こんな例えがあります。

スマートフォンには、ほとんどの人がスマートキーボードを搭載しています。単語を入力すると、キーボードが次の単語を提案します。単語や前に入力した単語によって異なります。試してみると、キーボードが提案する言葉から、かなり意味のある文章も打てますね。言葉はパターンであり、言葉の集まりはパターンの集まりである。

しかし、この技術も、ここで考えたMOと同じように、市場では「言葉」が時間とともに変化し（個々の文字の順番や組み合わせ）、個々の「言葉」の意味が変わるため、無力化することになるのである。ただ、テキスト全体が持つ、より高度な意味だけが残っている。

今、私たちはどうしたらいいのでしょうか？- MOはどうしようかな、結果はやっぱり最悪だろうし。

あるいは、"MOの調理法を知らないだけだ！"と言われることもあります。- しないのでしょうね。しかし、誰がどのように知っていますか？MOを市場で活用できているのは？どなたか、そのような成功例をご存じないでしょうか？そうそう、今度はバッターの例を出してくるが、彼もその後にバタバタと倒れてしまった......。

BlackTomcat 2016.10.21 07:25 #1700

mytarmailS:

2)OK、しかし、それではなぜ確率が逆なのか、実際には単純なランダムであり、逆相関ではないはずだ

ネットワークデータの表現方法について何かご提案があれば、ぜひお聞かせください。

このような巨大な引用で申し訳ありませんが、私は今、携帯電話から書いていて、編集オプションはここで制限されています。引用をマッシュアップし始めると、テキストのためのきれいなフィールドに戻れなくなることがあります。これはPCでは簡単に直せますが、スマホでは問題になります。

2について - 完全なランダムであるべきというのは同感ですが、実際、逆の結果が出たフォワードテストの期間が、トレーニングを行った期間の直後に続いているのはいかがなものでしょうか。この間に時間差はありますか？テスターのバランスグラフは、まず傾きが小さくなり、次に落ち込んでいく。パターンが出尽くし、それが認識され、多くの人がそれを利用し始める。そのため、逆パターンに変化してしまうのです。しかし、そのパターンの背後に論理的（市場）な根拠があった場合、しばらくするとまた動き出すことがあります。しかし、ここでは次のように、それまで働いていた規則性が長ければ長いほど、「忘却」の期間も長くなるのが妥当であると思われる。しかし、まだ十分な検証はしていません。

私はニューラルネットワークを扱うことがないので、学習用のデータをどのように用意すればいいのか、全くわかりません。グラフィカル（幾何学的）な手法は、目で見てよくわかるが、形式化するのが難しい。今、私はグラフィカルな手法を用いたTSを制作しています。私見ですが、作業パターンがあるとすれば、ここだと思います。

前回の記事に対して、もう少しコメントをしたいと思います。そこで個々の小節の分析が厳しくなったような気がします。しかし、実際はそうではありません。個々のバーの分析は存在する権利がありますが、これらの重要なバーは、通常、トップの領域にはありません。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 170