トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

mytarmailS 2016.10.08 06:32 #1431

私はネットへの価格フィードの代替方法を考えてきた、私はほとんどすべての成功したトレーダーの貿易レベル、それらは考慮に最近の価格値のシリーズだけでなく、同じ価格で、過去にあったチャートのスライスを取ることに気づいた。

考えてみるといろいろな問題が出てくるので、誰か似たようなことをやっている人はいないか、議論したいのですが......。

この方法は今のところ保留にしていますが、期待できそうです......。

もっと単純なことに目を向けて、完全ではないにしても、何か別の方法で過去の価格を考慮し、価格情報を圧縮してみようかと。価格プロファイル（またはボリュームプロファイル）の話ですが、本当に1つのヒストグラムに数百本のバーがあると考えると、それらは多くの過去の価格を考慮すると同時に圧縮されます...。私はプログラマーの初心者で、まだプロファイルを実現することができません。そのため、簡単な方法を取りました。ディストリビューションを取り、価格の部分に構築しただけです。マーケットプロファイルでないものは何ですか？;)

PRICE <- cumsum(rnorm(300))+1000
layout(1:2)
plot(PRICE,t="l",ylab = "цена" , xlab = "индексы",lwd=2)
Max <- max(PRICE)
Min <- min(PRICE)
range.vector <- seq(Min, Max, length.out=50)
H <- hist(PRICE, breaks = range.vector,
          xlab = "все цены которые есть в етом участке", 
          ylab = "сколько раз график был на одной и той же цене",col = 5)

このプロファイルは、チャートが1つの価格に当たった回数を計算することによって起こったすべての取引を考慮に入れていると言うことができるので、ネットワークが生の価格よりもこの分布（プロファイル）を理解するという希望のようなものがあり、取引は理論的にレベルです...。チェックしなければならない．完成しました :) ディストリビューションの解析に協力してくれたD.traderに 感謝します。

スライディングウィンドウで200の価格値のスライスを取り、 それをスケーリングし、センタリング した後、分配してRFに供給した

生産高

H$breaks

H$counts

そして，分布の元となった切断の最後の5つの値，つまり，すべての価格がすでに比例配分されているので，アルゴリズムは H$breaksとH$countsの値に対して最後の値の方に方向づける ことができます。

5分足チャート、ターゲットはいつも通り、リバーサル

結果はイマイチ...。ネットワークが何をすべきかわからないことがある......。

美しく入ることもある。

そして、興味深いのは、新しいデータについて、強引な勧誘がないことです

私は何も調整せず、単にモデルを学習させ、結果を確認しました。

もし興味があれば、ターゲットと一緒にトレーニングをしてみると、何か役に立つことがあるかもしれませんよ...。

ありがとうございました ;)

Alexey Burnakov 2016.10.08 07:22 #1432

このアプローチには、難解な問題や、解けるが良い学習が得られない問題がたくさんあります。

最低でも、生の商の分布の非定常性。

mytarmailS 2016.10.08 07:28 #1433

アレクセイ・ブルナコフ
このアプローチには、解けない問題や、解けるが良い学習が得られない問題が多く存在する。

少なくとも、生コテハン分布の非定常性。

まあ、市場プロファイルをプログラムしないために、私は単に分布に置き換え、すなわち正規分布とその特性は、ここでは考慮されていない、または私はコメントを理解していなかったのですか？:)

Alexey Burnakov 2016.10.08 07:35 #1434

mytarmailS:
まあ、なんというか、市場プロファイルを分布に置き換えただけで、それらの正規分布やその特性はここでは考慮されていない、というか、コメントがよくわからないのですが？:)

いや、そんなことはないだろう。

960、970、...をやってはいけないのです。

しかし、最後の価格からの差を数えるなどして、定常的な形にもっていく。10, -5, 0, 5, ...となる。50.そうしないと、あるセグメントの平均値と、別のセグメントの平均値がまったく異なるものになってしまいます。片方で900円、もう片方で600円。サンプルの外では何も動作しません。

mytarmailS 2016.10.08 07:46 #1435

アレクセイ・ブルナコフ
理解されない。

960、970、...ではないんです。

960, 970, ...-- 価格を-2～2と表記していたら、あまり分かりやすくはないでしょう。

Alexey Burnakov 2016.10.08 08:07 #1436

mytarmailS:

960, 970, ...-- 写真の例で価格を-2～2と表示しても、完全には分かりませんでした。

しかし、最後の価格への参照がない場合、機械はあなたの平均がどこにあるのかを理解できません。最後の価格からすべての価格を引くと、平均はゼロになり、価格に対するこの平均の位置は固定されます。

mytarmailS 2016.10.08 08:16 #1437

アレクセイ・ブルナコフ
OK、しかし、最後の価格への参照がなければ、あなたの平均がどこにあるのか、機械にはわからないのです。最後の価格からすべての価格を引くと、平均はゼロになり、この平均の位置は価格に対して固定されます。

リンクがあります:)

私の投稿の中で太字の青で 強調されている

Alexey Burnakov 2016.10.08 08:28 #1438

mytarmailS:
縛りがある:)

私の投稿の中で太字の青で 強調されている

なるほど、それは素晴らしい。発想が全般的に面白い!

しかし、ラーニングカーブを完成させるための動的な情報が十分ではありません。この配分では、機械は前と後を理解していないんです。もっと入力を増やさないといけない。

mytarmailS 2016.10.08 08:53 #1439

アレクセイ・ブルナコフ
非常に良い。一般的に面白いアイデアですね

しかし、ラーニングカーブを完成させるための動的な情報が十分ではありません。機械は、この配分の前と後を理解していないのです。もっと入力を増やさないといけない。

これはどうすれば解決するのでしょうか。配信の1つのスライスではなく、いくつかのスライスを一度に連続して食べさせればいいのでしょうか。

私は、図のようなRFモデルを持っており、パラメータは、ntree = 20 , mtry = 5です。

ntree =100とすると、モデルは新しいデータに対して一度も対処しないので、再トレーニングを行います。

=============================================

ネットワークで過去のチャートを同じ値段で見られるようにする問題を解決するには

これがネットワークが見ているものです。

青い領域はネットが見ているものです。青いバーはこの領域の価格分布を表しています。ネットは200本ものローソク足を見ていますが、主なものは見ていません。同じ価格で以前からあったチャートです。

これが重要な情報であるように思います。

そして、ネットワークは何も知らない

Alexey Burnakov 2016.10.08 17:29 #1440

mytarmailS:

ネットワークに過去にあったチャートが同じ価格で表示される問題を解決する方法をまだ考えておく必要があります

これは大きな問題です。学習を損なわずに解決することは、ほぼ不可能なことです。

ここで重要なのは、過去を調べれば調べるほど、近隣の観測結果に依存することになるということです。

もし、機械にNon-Specified観測を与えてしまうと、最も重要なことである観測の独立性の要件が失われてしまうのです。それ以降、学習が極端に足りなくなる。そして、統計が機能しない。

そして、これを避けるためには、最大の振り返りのラグが、観測を間引くステップと同じかそれ以下になるように、観測を間引く必要があります。そして、それが何につながるのか？学習用サンプル数の百倍削減。

ここには妥協点がある。見栄えの深さ vs サンプル数。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 144