トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 214

 
ウラジミール・ペレヴェンコ


PS.そして、lm()の計算を並列化する。今がちょうどその時期なんです。

ありがとうございます。

foreach %dopar%でループ内の処理を並列化する方法を見たことがあります。DTの隠しループに引っ掛ける方法がわからない。速くなる可能性があるかどうかは分かりませんが。

 
アレクセイ・ブルナコフ

ありがとうございます。

foreach %dopar%でループ内の処理を並列化する方法を見たことがあります。DTの隠しループにつける方法がわからない。そして、その方が早いかどうかもわからない。

私が言いたかったのは、コードのこの部分です。

lm_models <-    x[,
{
        lapply(c(1:20), function(x) summary(lm(data = .SD[, c(1:x, 21), with = F],    formula = V21 ~ . -1))$'fstatistic'[[1]])
}
, by = sampling
]

lapplyの代わりにForeach()を使う

 

グラフを作るのに数十秒かかるのは、どこかおかしい。

このパッケージ("nhstplot")をチェックしてみてください。素早く描けるし、なかなかいいんじゃないかと思います。

> plotftest(f = 4, dfnum = 3, dfdenom = 5, title = "Fisher's F test")

 
ウラジミール・ペレヴェンコ

グラフを作るのに数十秒かかるのは、どこかおかしい。

このパッケージ("nhstplot")をチェックしてみてください。素早く描けるし、なかなかいいんじゃないかと思います。

> plotftest(f = 4, dfnum = 3, dfdenom = 5, title = "Fisher's F test")

拝見させていただきます。しかし、この半透明はどこにあるのか、何百ものオブジェクトが重なり合っているのはどこなのか。ヘビーコンディションでテストしてみれば、速いかどうかがわかるはずです。
 
ウラジミール・ペレヴェンコ

ああ、試してみます、ありがとうございます。lapplyループが並列ループに置き換わることが判明した。しかも、1000回の繰り返しでDTループで回っているのです。

あるいは、foreachによるこの1000回の反復をスキップする別の方法があります。

 
アレクセイ・ブルナコフ
もちろん、拝見させていただきます。しかし、この半透明はどこにあるのか、何百ものオブジェクトが重なり合っているのはどこなのか。ヘビーコンディションでテストすれば、速いかどうか理解できるはずです。

OpenGLグラフィックスカードを使用することで、高速な半透明描画が可能です。Rでは、このためのライブラリrglがあります。これは3次元向けですが、直交投影と線描画が できれば、必要なものになるでしょう。直ぐには解らなかったので、ドキュメントを読まないといけない。

了解です。

半透明の線を描くのはとても簡単で、XとYの座標を持つテーブルがあればいいのです。また、3つ目のZ列を追加して立体感を出すことも可能です。

library(rgl)
for(i in 1:1000){
    lines3d(cbind(1:1000, cumsum(rnorm(1000))), col="blue", alpha=0.1)
}

しかし、それはすべて同じように遅いことが判明しました。procesexplorerで判断すると、1つの論理プロセッサが100%であるのに対し、ビデオは5%しか使用されていません。RはOpenGLにデータを送り込むのが遅すぎて、受信できる速度よりずっと遅いと思います。なんとなく、そうなってしまったんです。

ただ、散らかりやすいので :) やってみて、ウィンドウをフルスクリーンに最大化し、マウスの左ボタンで「図」を回転させてください。

library(rgl)
for(i in 1:100){
    lines3d(cbind(cumsum(rnorm(100)), cumsum(rnorm(100)), cumsum(rnorm(100))), alpha=0.2)
}
 
こんなこともできるんですね。100行をランダムに取り出す。そして、分配金は満額になる。もっと速くなる
 

以前発表したクラスターのアイデアをようやく初挑戦しました。テストランで、様子を見るだけです。予測変数はシンプルです

OHLC 5+体積+volatilの移動系列 各5値の6予測因子

ラーニングヒストリー 100 000 バー

各予測変数はもちろん正規化されています)、そして100クラスタにクラスタリングされます。

ターゲットはいきなり作ったので(今はまだ座ったばかり)、単純にこの形でリバーサルを取っただけです。直前の4本のローソク足より高く、その次の10本のローソク足より高い極値を目標とします。

繰り返しのパターンを探すようになった......。

このような予測因子なしでのベストは、次のようなパターンです。

open high low close volum volat target_avg target_count
91      30  41    91    100   0.4        9

は、このパターンを特徴付けるクラスタの数です。

target_avg - このパターンで私の反転がトリガーされる確率 です。 これらの予測に よると、80-90%の確率でトリガーされるパターンを見つける ことができませんでした。

target_count - 履歴の中でパターンが捕捉された回数、私はこの 予測式を用いて30~50回捕捉された重要なパターンを発見 していない

私がこれらの予測因子で 見つけた最高のものは、反転(ターゲット)が40%の頻度でトリガーされるパターンであり、9つの観測(パターンの数)しかありません。

ですから、予測変数のセットから抽出できる、おそらく唯一の有用な情報、必要な「NO BLOW」であり、それは逆転のたった一つの理由を説明し、それさえも40%で、異なる逆転の理由は10や30は絶対にないイミフです。

そして、MOアルゴリズムが、このような予測因子を使って、すべての市場の動きを説明することができるか考えてみてください。

さらに、統計的な再現性のコントロールができない、つまりIRは1つか2つの観測に基づいて判断することができ、それは95%以下のケースの大半で実際にそうなっている。

とにかく、余談ですが...。は、私はそう教えてくれる新しいサンプルに入力の品質を推定した、パターンに続けてみましょう、それは遠くメルセデスではありませんが、それは殺されたZaporozhetsであれば、このアプローチは、工場からわずか9

入力の質が格段に上がり、クリアで、エラーが少なくなって...。

で、もうひとつは、フルパターンが......。

open high low close volum volat
91   6    30  41    91    100

50,000本のローソク足の新しいデータで認識を実行したところ、アルゴリズムはそのようなパターンを見つけることができず、ただ表示されなかっただけでした ))

柄を削って値段だけ残していました

open high low close volum volat
91   6    30  41    91    100

このようなパターンをすでに20個ほど発見しています。

ここにパターンのエントリーがありますが、私は何も「アラベストエントリー」を選んでいません。ただ、取引が行われた順序でそのまま写真を撮りました。

й

イーキティは良いが、リスクは予想以上に大きい。

к

たかが一文字、されど一文字

もし誰かがコードを必要とするならば、私はそれを投稿します、しかし私はそれを疑う、それはすでに非常に明確です
 

214ページというのは、勉強・学習する量としては多いですね。それぞれ違うことをテーマにしていて、必ずしもわかりやすいものではありません)。

あまり短くなくてもいいので、これらのページを1つの記事にまとめることは可能でしょうか?タイプ:設定された目標、解決方法、結果、結論。

最初に断っておきますが、私の市場モデルはランダムプロセス(ブラウン運動)であり、むしろフィードバックを伴うこうした動きの複数(多数かもしれません)の合計です。そして、何かを予測したり、統計的なもの以外のパターンを探したりすることは、まったくもって無益な行為である。つまり、少なくとも推測の域を出ない、意味のある予測因子が存在しないのである。

 
コードももちろんですが、面白いですね。
理由: