トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 838

 
ミハイル・マルキュカイツ

一般に、予測変数の選択には、この特定のパッケージを使用します。デメリットがあることは明らかで、特にターゲットに対する複数の予測因子の相互作用がないことです。でも、全体としては今のところ私の最適化には十分なのですが...。ですから、もし他にデータ前処理のためのパッケージがあれば、喜んで検討したいのですが...。

私の経験から、RandomUniformForest パッケージは、予測変数の重要性の様々な側面を最も完全かつ専門的に扱うものとして、お勧めできます。事例は こちらで ご覧いただけます。

グッドラック

追記:ところで、新しいデータでモデルを再トレーニングできる数少ない製品の1つです。これは、多くの時間を節約するものです。

 
Dr.トレーダー

毎週新しいツアーが開催されます。1週間でモデルを学習させ、予測を送らなければならない。しかし、あなたのモデルの前方推定値がわかるのは、さらに3週間後で、あなたの予測はその3週間の実際のものと比較されることになります。

少なくとも9割は残していると思います。

少なくとも9割はキープしていると思う」ってどういうこと?送られてきたこの予測を取引しているのだろうか?一般的に、事前に予報を計算するためのサインはどのように調べればよいのでしょうか。補間か何かで?マイニングのようにランダムに勝者を選び、おそらく半分くらいはほぼ同じ結果で、さらにランク付けするフィルターをランダムに投げるという、ただの「proof of work」だとドキュメントに書いてあるのですが、まあ恥ずかしいカジノですね。ヘッジファンドなどという戯言は、純粋にコインの人気を得るためのものだ。

 
マキシム・ドミトリエフスキー

さて、mikhailさん、熱狂から立ち直って、そろそろ狂信的にならずに、感覚的にtsを評価し始めませんか?:)

狂犬病は持っていなかった。前回から何ら変わっていない冷徹な計算のみ。アプローチ論は言うまでもなく、今でも有効です。一瞬...

 
ゴビッチ

具体的にいくら預かっているかは、公式には書かれていない。いろんな金融雑誌が2016年に150万円の利益が出たと書いていますが、そのうち参加者にいくら支払ったかを比較すると、たいしたことはないんです。

> 送られてくるこの予測を取引しているのだろうか?
そう、それが戦略なんです。例えば、私が機能をたくさん作り、トレーニング用のスプレッドシートを作り、それをフォーラムに送り、10人が予想を出し、私はその予想でトレードする、そんな単純なものです。
彼らは長い間、独自の暗号を持たず、ビットコインで支払っていたのです。1年間、毎週数千円のビットコインを取られただけです。そして、ビットコインを扱う必要がないように、独自の暗号をリリースしたのです。

> 予測を計算するための符号を事前に知るには?補間なのでしょうか?
補間、最近傍による予測、クラスタリング、多くの選択肢がありますが、具体的な答えは教えてくれませんので、推測するしかないでしょう。

 
ウラジミール・ペレヴェンコ

私の経験から、予測変数の重要性の様々な側面を扱う最も包括的で専門的な方法として、RandomUniformForest パッケージを推薦することができます。事例は こちらで ご覧いただけます。

グッドラック

追記:ところで、新しいデータでモデルを再トレーニングできる数少ない製品の1つです。これは、時間の節約になりますね。

試してみました。結果を得ることができなかった。

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2,ytest = y2,mtry = 1,ntree = 300,threads = 2, nodesize = 2)

5分で生成されます。
OOB.votes - Y: Unsimilar multidimensional matrices のエラー。

フィードするマトリックスの構造。

> str(x1)
num [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 1 1 1 ...
> str(x2)
num [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 0 0 0 0 0 0 ...

明確でない - 何が必要なのかとの類似性。
xtest = x2、ytest = y2なしで試してみましたが、同じ結果でした。
次のパッケージへ

 
エリブラリウス

試してみました。結果が出なかった...。

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2,ytest = y2,mtry = 1,ntree = 300,threads = 2,nodesize = 2)

5分後
OOBにエラーが発生しました。

投入されるマトリックスの構造。

> str(x1)
num [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 1 1 1 ...
> str(x2)
num [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 0 0 0 0 0 0 ...

はっきりしないんですよねー、何がどう必要なのかっていうのが似てるんですよ。
xtest = x2、ytest = y2なしで試しましたが、同じ結果でした。
次のパッケージへ

なぜうまくいかなかったのかわからない、私にはうまくいっている。

カレットで良い結果が出た。予測器選択には3つの機能があり、それぞれ効率が異なり、様々な計算資源を 消費する。


また、CORElearnという非常に興味深いパッケージがあります。このパッケージには予測変数の選択のための2つの関数が含まれており、私はそれらを一緒に使い、私の予測変数に非常に良い結果を与えました。特に興味深いのは、attrEvalです。attrEvalには、非常に素晴らしい選択評価メソッドが用意されており、その中でも、1つの観測値(文字列)だけでなく、最も近い文字列も評価するReliefグループが特別な位置を占めています。


頑張ってください。


PS.

予測変数の選択は、少なくとも以下のステップで構成されることを忘れないでください。

  • による選択:ターゲットに関連する予測因子。このステップの理論については、こちらのWizardがリンクを貼ってくれています。統計学とエントロピーの2つの方法が区別されます。両方について、ここにコードがありました
  • 将来のモデルに関連しない列挙されたパッケージによる選択
  • モデル結果に基づいて行われる選択。リニアモデルで非常に有効です。例えば、glmでは意味のある予測変数のみを選択し、その予測変数のみをネットワークに取り込みます。意外な結果かもしれません。


予測変数の選択前に、センタリングなどの前処理が必要な場合があります。Vladimir Perervenkoの 記事によく書かれています。

 
エリブラリウス

試してみました。結果が出なかった...。

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2,ytest = y2,mtry = 1,ntree = 300,threads = 2, nodesize = 2)

5分後
OOBにエラーが発生しました。

投入されるマトリックスの構造。

> str(x1)
num [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 1 1 1 ...
> str(x2)
num [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 0 0 0 0 0 0 ...

はっきりしないんですよねー、何がどう必要なのかっていうのが似てるんですよ。
xtest = x2、ytest = y2なしで試してみましたが、同じ結果でした。
次のパッケージへ

オリジナルのセットを掲載することは可能ですか?

ターゲットが要因ではないので、回帰ではないことを明記する必要があります。パラメータの追加

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2,ytest = y2,mtry = 3,ntree = 300,threads = 2,nodesize = 2,regression = FALSE)

または

ruf <- randomUniformForest( X = x1, Y = y1 %>% as.factor, xtest = x2, ytest = y2 %>% as.factor, mtry = 3.0 %>% as.factor, ytest = x1, y2 %>% as.factor, mtry = 3,

ntree = 300, threads = 2, nodesize = 2)。

グッドラック

 
サンサニッチ・フォメンコ

もうひとつ、CORElearnという非常に興味深いパッケージがあります。このパッケージには予測変数の選択のための2つの関数があり、私はそれらをペアで使いましたが、私の予測変数に対して非常に良い結果を得ることができました。特に興味深いのは、attrEvalです。attrEvalには、非常に素晴らしい選択評価メソッドが用意されており、その中でも、1つの観測値(文字列)だけでなく、最も近い文字列も評価するReliefグループが特別な位置を占めています。


同意見です。原理的には、RF用のパッケージとしては最も本格的なものでしょう。開発者のマルコ・ロブニク・シコンヤに 注目してほしい。

グッドラック

 
ウラジミール・ペレヴェンコ

オリジナルのセットを掲載することは可能ですか?

ターゲットが要因ではないので、回帰ではないことを明記する必要があります。パラメータの追加

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2,ytest = y2,mtry = 3,ntree = 300,threads = 2,nodesize = 2,regression = FALSE)

または

ruf <- randomUniformForest( X = x1, Y = y1 %>% as.factor, xtest = x2, ytest = y2 %>% as.factor, mtry = 3.0 %>% as.factor, ytest = x1, y2 %>% as.factor, mtry = 3,

ntree = 300, threads = 2, nodesize = 2)。

グッドラック

それは助かりました。ありがとうございました。
 
Dr.トレーダー

具体的にいくら持っているかは、公式には書かれていない。あらゆる金融雑誌が2016年に150万円の利益について書いていますが、そのうち参加者にいくら支払っていたかを比較すると、大したことはないんです。

> 送られてくるこの予測を取引しているのだろうか?
そう、それが戦略のすべてなのです。例えば、私が機能をたくさん作り、トレーニング用のスプレッドシートを作り、それをフォーラムに送り、10人が予想を出し、私はその予想でトレードする--すべてがシンプルなのです。
彼らは長い間、独自の暗号を持たず、ビットコインで支払っていたのです。1年間、毎週数千円のビットコインを取られただけです。そして、ビットコインを扱う必要がないように、独自の暗号をリリースしたのです。

> 予測を計算するための符号を事前に知るには?補間なのでしょうか?
正確な答えを知ることはできませんが、推測することは可能です。

1.5m$は小銭、Entire Kantorのように、暗号を取引所に置いたその瞬間、一部の参加者(トップだった人)は、数百万$どころか、数十万$を全て手にしたと聞きました。一度だけ、1位と4000NMRを1コイン200ドル=800.000k$で手に入れることができましたが、このボールはすぐになくなりNMRはクラッシュしてコインをあまり渡さなくなってしまいました。

IMHOは、当初、彼らは予測を交換しようとした可能性があり、そこでも多かれ少なかれ予測可能であった場所、おそらく彼らが自分自身に支払ったお金の90%、最初の100のほとんどはおそらく彼らの仲間だった、お金は誰が知っているに漏れることはなかったと思う。しかし、今は「プルーフ・オブ・ワーク」とランダム性を多用した純粋なカジノになっている、それが少なくとも噂の内容である。


追記:コインができる前は、週に6千ドル払っていたそうです(でも、誰に?)しかし、明らかに、これらの数字はすべて捏造可能です。

理由: