トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1933

 
Aleksey Vyazmikin:

前回の結果、4つのクリアなクラスターからこの写真を入手しました。

先ほど、結果を評価するための数値のお話がありましたが、どのような数値を見ればよいのでしょうか?

Yeah))で、今度はテストデータを見てみましょう。

scatter3d(x = predict.test[,1], 
          y = predict.test[,2], 
          z = predict.test[,3],
          groups = Y[test.idx],
          grid = F, 
          surface = F,
          ellipsoid = F,
          bg.col = "black",surface.col = c(2,3))

私は、それはナンセンスだと言いました。写真ではなく、テストデータでのモデルの誤差を見るべきだと思います。


ちなみに、10kのデータで学習するため、インデックスを変更します。

train.idx <- 100:8000
test.idx <- 8001:10000

で、500k以上のデータをお持ちの方

 
mytarmailS:

多項式や調和的近似について知っている人PLEASE!

 
mytarmailS:

Yeah))で、今度はテストデータを見てみましょう。

私が言ったのは、それはナンセンスだということです。きれいな写真ではなく、テストデータでのモデルの誤差を見るべきです。


今、テストデータに戻りました。

> library(car)

> scatter3d(x = predict.test[,1], 
+           y = predict.test[,2], 
+           z = predict.test[,3],
+           groups = Y[train.idx],
+           .... [TRUNCATED] 
Error in complete.cases(x, y, z, groups) : 
  не все аргументы имеют одинаковую длину
mytarmailS:

10kのデータでしかトレーニングしていないんですね。

で、500k以上のデータを持っているんですね。

まずは小さいデータでチューニングして、それから大きいデータで試してみないと。

ところで、Rはメモリに対して非常に非合理的で、たくさん食べてしまうことに気がつきました。

 
Aleksey Vyazmikin:

今、テストデータで再び叱咤激励

そりゃそうだ

library(car)

> scatter3d(x = predict.test[,1], 
+           y = predict.test[,2], 
+           z = predict.test[,3],
+           groups = Y[train.idx],
+           .... [TRUNCATED] 
 
mytarmailS:

もちろん、そうでしょう。

あ、はい、ありがとうございます

これがその写真です。少し悪くなっていますが、トレンドはそこにあります。

今までなかったのに、どこからか別のクラスタが生まれたのか、何が起こっているのか理解できません。

 
Aleksey Vyazmikin:

あ、はい、ありがとうございます

これがその写真です。少し悪くなっていますが、トレンドはそこにあります。

以前はなかったのに、どうして別のクラスタがあるのか、私には理解できません。

さほどでもない)

新しいデータ - 新しいポイント

 
mytarmailS:

(ちょっぴりですが))。

新しいデータ - 新しいポイント

何が起こっているのか理解できない。

何かを訓練して、それをテストに応用したのか、何なのか。:)

ナンセンスに思えてしまう。

 
アレクセイ・ヴャジミキン

ナンセンスな話ばかりに思えますが。

何度言ったらわかるんだ? 3、5?

 
mytarmailS:

多項式や調和的近似について知っている人PLEASE!

そして、最終的にどうしたいかというと、高調波でフーリエへの道です。あるいは直交多項式に、たくさんあります。すべてのものは分解できる)

 
私の質問の答えを読んでください。皆さん、本当にありがとうございました。
理由: