トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 3375

 
Maxim Kuznetsov #:

生年月日、生年月日、生年月日、生月月日生年月月日生年月日生年月月日。

TOではない?

では、表形式/非表形式データとは何なのか......。表形式は直線的な尺度であり、YはXにのみ依存する? それなら、そうだ。

Tabular is heterogeneous, like a list of employees.度、度、度、度、度、度。例えば、何人かの労働者を足し合わせても、オプティマス・プライムは機能しない。ー例えばー、ーのー行のー行ーーーー
 
我々の場合、元データは表ではなく時系列である。ニュース分析を使用しない場合、使用する場合はテーブルを使用します。

つまり、最初のケースでは、NSとboustingの両方が適しており、おそらくNSの方がよいでしょう。2つ目のケースでは、boustingの方が優れています。

つまり、最初のデータ表現と処理後のデータ表現を区別することを学びました。
 
Aleksey Nikolayev #:
表には書けるが行列には書けない場合)
NSは同種のデータに対してより良く機能する。表データは、同じ型であれば行列に書き込むことができる。
 
表データには、ニューロニクスTabNetアーキテクチャがあります。

boostsの競合として位置づけられている。
私も試してみたが、よく動くし、スカムもしない。
 
そのようなネットワークはある。しかし、私たちのトピックでは、テーブルではなくシーケンスを扱うためのネットワークが必要です。なぜなら、それらは最初から配列だからだ。
 
Maxim Dmitrievsky #:
そのようなネットワークはある。しかし、私たちのトピックでは、テーブルではなくシーケンスを扱うためのネットワークが必要です。なぜなら、それらは最初から配列だからだ。

気分なんだ。

配列であることを証明できますか? 配列であるという事実は別として。

 
このタレコミから私が理解した表形式のデータ

いわゆる整頓されたデータ、つまり "tidy data "である。

各行が観察であり、列が特徴である表である。

 
Maxim Dmitrievsky #:
トピックには、テーブルではなくシーケンスを扱うネットワークがもっと必要だ。
シーケンスは表形式ではダメなのか?
 
Maxim Dmitrievsky #:
そのようなネットワークはある。しかし、私たちのトピックでは、テーブルではなくシーケンスを扱うためのネットワークが必要です。なぜなら、それらは最初からシーケンスだからだ。

最初の選択肢である表は、エクセルのスプレッドシートで、各行には時間マーカーがある。財務データの最も身近な形式である。

第二の選択肢、手書きの文字。印刷された手紙を先生とし、その下にその手紙の手書きの変形を列にして、先生と学ぶ。

ブスティングとNSの比較。どちらがより適しているか、どのような場合に適しているか。それとも同等か?

追記

Rattleから、rpart(単純木)、rf、ada、SVM、glm、nnet(おそらく最も単純なNS)がある。最も悪い結果はrpartで、最後から2番目はnnet、他の4つはほぼ同じで、入力データに依存する。

 
Maxim Kuznetsov #:

そんな気分なんだ。

時系列であることを証明できますか? 時系列であるという事実は別として。

時系列の方がより正確です。まず代替案を提示する必要があるようだ。そうでなければ、何かがあるか、何もないかだ