トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2846

 
Andrey Dik #:
何か公式があるのは明らかで、おそらく秘密でもあるのだろうが、もし複雑な基準の構成要素に重みを割り当てることが可能だとしたら......。うーん、素晴らしい。

説明から判断すると、まず1つの基準によるベストパスの一部が選択され、次に選択されたものから2つ目の基準によるベストパスの一部が選択される、というように理解できる。

"最初に取引回数で、次にこのサンプルから収益性の期待値で、次にリカバリー係数で、といったように、段階的にベストな通過を選択することができます。"

 
Aleksey Nikolayev #:

この記述から判断すると、まず1つの基準に従って最良の文章の一部が選択され、次に選択されたものから2番目の基準に従って最良の文章の一部が選択され、これが繰り返されることが理解できる。

"これは、段階的に最良のパスを選択することを可能にします:まず、取引数によって、次に、このサンプルから収益性の期待値によって、次に、回復係数によって、など。"

基準は最適化の各パスで一度に計算され、各パスのすべての結果を個別に考慮する最適化の終わりではありません。
 
Maxim Dmitrievsky #:

すぐに違いや利点はわからなかった

表形式データを生成する新しい方法。どの程度優れているのだろうか?それともGMMはまだ競争から抜け出せていないのだろうか?

https://github.com/kathrinse/be_great

 
Evgeni Gavrilovi #:

表形式データを生成する新しい方法。それはどれほど優れているのか?それともGMMはまだ競争から抜け出せていないのだろうか?

https://github.com/kathrinse/be_great

表形式データは分析しないのでわからない。
時系列には向かない
T-ganの方がいいかもしれない

⚙️ 時系列変換生成逆数ネットワーク


Github: https://github.com/jsyoon0823/TimeGAN


論文: https://arxiv.org/abs/2205.11164v1


株式データ: https://finance.yahoo.com/quote/GOOG/history


エネルギーデータ: http: //archive.ics.uci.edu/ml/datasets/Appliances+energy+prediction



@ai_machinelearning_big_data


 
Maxim Dmitrievsky #:
T-ガンの方がいいかもしれない

その妥当性はどのようにチェックするのか?実データと合成データの分布を、系列ごとに別々に比較する?

 
Evgeni Gavrilovi #:

尤度はどのようにチェックしますか?実データと合成データの分布を系列ごとに別々に比較するのですか?

PCAによる視覚的な比較をどこかで見たことがありますが、すぐには思い出せません。たぶん後で。
 
Evgeni Gavrilovi #:

尤度はどのようにチェックしますか?実データと合成データの分布を系列ごとに別々に比較しますか?

https://hackernoon.com/a-gan-approach-to-synthetic-time-series-data-pe2r33fd

A GAN approach To Synthetic Time-Series Data | HackerNoon
A GAN approach To Synthetic Time-Series Data | HackerNoon
  • hackernoon.com
Although sequential data is pretty common to be found and highly useful, there are many reasons that lead to not leverage it
 

ヒストグラムのためにどのような予測変数が考案できますか?

画像が挿入されないので、ファイルとして添付しました。

ファイル:
 
Aleksey Vyazmikin #:

What predictors can we come up with for histograms?

)))))))
ヒストグラムとポイントの違いは何ですか? 恥ずかしながら、視覚化以外でお聞きしたいことがあります。
 
mytarmailS #:
))))
ヒストグラムとポイントの違いは何ですか? 恥ずかしながら、視覚化以外でお聞きしたいことがあります。

点を使えばどんな形でも視覚化できる。視覚化は抽象的な思考を刺激し、アイデアの創出を促すために必要です。

確かに、ヒストグラムはサンプルのバイナリ予測であり、赤い棒は信号がなくなった(ゼロ)ことを意味し、その高さはサンプルに信号「1」がなかった時間を意味する。

サンプル中の信号発生の度数分布の異なる特性は、トレーニングでこの予測変数のさらなる使用を分類するのに役立つと仮定する。したがって,この予測変数は,アッパー・ルート分割の構築のためにのみ除外または使用を推奨できる.

これが、予測変数がヒストグラムを記述するために必要とされる理由です。そうです,我々はTP+FPバランスの予測子も作ることができます - よく知られているものを除いて,その記述のアイデアも興味深いです.

理由: