トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1909

 
Mihail Marchukajtes:

私は24リーグを取る7700コラムの汚いファイルを持っているので、先に進まず、こちらをご覧ください。これがあなたのファイルです。

そして、これが私のものです。

何が違うんだ?もう、待たせませんよ。主成分分析では、各列が独自の座標系である場合、異なる列からの点を同じ座標系にプロットできるように、それらをクラスタリングできることが重要である。通訳は簡単です。縦と横のベクトルが多いほどカッコいい。あるのは、ぶっきらぼうに均一なスポットです。

情報を圧縮したい場合は、まず自己相関を チェックし、入力は1つだけにしておくと安心ですが、メモリがないのでネットワークは動きません。

 
ロールシャッハ

情報を圧縮したいのであれば、まず自己相関をチェックし、入力は1つだけにしておくと安心です。ただ、ネットワークはメモリがないので動きません。

ネットワークにとってメモリは最も重要なものではありません。それを提供するのはラグですが、(分類の話であれば)クラス分割の質は非常に重要なのです。矛盾がなく、クラスがまとまっているようなデータセットを得ることが必要です。これらはすべて、質的な分離につながります。Rattle(Pのグラフィカルシェル)であなたのファイルを実行したところ、参照 ベクトルの方法があり、結果は65%の冗長性でした。つまり、データセットがプレーンなGであれば、魚は存在しないことになる。しかし、これらの方法は、大規模なデータセットを必要としません。もしかしたら、全部のセットを使えば高い学習スコアが得られるようなAIの構成を使っているのかもしれませんが、普通はちょっと遠回しに言うだけで、それ以上のことはありません。
 
Mihail Marchukajtes:

まあ、それに加えて、モデルの推定値も。

予測変数は、ファイル中の列数を示す

ベクターの総数258個。クラス1と数が釣り合っていたので、クラス0を削除し、クラス2をゼロに改名して残しました。19.60は二次誤差、つまり直線と二次の差はゼロになるはずです。79.141は一般化能力、100になると誤差の差が小さくなります。69.767はスパイシー化です。総管理区画は75で、一般化度は70。NOT KNOWSの答えは、コントロールプロットでは17個だったものが、全サンプル中77個のベクトル上で得られました。

実際、トレーニングではもっと悪い結果が出たのですが、コントロールプロットではずっと良い結果が出ました。しかも、あなたのようなテスト区間ではなく、ネットがまったく見ていないコントロール区間だったのです。テスト区間は、学習区間で学習し、テスト区間でもうまくいくようにしたもので、潜在的には学習中にネットがテスト区間を見ていることになります。テストの方はそうではありません。質問?

アダバストは79に79をつけた

 
マキシム・ドミトリエフスキー

アダバストから79が出ました

私の機種とOOSを交換してもらえませんか?
 
Mihail Marchukajtes:
おそらく、セット全体を使用して高い学習スコアを得ることができるAIの構成を使っているのでしょう。

まさにその通りです。別の言い方で説明してみよう。Ma(100)と価格に関する古典的なシステムがあるとする。クロスアップは買い、クロスダウンは売り。通常、Maと価格を入力に、システム信号を出力に与えます。これは、Maをあらかじめ計算し、準備の整った状態でネットに供給するため、投入量を節約することができるのです。あるいは、MAではなく、入力に価格(ネットワークが自己計算するためのもの)、出力にシステム信号の100のラグをネットワークに与えることも可能である。この形態では、価格ラグが100以下のネットは投入できない。

 
ロールシャッハ

これがそうです。別の言い方で説明しよう。例えば、ma(100)と価格にクラシックなシステムがあるとします。アップクロッシングの買い、ダウンクロッシングの売り。通常、Maと価格を入力に、システム信号を出力に与えます。これは、Maをあらかじめ計算し、準備の整った状態でネットに供給するため、投入量を節約することができるのです。あるいは、MAではなく、入力に価格(ネットワークが自己計算するためのもの)、出力にシステム信号の100のラグをネットワークに与えることも可能である。この形態では、価格のラグが100以下ではネットワークに供給できない。

原始的な思考で、早く捨てれば、妄想の穴から飛び出すことができる。あなたはモデル準備の主要なルールの一つを破っているのです。私たちはここで一度アレクセイ Vyazemsky とオリンピックのアクティブだったので、感謝の印として私は彼のラグと私は驚いたという効果について podnakil している覚えています。私は実践者であり、そして理論家でもあるのです。私はラグの本質が明らかにされている私の通信の一部を引用することができます。

引用元

エヘン、エヘン...が面白い。まあ、退屈はさせませんよ。 あなたは私に良くしてくれたので、教えてあげます。私は実務家なので、さまざまな現象に遭遇し、後で理論的に説明したり、発見した効果を詳細に調べたりすることがよくあります。でも、一番面白いのは、自分の疑問に対する答えを得ることです。そこで、私たちは質問をしました。分類器を学習する際に、現在のデータではなく過去のデータを装備する方法。回帰に基づく予測モデルを構築する場合、データの順序は非常に重要です。つまり、履歴から学習ファイルを作成した場合、いかなる場合でも、それらを入れ替えたり、混ぜたりしてはいけません。予測モデルが学習サンプルの全履歴を見ることができるのは、データの順序(厳密な順序で進む)であり、私が言ったように、学習サンプルの最初のデータは、順序によって最後のデータに影響します。それは過去から未来にかけてのことであり、決して混同してはいけない。マックスが一度試したものの、残念な結果に終わったのを覚えていますか?混合は回帰に適用できないからです。分類はまた別の問題で、過学習を避けるために学習セットをランダムに混ぜるという方法が必要になる。つまり、データがうまくシャッフルされたからということではなく、本当の意味で学習の質を推定することができるのです。10個のエポックを回転させ、セットをシャッフルし、また回転させ、またシャッフルする。この場合、学習ベクトル間の接続はなく、基本的に各ベクトルは単独で動作する。
2020.07.02 22:47
そこで、NSに現在のシグナルの指標の値だけでなく、履歴も提供するにはどうしたらよいかと考えました。ようやく、思いついたことがあります。それはとてもシンプルなことです。シグナルが発生した瞬間に指標を保存し、現在のシグナルに対して前の指標の値を取り、さらに前のシグナルに対して別の指標を取るなどしています。その結果、現在の信号の指標だけでなく、過去の信号の指標も保存されることになる。現在、私は24シグナルのラグを取っています。つまり、現在のシグナルに対して、24シグナル前の指標の値を保存しておくのです。フォーラムで、トレーニングファイルには50行で7500カラムが含まれているが、どうしてそうなったのか誰も推測できないと言ったのを覚えています。MOエリアの問題、ここはみんな賢すぎる :-)
2020.07.02 22:52
さて、本題に入りましょう。
お気づきかもしれませんが、私は15種類の商品のデータを保存し、このデータを使っていくつかの指標を作成しています。確率的な関数を取っています。累積標準偏差 をとって、それくらいです。その結果、現在の信号に対して一義的な入力バーが307本もあるんです。その結果、この307本を現在のシグナルとし、それに24本前のシグナルの307本を足すことになります。最後の24の信号のためにすぐにNSにデータを提示する信号の出現でこの政令の意味。これは、分類が現在の信号の履歴を深く見ることができるようにするための変換である。本来は24の奥行きにラグがある
2020.07.02 22:59
でも、一番面白いところは最後の段落に残しておきました。P.のvtreatアドオンはご存知かと思いますが、この獣は出力変数に意味のある列を特定することでデータの前処理を行うわけです。処理後は、原則として130~180の有意な列が存在する。しかし、現在のシグナルの指標の値がこのサンプルに該当することは非常に稀であるというパラドックスがある。非常に稀です。後処理を施したファイルには、同じように24のタイムラグが生じることが少なくないのです。つまり、24ラグ前の指標の値が目標関数にとって重要なのである。基本的には、5コペックのようなシンプルな発想です。かなり大きなサンプルを保存し、Excelのセルを1つ下げたオフセットを持つ列を掛け合わせ、後処理をする。それが利益だ!


見積もりは完了です。

ネットワークだけではどうにもならない。インプットとして与えたものが、結果として得られるものです。練習でわかるように、すべてのラグが良いわけではありませんし、あなたのセットでは、NSが何とかして適切なモデルを得るのに役立つような列は一つもありません......。頑張ってください!!!!!!!

Документация по MQL5: Константы, перечисления и структуры / Константы объектов / Типы объектов
Документация по MQL5: Константы, перечисления и структуры / Константы объектов / Типы объектов
  • www.mql5.com
При создании графического объекта функцией ObjectCreate() необходимо указать тип создаваемого объекта, который может принимать одно из значений перечисления ENUM_OBJECT. Дальнейшие уточнения свойств созданного объекта возможно с помощью функций по работе с графическими объектами.
 

そして、正しく行われると、このモデルはこのように機能します......。


 
Valeriy Yastremskiy:

はい、間違っています)どうやら解析の不具合か、読み込んだデータ上での不具合のようです。

ノーマライゼーションは便利とは言い難い。良い点は、ターミナルにアーカイブのニュースデータが必要で、それらをロードする定期的な可能性があり、それらを扱う サービスが必要であることです。アーカイブスがないとは思いませんが)しかし、クリエイターの立場からすると、ユーザーが欲しいものを口にするまで、始まらないし、始まるとしたら、まず有償版でしょう(笑)。

まあ、そうなんですが、自由で良いカレンダーは、ほとんどありえません)

 
アレクセイ・ニコラエフ

ええ、まあ、自由で良いカレンダーは、ほとんど全く不可能ですが)

はい、あなたは悪いカレンダーを作ることができ、長く、正確な)アーカイブで)それはミントサービス)自分で今解析について)。
 
Mihail Marchukajtes:

ありがとうございます!面白いですね!前の信号を使うとは思いもよりませんでした。このことから、もしかしたらネットは全く不要なリンクなのでは?

それが、機能を淘汰しないためのネットの面白さだと思います。そうでなければ、古典的なシステムを作る方が簡単でしょう。

私はもっと実験をしなければならないでしょう、私は手首にシステムの非常に多くの例を取り、トレーニングでは単一の繰り返しがなく、1つのエポックに収まることが可能であったようにします。

理由: