トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Dr. Trader 2017.01.01 22:59 #2561

なんだか、混乱しています。

値段があるんです。直近の200本のバーを使って、2つのクラス（買い/売り）のモデルをトレーニングしてみます。森でもニューロンでも何でも訓練できますが、それでは意味がありません。なぜなら、すべての訓練例を200次元空間の点に見立てると、そこには両方のクラスが均等に混在しており、超平面を使って分離しようとしても、十分な精度が得られないからです。

今より良い選択肢は、あらゆる種類のヘッジファンドが価格に基づいて新しい予測因子（指標、クラスタ、いくつかの数式、および何か）を作成することです。そして、この新しい予測変数に対して、最初のポイントと同じモデルを学習させますが、この場合、キャベツを切ります。

つまり、2つ目のケースでは、そこに新しい情報が形成されて追加されるのではなく、200次元空間の同じ点が、より少ない空間に移動したに過ぎないのです。つまり、同じクラスの点同士を空間的に近づける、そんな特異な次元の縮小を行うのです。しかし、機械学習モデルはこの他にも、アルゴリズムを使って次元を減らし、クラス同士を近づけることも行っています。この2つの方法の違いは何でしょうか？

なぜかというと、空間上の点を半自動的に、さまざまな仕掛けで近似し、モデルを学習させれば、うまくいくからです。しかし、モデルそのものを信頼して元の空間と連動させると、失敗するのでは？これらはどちらも似たような操作です。

Aleksey Vyazmikin 2017.01.02 03:04 #2562

Dr.トレーダー

今より良いオプション - あらゆる種類のヘッジファンドは、価格に基づいて新しい予測因子（指標、クラスタ、いくつかの数式、および他の何か）を作成します。そして、この新しい予測変数に対して、最初のポイントと同じモデルを学習させますが、この場合、キャベツを切るのです。

...

なぜかというと、空間上の点を半自動的に、いろいろな仕掛けで近似し、その後にモデルを教えれば、うまくいくのです。そして、そのモデルを信頼して元の空間そのものに働きかけると、失敗するのでは？どちらも似たような操作ですね。

大きな市場参加者が価格を動かすことを考慮しないのですか？

СанСаныч Фоменко 2017.01.02 07:31 #2563

Dr.トレーダー

なんだか、混乱しています。

値段があるんです。直近の200本のバーを使って、2つのクラス（買い/売り）のモデルをトレーニングしてみます。森でもニューロンでも何でも訓練できますが、それでは意味がありません。なぜなら、すべての訓練例を200次元空間の点に見立てると、そこには両方のクラスが均等に混在しており、超平面を使って分離しようとしても、十分な精度が得られないからです。

今より良い選択肢は、あらゆる種類のヘッジファンドが、価格に基づいて新しい予測因子（指標、クラスタ、いくつかの数式、その他）を作成することです。そして、この新しい予測変数に対して、最初のポイントと同じモデルを学習させますが、この場合、キャベツを切ります。

つまり、2つ目のケースでは、そこに新しい情報が形成されて追加されるのではなく、200次元空間の同じ点が、より少ない空間に移動したに過ぎないのです。つまり、同じクラスの点同士を空間的に近づける、そんな特異な次元の縮小を行うのです。しかし、機械学習モデルも同様に、アルゴリズムを使って次元を減らし、クラス同士を近づけていくのです。この2つの方法の違いは何でしょうか？

なぜかというと、空間上の点を半自動的に、さまざまな仕掛けで近似し、モデルを学習させれば、うまくいくからです。しかし、モデルそのものを信頼して元の空間と連動させると、失敗するのでは？これらは、結局のところ、どちらも似たような操作なのです。

なぜ、原理的にモデルが必要なのか？

なぜ、無線工学と計量経済学で異なるフィルターが必要なのでしょうか？スムージングなどなど...。

統計学はとても卑劣な学問で、簡単に数字のゲームにのめり込んでしまいます。どのステップでも

ターゲット変数を定義したなら、そのターゲット変数に予測変数をマッチングさせる必要があります。どんな予測変数でもいいわけではなく、そのターゲット変数に確実に関連するものだけをマッチングさせます。常に予測変数を見て、「私のこの予測変数は、私のターゲット変数にどのような特性、特徴を反映しているか？そしてとにかく、予測因子と金融市場にはどんな関係があるのだろうか？

例えば、RSI：買われすぎ／売られすぎの相場を反映しているようです。リバーサルに明確に関係する。といった具合に。

あるいは、Burnakoffを思い出してみよう（この人は洪水で現場から追い出されたそうだが）：かなり大きなラグを持った増分は周期性の鐘のようなものである。

そして一般的に言えば、金融市場の一般的な言語化されたモデルを策定する必要がある。

ヒンディマンの（予報パッケージ）などがあります。彼の意見では、市場は以下のように構成されている。

三種の神器
さんかくざつおん
周期性、これは彼が一定期間を持つもので、農業生産などの生産データと整合的である。

唯一のアプローチではないでしょう。しかし、それはノイズではなく、確実なものである

この方法で、あなたはコーヒーの粉、土星の輪（占星術師のリストを参照）を刻むでしょう...

また、「非定常性」と呼ばれる金融データの弊害も忘れてはならない。

また、金融市場のモデルは、ほとんどの場合、過剰に訓練されていることを忘れてはならない。

私たちは皆、勝ったのでしょうか？竹を燻す...。

mytarmailS 2017.01.02 09:28 #2564

Dr.トレーダー

なんとなく混乱しています。

1) ファンデーションがそうなっていないだけでは？

2）自分なりにではあるが、市場がどうなっているかを理解する必要がある...。

3）誰から、何のためにお金を取るのか、自分なりの具体的な考え方が 明確に必要

4) MOのすべてなど...これは 具体的なアイデアを 説明するためのツールキットであって、アイデア そのものではないので、このブランチのほとんどの人は、MOがすべて自分で考えてくれると考えているわけです

どんなに偉そうなことを言っても、ある程度適切な市場予測ができるようになったし、かなり複雑なアルゴリズムを持っているので、ローソク足1本を計算するのに6分くらいかかるが、いくつかの基本要素はC++で書き直される予定だ

しかし、この複雑なアルゴリズムで計算された結果は、私の目で分析しなければなりません。自動ではなく半自動ですが、近い将来、私の視覚分析をパターン認識用のMOに置き換えてみようと思います。ちなみに、予測とは異なり、MOは非常によく認識されます。自分の目でそれぞれの出力を見て、「これは買いシグナル、これは買いシグナルではない」と判断し、その通りにターゲットを作成したのですが、まだあまりデータを作っていなかったので、実験的なものでした。..100個の学習済みサンプルと50個のコントロールがあったので、通常のForestを学習させたところ、どうでしょう？ Forestは新しいサンプルの90％を認識しました

Mikhail Toptunov 2017.01.02 09:43 #2565

タスクさん、こんにちは。

- X,Y,Zの値の配列があります。

- n番目のYに1から1000までのXでスライスしてみましょう。

-極小点、極大点があり、Xでスライスした場合、>1 の値は重要である。

軸に対する重みの種類の計算を再現するには、どのように見ればよいのでしょうか。

つまり、対象物の計測を開始する。

セルx-55 y-163で信号を受信した場合、X軸とY軸（場合によっては対角線上）に対する点の値（重み）を決定し、物体上の点の位置を感じるというタスクである。

分散、中央値、最頻値、非対称性など、主な統計的特徴の方に目を向ける必要があるのではないでしょうか。

一般的には、対象物を何らかの方法で測定し、各単位を互いに関連付けることから始める必要があり、また、対象物上の点の値には他の対象物の存在が考慮されていることが必要である。

ファイル:

eiova.jpg 382 kb

1.jpg 320 kb

mytarmailS 2017.01.02 10:01 #2566

トップ2n:

グッドタイム、タスク。

シンプルにしてくれませんかね、何がしたいのかわからないです。

Dr. Trader 2017.01.02 13:44 #2567

サンサニッチ・フォメンコ

ありがとうございます、何となくわかりました。

モデルは基本的に、予測変数空間を2つの部分空間（クラスバイとクラスセル）に最適に分割するだけです。
もし私たちが新しい予測因子をランダムに長い時間作り始めたら、私たちは少しモデルを助けることができ、自分たちでその仕事の一部を行うことができます。しかし、安定性や予測性が向上する必要はなく、より少ない反復でモデルが仕事をするのを助けるだけでよく、その操作には私たちが望むほどの効用はないのです。

しかし、あなたがおっしゃるノイズ除去、平滑化、トレンド調整などの操作は、単にモデルに適した予測器を作るだけではありません。これは、市場の内部プロセスを何らかの形で記述する予測変数の作成である。
昔のいろいろなストラテジーを見てきましたが、MAなら21、RSIなら14というように、常にいくつかの定数を持っています。これらの定数とそれを用いた指標はすべて、モデルのデータ分類を容易にするだけでなく、市場内部のプロセスを記述するいくつかの特性を持っています。さらに、予測値の計算式に含まれる定数が異なれば、何らかの新しいデータとなりますので、元のデータに新しい情報を追加することになります。

その結果、無闇に新しい予測因子を生成しても、学習時にモデルの精度が上がるだけで、市場内のプロセスを記述することには役立たないので、予測に信頼性がないことがわかりました。だから、いろいろ考えて生み出さないといけないんですね、納得です :)

そして、私にとって予測変数の新しい特性は、オリジナルデータの内部プロセスの記述という興味深いものです。
つまり、例えば数百本の価格バーを簡単に再構築できる予測変数が12個あれば、明らかに必要な市場特性を含んでおり、それを基に構築されたモデルの方が優れているはずなのです。

Dr. Trader 2017.01.02 14:11 #2568

トップ2n:

おそらく誤解されていると思いますが、ある半径（たとえば4）をとって、各ポイントについて、その半径内の平均値を求めます。
すなわち、X=BC, Y=158, Z=1とすると、この半径R=4内のすべての点の平均値を求めることができる。これは、点(BC,158,1)とその近傍の平均重量になる。これを配列のすべてのポイントに対して行うと、新しい配列ができ、その数値が大きいほど、元の配列の近傍にある信号が多くなる。
そして、ある軸に投影することができます（Z座標を捨て、異なるZ座標を持つ関連するXとYのセルをすべて足し合わせます）。そして、Yも単体で捨て、すべてのセルをXで合計する。

ファイル:

w5rtduyghjbn.png 388 kb

СанСаныч Фоменко 2017.01.02 14:23 #2569

Dr.トレーダー

無闇に新しい予測因子を生成し始めると、学習でモデルの精度を上げるのに役立つだけで、市場内のプロセスを記述するのには役立たないので、それを使った予測は信頼できないことがわかりました。だから、いろいろ考えて生み出さないといけないんですね、納得です :)

それでも、踊るためのオーブンは、市場を何らかの言葉で、直感的に説明することである。

私は、金融市場では、この直感的な描写はZZによって与えられるという考えを持ち続けてきました。見ていただければ。

動向がうかがえる
ノイズは直線からのズレとして見ることができる
を見ると、周期性があることがわかります。

私たちの悩みは、この両軸でカオス的に変化する周期性にあるような気がするのです。それが、はまり役になっているのです。せめてこの非定常性をどうにかできるようになれば、あとは楽なんですけどね。

Mikhail Toptunov 2017.01.03 19:52 #2570

サンサニッチ・フォメンコ

それでも、踊るべきオーブンは、市場に関する何らかの言葉による直感的な記述である。

私は、金融市場では、この直感的な描写はZZによって与えられるという考えを長く持ち続けてきました。見ていただければ。

動向がうかがえる
ノイズは直線からのズレとして認識される
を見ると、周期性があることがわかります。

私たちの悩みは、この両軸でカオス的に変化する周期性にあるような気がするのです。それが、はまり役になっているのです。せめてこの非定常性をどうにか処理できるようになれば、あとは楽なんですけどね。

厳密に判断せず、どういう意味かと聞かれても困りますが、White_Noise Generatorがお役に立てるかもしれません。ところで、もし可能な人がいたら、Fourier_Laplace_Z変換の経験を教えてください。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 257