トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

СанСаныч Фоменко 2017.10.03 09:47 #4951

Dr.トレーダー

森は外挿できるのか？はい。
うまくできているのでしょうか？いいえ。

何が良くて、何が悪いのか。

各機種の比較分析はされていますか？そして、最初から、特定のターゲットに対する特定の予測変数の適合性、特定のモデルに対する特定の予測変数のセットの適合性、そして、トレーニングファイル以外のファイルに対する強制実行による評価ですか？モデルが過剰に訓練されていないことを正当化した上で。

これが揃えば、特定の 予測因子とターゲットのセットに対して、何が良くて何が悪いかを判断することが可能になる。同時に、異なる予測因子とターゲットが存在し、異なる結果が得られる可能性が高いことを理解する必要があります。

私の場合は、そのような作業を行いました。このスレッドでも何度か結果を載せています。モデルの順番は、降順で、ada、rf、SVM。一番悪いのはNSですが、昔のバージョンで、最近のものは使ったことがありません。ただし、上記の条件をすべて満たすことが条件となります。

Maxim Dmitrievsky 2017.10.03 09:52 #4952

Dr.トレーダー

ここに面白い例があります、少し前にこのスレッドに投稿したものです。
この場合の外挿は、"既知の点の雲 "の外側を予測することになる。

既知の点がうまくクラスター化されていれば、ほとんどのモデルで外挿は問題ないことがわかる。
しかし、もし既知の点が明らかなクラスターを持たず、よりランダムに配置されていたとしたら、予測自体が悪くなり、外挿も信用できないでしょう。

予測変数が重要で、モデルにゴミを入れると、うまく外挿できなくなるのです。
また、外挿を使った金融データでの取引は絶対にしない。

外挿は未知の点に対する予測であり、もし点が学習サンプルの最大値と最小値の外にある場合、RFは常に学習サンプルの最大値と最小値を出力することになる

は、mb近似と混同しているだけでは？

СанСаныч Фоменко 2017.10.03 09:55 #4953

Dr.トレーダー

ここに面白い例があります。少し前にこのスレッドに投稿したものです。
外挿は「既知の点の雲」の外側を予測することになる。

既知の点がうまくクラスタリングされていれば、ほとんどのモデルで外挿は問題ないことがわかる。
しかし、もし既知の点が明らかなクラスターを持たず、よりランダムに配置されていたとしたら、予測自体が悪くなり、外挿も信用できないでしょう。

予測変数が重要で、モデルにゴミを入れると、うまく外挿できなくなるのです。
また、外挿を使った金融データでの取引は絶対にしない。

統計一般に対する信頼の問題は、哲学的なものです。

ここでは、その分類を紹介します。

外挿という概念そのものが適用されるのでしょうか？私の心にはない。分類は、パターンを発見し、そのパターンに従って新しいデータを分配しようとするものである。

解析的な形で何らかの機能を持つ解析モデルにおける外挿。

AND ARIMA?そこには外挿があるのでしょうか？ものによるのです。モデル自体は最後の数小節、通常は全く1小節を使用します。しかし、パラメータの選定には何千本もの小節が必要です。この千は外挿で、前回の計算にあったものは外挿ではありません。

数学的な意味での外挿は、金融市場には当てはまらないと思っています。

Maxim Dmitrievsky 2017.10.03 10:02 #4954

サンサニッチ・フォメンコ

統計一般に対する信頼の問題は、哲学的なものです。

ここでは、その分類を紹介します。

外挿という概念そのものが適用されるのでしょうか？私の心にはない。分類は、パターンを発見し、そのパターンに従って新しいデータを分配しようとするものである。

解析的な形で何らかの機能を持つ解析モデルにおける外挿。

AND ARIMA?そこには外挿があるのでしょうか？ものによるのです。モデル自身は最後の数小節、通常は全く1小節を使用します。しかし、パラメータの選定には何千本もの小節が必要です。この千は外挿で、前回の計算にあったものは外挿ではありません。

数学的な意味での外挿は、金融市場には当てはまらないと思うのです。

MOにおける外挿は、新しいデータに対してモデルが機能する能力であり、近似の特殊なタイプである。トレーニングサンプルでは「推定」し、トレーニングサンプルにない新しいデータでは「推定」する。

だから、線形回帰とXGboostを比較した例を挙げたのです。線形回帰は完全に外挿しますが、決定木を含むものは、決定木の構造上、外挿できません

СанСаныч Фоменко 2017.10.03 10:43 #4955

一般に線形回帰は存在し、特にモデルから正規分布の残差を持つ定常系列に対してのみ外挿を行う。この種のモデルを金融シリーズに使うには、膨大な数の制限がある。

あるいは、自分の特定のデータに対するモデルの適用可能性にまで踏み込むことができれば、それはモデリングであり、それ以外の場合は数字のゲームに 過ぎないのです。

このスレッドの膨大な数の書き込みは、何の根拠も示されていないため、数字遊びです。

Maxim Dmitrievsky 2017.10.03 10:59 #4956

サンサニッチ・フォメンコ

一般に線形回帰は存在し、特にモデルから正規分布の残差を持つ定常系列に対してのみ外挿を行う。この種のモデルを金融シリーズに使うには、膨大な数の制限がある。

あるいは、自分の特定のデータにモデルを適用することができるのであれば、それはモデリングであり、それ以外の場合は数字の ゲームなのです。

このスレッドの膨大な数の書き込みは、何の根拠も示されていないため、数合わせのようなものです。

線形回帰と何の関係があるのでしょうか？問題は、「抽出できる」と思ってしまうような愚かな間違いをしないために、足場をどう正しく使うか、ということでした。

森に相場表形式の時系列を与えると、モデルは学習した時系列の最大値と最小値のみを予測し、もしそれが範囲を超えたら

Дмитрий 2017.10.03 11:30 #4957

アリョーシャ

なんということだ、諸君...。

KOさんからの情報です。

金融市場では、外挿・内挿は応用が利き、非常に需要が高い。

応用力があり、需要がある」のなら、なぜ今までずっとTSを成功させなかったのですか？

追伸：猫の鳴き声が聞こえる・・・。そっか、アリョーシャがまた何か書いてたんだー。

Maxim Dmitrievsky 2017.10.03 11:34 #4958

アリョーシャ

なんということだ、諸君...。

KOさんからの情報です。

MOでいう外挿と内挿は同じ!どちらの場合も、学習データセットの点と同じではない点の値(int,float[]) を取得する必要があります。ハイパースペースでの点の位置についての予約は、訓練点群に関して、それはすべての特徴、特徴空間の構造に依存するので、不可能である、1つの投影では、訓練雲「外」のポイントになります、別の「内部」は重要ではありません、それは唯一のポイント、訓練にないものを意味する。

要約すると、学習データセットに点がない場合、その分類または回帰の結果は、外挿と補間の両方になり、対象領域によって結果の最終的な解釈が異なりますが、MOアルゴリズムでは、それらは1つで1つになります。

森は外挿するんですねー、すごいなー。正しい使い方をすれば、NSよりも優れており、桁違いに速い。

金融市場では、外挿・内挿は応用が利き、非常に需要が高い。

マキシムへの別のアドバイス：賢い人は愚か者よりも多くのテストを行うので、しばしば間違われますが、愚か者だけが自分の視点に感情的に固執し、それを手放すことが困難です。あなたは誰を選ぶのか)))です。

足場がどれだけうまく外挿できるか、少なくとも1つの記事で例を挙げてください。見つからなかったんです。

というのは、私の中ではイマイチなんです。

そして、ポイントがクラウドの内側にあるときと外側にあるときをどのように判断するのでしょうか。多くの異なる特徴がある場合、トレーニングにおけるターゲット値の範囲は、すべてのツリーが構築されたとき、ターゲットがこの範囲から出ることは決してありません。

Dr. Trader 2017.10.03 11:39 #4959

マキシム・ドミトリエフスキー

線形回帰は外挿に優れているが、決定木は外挿ができない。

外挿は、学習時に知っている予測値を超えて新しいデータを予測することである。

これは古い写真の一部で、緑色の影はすべて外挿で、森が外挿の方法を知っていることを示しています。

フォレスト、ニューラルネットワーク、線形モデルのいずれも外挿が可能です。もし、既知の値から遠く離れた場所を予測したいのであれば、これらのモデルはすべて予測を行い、そのような場合のために何らかのアルゴリズムを持っているのです。

しかし、線形モデルがy=ax+bの式で外挿すると完璧に外挿できるのに、森林が最も近い既知の隣人を用いて外挿すると役に立たないのはなぜでしょう？どちらのアルゴリズムも存在する権利があります。SanSanychが言ったように、予測因子とターゲットのセットごとに、モデルを研究し比較することで、初めてそのモデルが外挿を完全に行うかどうかを判断することができます。
フーブラの記事に書かれていることは、特定の予測因子やターゲットにも当てはまり、すべてのケースに通用する真実ではなく、特定のケースに対する具体的な研究なのです。

Maxim Dmitrievsky 2017.10.03 11:45 #4960

Dr.トレーダー

外挿は、学習時に知っている予測値を超えて新しいデータを予測することを意味します。

これは古い写真の一部ですが、緑色の影がついたものはすべて外挿で、この写真から判断すると、フォレストは外挿が可能です。

フォレスト、ニューラルネットワーク、線形モデルのいずれも外挿が可能です。既知の値からかけ離れたデータを与えても、これらのモデルはすべて予測を行いますし、そのような場合のためのアルゴリズムも持っています。

しかし、線形モデルがy=ax+bの式で外挿すると完璧に外挿できるのに、フォレストが最近接を使って外挿すると何もできないと思うのはなぜでしょう？どちらのアルゴリズムも存在する権利があります。SanSanychが言ったように、予測因子とターゲットのセットごとに、モデルを研究し比較することで、初めてそのモデルが外挿を完全に行うかどうかを判断することができます。
ハブラ～の記事に書かれていることは、特定の予測因子やターゲットにも当てはまることで、すべてのケースに通用する真理ではなく、具体的な事例を紹介するものです。

木の研究をすればいいんです。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 496