トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 3339

 
СанСаныч Фоменко #:

見出しだけを読む習慣はやめよう:本はツイッターの投稿ではない。

私はこの本の半分以上を読んでいるので、内容は自分で判断できる。

この本のコードを書くときに使用したパッケージのリストはこちら。

内容的には、この本は「機械学習」と呼ばれるものの問題点と解決策を体系的に提示している。このサイトでは、「機械学習」は通常単なるモデルとして理解されているので、とても役に立つ。

ええ、いい本ですよ。

半分も読んだんだから。

おそらくコードを1行書くことができるでしょう。

一番印象に残っているのは?

P.Z.です。

みんなにこの本を勉強することを勧めるよ。

 
Maxim Dmitrievsky #:
統計学習

kozulは自己宣伝、古いズボンに新しいステッカー。

Maxim Dmitrievsky#:
リサンプリングとcvの後の統計的出力はどこにあるのか?そして最終的な分類器の構築。このトピックを取り上げ、発展させる。これがkozulの基本である。

効率的なモデルの作成、複数のモデルの比較、リサンプリング。次は統計的推論と不偏モデル構築のようなもの。

統計的推論が必要だ。同じRLや他の方法と比較して、ある程度の結果が得られる。

Rで検索:統計的学習、弱い教師あり学習、機能拡張学習。

Kozulは不当な広告であり、古いズボンに新しいステッカーを貼ったものである。

Tulsは効果的なモデルを作成するためのもので、リサンプリングに対して複数のモデルを比較する。次は、統計的推論と不偏的モデル構築のようなものだ。

これは機械学習の標準であり、この本の大部分は、何年も前から多くのツールが発明されてきた、まさにこれらの問題を扱っている。本書のパート3は「効果的なモデルを作成するためのツール」と呼ばれ、以下のような内容となっている:

-10 性能評価のためのリサンプリング

-11 リサンプリングによる モデルの比較

-12 モデルのチューニングとオーバーフィッティングの危険

-13 グリッド探索

-14 反復探索

-15 複数のモデルの表示

さらに第20章"モデルのアンサンブル "があり、最終的なモデルの構築方法が述べられて いる。

我々は統計的な知識を必要とする。

必要ですか?CRAN Task View: 機械学習と 統計学習

10 Resampling for Evaluating Performance | Tidy Modeling with R
10 Resampling for Evaluating Performance | Tidy Modeling with R
  • Max Kuhn and Julia Silge
  • www.tmwr.org
The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases of the modeling process.
 
アンサンブルはすでにコズルに近づいており、少なくとも分散を増やしてバイアスを均等にすることができる。

しかし、予測にはまだ多くのノイズがあります(分散が大きくなるため)。つまり、トレーンのTSでさえ、例えば60%しか利益の出る取引がない。テストでも同じかそれ以下です。

そう、あなたはこのノイズを修正するためにステーキングを始めるでしょう...まあ、試してみてください。
 
Maxim Dmitrievsky #:
これは初心者のためのヒントで、コズールと考える能力が必要です。

ここで、フロントに群がることなく、統計局へ。

この本に従って、最終的なモデルの作り方を論文にしてもらえますか?今、携帯で見れないんだ。

複数の単一学習者の予測を集約して1つの予測にするモデルアンサンブルは、最終的に高性能なモデルを作成することができます。アンサンブルモデルを作成する最も一般的な方法は、バギングBreiman 1996a、ランダムフォレストHo 1995;Breiman 2001a、ブースティングFreund and Schapire 1997)である。これらの方法はそれぞれ、同じタイプのモデル(例えば分類木)の複数のバージョンからの予測を結合する。しかし,アンサンブルを作成する最も初期の手法の1つは,モデル・スタッキング である(Wolpert 1992;Breiman 1996b).

モデル・スタッキングは,任意のタイプの複数のモデルの予測値を結合する.たとえば,ロジスティック回帰,分類木,サポート・ベクトル・マシンは,スタッキング・アンサンブルに含めることができる.

この章では、stacks パッケージを使って 予測モデルをスタックする方法を示します。コンクリート混合物の圧縮強度を予測するために複数のモデルが評価さ れた 第15 章の結果を再利用します。

スタック・アンサンブルを構築するプロセスは次のとおりです:

  1. ホールドアウト予測(リサンプリングによって生成される)のトレーニングセットを組み立てます。
  2. これらの予測をブレンドするモデルを作成する。
  3. アンサンブルの各メンバーについて、元の訓練セットにモデルを適合させる。


20.5 章の まとめ

この章では、より良い予測性能を得るために、異なるモデルをアンサンブルに組み合わせる方法を示しました。アンサンブルを作成するプロセスでは、パフォーマンスを向上させる小さなサブセットを見つけるために、候補モデルを自動的に排除することができます。stacks パッケージには 、リサンプリングとチューニングの結果をメタモデルに結合するための流暢なインターフェイスがあります。



これは筆者の問題意識であるが、複数のモデルを組み合わせる唯一の方法ではない。 Rにはモデルを組み合わせるためのstacksパッケージがある。 例えば、caretEnsemble: Caretモデルのアンサンブル

20 Ensembles of Models | Tidy Modeling with R
20 Ensembles of Models | Tidy Modeling with R
  • Max Kuhn and Julia Silge
  • www.tmwr.org
The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases of the modeling process.
 
アンサンブルとスタッキング、つまり分類器間のブースティングが必要だ。アンサンブルはバイアスを取り除き、スタッキングは分散を取り除く。理論的にはうまくいくが、実際にはやったことがない。また、モデルの数が多くなり、本番では不愉快なことになる。

というのも、本番になると、たくさんのモデルで立ち往生することになるからだ。そして、あなたは1つか2つ欲しい。

それに、常に市場にいる必要はないという問題も解決できない。モデルは常に打ち込むことになる。こうした、言ってみればニュアンスの違いから、開発から実装までのサイクル全体が壊れてしまう。
テスターはテストに手間取り、すべてが遅々として進まなくなる。
 
また、この本ではアンサンブルとスタッキングが混同されているようだ。要するに、普通のアプローチだが、本番ではおかしなことになる。そして、山のようなパッケージを必要としない。

ああ、最も重要なマークアップの問題も解決できない。
 
ウラジミールの記事への最近のリンクのように。これは最も奇妙なTCの作成例だ。多くの作業や変換を行った結果、何もしなくてもランダムな 総当たりで得られるモデルが出力される。面白いけど、非生産的だ。
 
Maxim Dmitrievsky #:
すべてが遅くなる。
Maxim Dmitrievsky#:
また、この本はアンサンブルとスタッキングを混同しているようだ。要するに、これは普通のアプローチだが、本番では綿に なる可能性がある。
Maxim Dmitrievsky#:
最近、ウラジーミルの記事へのリンクを与えたように。最も奇抜な TC作成の例。

どんな綿密さですか?

 
Forester #:

その綿のような感触は何?

スローの対義語
 

コズール、統計的学習、信頼できるAIに戻ることを提案する。

P.Z.

より細かい部分を把握する

理由: