トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

削除済み 2023.11.23 09:46 #33381

СанСаныч Фоменко #:

見出しだけを読む習慣はやめよう：本はツイッターの投稿ではない。

私はこの本の半分以上を読んでいるので、内容は自分で判断できる。

この本のコードを書くときに使用したパッケージのリストはこちら。

内容的には、この本は「機械学習」と呼ばれるものの問題点と解決策を体系的に提示している。このサイトでは、「機械学習」は通常単なるモデルとして理解されているので、とても役に立つ。

ええ、いい本ですよ。

半分も読んだんだから。

おそらくコードを1行書くことができるでしょう。

一番印象に残っているのは？

P.Z.です。

みんなにこの本を勉強することを勧めるよ。

СанСаныч Фоменко 2023.11.23 10:46 #33382

Maxim Dmitrievsky #:
統計学習

kozulは自己宣伝、古いズボンに新しいステッカー。

Maxim Dmitrievsky#:
リサンプリングとcvの後の統計的出力はどこにあるのか？そして最終的な分類器の構築。このトピックを取り上げ、発展させる。これがkozulの基本である。

効率的なモデルの作成、複数のモデルの比較、リサンプリング。次は統計的推論と不偏モデル構築のようなもの。

統計的推論が必要だ。同じRLや他の方法と比較して、ある程度の結果が得られる。

Rで検索：統計的学習、弱い教師あり学習、機能拡張学習。

Kozulは不当な広告であり、古いズボンに新しいステッカーを貼ったものである。

Tulsは効果的なモデルを作成するためのもので、リサンプリングに対して複数のモデルを比較する。次は、統計的推論と不偏的モデル構築のようなものだ。

これは機械学習の標準であり、この本の大部分は、何年も前から多くのツールが発明されてきた、まさにこれらの問題を扱っている。本書のパート3は「効果的なモデルを作成するためのツール」と呼ばれ、以下のような内容となっている：

-10 性能評価のためのリサンプリング

-11 リサンプリングによるモデルの比較

-12 モデルのチューニングとオーバーフィッティングの危険性

-13 グリッド探索

-14 反復探索

-15 複数のモデルの表示

さらに第20章"モデルのアンサンブル "があり、最終的なモデルの構築方法が述べられている。

我々は統計的な知識を必要とする。

必要ですか？CRAN Task View: 機械学習と統計学習

10 Resampling for Evaluating Performance | Tidy Modeling with R

Max Kuhn and Julia Silge
www.tmwr.org

The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases of the modeling process.

Maxim Dmitrievsky 2023.11.23 11:05 #33383

アンサンブルはすでにコズルに近づいており、少なくとも分散を増やしてバイアスを均等にすることができる。

しかし、予測にはまだ多くのノイズがあります（分散が大きくなるため）。つまり、トレーンのTSでさえ、例えば60％しか利益の出る取引がない。テストでも同じかそれ以下です。

そう、あなたはこのノイズを修正するためにステーキングを始めるでしょう...まあ、試してみてください。

СанСаныч Фоменко 2023.11.23 11:09 #33384

Maxim Dmitrievsky #:
これは初心者のためのヒントで、コズールと考える能力が必要です。

ここで、フロントに群がることなく、統計局へ。

この本に従って、最終的なモデルの作り方を論文にしてもらえますか？今、携帯で見れないんだ。

複数の単一学習者の予測を集約して1つの予測にするモデルアンサンブルは、最終的に高性能なモデルを作成することができます。アンサンブルモデルを作成する最も一般的な方法は、バギング（Breiman 1996a）、ランダムフォレスト（Ho 1995;Breiman 2001a）、ブースティング（Freund and Schapire 1997）である。これらの方法はそれぞれ、同じタイプのモデル（例えば分類木）の複数のバージョンからの予測を結合する。しかし，アンサンブルを作成する最も初期の手法の1つは，モデル・スタッキング である(Wolpert 1992;Breiman 1996b)．

モデル・スタッキングは，任意のタイプの複数のモデルの予測値を結合する．たとえば，ロジスティック回帰，分類木，サポート・ベクトル・マシンは，スタッキング・アンサンブルに含めることができる．

この章では、stacks パッケージを使って予測モデルをスタックする方法を示します。コンクリート混合物の圧縮強度を予測するために複数のモデルが評価された第15 章の結果を再利用します。

スタック・アンサンブルを構築するプロセスは次のとおりです：

ホールドアウト予測（リサンプリングによって生成される）のトレーニングセットを組み立てます。
これらの予測をブレンドするモデルを作成する。
アンサンブルの各メンバーについて、元の訓練セットにモデルを適合させる。

20.5 章のまとめ

この章では、より良い予測性能を得るために、異なるモデルをアンサンブルに組み合わせる方法を示しました。アンサンブルを作成するプロセスでは、パフォーマンスを向上させる小さなサブセットを見つけるために、候補モデルを自動的に排除することができます。stacks パッケージには、リサンプリングとチューニングの結果をメタモデルに結合するための流暢なインターフェイスがあります。

これは筆者の問題意識であるが、複数のモデルを組み合わせる唯一の方法ではない。 Rにはモデルを組み合わせるためのstacksパッケージがある。例えば、caretEnsemble: Caretモデルのアンサンブル。

20 Ensembles of Models | Tidy Modeling with R

Max Kuhn and Julia Silge
www.tmwr.org

The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases of the modeling process.

Machine learning in trading:

Maxim Dmitrievsky 2023.11.23 11:11 #33385

アンサンブルとスタッキング、つまり分類器間のブースティングが必要だ。アンサンブルはバイアスを取り除き、スタッキングは分散を取り除く。理論的にはうまくいくが、実際にはやったことがない。また、モデルの数が多くなり、本番では不愉快なことになる。

というのも、本番になると、たくさんのモデルで立ち往生することになるからだ。そして、あなたは1つか2つ欲しい。

それに、常に市場にいる必要はないという問題も解決できない。モデルは常に打ち込むことになる。こうした、言ってみればニュアンスの違いから、開発から実装までのサイクル全体が壊れてしまう。

テスターはテストに手間取り、すべてが遅々として進まなくなる。

Maxim Dmitrievsky 2023.11.23 11:22 #33386

また、この本ではアンサンブルとスタッキングが混同されているようだ。要するに、普通のアプローチだが、本番ではおかしなことになる。そして、山のようなパッケージを必要としない。

ああ、最も重要なマークアップの問題も解決できない。

Maxim Dmitrievsky 2023.11.23 11:38 #33387

ウラジミールの記事への最近のリンクのように。これは最も奇妙なTCの作成例だ。多くの作業や変換を行った結果、何もしなくてもランダムな総当たりで得られるモデルが出力される。面白いけど、非生産的だ。

Forester 2023.11.23 12:55 #33388

Maxim Dmitrievsky #:
すべてが遅くなる。

Maxim Dmitrievsky#:
また、この本はアンサンブルとスタッキングを混同しているようだ。要するに、これは普通のアプローチだが、本番では綿になる可能性がある。

Maxim Dmitrievsky#:
最近、ウラジーミルの記事へのリンクを与えたように。最も奇抜な TC作成の例。

どんな綿密さですか？

Maxim Dmitrievsky 2023.11.23 13:06 #33389

Forester #:

その綿のような感触は何？

スローの対義語

削除済み 2023.11.27 02:09 #33390

コズール、統計的学習、信頼できるAIに戻ることを提案する。

P.Z.

より細かい部分を把握する

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 3339

20.5 章の まとめ

20.5 章のまとめ