トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

mytarmailS 2022.12.07 11:44 #28301

Aleksey Nikolayev #:

私はこの問題を詳しく研究したことはない。アイデアは単純なようだが、実装方法には技術的に微妙な点が多い。

また、ノイズの多い関数で最大値を求めるとはどういうことかという問題もある。

私が理解した定義では、「ノイズの多い関数を最適化する」というのは、関数が複雑で最大値を見つけるのが難しい、勾配アルゴリズムが適用できない、などの意味です。大雑把に言えば、グローバルな最適化アルゴリズムを適用し、グローバルな最大値を探しに行った...ということだ。

しかし、私は違う見方をしている。ノイズのある関数の最大値を求めたいが、ノイズを取り除いた関数の最大値を求めたいのであって、ノイズのある関数の最大値ではなく、ノイズを取り除いた関数の最大値を求めたいのだ・・・。

(関数もノイズのパラメータもわからないのだから...。

What optimization algorithm can be used to find the maximum in a noisy multidimensional parameter space

2022.12.07
mr.T mr.T 113 6 6 bronze badges
stats.stackexchange.com

I tried several algorithms that seem to be able to handle this, but it didn't work for me. Here is my fitness function which just looks for the max by index

Maxim Dmitrievsky 2022.12.07 11:46 #28302

СанСаныч Фоменко #:

1.Dickの質問は完全に妥当で正しい質問です。私はNSは使いませんが、どのRパッケージのどの関数にも、必ずそのアルゴリズムの作者へのリファレンスが含まれており、本格的なアルゴリズムについては、Rで実装されたアルゴリズムを説明した論文/書籍へのリファレンスが含まれていることを知っています。あなたはNSに精通しているので、もしあなたがRを使っていたなら、Rで対応するNSの種類を検索し、対応するアルゴリズムが記述されているリファレンスを見つけ、アルゴリズムに関する議論を見つけ、専門家のニュアンスをすべて知ることができるでしょう．そして、卑猥なことをつぶやくのではなく、最高のプロフェッショナル・レベルでディックに答えることができる。

2.名前でR：統計とグラフィックスの言語。Rの本質は、その参照装置のルーブリックを明らかにする。

Rのパッケージが扱うトピックの一覧である。トピックのひとつは機械学習である。

以下は MOに関連するパッケージのリストである。

数年前までは、他の専門的な統計言語の中にRの競合を見つけることができた。例えばSPPSなどである。Rはサポートされ、モデレートされた唯一の統計言語であり続け、マイクロソフトのソフトウェアに含まれる膨大な数のミラーがあります。

3.RとPythonを比較するのは全く正当化できない。

Rは特殊な言語である。Pythonは普遍的な言語である。Pythonのユーザー数はRをはるかに凌駕しているが、Pythonのマスユーザーはウェブデザインである。Pythonに統計パッケージがあるという事実は、Pythonを統計言語として分類することを許さない。その点、RとPythonの両方で使用されているパッケージが実装されているC++は、統計言語として分類することができる。その詳細なルーブリックと提案された関数のアルゴリズムへの参照により、Rは統計の理論と実践の研究に使用できるが、Pythonは使用できない。

機械学習は、古典的な統計学と比較して、トレーディングにおいてより多くの可能性を与えてくれる。

そして、MOバイブルはPythonのために非常によく開発されています。だから、これらの事実を議論し、お互いに何かを証明することは無意味である。

私の理解では、Rは学生や教授や趣味人のためのものです。だから、お互いに引用し合って、何かを自慢することができる。教授向け、多分教える教授もいる。Pythonは本格的なプロジェクトやプロダクション向け。Rで大規模なMOプロジェクトを立ち上げたという話は聞いたことがない。

СанСаныч Фоменко 2022.12.07 14:27 #28303

Maxim Dmitrievsky #:

機械学習はトレーディングにおいて、古典的な統計学と比較して、より多くの可能性を与えてくれる。

そして、MOバイブルはpythonのために非常によく開発されている。だから、これらの事実を議論し、お互いに何かを証明することは無意味である。

私の理解では、Rは学生や教授や趣味人のためのものです。だから、お互いに引用し合って、何かを自慢することができる。教授向け、多分教える教授もいる。Pythonはシリアスなプロジェクトやプロダクション向け。Rで大規模なMOプロジェクトを立ち上げたという話は聞いたことがない。

なぜあなた自身が知らないと言っていることについて議論しているのですか？

マイクロソフトは、Rを多くの開発者による大規模なプロジェクト開発のためのツールにするために、いくつかの努力をしている。

以下は、Rで作業できるようにするマイクロソフトの製品/サービスのリストである。
。

Microsoft R Server / R Server for Azure HDInsight
データサイエンスVM
Azureマシンラーニング
SQL Server Rサービス
Power BI
Visual Studio用Rツール

Microsoft R Serverエコシステムは、どのような趣味の人、どのような教授に必要なのでしょうか？

そして、あらゆるものを統合できるVM仮想マシン？

そして機械学習パッケージや共同開発ツールを備えたAzuraクラウドサービス？

Rは今や、マイクロソフトが自社やマイクロソフト以外の開発に統合した産業用システムだ。

そして、あなたは "アマチュア向け "なのだ...。

Machine learning in trading:

Maxim Dmitrievsky 2022.12.07 14:40 #28304

СанСаныч Фоменко #:

なぜ、あなた自身がわからないと言っていることについて憶測で語るのか？

マイクロソフトは、Rを多くの開発者が大規模なプロジェクトを開発できるツールにするために、いくつかの努力をしている。

以下は、Rで作業できるようにするマイクロソフトの製品/サービスのリストだ。
。

Microsoft R Server / R Server for Azure HDInsight
データサイエンスVM
Azureマシンラーニング
SQL Server Rサービス
Power BI
Visual Studio用Rツール

Microsoft R Serverエコシステムは、どのような趣味の人、どのような教授に必要なのでしょうか？

そして、あらゆるものを統合できるVM仮想マシン？

そして、機械学習パッケージと共同開発ツールを備えたAzuraクラウドサービス？

Rは今や、マイクロソフトが自社やマイクロソフト以外の開発に統合した産業用システムだ。

そして、あなたは "アマチュア向け "なのだ...。

"そこに何かがある "のは明らかだ。

私は、少なくともロシアでは、大規模なものも含めて、実装者とコミュニケーションした経験から話している。

彼らは皆、パイソンでやっていた。

マイクロソフトはC#とAsureで機械学習用のSDKを持っていますが、誰も使っていません。

Rで大きなプロジェクトを作り、サーバーに置く。なぜなら、そのような量のスペシャリストはいないし、1つの統計のためにRを学ぼうとする人もいないからだ。

パイソンなら、ソーセージ1本で学生を雇えばいい。

"誰も "というのは、誰もRで書かないという意味だ。なぜならパイソンがあるからだ。

そして、あなたはtraddunsをRで書くように駆り立てる。

Aleksey Nikolayev 2022.12.07 14:45 #28305

mytarmailS #:

ノイズの多い関数で最大値を求めるとはどういうことかという問題もあるが...。

私が理解した定義では、「ノイズの多い関数の最適化」とは、関数が複雑で、その中で最大値を見つけるのが難しい、勾配アルゴリズムが適用できない、などの意味です。大雑把に言えば、大域的最適化アルゴリズムを適用し、大域的最大値を探索する...ということだ。

ノイジーな関数の最大値ではなく、ノイズを除去した関数の最大値を求めたいのです。

(しかも、関数もノイズのパラメータもわからないのだから、簡単なことではない。

ノイズに関する先験的な情報が必要なのだ。さらに、加法的、乗法的、あるいは他の何かといったノイズの明確なマトモデルが必要です。モデルなしではフィルターは作れない。そして、このモデルは実際のデータに近いものでなければならない。

おそらく、2次元や3次元のデータを扱うジオデータの処理方法に目を向けるべきだろう。jpg画像のようなフーリエ変換や、jpgの新バージョンのようなウェーブレット、多次元スプラインなどだ。

Aleksey Nikolayev 2022.12.07 14:56 #28306

Maxim Dmitrievsky #:

戦って探す-見つけて隠す」というスローガンを引用したい。

カスタムメトリック、特にこれらの標準的なメトリックとして任意の基準を設定します。それでもloglossで最適化されるが、これらのカスタム基準で止まる。

というのも、同じブースティングで止まるのは、常に精度のようなキャスト基準に基づいているからだ。

今のところ、こんな感じかな。カスタム基準でツリーを刈り込むこともできる。

Aleksey Nikolayev 2022.12.07 15:08 #28307

Maxim Dmitrievsky #:

ある」ことは明らかだ。

私は、少なくともロシア連邦では、大企業を含む実施者とコミュニケーションをとった経験から話している

すべてはPythonで行われた

マイクロソフトはC#とAsureで機械学習用のSDKを持っているが、誰も使っていない。

だから、あなたはRで大きなプロジェクトを作り、サーバーに置いた。なぜなら、そのような大規模なプロジェクトにはスペシャリストがいないし、たった一つの統計のためにRを学ぼうとする人もいないからだ。

パイソンなら、ソーセージ1本で学生を雇えばいい。

"誰も "というのは、Rで文章を書く人は誰もいない、という意味だ。なぜならパイソンがあるからだ。

そして、あなたはtraddunsをRで書くように駆り立て、彼らが無駄な言語に時間を費やすように仕向ける。

RFは悪い例で、matstatの意味で非常に眠っているからだ。私たちのフォーラムには技術者がたくさんいるが、彼らのほとんどはmatstatについて極めて稚拙な考えを持っている。ソ連時代からの深刻な解決策は、国内で開発されるよりも、むしろ海外で既製品を購入することの方が多いのだ。

mytarmailS 2022.12.07 15:08 #28308

Aleksey Nikolayev #:

ノイズに関する先験的な情報が必要であることは正解である。さらに、ノイズの明確な数学的モデル（加法性、乗法性、その他）が必要です。モデルなしではフィルターは作れません。そしてこのモデルは実際のデータに近いものでなければならない。

おそらく、2次元や3次元のデータを扱うジオデータの処理方法に目を向けるべきだろう。jpg画像のようなフーリエ変換や、jpgの新バージョンのようなウェーブレット、多次元スプラインなどだ。

どんな分解でも、PCAでも、問題なくモデルを作ることができる。

しかし、データは存在せず、未知の関数であり、しかも多次元である。

データはすべてAOの検索結果の散らばった点である（保存すればの話だが）。

時系列ではないし、構造も秩序もない。

Maxim Dmitrievsky 2022.12.07 15:20 #28309

Aleksey Nikolayev #:

RFは悪い例で、matstatという意味では極めて愚かだからだ。私たちのフォーラムには技術者が大勢いるが、彼らのほとんどはmatstatに関して極めて稚拙な考えを持っている。ソ連時代の深刻な解決策は、国内で開発されるよりもむしろ、海外で既製品を購入することの方がはるかに多い。

エクセルの方が後々役に立つだろう。

Aleksey Nikolayev 2022.12.07 15:27 #28310

mytarmailS #:

どんな分解でも、PCAでも、問題なくモデルを作ることができる。

しかし、データは存在しないし、未知の関数だし、多次元だし...。

データは、AO探索で得られた散在点である（保存しておけば）。

時系列ではないし、構造も秩序もない。

まず思いつくのは、大きすぎず小さすぎないセル（大きさはノイズモデルによって決定される）を持つグリッドで空間を分割することだ。いくつかの（例えばランダムに選ばれた）セルから始めて、その中のいくつかの点で平滑化関数の勾配の方向を決定し、次のセルに移動し、遷移やループがなくなるまでそれを繰り返す。極限の位置はセルの大きさに合わせて正確に設定されるので、大きすぎてはいけないが、同時に平滑化の可能性を与えるものでなければならないので、小さすぎてもいけない。また、極限の位置は平滑化の方法によって変わるので、原理的に厳密な位置は存在しないという事実を受け入れなければならない。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 2831