トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Maxim Dmitrievsky 2023.08.19 15:24 #31861

起こったことの意味がまったく理解できなかったが、これは私にとって普通の精神状態だ。

Rorschach 2023.08.19 18:05 #31862

fxsaber #:.

ZЫ 一般的に、2つの行の違いを見つけようとする興味があれば、それを提供することができる。

私があなたに書いたものを見てください。私自身は秋にしか見ることができません。

Aleksey Vyazmikin 2023.08.19 20:54 #31863

Aleksey Nikolayev #

フォレスター

ったな。

列の内容の説明

Generation - the number of random generation of the target with a fixed number of "1" and "0", the last line - the original target
すべての類似度 - ターゲットの類似度のパーセンテージを示す。
度」の度 "1度" - ターゲ度 "度 "の度 "度 "の度 "度 "の度 "度 "の度 "度 "度 "度 "度 "度 "度 "度 "度 "度 "度
% Similarity "0" - the percentage of similarity of the target is given, but only for a response of "0".
ー870の量子テーブルとー6533述語をー
度（度（度Q_All% - オリジ度Q_Allが度(度)
度（度（度（度Q_度Q_度Q_度Q_度Q_度Q_度Q_度Q_度Q_度Q_度Q_度Q_度Q_度Q_度Q_度Q_度Q_度Q）
selected%-Q_Allの度（度(度)-Q_Allの度(度)です。度(度)
Predictors - サンプルからいくつの予測因子について、指定された条件を満たす量子セグメントを見つけることができたかを示します。
Predictors % - サンプルから何個の "Predictors "が選択されたか。

説明すると、1つの予測値に対して複数の量子セグメントを選択することができ、これらのセグメントは予測値の範囲内で重複してはならない。

私が気に入らないのは、ターゲットの50％近傍がそのままになっていることで、これは結果の評価に悪影響を及ぼす可能性がある。

実際、かなり多くの量子セグメントがランダムなターゲットで見つかったが、それらはいくつかのクラスター（おそらく）であったため、異なるテーブルがそれらの座標をオーバーラップさせた。そのため、オーバーラップしない範囲を選択した後、これらの量子セグメントの品質（ユーティリティ）は、元のものよりも10倍悪い（少ない）ことが判明した。従って、オリジナルのターゲットを持つサンプルでは、平均して、異なる予測因子に対して量子カットが3.5倍多く発見された。

この結果をどう思いますか？

追加しました：

ランダムターゲットとオリジナルターゲットのバイナリ配列プロットは以下のようになります。

Machine learning in trading: A probability theory problem a trading strategy based

Forester 2023.08.19 21:12 #31864

Aleksey Vyazmikin #:

GIFを公開したサンプルで実験を行ったところ、すでに47％のユニットがサンプルに含まれていた。

列の内容の説明

生成 - "1 "と "0 "を固定したターゲットのランダム生成数、最後の行 - オリジナルのターゲット。
すべての類似度 - ターゲットの類似度のパーセンテージが指定される。
類似度 "1" - ターゲットの類似度のパーセンテージが指定されるが、レスポンス "1 "のみ。
類似度 "0" - 対象の類似度のパーセンテージが指定されますが、応答 "0" の場合のみです。
Q_All - 870の量子テーブルと6533の述語を使って、いくつの量子セグメントが見つかったか。
Q_All% - オリジナルのターゲットとのサンプルの割合として、いくつの "Q_All "があったかを示します。
Q sampled - サンプリングされた量子セグメントの数。
Q selected% - 元ターゲットを持つサンプルから何個の "Q selected "が選択されたかをパーセンテージで表示します。
Predictors - サンプルからいくつの予測因子について、指定された条件を満たす量子セグメントを見つけることができたかを示します。
Predictors % - サンプルから何個の "Predictors "が選択されたか。

説明すると、1つの予測値に対して複数の量子セグメントを選択することができ、これらのセグメントは予測値の範囲内で重複してはならない。

私が気に入らないのは、ターゲットの50％近傍がそのままになっていることで、これは結果の評価に悪影響を及ぼす可能性がある。

実際、かなり多くの量子セグメントがランダムなターゲットで見つかったが、それらはいくつかのクラスター（おそらく）であったため、異なるテーブルがそれらの座標をオーバーラップさせた。そのため、オーバーラップしない範囲を選択した後、これらの量子セグメントの品質（ユーティリティ）は、元のものよりも10倍悪い（少ない）ことが判明した。従って、オリジナルのターゲットを持つサンプルでは、平均して、異なる予測因子に対して量子カットが3.5倍多く発見された。

この結果についてどう思いますか？

アレクセイに質問です。私は統計理論に強いわけではありません。世代の代わりにターゲットを混ぜることを提案しただけです。

Aleksey Vyazmikin 2023.08.19 21:18 #31865

Forester #:
アレクセイに質問です。私は統計理論が得意ではありません。ただ、世代ではなく対象を混ぜることを提案しただけだ。

なるほど。

フォレスト構築のプロセスをもっと管理しやすくして、各ツリーのルートとして選択された量子セグメントの特定のサブサンプルを取ったらどうでしょう？

深さを2～3分割程度にして、葉によって分類可能なクラスの例が少なくとも1％になるようにします。

そうすれば、より安定したモデルになると思います。

Aleksey Nikolayev 2023.08.20 03:55 #31866

Aleksey Vyazmikin #:

GIFを公開したサンプルで実験を行ったところ、すでに47％のユニットがサンプルに含まれていた。

列の内容の説明

生成 - "1 "と "0 "を固定したターゲットのランダム生成数、最後の行 - オリジナルのターゲット。
すべての類似度 - ターゲットの類似度のパーセンテージが指定される。
類似度 "1" - ターゲットの類似度のパーセンテージが指定されるが、レスポンス "1 "のみ。
類似度 "0" - 対象の類似度のパーセンテージが指定されますが、応答 "0" の場合のみです。
Q_All - 870の量子テーブルと6533の述語を使って、いくつの量子セグメントが見つかったか。
Q_All% - オリジナルのターゲットとのサンプルの割合として、いくつの "Q_All "があったかを示します。
Q sampled - サンプリングされた量子セグメントの数。
Q selected% - 元ターゲットを持つサンプルから何個の "Q selected "が選択されたかをパーセンテージで表示します。
Predictors - サンプルからいくつの予測因子について、指定された条件を満たす量子セグメントを見つけることができたかを示します。
Predictors % - サンプルから何個の "Predictors "が選択されたか。

説明すると、1つの予測値に対して複数の量子セグメントが選択可能で、これらのセグメントは予測値の範囲内で重複してはならない。

私が気に入らないのは、ターゲットの50％近傍がそのままになっていることで、これは結果の評価に悪影響を及ぼす可能性がある。

実際、かなり多くの量子セグメントがランダムなターゲットで見つかったが、それらはいくつかのクラスター（おそらく）であったため、異なるテーブルがそれらの座標をオーバーラップさせた。そのため、オーバーラップしない範囲を選択した後、これらの量子セグメントの品質（ユーティリティ）は、元のものよりも10倍悪い（少ない）ことが判明した。従って、オリジナルのターゲットを持つサンプルでは、平均して、異なる予測因子に対して量子カットが3.5倍多く発見された。

この結果をどう思いますか？

追加しました：

ランダムターゲットとオリジナルターゲットのバイナリ配列プロットは以下のようになります。

統計的に有意な結果を得るには数千回のシミュレーションが必要です。

また、特定のケースについて専門家の意見を述べる用意はないが、考えられる問題とそれを解決する一般的な方法を指摘しただけである。

Maxim Dmitrievsky 2023.08.20 04:06 #31867

Aleksey Vyazmikin #:

この結果をどう思いますか？

追加しました：

ターゲット・ランダムとオリジナルのバイナリ配列グラフは以下のようになる。

あなたは無意味で執拗なナンセンスなことをしている。セイバーは少なくとも30分で起きて忘れてしまった。

Aleksey Vyazmikin 2023.08.20 04:13 #31868

Aleksey Nikolayev #:

統計的に有意であるためには何千ものシミュレーションが必要なのだ。

また、私は特定のケースについて専門家の意見を述べる用意はなく、考えられる問題と一般的な解決方法を指摘しただけである。

数千回-計算資源がかかりすぎる-1パス-約40分-ビデオカードでの基本的な計算。

私は一般的に、このテストは予測器の異なる範囲におけるそのようなクラスターの可能性をチェックすることしかできないと考えた。

そして、最初に選択した量子セグメントの特定の範囲にヒットする確率を見る必要がある。

また、このようなテストの信頼性のために、パーセンテージ表現におけるターゲットの差の問題についての意見を聞きたいと思います。

Aleksey Vyazmikin 2023.08.20 04:15 #31869

Maxim Dmitrievsky #:
あなたは無意味で執拗なナンセンスなことをしている。セイバーは少なくとも30分でそうなって忘れてしまった。

他人のパフォーマンスに対する評価は、特に相手のやっていることを理解していないときには、自分の胸にしまっておくことだ。

私は建設的な批評を受け入れるが、あなたからは何も出てこない。

Maxim Dmitrievsky 2023.08.20 04:20 #31870

Aleksey Vyazmikin #:

他人のパフォーマンスに対する評価は、特に相手のやっていることが理解できないときには、自分の胸にしまっておくこと。

私は建設的な批評を受け入れるが、あなたはそうではない。

あなたはでたらめをやっている。適当にやってもどんな結果も出ると何度か書かれている。目を開けて見なさい。付け加えることは何もない)

少なくとも、自分が何をしているのか、なぜそうするのか、理解できますか？）

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 3187