トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Aleksey Vyazmikin 2023.05.23 11:56 #30811

Maxim Dmitrievsky #:
本業はセラピストですか？いいえ、フルタイムのセラピストです。

ええ、クライアントを探しているんですが、契約しませんか？

実際、あなたは批判を受け入れない。あなたは自分がやっていることと似たようなことを見た - サンプルの不快な部分をフィルタリングすることで、あなたの考えによれば、あなたのアプローチに科学性を与え、今それを擁護している。あなたがそれを擁護する方法のひとつは、相手を中傷したり侮辱したりして攻撃することだ。私は、この問題で進歩があったこと、つまりあなたがより抑制的になったことは認める。

同時に、私が提案した共同活動、つまり研究対象に関する知識を深めることを目的とした建設的な提案について、あなたはそれをテーマから逸脱していると言う。

このスレッドのテーマとは何か--個々の参加者の心の美しさと独自性を示すことなのか？つまり、真実を探求するのではなく、ベラベラしゃべることだとあなたはお考えなのでしょうか？

Aleksey Vyazmikin 2023.05.23 14:47 #30812

Maxim Dmitrievsky #:
そうでなければ書かない。そうでないなら書かない。。

勉強してから議論しよう。できないなら-怒らない。咀嚼して口に入れるのは他人のためだ。

マキシム、先ほどなんとか手に入れた翻訳を投げた。そこから率直に言って、私はサンサニッチ・フォメンコと同じような結論に達した。私はそれが歪曲された翻訳であることを認める、そこに物事の多くはちょうど奇妙に聞こえるように、その後、彼らはサンプリング処理であり、その後、指標のフィッティング....

だから私は、誰も理解できなかったことを、あなた自身の言葉で、少なくともこれらの言葉で説明することを提案します。そうすれば、書かれた情報を違うように受け止められるかもしれない。

以下は翻訳からの抜粋だが、すべて理解できただろうか？

Lilita Bogachkova 2023.05.23 15:35 #30813

СанСаныч Фоменко #:

記事には載っていない。

クロス検証を含む、元の予測変数の異なる分割による通常のフィッティングが記述されている。言葉でカモフラージュされたルーチン。

機械学習通の方に質問です。あるキャラクターのデータをトレーニングに使い、別のキャラクターのデータを検証に使い、3番目のキャラクターのデータをテストに使う場合、これは良いやり方でしょうか？

また、テストデータから以下の結果を得ています：緑のセルは非常に良い、黄色のセルは良い、赤のセルは平均です。

また、モデルをトレーニングするためにデータを修正することについても質問があります。
。そこで、私はトレーニングデータから60以上40未満の値を見つけ、それをモデルに入力する前にトレーニングデータに追加しています。そこで質問ですが、極値に関する情報を含むトレーニングデータを増やすことで、モデルの精度を向上させることはできますか？

inputs_unique, indices = np.unique(inputs, axis=0, return_index=True)
outputs_unique = outputs[indices]

#  Find indices where outputs_unique values are greater than 60
indices_greater_than_60 = np.where(outputs_unique > 0.6)

#  Get the corresponding inputs_unique and outputs_unique values
filtered_inputs_greater = inputs_unique[indices_greater_than_60]
filtered_outputs_greater = outputs_unique[indices_greater_than_60]

#  Add filtered_inputs values to inputs_unique
inputs_unique = np.concatenate((inputs_unique, filtered_inputs_greater), axis=0)
#  Add filtered_outputs values to outputs_unique
outputs_unique = np.concatenate((outputs_unique, filtered_outputs_greater), axis=0)

#  Find indices where outputs_unique values are smaller than 40
indices_smaller_than_40 = np.where(outputs_unique < 0.4)

#  Get the corresponding inputs_unique and outputs_unique values
filtered_inputs_smaller = inputs_unique[indices_smaller_than_40]
filtered_outputs_smaller = outputs_unique[indices_smaller_than_40]

#  Add filtered_inputs values to inputs_unique
inputs_unique = np.concatenate((inputs_unique, filtered_inputs_smaller), axis=0)
#  Add filtered_outputs values to outputs_unique
outputs_unique = np.concatenate((outputs_unique, filtered_outputs_smaller), axis=0)

mytarmailS 2023.05.23 16:54 #30814

ML、DMに関する良書

https://mhahsler.github.io/Introduction_to_Data_Mining_R_Examples/book/introduction.html

Chapter 1 Introduction | An R Companion for Introduction to Data Mining

Michael Hahsler
mhahsler.github.io

1.1 Used Software This companion book assumes that you have R and RStudio Desktop installed and that you are familiar with the basics of R, how to run R code and install packages. If you are new...

Maxim Dmitrievsky 2023.05.23 18:10 #30815

mytarmailS 2023.05.24 08:47 #30816

Lilita Bogachkova #:

機械学習の専門家に質問があります。あるキャラクターのデータをトレーニングに使い、別のキャラクターのデータを検証に使い、3人目のキャラクターのデータをテストに使うとしたら、これは良いやり方でしょうか？

簡単に言うとNOです。

スイカを認識するようにモデルを訓練し、リンゴでテストし、...で検証する。

Rorschach 2023.05.24 09:20 #30817

Lilita Bogachkova #:

機械学習の専門家に質問があります。ある人物のデータをトレーニングに使い、別の人物のデータを検証に使い、3人目の人物のデータをテストに使うとしたら、これは良いやり方でしょうか？

同じ記号にノイズを加えて使ってみてください。

mytarmailS 2023.05.24 09:44 #30818

Rorschach #:

同じキャラクターにノイズを加えて使ってみてください。

刻みでなければ時間をずらした方がいいと思う、

ノイズはデータを歪めるし、ノイズにはパラメータがあり、どれを選べばいいのかわからない。

Aleksey Vyazmikin 2023.05.24 12:26 #30819

Maxim Dmitrievsky #:

厄介なパラメーターを関数に変えるには、記事のようにRFや基本的なアルゴリズムの出力値を使えばいい。まったく知識がない人のために：選択したパラメータの値を関数の値に置き換えてください。そして、線形回帰（または他のアルゴリズム）が、トリットメント効果が評価されるメタ・ラーナーとなります。なぜ、そしてどのようにこれが機能するのか - 数学を学ぼう。

それを理解するには、頭で考え始めるだけで十分である。しかし、サンシュはまたナンセンスなことを言い始めるだろう。何も考えずに何かを言いたいだけだからだ。サンシュ、あなたの理解力の欠如は、RFパラメータを何らかの証拠として引き合いに出すほどだが、それは絶対に信じられないことだ。RFのことは忘れてください。トピックを勉強してからわめきなさい。そうでなければ、同じように勉強していない人たちがあなたを盲目的に信じてしまう。

そして、知ったかぶりで私の投稿に反応しないでください（迷惑です）。なぜなら、あなたは何も知らないし、プトゥシュニクの戯言のように見えるからです。

出典の参照はすべて記事中に示されている。盲目の子猫のように一言一句つつかれる必要があるのか？それとも大人なのか？

あなたこそ何か別のものを引用しているようだが...。

我々はモデルをうまく訓練し、自然発生的な予測因子を取り出し、モデルによって予測された値に置き換えた。その結果を回帰モデル／データのRMSEで比較する。もし結果が改善されたなら、置き換えられた予測変数がトレーニング期間中にその特性を変えたということでしょうか？

Aleksey Vyazmikin 2023.05.24 12:36 #30820

Lilita Bogachkova #:

機械学習の専門家に質問があります。ある人物のデータをトレーニングに使い、別の人物のデータを検証に使い、3人目の人物のデータをテストに使うとしたら、これは良いやり方でしょうか？

また、テストデータから次のような結果が得られます：緑のセルは非常に良い、黄色のセルは良い、赤のセルは平均的。

私は専門家ではありませんが、私の考えをお話します。

異なるキャラクターでうまく動作するモデルを手に入れることができる人はほとんどいない。だから、もし本当にそうであれば、良い成果だと考えることができる。私は、モデルが確率的に等しく実現するパターンを見ていると仮定します。

Lilita Bogachkova#：

モデルを訓練するためにデータを修正することについての質問です。
。そこで、私は学習データから60以上40未満の値を見つけ、さらにそれをモデルに入力する前に学習データに追加し直しています。そこで質問なのですが、極値に関する情報を含む学習データを増やすことで、モデルの精度を向上させることは可能でしょうか？

より多くのサンプルを追加すれば、モデルはその中に統一されたパターンを見つけるかもしれません。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 3082