トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1709

 
アレクセイ・ニコラエフ

実験がないとダメなんです。私が理解する限り、主なアイデアは、単に実験に使用できる物質のリストを大幅に削減することです。この研究について、生物学に重点を置き、手口の詳細は省き、より賢明なロシア語の説明へのリンク はこちらです。

AIの全能感や万能薬が近いという「バブリー」な熱狂はなく、科学的で良い記事。自然がいかに「厄介」であるか、そしてその鍵をすでに見つけたと思うことがいかに甘いかを示している。そして、今...

MOを使って、膨大な化合物の "ライブラリー "と、異なる菌株に対する効果のデータから、適切な選択肢を見つけることに成功した結果です。しかし、これはほとんど孤立した結果であり、今後同様の勝利を保証するものではありません。なぜ?- MOEは統計的、確率的なアプローチを用いているため。それ以外の用途では、この検索は全く成功しないかもしれません。

私は、微生物の複製の一般原理を学び、特定の株で選択的にブロックするためのツールを作ることに焦点を当てたいと思います。これが、知的アプローチと統計的・確率的アプローチの違いです(つまり、普遍的な解決策と特定の解決策の違いです)。

 
ロイター・コノウ

AIの全能感や万能薬が近いという「バブリー」な熱狂はなく、科学的で良い記事。自然がいかに「狡猾」であるか、そして、その鍵をすでに見つけたと思い込んでいる人間がいかに世間知らずであるかを示している...

MOを使って、膨大な化合物の "ライブラリ "と、異なる菌株に対する効果に関するデータから、適切な選択肢を見つけることに成功した結果です。しかし、これはほとんど孤立した結果であり、今後同様の勝利を保証するものではありません。なぜ?- MOEは統計的、確率的なアプローチを用いているため。それ以外の用途では、この検索は全く成功しないかもしれません。

私は、微生物の複製の一般原理を学び、特定の株で選択的にブロックするためのツールを作ることに焦点を当てたいと思います。これが、知的アプローチと統計的・確率的アプローチの違いです(つまり、普遍的な解決策と特殊な解決策)。

DNA1分子のレベルでは、量子効果が避けられないが、これは本質的に確率的なものであり、理論家やマットスタットなしには原理的に考えることができない。そして、臨床試験に至るまで、より高いレベルにおいて、これらの科学は不可欠なものとなっています。したがって、本研究で用いたような方法は、生物学にとって決して異質なものではなく、in silico(in vivoやin vitroと同様)という造語さえ生まれているのである。

 
アレクセイ・ニコラエフ

DNA1分子のレベルでは、量子効果が不可避であり、それは本質的に確率的なもので、理論家とマットスタットなしには原理的に考えられないものである。そして、臨床試験に至るまで、より高いレベルにおいて、これらの科学は不可欠なものとなっています。したがって、本研究で用いたような方法は、生物学にとって決して異質なものではなく、in silico(in vivoとin vitroの類似)という言葉さえ生まれているのである。

そうそう、私も「禅」の記事で、DNAが突然変異を起こす際の量子の「ゆらぎ」についての記事に気づきました。確かにMOは、多くの研究分野で有効なツールです。しかし、個人的には、MOはAIではないので、混同してはいけないと気づきました。AIは絶対的な解を探し、MOは私的な解を探します。仕事のやり方が全く違うし、MOがAIに「成長」することはない。

 
good evening, any advice for a newbie...


EAを購入した場合(5枚)、その後のアップデートは全て可能ですか? 5枚全てに無料で提供されますか?

 
アレクセイ・ニコラエフ

ヘーゲルの絶対イデアをどう考えるか)

よくわからない、覚えていない :) 今はキリスト教にハマっていて、パズルを解いています。
 
3565832:
good evening, can you advise a newbie-...


EAを購入した場合(5枚)、その後のアップデートはすべて可能ですか? 5枚すべてで無料になるのでしょうか?

はい
 
Maxim Dmitrievsky:
よく知らないし、覚えていない :) 今はキリスト教にハマって、パズルを解いています。

アレクサンダー=トドラーで、あなたは聖杯の 教義を作成しますか?)

 
elibrarius:

Alexeiさんは葉っぱの分析をされているので、どうやら答えられるようです...。またはそのような人がいる。

カボスの2本分の深さの木の割れを説明します。


価値」とは何か?葉の答えでしょうか。負の数は何を意味するのか?

その場合、マルチクラス分類の価値とは何でしょうか?以下は、3クラスで学習させた木の1つを分割したものである。
各リーフには、3つの値のvalueの配列が見えます。答えは何でしょうか?最高値は?では、なぜ冗長な2値を保存するのか?マイナスの値は何を意味するのか?

興味深いのは、3つの値の合計が0であることだ。

そう、二値分類では、「主」クラスに属する確率の値です。

CatBoostで多階級化をやったことはないのですが、特定のクラスに属する確率だと思うんです。

実際の確率値を得るためには、この図を変形する必要がある。ロジスティック 関数がある。

モデル内の活性化された葉は合計されます - だから、とりわけ、符号は異なる符号とすることができます - これはバランスをとるプロセスです、ちょうどそれはモデルを構築した後に間引くことができ、ごみの葉や木は捨てることができます。

 
アレクセイ・ヴャジミキン

そう、二値分類では「主」クラスに属する確率の値です。

CatBoostで多階級化をやったことはないのですが、特定のクラスに属する確率だと思うんです。

実際の確率値を得るためには、この図を変形する必要がある。ロジスティック関数がある。

モデル内の活性化された葉は合計されます - だから、とりわけ、符号は異なる符号とすることができます - これはバランスをとるプロセスです、ちょうどそれがモデルを構築した後に間引くことができ、ゴミの葉や木は捨てることができます。

ありがとうございます。だいたいそんな感じです。
この値をどのように算出しているのかはよくわかりません。
例えば深さ1のツリーを1つ学習させました。

    "left": {
      "value": -0.5202020202020202,
      "weight": 384
    },
    "right": {
      "value": -0.0019267822736030828,
      "weight": 507
    },
    "split": {
      "border": 12.587499618530273,
      "float_feature_index": 0,
      "split_index": 0,
      "split_type": "FloatFeature"
    }

ツリーに応答を要求すると、次のようになります。

cmodel.predict(X, prediction_type='RawFormulaVal') = -0.5202020202 - これはシートの説明文にある値です。

cmodel.predict_proba(X)=0.372805 はクラス1の確率です。
という式で調べました。
x1=-0.52020202
prob=math.exp(x1)/(1+math.exp(x1))=0.3728049958676699

正しく計算されています。

データセットには全部で891行が含まれています。

で1級の発生回数を数えてみました。
ボーダー < 12.587499618

葉の説明から重量に相当する384例が得られ、そのうち89例がクラス1の例です。

クラス1の確率は、必ず
89 / 384 = 0,2317708

しかし、モデルでは0.372805の 確率となる。

そこでは、確率を求めるために、何か別のアルゴリズムが使われていることがわかった。

 
エリブラリウス

そこでは、何か別の確率アルゴリズムが使われていることが判明した。

そう、結果がおかしいのです。トレーニングに関わるテストサンプルから確率を取るのではないのですか?しかし、ここでエラーが発生したようです。

サンプルには全部で何台(対象ライン)あるのでしょうか?
理由: