トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1038

 
ロフィルド
それが、ランダムフォレストの「しきい値」とどう関係があるのでしょうか?

閾値が何だったか忘れたが、取引を開始するための閾値か、0.75か何か(確率のようなもの)である必要がある。

 
ロフィルド
閾値」と「ランダムフォレスト」とはどのような関係があるのでしょうか?

ロジット回帰の場合、クラスの割り当て確率がどうなるかは想像がつきますが、森の場合は残念です。つまり、これらは擬似的な確率である可能性が高く、そのように動作することはないはずです。閾値が0.75の場合、例えば0.6の場合よりもクラスへの割り当て確率が高くなるということはないはずである。

少なくとも私はそれに関する情報を読んでいません。
 

そして、「確率」はランダムフォレストアルゴリズムの 重要な要素として受け入れています。なぜなら、すべての木の結果を計算する公式が、この「確率」に基づいているからです。

この「確率」を意識して木の本数も設定しています。

 
ロフィルド

そして、「確率」をランダムフォレストアルゴリズムの重要な要素として受け入れています。なぜなら、すべての木から結果をカウントする式は、その上に成り立っているからです。

この「確率」を意識して木の本数も設定しています。

サンプル区画を占める葉の数を考慮しているのでしょうか?そのような木の各葉の能力確率が高いことを考えると、実際に投票する委員会の規模は?

 
アレクセイ・ヴャジミキン

サンプルの面積を占める葉の数を考慮していますか?そのようなツリーの各葉の能力確率が高いことを考えると、実際に投票する委員会の規模は?

最終ブランチは、学習済みサンプルのうち、少なくとも25のバリアントを担当します。Sparkのパラメータに設定されています。AlgLibには、そのようなパラメータはありません。
 
ロフィルド
最終ブランチは、学習済みサンプルのうち、少なくとも25のバリアントを担当します。Sparkのパラメータに設定されています。AlgLibには、そのようなパラメータはありません。

たぶん、そういう言い方はしなかったと思います。

100本の木があるとすると、それぞれの木の葉が一度に(2択の単純な場合)分類を行うので、投票には誤差が非常に大きい木、例えば49/51というような、平均予測値を大きく歪めてしまう木が含まれることを考慮しているのでしょうか。そんな葉っぱは、完全に投票から排除した方がいいのでは?なぜなら、予測能力の欠如は、特定のデータを扱ったときの木の葉モデルの貧弱さをより物語っているからです。

 
Python、Rなどプログラミング言語の新着 ランキング
 
サンサニッチ・フォメンコ
python、Rなどプログラミング言語の新着 ランキング
いいものですね。しかし、RとPythonに関するあなた自身の結論は、遠回しに言っているのです。あなたの基準ではまったく比較できない、あたたかさとやわらかさのようなものです。
 
ユーリイ・アサウレンコ
いいものですね。しかし、RとPythonに関するあなた自身の結論は、遠回しに言っているのです。 自分の基準ではまったく比較できない、あたたかさとやわらかさみたいなものですね。

さらに具体的には?

言語の参照装置を比較しているのです。

どのようにしたいですか?

 
サンサニッチ・フォメンコ

具体的には?

言語の参照装置を比較しているのです。

どのようにしたいですか?

量的にはトラクターより自動車の方が多いのですが、比較すること自体がナンセンスです。
ヘルプの面では、どちらも充実しています。モジュールという意味では、部分的に重複しています。
PythonはRに、RはPythonに移植されていると思います。
複雑な作業をする場合、どんな環境、どんな言語で作業しても、外から何かを移植しなければならない。好むと好まざるとにかかわらず、トラック、トラクター、ショベルカーを追加で用意する必要があります。
理由: