トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 883

 
マキシム・ドミトリエフスキー

通常のフォレストとランダムフォレストとツリーフォレストは同じものです :)森は樹木のアンサンブル

特徴量が折りたたまれているということは、その数が少ないということでしょうか?折りたたまれている特徴量とは、ほとんど変化しない、あるいは1や0のようなカテゴリ的なものです(まあ、これはハイレベルな理解ですが)。

いいえ、コラプスは、1つの変数が多くの値を持つが、組み合わせの数は変わらないという意味です。昨年の買い物用と同じような、別の表現のファイルを添付しました。

ファイル:
 
ヴィザード_。

二値化は多くの有用な情報を殺してしまう。

情報の見せ方にどんな違いがあるのか、それは変わらないのか・・・????

 
マキシム・ドミトリエフスキー

彼は非常に有能で慎重な人物で、自分の知らないことをやっている。

私は直感的にpythonが好きです。特別に何かすごいことを発明したわけではありませんが、静かに勉強を続けて、それが役に立つかどうか見ています :D

RはPythonと比較して多くの利点がある素晴らしい環境です。最も重要なのは、Rがモデリング環境であることです。Pythonと比較して、Rではより速く、より簡単に結果を得ることができます。

Pythonはモジュールとの組み合わせで、それなりのメリットがあることは明らかです。

ところで、RFについては、ここでもNSと同様に、試行錯誤の末の予測変数の選択をせず、直接正規化したBPをそのまま使うことができるようです。

 
サンサニッチ・フォメンコ

ノーマルフォレストかランダムフォレストか、あるいはその両方か?

ラトルで、treeとadaという両方のフォレストモデルを実行します。ログタブを開くと、Rコード、使用したパッケージのリファレンスが表示され、それらの違いを理解することができます。

私はツリーとスキャフォールディングの違いを理解しています。スキャフォールディングはランダム(短縮による独立)ツリーで発生する投票によって決定を行うため、データに不確実性がある場合、すなわち安定性の低いパターンがある場合に使用するとよいのですが、間違っているでしょうか。そして、私が持っていないオプション「adad」、それはスクリーンショットではありませんが、「森」がある - それはないですか?

サンサニッチ・フォメンコ

私はガラガラとR(まあ、そしてグリッチすべてのこのようなもの...)を置く。

私はどのような グリッチを理解していない、最近、モデルの膨大な数を実行 - すべての正常な

パッケージのダウンロードで、「始めた」と言いながらダウンロードしない、「必要なライブラリがない」と置いていく、ファイルからデータを読み込むときにハングアップする......といった問題が起きています。まあ、作業工程が見えないので、完成までどれくらい待てばいいのか、よくわからないのですが。ここまでは、そんなバグの話です。ディスパッチャからタスクを削除すると...

サンサニッチ・フォメンコ


ガラガラからの写真、未完成なんですね。少なくとも、次のタブに移動して、そこで結果を見る必要があります。

しかし、最も重要なことは、ソースファイルを異なる名前の2つの部分に分割することです(ほとんどの場合、Rで行う必要があるでしょう)。

最初のファイル では、6つのモデルをすべて構築し、その推定テスト、検証を見ます。 次に、2番目のファイルの名前をR Datasetフィールドに入力します。そして、その上にまたマークがつく。すべての推定値がほぼ同じであること!

もしこれらの推定値が一致せず、2番目のファイルがモデルのより悪い結果を示すなら、それはモデルが過剰に訓練され、その理由がノイズ(ターゲット変数に関係しない)予測変数であることを意味します。


これは真実の瞬間であり、特定のターゲット変数に関連する予測変数のセットを持っているか、持っていないかです。そして、どんなモデルもこの不幸な状況を解決することはできません。そして、「ターゲット-予測因子」のペアを選択する馬鹿な作業が始まる、モデルは全く面白くない、ペアを見つけろ、そうすればモデルはRの単なる種だ、一日で何十個も見つけ、そのアンサンブルを作ることができる。

では、Rでファイルをカットするにはどうすればいいのか、特別なアルゴリズムが必要なのでしょうか。最終的にどうなるのか興味深い。

 
サンサニッチ・フォメンコ


2.R EAを使用することに問題はありません。

MT5でも使えますか?コード例はどこにあるのですか?オプティマイザーでEAと接続したときに比較しやすく、フォレストがその時々の相場をどう考えているかを視覚的に示すことができるので、インジケーターで 情報を送る方が良いと思います。

 
ユーリイ・アサウレンコ

RはPythonに比べて多くの利点があり、素晴らしい環境です。主なものは、Rがモデリング環境であることです。Pythonに比べ、Rでの結果はより早く、より簡単に得ることができます。

Pythonはモジュールとの組み合わせで、それなりのメリットがあることは明らかです。

ところで、RFについては、こちらもNSと同様、予測変数の選択を行わず、直接正規化したBPをそのまま使用することが可能なようです。

を使用することもできます。

 
マキシム・ドミトリエフスキー

配給制にしないことも可能です。

うまくいかない。例えば、BPセクションがあるレベル、ゼロ、に明確に言及されている必要があります。

 
アレクセイ・ヴャジミキン


ツリーとフォレストの違いは理解しています(というか、理解しているつもりです)。フォレストはランダム(短縮による独立)ツリーが行う投票によって意思決定を行うので、データに不確実性が高い場合、つまり安定しないパターンの場合に使用するとよいのですが、間違っていますか?

結果論で判断しているので、わからない。

そして、オプションの「adad」は、私は持っていない、それはスクリーンショットではありません、「森」がある - これはそれではないのですか?

順番に


rpart' パッケージは 'rpart'関数を 提供します。


ブースト

# エクストリームブースト

# xgboost' パッケージは極端な勾配ブーストアルゴリズムを実装しています。


エスブイエム

# サポートベクターマシン

# 'kernlab' パッケージは 'ksvm' 機能を提供します.


リニア

# 回帰モデル

# Regression model を構築する。


ニューラルネット

# ニューラルネットワーク

# nnetパッケージを使ってニューラルネットワークモデルを構築する。

library(nnet, quietly=TRUE)


ちなみに、この作業は私がやったのですが、Logで全部自分で見ることができます。別のバージョンのガラケーをお持ちの場合は、リストが異なる場合があります。


では、Rでファイルをカットするには、特別なアルゴリズムが必要なのでしょうか?どのような結果になるのか、興味深いところです。

インデックス別など。[1:2000,], [2001:4000,].秒単位の自然な時間の流れを壊さないことが重要です

 
アレクセイ・ヴャジミキン

MT5でも使えますか?コード例はどこにあるのですか?指標 別に情報を提供した方が、オプティマイザーがEAに接続する際に比較しやすく、森がその時々の相場状況についてどう考えているかを視覚的に確認できるため、良いと思います。

MT5からのテスターが必要という私の要望により、ライブラリーを修正しました。計算した、探すのが面倒だ、もしかしたら綺麗になったかもしれない。

Vladimir Perervenkoの 記事をご覧ください。

ネットワークに興味があるなら、この分野では最新のR、アドバイザー、その人はサイト上で利用可能です
 
アレクセイ・ヴャジミキン

いや、コラプテッド、つまり、ひとつの変数が多くの値を持つが、組み合わせの数は変わらないということだ。前回の買い物用と類似したファイルを添付しましたが、表現が違います。

あなたが好きなようにそれを試してみてください:)主なものは、愚かな何かをしないだろうし、あなたが必要とするパッケージが困難ではない理論を読むことを忘れてはならない、彼らはそれらの完全であり、さらにオンライン - あなたは何をインストールする必要はありません。データセンスがブーム、"それ "はどこにでもある

アーカイブを解析している暇はない、自分のことをやっているのだ

理由: