トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 884

 
サンサニッチ・フォメンコ

ツリーとフォレストの違いは理解しています(というか、理解しているつもりです)。フォレストはランダム(短縮による独立)ツリーが行う投票によって意思決定を行うので、データに不確実性が高い場合、つまり安定しないパターンの場合に使用するとよいのですが、間違っていますか?

結果論で判断しているので、わからない。

そして、オプションの「adad」は、私は持っていない、それはスクリーンショットではありません、「森」がある - これはそれではないのですか?

順番に


rpart' パッケージは 'rpart'関数を 提供します。


ブースト

# エクストリームブースト

# xgboost' パッケージは極端な勾配ブーストアルゴリズムを実装しています。


エスブイエム

# サポートベクターマシン

# 'kernlab' パッケージは 'ksvm' 機能を提供します.


リニア

# 回帰モデル

# Regression model を構築する。


ニューラルネット

# ニューラルネットワーク

# nnetパッケージを使ってニューラルネットワークモデルを構築する。

library(nnet, quietly=TRUE)


ちなみに、この作業は私がやったのですが、Logで全部自分で見ることができます。別のバージョンのガラケーをお持ちの場合は、リストが異なる場合があります。

書き起こしありがとうございます。私はバージョン5.1.0がおそらく最新です。これらのパッケージはすべて、呼び出されたときに自動的にインストールされ、さらに「Forest」が存在します。

サンサニッチ・フォメンコ

ライブラリは私の注文に応じて修正されます - MT5からのテスターが必要だったのです。計算したんだ、調べるのが面倒で、きれいになったかもしれない。

Vladimir Perervenkoの 記事をご覧ください。

ネットワークに興味があるなら、この分野では最新のR、アドバイザー、その人はサイト上で利用可能です

ありがとうございます、見てみます。

 
サンサニッチ・フォメンコ


では、Rでファイルをカットするにはどうすればいいのか、特別なアルゴリズムが必要なのでしょうか。最後はどうなるのかが気になるところです。

インデックス別など。[1:2000,], [2001:4000,].2番目のファイルでは、自然な時間の流れを壊さないことが重要です。

つまり、Excelでカットすればいいんですよね?

 
マキシム・ドミトリエフスキー

どのパッケージを使うのも難しいことではありません。データセンスがブーム、"それ "はどこにでもある

アーカイブを解析している暇はない、自分の仕事をするんだ

ポイントは、異なる変種は異なる結果を与えるということであり、もしそうなら、予測因子の質についてどのように結論づけることができるでしょうか。ただ、平均的なバージョン、つまり、どこも悪くないのであれば、それで良しとし、その後、ネットワークや樹木、森林を調整する必要があることがわかっただけでしょうか。

それにしても、ツリーのロジックをExpert Advisorに移行する方法を知りたいのですが...。

 
アレクセイ・ヴャジミキン

では、Excelでもカットできるのですね。

Excelは必要ありません。一行で終わりです。

ロバート・I・カバコフ R・イン・アクションを読む。R言語によるデータ解析と可視化。インターネット上で公開されています。

 
ユーリイ・アサウレンコ

Excelは必要ありません。1行で終了。

読む - ロバート・I・カバコフ R in Action.R言語によるデータ解析と可視化。インターネット上で公開されています。

私はRのプログラミングを学ぶ目的はなく、予測変数のチェックとルールセットのMT5への変換ができればいいと思っています。だいたい、文字列1つなら、書いてあげればいいじゃないですか。使える手段で対処してきた。

 
サンサニッチ・フォメンコ


あなたのガラケー画像は不完全です。少なくとも、隣接する評価タブに移動し、そこで結果を確認する必要があります。

しかし、最も重要なことは、ソースファイルを異なる名前の2つの部分に分割することです(ほとんどの場合、Rで行う必要があるでしょう)。

最初のファイル では、6つのモデルをすべて構築し、その推定テスト、検証を見ます。 次に、2番目のファイルの名前をR Datasetフィールドに入力します。そして、その上にまたマークがつく。すべての見積もりは、ほぼ一致する必要があります

もしこれらの推定値が一致せず、2番目のファイルがモデルのより悪い結果を示すなら、それはモデルが過剰に訓練され、その理由がノイズ(ターゲット変数に関係しない)予測変数であることを意味します。


これは真実の瞬間であり、特定のターゲット変数に関連する予測変数のセットを持っているか、持っていないかです。そして、どんなモデルもこの不幸な状況を解決することはできません。そして、「ターゲット-予測因子」のペアを見つけるという間抜けな作業が始まる、モデルは全く面白くない、ペアを見つける、そしてモデルはRの単なる種、一日で何十個も見つけて、そのアンサンブルを作ることになるのです。

もう少し詳しく説明していただこうと思っています。

1.評価 "タブで、"タイプ "のセットでどのようなパラメータを選択するのですか?

2.2つ目のファイル名を入力できるようにするには、どうしたらよいですか?ウィンドウはアクティブなのに、ファイルが選択できない!また、「CSVファイル」ですが、なぜそこで選択できるのでしょうか?


 
Aleksey Vyazmikin:

ポイントは、異なる選択肢は異なる結果をもたらすということであり、もしそうであれば、予測因子の質についてどのように結論づけることができるでしょうか。単純に平均的なバリアントをとって、つまりどこも悪くなければOKということで、ネットワーク・木・森をいじればいいということでしょうか。

それにしても、ツリーのロジックをExpert Advisorに転送する方法を知りたいのですが......。

なぜかというと、mt5にはランダムフォレストが あるので、それを適応させればいいのです。エラーを監視し、テスト例を与え、その結果を見る。ただ、変数を出力しないので

しかし、アルゴリズムはどこでも同じと考えれば、Rで可視化して実験し、それを学習させてMTを使うこともできるだろう。

 
アレクセイ・ヴャジミキン

とにかく、一行なら書いてあげればいいじゃないですか。まあ、とりあえず手近な手段で何とかしています。

まあ、私が聞いたのではなく、あなたが聞いたのですが) 私には必要ないのです。)

また、Rと一緒に仕事をする場合、そうしなければならないこともあります。

 
アレクセイ・ヴャジミキン

もう少し詳しい説明をお願いしたい。

1.評価」タブで、「タイプ」セットでどのパラメータを選択すればよいのでしょうか?

2.2つ目のファイル名を入力できるようにするには、どうしたらよいですか?ウィンドウはアクティブなのに、ファイルが選択できない!?また、「CSVファイル」ですが、なぜそこで選択できるのでしょうか?


1. 任意モデルの評価も違うし、それぞれ意味も違う。ラトルの良さは、入力データの準備、モデリング、モデルの推定など、機械学習に関する体系的な知識を初心者に与えることにある。少なくとも原始的なレベルでは、この3つのパートをマスターしてこそ、数字遊びからより意味のあるものへと移行することができるのです。

2.R Datasetはr-fileである。これは、Dataタブで初期データがRData Fileとしてロードされたことを意味し、Rの観点からはワークスペースとなる。このワークスペースには、モデルのトレーニング用とテスト用の2つのデータフレームが用意され、もう1つはまさにこのR Datasetとして用意されています。

最も簡単な方法は、既製のExcelファイルをアップロードし、ログをダウンロードし、Rに終了し、結果のデータフレームを2つに分割することです。

あるいは。

R自体を開き、そこにエクセルファイルをダウンロードします - これは1行です。そして、データフレームを2つに分割する。

ただし、学習済みモデルの2つ目のファイルを使用する必要があります。

 
マキシム・ドミトリエフスキー

なぜかというと、mt5にはランダムフォレストがあり、自分のニーズに合わせることができる。

あるいは、アルゴリズムはどこでも同じだと考えると、Rで可視化して実験し、MTで学習して利用することも可能です

Deductor Studio」は、ツリーやルールなど、すべてを視覚的にうまく表示してくれます。Rにはまだありませんし、MT5にもないでしょう(つまり、すべてができるのですが、そのためにお金を払わなければなりません...)。ということは、MT5にランダムフォレストを入れるには、algibライブラリを使えばいいということになりますね。

RでC4.5 アルゴリズムのコード (http://datascientist.one/algorithm-c4-5/)を見つけたのですが、MT5で実装するのは非常に難しいですか?

C45 <- function(data,x){
   result.tree <- NULL
   if ( IsEmpty(data) ) {
                node.value <- "Failure"
                result.tree <- CreateNode(node.value)
                return(result.tree)
        }
         if( IsEmpty(x) ){
                node.value <- GetMajorityClassValue(data,x)
                result.tree <- CreateNode(node.value)
                return(result.tree)
        }
         if( 1 == GetCount(x) ){
                node.value <- GetClassValue(x)
                result.tree <- CreateNode(node.value)
                return(result.tree)
        } <br>

       gain.ratio <- GetGainRatio(data,x)<br>
     best.split <- GetBestSplit(data,x,gain.ratio)

     data.subsets <- SplitData(data,best.split)
     values <- GetAttributeValues(data.subsets,best.split)
     values.count <- GetCount(values)

     node.value <- best.split
    result.tree <- CreateNode(node.value)
         idx <- 0
    while( idx<=values.count ){
        i       dx <- idx+1
                newdata <- GetAt(data.subsets,idx)
                value <- GetAt(values,idx)
                new.x <- RemoveAttribute(x,best.split)
                new.child <- C45(newdata,new.x)
                AddChildNode(result.tree,new.child,value)
   }

    result.tree
        }
Алгоритм C4.5
Алгоритм C4.5
  • 2016.05.06
  • datascientist.one
Алгоритм C4.5 строит классификатор в форме дерева решений. Чтобы сделать это, ему нужно передать набор уже классифицированных данных. А что такое классификатор? Классификатор – это инструмент, применяемый в data mining, который использует классифицированные данные и на их основании пытается предсказать, к какому классу стоит отнести новые...
理由: