トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 640

 
ミハイル・マルキュカイツ


真面目な話、騒がないでくださいよ、ミカエルさん。その瞬間が肝心なのです。もしこのアイデアが、どんな理由であれ(新しいチャンスの前のスキル不足や完全な愚かさのためであれ)うまくいかなければ、次のアイデアがとてもとても早くトレーダーのコミュニティーに降りかかってくるでしょう。間違いないです。

 
ミハイル・マルキュカイツ

ここに私の7人がいる!!!!そして、この日を赤鉛筆でカレンダーにマークしてください。この日は、私がRをダウンロードして、少しずつ回していく日ですから...。

先生について、男子からのプレゼント)))h2o.automl.

ガタツキは平均的ですが、すべてオートマチックで...

 
ヴィザード_。
老ファは果樹園の中に立っていた。目の前にはオレンジの木が広がっていた。鳥があちこちに飛んでいて、混沌としている。
鳥はオレンジの木に降り立つことができず、その実には毒があると思ったのでしょう。彼は、一歩横に出て、見てみると
オレンジの木の後ろのリンゴの木、果物の上に、鳥のカップルまたはそれ以上が無秩序に飛び回っている。
は、必ず座ると思います。しかし、彼はただ一か所に立ち続けた...。腹が減って、疲れて、落ち込んで...。
 6年目の終わりには、胡蝶は狩猟術の真髄を極めたように思えた。獲物ではなく、その概念そのものが彼の中心になっていたからだ...。(с)
	          
 

http://playground.tensorflow.org

NSの学習を可視化したもので、単なるお遊びや教育例と思われるもの

明らかに螺旋の分類に困っているようです :)


Tensorflow — Neural Network Playground
Tensorflow — Neural Network Playground
  • Daniel Smilkov and Shan Carter
  • playground.tensorflow.org
It’s a technique for building a computer program that learns from data. It is based very loosely on how we think the human brain works. First, a collection of software “neurons” are created and connected together, allowing them to send messages to each other. Next, the network is asked to solve a problem, which it attempts to do over and over...
 

そして、そのようなアーキテクチャは、すでに

ポアンカレと同じで、特徴空間が非干渉であれば、少なくとも2つの層が必要です。


 
マキシム・ドミトリエフスキー

そして、このアーキテクチャは、すでに


マキシム、特徴量の選択はどうする?賛成
また、ネットワークが振動し始めたら、学習速度を遅くしてください。

去年の夏、こいつで遊んだんだ。非常に視覚的なもの)。
 
アレクセイ・テレンテフ
マキシム、特徴量の選択はどうでしょうか?賛成
また、ネットワークが振動し始めたら、学習速度を遅くしてください。

去年の夏、こんなもので遊びました。非常に図解的なもの)。

そうですね、サインを入れれば、1層でも可能です。

 

EMVCは私が望んでいたようなことはしてくれません。説明をざっと読んだだけでは、そのようなことはできません。

EMVCは、予測変数とターゲット(クラスのみ。回帰は不可)のテーブルを受け取り、各トレーニング例が本当に与えられたクラスに属するかどうかの確率を計算する。学習テーブルの中から大多数の学習例と矛盾する行(外れ値、エラー)を見つけ、それらを削除することで、学習中のモデルを混乱させないようにすることが可能である。

最も高い確率の推定値を与える予測変数のセットを見つけるはずでしたが、見つかった予測変数のセットは満足のいくものではありませんでした。私はこの実験をするつもりはありません。予測因子を選択 するためのもっと良いツールがあるのです。クロスエントロピーの推定値を見ることができません。パッケージは内部で何らかの形でそれを使用していますが、その答えをユーザーに返すことはありません。

しかし、予測因子ではなく、学習例をふるい落とすための興味深いツールがある。


library(EMVC)
data(iris)


trainTable <- iris #таблица  на которой в дальнейшем будет обучаться какая-то модель
PREDICTOR_COLUMNS_SEQ <- 1:4 #номера  колонок с предикторами
TARGET_COLUMN_ID <- 5 #номер  колонки с таргетом

EMVC_MIN_TRUST <- 0.9 #минимально  допустимая вероятность принадлежности к классу посчитанная через emcv. От 0 до 1.

emvcData <- t(as.matrix(trainTable[,PREDICTOR_COLUMNS_SEQ]))
emvcAnnotations <- as.numeric(trainTable[,TARGET_COLUMN_ID])
emvcAnnotationsUnique <- unique(emvcAnnotations)
emvcAnnotationsMatrix <- matrix(0, ncol=ncol(emvcData), nrow = length(emvcAnnotationsUnique))
for(i in 1:length(emvcAnnotationsUnique)){
  emvcAnnotationsMatrix[i, emvcAnnotations == emvcAnnotationsUnique[i]] <- 1
}

set.seed(0)
emvcResult <- EMVC(data = emvcData,
                   annotations = emvcAnnotationsMatrix,
                   #  bootstrap.iter = 20,
                   k.range = 2
                   #  clust.method = "kmeans",
                   #  kmeans.nstart = 1,
                   #  kmeans.iter.max = 10,
                   #  hclust.method = "average",
                   #  hclust.cor.method = "spearman"
)

badSamples <- c()
for(i in 1:ncol(emvcResult)){
  if(max(emvcResult[,i])<EMVC_MIN_TRUST){
    badSamples <- c(badSamples, i)
  }
}
cat("Indexes of bad train samples:", badSamples,"\n") #Это  номера строк в обучающей табличке которые повышают кросс-энтропию данных. Они противоречат большинству других обучающих примеров, и возможно следует их удалить из обучающей таблички
trainTable <- trainTable[-badSamples,]

 
Dr.トレーダー

EMVCは私が望んでいたようなことはしてくれません。説明をざっと読んだだけでは、そのようなことはできません。

EMVCは、予測変数とターゲット(クラスのみ。回帰は不可)のテーブルを受け取り、各トレーニング例が本当に与えられたクラスに属するかどうかの確率を計算する。学習テーブルの中から大多数の学習例と矛盾する行(外れ値、エラー)を見つけ、それらを削除することで、学習中のモデルを混乱させないようにすることが可能である。

最も高い確率の推定値を与える予測変数のセットを見つけるはずでしたが、見つかった予測変数のセットは満足のいくものではありませんでした。私はこの実験をするつもりはありません。予測因子を選択するためのもっと良いツールがあるのです。クロスエントロピーの推定値を見ることができません。パッケージは内部で何らかの形でそれを使用していますが、その答えをユーザーに返すことはありません。

しかし、少なくとも、予測因子ではなく学習例を選別するための興味深いツールを手に入れることができました。


残念なことです。

奇跡は起こらない、ゼロからすべてを拾い上げなければならない、という考えをまたもや証明してくれましたね。

 
Dr.トレーダー
そのため、学習テーブルの中から他の学習例のほとんどと矛盾する行(スパイクやエラー)を見つけ、それらを削除することで、学習中のモデルの混乱を回避することができます。

規則性が見出しにくいFXのデータでは、本当に問題ないのでしょうか?このプログラムで半分の例をふるい落とせると思います。また、異常値を削除するのではなく、例えば許容最大値と同等にするなど、よりシンプルな方法で異常値を探索することができる。

理由: