トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 858

 
マキシム・ドミトリエフスキー

私は他人のアルゴリズムは使いません。

もちろん、クリビン・スピリットは良いものですが、一番面白いもの、必要なものはすでに発明されていて、手のひらの上にあるのです。世界中の何十年にもわたる研究を否定するつもりはない。

 
マキシム・ドミトリエフスキー

そういうのもあるし、儲かるけどいつも儲からないというのもあるし、いつも(というかほとんど)儲けたいんです。そうして初めて、アドバイスができるようになるのです。

貯金箱の中!?知らないところでヒントを出し始めると、毎回挿入してしまいます :)

 
Dr.トレーダー

もちろん、クリビン・スピリットは良いものですが、一番面白いもの、必要なものはすでに発明されていて、手のひらの上にあるものなのです。世界中で何十年も研究するのはかまわない。

中身のない主張には閉口しますよ。

 
Dr.トレーダー

貯金箱の中!?知らないところでアドバイスをし始めると、毎回入れてしまいます :)

死んだ馬に分かりやすい言葉を求めても無駄で、降りて反応しない方が楽だと学んだ。

 
Vizard_: さあ、始まりましたよ。ヲタクのための生グリース...


13x6400のマトリックス(例の10倍)で2分間作業した後
こんなこともあるんですね。
エラー:3.2Gbベクターを配置することができません。
そして、12-13Gbを取ろうとしている、私は合計16Gbを持っているのに......。


 
Rは通常、少しづつチャンクでメモリを消費します。すでに12~13個取っていて、あと3個欲しいと言っているし、あと何個必要になるかわからない。
 
Dr.トレーダー
Rは通常、少しづつチャンクでメモリを消費します。彼はすでに12〜13個取っていて、あと3個欲しいと言っているし、あと何個必要かは誰にもわからない。

マトリックスを縮小 - 13x500を数えることさえできませんでした....どうやらパターンのないマーケットデータが彼を狂わせたようだ))。ブドウ糖で糖尿病の判定をするのは

マーケットデータで試された方はいらっしゃいますか?運が良かった?

最後に...13x100:でなんとかなりました(でも100行で何かをふるい落とすのは馬鹿らしい)。2番の入力が最も重要なようで、以前のパッケージでは最終的にそうなっていました。おそらく、6400行ではなく、100行で評価していることが原因だと思われます。

重要性の高い 順に並べた。
2 5 10 12 64 7 8 9 1 11
スコア 0.24 0.025 0.019 -0.048 -0.055 -0.057 -0.063 -0.067 -0.072
3
スコア NA

---

スコアのマトリクス。
2 5 10 12 64 7 8 9 1 11
2 0.24
5 0.128 0.025
10 0.186 -0.002 0.019
12 0.015 -0.043 -0.051 -0.048
6 0.086 -0.053 -0.011 -0.068 -0.05
4 0.066 -0.029 -0.073 -0.054 -0.065 -0.055
7 0.134 -0.088 -0.101 -0.188 -0.121 -0.099 -0.057
8 0.12 -0.202 -0.069 -0.1 -0.068 -0.089 -0.061 -0.05
9 0.092 -0.004 -0.138 -0.097 -0.088 -0.069 -0.112 -0.088 -0.063
1 0.086 -0.06 -0.088 -0.107 -0.083 -0.084 -0.066 -0.081 -0.076 -0.067
11 0.095 -0.017 -0.183 -0.115 -0.083 -0.078 -0.066 -0.086 -0.066 -0.082 -0.072
3 0.059 -0.132 -0.102 -0.146 -0.114 -0.126 -0.109 -0.113 -0.131 -0.117 -0.135


 

こんにちは。


AIを搭載したロボットニューロはできているか?


試してみてください。)))



とりあえず、テスターと同じように動作させるためのティックボットの作り方を見つけました )))

 

グレタの紹介


グレタには 驚きました。私は、tensorflowreticulate パッケージによって、R開発者は最終的に深層学習アプリケーションを越えて、TensorFlow プラットフォームを利用してあらゆる種類のプロダクショングレード統計アプリケーションを作成できるようになると思っていました。でも、ベイズ的な考え方はしていなかったんです。結局のところ、スタンは ベイズ・モデラーが望むすべてを備えているのだろう。Stanは、洗練されたRインターフェース、詳細なドキュメント、そして熱心な開発チームによる、強力でプロダクションレベルの確率分布モデリング・エンジンです。

しかし、gretaはTensorFlowベースのベイズモデルを直接Rで書く ことができるのです!gretaは、TensorFlowが使える場所ならどこでも動作する高性能なMCMCモデルを提供することを約束しつつ、中級のモデリング言語を学ぶというバリアを取り除きました。

今回は、Richard McElreathの著書 "Statistical Rethinking: A Bayesian Course with Examples in R and Stan"の8.3節で使われている簡単なモデルを使って、gretaを紹介します。このモデルは、アフリカに属するか否かをコントロールしながら、地形の起伏の度合いを指標として、その国のGDPの対数を説明しようとするものである。gretaを使ったMCMCサンプリングの説明のためだけに使うつもりです。しかし、McElreathの本にある拡張例は、相互作用のモデリングの微妙さについての瞑想であり、研究する価値が十分にあるものです。

まず、必要なパッケージをロードし、データを取得します。 DiagrammeRはモデルのTensorFlowフロー図をプロットするために、bayesplotはマルコフ連鎖のトレース図をプロットするために使用されます。234の52の変数を提供する頑丈なデータセットはかなり面白いが、ここでは170の郡と3つの変数だけというトリミングされたデータセットを使うことにする。


library(rethinking)
library(greta)
library(DiagrammeR)
library(bayesplot)
library(ggplot2)

使用するコードは以下の通りです。


サイクリストの発明家の皆さん、こんにちは。

 
ヴィザード_。

)))

最初の検索では、"peng"(速く)または "esteves "のどちらかを使うことをお勧めします。
(信頼性は高いが、大規模なデータセットではかなり遅い)、また、もし
変数が大きい(>100)場合、"前方 "検索を "n.var = 100 "に制限します。があります。
プログレスバーで残りの実行時間を確認することができます。


ライブラリ(varrank)

data(nassCDS, package = "DAAG")

nassCDS.varrank <- varrank(data.df = nassCDS.varrank),
method = "peng " です。
の変数になります。important= "dead "です。
variable.method = "dead"、 variable.method = "sturges"。
algorithm = "forward "です。
scheme = "mid"。
verbose = FALSE)

summary(nassCDS.varrank)
plot(nassCDS.varrank, notecex = 0.5)

この特殊なアルゴリズムは、予測因子を選択するのが良いのか悪いのか?


一般的に、予測因子選択において、何が良くて何が悪いのか?

表面的には、予測変数の選択とモデルの性能をリンクさせるということです。

私にはそれが第二のステップに聞こえます。

最初のステップは、常にモデルのオーバートレーニング(将来のモデルの挙動が過去の挙動と一致しない状況)に対処することです。何も考えていなければ、すべては数字だけの勝負になってしまいます。


投稿に戻ります。

窓の移動に伴う予測変数の分布があまり変わらないのであれば、モデルの将来の挙動は過去のデータに対する挙動とほとんど変わらないと考えています。

パッケージが計算するランクは、ある予測変数のセットで変化するのか、しないのか?もちろん、予測変数のセットが違えば結果は異なるかもしれませんが、それでも、もし(上記のように)このような投稿がここに掲載されたら......。

理由: