世界の陰謀論者、完全なパラノイアック、あるいは単に価格をコントロールするのが好きな人たちへ。;)

Vladimir Gomonov 2012.03.01 16:59 #61

Mathemat:
ああ、GPGPUの計算を自慢してるんだな。加速度は？

ノートPCの加速度はどこから得ているのでしょうか？計算よりもバッファへのコピーに時間がかかる。

あくまで試運転です。比較的重い計算をすると、加速度が発生します。

与えられたパターン群（512パターン並列）との相関を全履歴で計算するスクリプトを追加するだけで、百倍利得がある（と思う）んだけどね。解剖してみると、本当はどうなるのかがわかる。

Vladimir Gomonov 2012.03.01 18:04 #62

そしてとにかく、自慢話ではなく、OpenCLを普及させることです。そこだ！:)

それもまた楽しい。

Vladimir Gomonov 2012.03.01 20:20 #63

Mathemat:

どうですか、加速度は？

ヤジからだ!!!!

2012.03.02 01:15:10     Tester-512_Test_001 (EURUSD,M1) СPU time = 7223 ms
2012.03.02 01:15:10     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.01871 at 49 pass
2012.03.02 01:15:03     Tester-512_Test_001 (EURUSD,M1) GPU time = 312 ms
2012.03.02 01:15:03     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.01871 at 49 pass
2012.03.02 01:15:02     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

結果は同じ（有効性チェック）ですが、時間は大きく異なります。この場合、差額の23倍。とにかく-その価値はありました。

単層パーセプトロンを144000本のバーの履歴に走らせ、512本のパスを一度に通しました。好きだったんです。;)

Sceptic Philozoff 2012.03.01 20:25 #64

MetaDriver: この場合、差額の23倍。とにかく、その甲斐がありました。

すごいですねぇ。

Vladimir Gomonov 2012.03.01 20:29 #65

Mathemat:
かっこいいですね。

結果的に、典型的な時間はさらに少し良くなっています。ここでは、そのリプレイを紹介します。

2012.03.02 01:26:59     Tester-512_Test_001 (EURUSD,M1) СPU time = 7238 ms
2012.03.02 01:26:59     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.80004 at 320 pass
2012.03.02 01:26:51     Tester-512_Test_001 (EURUSD,M1) GPU time = 281 ms
2012.03.02 01:26:51     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.80004 at 320 pass
2012.03.02 01:26:51     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.02 01:26:48     Tester-512_Test_001 (EURUSD,M1) СPU time = 7270 ms
2012.03.02 01:26:48     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.48404 at 207 pass
2012.03.02 01:26:41     Tester-512_Test_001 (EURUSD,M1) GPU time = 281 ms
2012.03.02 01:26:41     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.48404 at 207 pass
2012.03.02 01:26:41     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

25回以上非常に嗚呼とさえ思う。:)

それが8エントリーニューロンだったんです。では、16エントリーのほうをご覧ください。

2012.03.02 01:32:32     Tester-512_Test_001 (EURUSD,M1) СPU time = 14618 ms
2012.03.02 01:32:32     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.22936 at 78 pass
2012.03.02 01:32:18     Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.02 01:32:18     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.22936 at 78 pass
2012.03.02 01:32:17     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.02 01:32:01     Tester-512_Test_001 (EURUSD,M1) СPU time = 14618 ms
2012.03.02 01:32:01     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.21085 at 143 pass
2012.03.02 01:31:46     Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.02 01:31:46     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.21085 at 143 pass
2012.03.02 01:31:46     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

その差は45倍。

その通り、計算が重くなればなるほど、定数オーバーヘッド（配列の送受信）は少なくなります。

Vladimir Gomonov 2012.03.01 20:48 #66

しかも、それが1024パスも並行しているんです。

2012.03.02 01:45:04     Tester-512_Test_001 (EURUSD,M1) СPU time = 29282 ms
2012.03.02 01:45:04     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==0.73802 at 802 pass
2012.03.02 01:44:35     Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.02 01:44:35     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==0.73802 at 802 pass
2012.03.02 01:46:36     Tester-512_Test_001 (EURUSD,M1) СPU time = 29265 ms
2012.03.02 01:46:36     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.58618 at 821 pass
2012.03.02 01:46:06     Tester-512_Test_001 (EURUSD,M1) GPU time = 328 ms
2012.03.02 01:46:06     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.58618 at 821 pass
2012.03.02 01:46:06     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

注：GPUでは全く差がありません（1280コアあり、つまり全タスクが1パスで収まります）。

CPUのチェックはもちろん、逐次行われます。

つまり、必要な100倍は実質的に達成されているのです。その差は89.5474倍（！）。

Sceptic Philozoff 2012.03.01 20:55 #67

はい、重いインループの計算はOpenCLに最適です。

あなたやあなたの知り合いに、A8-3850搭載のコンピュータが眠っているのではありませんか？ちなみに、グラフィックスパイプラインは400本（統合）です

Vladimir Gomonov 2012.03.01 21:24 #68

Mathemat:

あなたやあなたの知り合いは、A8-3850ベースのコンピュートを身近に置いていないのですか？ちなみにGPUは400個（統合）搭載していますよ。

混乱はないのでしょうか？以下、http://kazan.kompiko.info/priceshop.php?desc_id=111255

特に何もないようです、4コアのみ、コンベアについては一瞥もなし。

Sceptic Philozoff 2012.03.01 22:50 #69

岩の解説はこちらでご覧いただけます。この岩（というかGPU部分）がOpenCLに対応していないとはとても思えません。

CPUの観点からすると、石はあまり良くないですね。しかし、きちんとしたビデオ統合機能を備えており、「良い」ケースでは、ディスクリートのビデオモンスターを使用せずに数十倍のスピードアップを期待できます。経済的なスパコンではないか、え？

そして、「5」はそのようなもので、マルチコアストーンのパワーはほとんど意味がないことがわかりました。もちろん、最適化についてはカウントしていません。最適化を1日24時間実行しなければならないのであれば、コアの数が4つでも6つでも違いはないでしょう。それどころか、最速とは言えない正直なデュアルコアCeleron G530でもCloudを走らせる...。

追伸：私はどちらかというと、AMDのファンではありません。私は、このAMDの混乱が最終的にどこにつながるかを計算しているんです。

Andrey Dik 2012.03.02 02:45 #70

Volodya さん、このスクリプトを実行し、結果を報告してください。

MQL5 さんに感謝します。

ファイル:

1_mlp_mql_compiler.mq5 15 kb

世界の陰謀論者、完全なパラノイアック、あるいは単に価格をコントロールするのが好きな人たちへ。;) - ページ 7