2012.03.0201:15:10 Tester-512_Test_001 (EURUSD,M1) СPU time = 7223 ms
2012.03.0201:15:10 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.01871 at 49 pass
2012.03.0201:15:03 Tester-512_Test_001 (EURUSD,M1) GPU time = 312 ms
2012.03.0201:15:03 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.01871 at 49 pass
2012.03.0201:15:02 Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.0201:26:59 Tester-512_Test_001 (EURUSD,M1) СPU time = 7238 ms
2012.03.0201:26:59 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.80004 at 320 pass
2012.03.0201:26:51 Tester-512_Test_001 (EURUSD,M1) GPU time = 281 ms
2012.03.0201:26:51 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.80004 at 320 pass
2012.03.0201:26:51 Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.0201:26:48 Tester-512_Test_001 (EURUSD,M1) СPU time = 7270 ms
2012.03.0201:26:48 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.48404 at 207 pass
2012.03.0201:26:41 Tester-512_Test_001 (EURUSD,M1) GPU time = 281 ms
2012.03.0201:26:41 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.48404 at 207 pass
2012.03.0201:26:41 Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
25回以上 非常に嗚呼とさえ思う。:)
それが8エントリーニューロンだったんです。 では、16エントリーのほうをご覧ください。
2012.03.0201:32:32 Tester-512_Test_001 (EURUSD,M1) СPU time = 14618 ms
2012.03.0201:32:32 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.22936 at 78 pass
2012.03.0201:32:18 Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.0201:32:18 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.22936 at 78 pass
2012.03.0201:32:17 Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.0201:32:01 Tester-512_Test_001 (EURUSD,M1) СPU time = 14618 ms
2012.03.0201:32:01 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.21085 at 143 pass
2012.03.0201:31:46 Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.0201:31:46 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.21085 at 143 pass
2012.03.0201:31:46 Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.0201:45:04 Tester-512_Test_001 (EURUSD,M1) СPU time = 29282 ms
2012.03.0201:45:04 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==0.73802 at 802 pass
2012.03.0201:44:35 Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.0201:44:35 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==0.73802 at 802 pass
2012.03.0201:46:36 Tester-512_Test_001 (EURUSD,M1) СPU time = 29265 ms
2012.03.0201:46:36 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.58618 at 821 pass
2012.03.0201:46:06 Tester-512_Test_001 (EURUSD,M1) GPU time = 328 ms
2012.03.0201:46:06 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.58618 at 821 pass
2012.03.0201:46:06 Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
ああ、GPGPUの計算を自慢してるんだな。加速度は?
ノートPCの加速度はどこから得ているのでしょうか?計算よりもバッファへのコピーに時間がかかる。
あくまで試運転です。比較的重い計算をすると、加速度が発生します。
与えられたパターン群(512パターン並列)との相関を全履歴で計算するスクリプトを追加するだけで、百倍利得がある(と思う)んだけどね。解剖してみると、本当はどうなるのかがわかる。
そしてとにかく、自慢話ではなく、OpenCLを普及させることです。そこだ!:)
それもまた楽しい。
どうですか、加速度は?
ヤジからだ!!!!
結果は同じ(有効性チェック)ですが、時間は大きく異なります。 この場合、差額の23倍。とにかく-その価値はありました。
単層パーセプトロンを144000本のバーの履歴に走らせ、512本のパスを一度に通しました。 好きだったんです。;)
かっこいいですね。
結果的に、典型的な時間はさらに少し良くなっています。ここでは、そのリプレイを紹介します。
25回以上 非常に嗚呼とさえ思う。:)
それが8エントリーニューロンだったんです。 では、16エントリーのほうをご覧ください。
その差は45倍。
その通り、計算が重くなればなるほど、定数オーバーヘッド(配列の送受信)は少なくなります。
しかも、それが1024パスも並行しているんです。
注:GPUでは全く差がありません(1280コアあり、つまり全タスクが1パスで収まります)。
CPUのチェックはもちろん、逐次行われます。
つまり、必要な100倍は実質的に達成されているのです。その差は89.5474倍(!)。
はい、重いインループの計算はOpenCLに最適です。
あなたやあなたの知り合いに、A8-3850搭載のコンピュータが眠っているのではありませんか?ちなみに、グラフィックスパイプラインは400本(統合)です
あなたやあなたの知り合いは、A8-3850ベースのコンピュートを身近に置いていないのですか?ちなみにGPUは400個(統合)搭載していますよ。
混乱はないのでしょうか? 以下、http://kazan.kompiko.info/priceshop.php?desc_id=111255
特に何もないようです、4コアのみ、コンベアについては一瞥もなし。
岩の解説はこちらで ご覧いただけます。この岩(というかGPU部分)がOpenCLに対応していないとはとても思えません。
CPUの観点からすると、石はあまり良くないですね。しかし、きちんとしたビデオ統合機能を備えており、「良い」ケースでは、ディスクリートのビデオモンスターを使用せずに数十倍のスピードアップを期待できます。経済的なスパコンではないか、え?
そして、「5」はそのようなもので、マルチコアストーンのパワーはほとんど意味がないことがわかりました。もちろん、最適化についてはカウントしていません。最適化を1日24時間実行しなければならないのであれば、コアの数が4つでも6つでも違いはないでしょう。それどころか、最速とは言えない正直なデュアルコアCeleron G530でもCloudを走らせる...。
追伸:私はどちらかというと、AMDのファンではありません。私は、このAMDの混乱が最終的にどこにつながるかを計算しているんです。
Volodya さん、このスクリプトを実行し、結果を報告してください。
MQL5 さんに感謝します。