世界の陰謀論者、完全なパラノイアック、あるいは単に価格をコントロールするのが好きな人たちへ。;) - ページ 7

 
Mathemat:
ああ、GPGPUの計算を自慢してるんだな。加速度は?

ノートPCの加速度はどこから得ているのでしょうか?計算よりもバッファへのコピーに時間がかかる。

あくまで試運転です。比較的重い計算をすると、加速度が発生します。

与えられたパターン群(512パターン並列)との相関を全履歴で計算するスクリプトを追加するだけで、百倍利得がある(と思う)んだけどね。解剖してみると、本当はどうなるのかがわかる。

 

そしてとにかく、自慢話ではなく、OpenCLを普及させることです。そこだ!:)

それもまた楽しい。

 
Mathemat:

どうですか、加速度は?

ヤジからだ!!!!

2012.03.02 01:15:10     Tester-512_Test_001 (EURUSD,M1) СPU time = 7223 ms
2012.03.02 01:15:10     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.01871 at 49 pass
2012.03.02 01:15:03     Tester-512_Test_001 (EURUSD,M1) GPU time = 312 ms
2012.03.02 01:15:03     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.01871 at 49 pass
2012.03.02 01:15:02     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

結果は同じ(有効性チェック)ですが、時間は大きく異なります。 この場合、差額の23倍。とにかく-その価値はありました。

単層パーセプトロンを144000本のバーの履歴に走らせ、512本のパスを一度に通しました。 好きだったんです。;)

 
MetaDriver: この場合、差額の23倍。とにかく、その甲斐がありました。
すごいですねぇ。
 
Mathemat:
かっこいいですね。

結果的に、典型的な時間はさらに少し良くなっています。ここでは、そのリプレイを紹介します。

2012.03.02 01:26:59     Tester-512_Test_001 (EURUSD,M1) СPU time = 7238 ms
2012.03.02 01:26:59     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.80004 at 320 pass
2012.03.02 01:26:51     Tester-512_Test_001 (EURUSD,M1) GPU time = 281 ms
2012.03.02 01:26:51     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.80004 at 320 pass
2012.03.02 01:26:51     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.02 01:26:48     Tester-512_Test_001 (EURUSD,M1) СPU time = 7270 ms
2012.03.02 01:26:48     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.48404 at 207 pass
2012.03.02 01:26:41     Tester-512_Test_001 (EURUSD,M1) GPU time = 281 ms
2012.03.02 01:26:41     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.48404 at 207 pass
2012.03.02 01:26:41     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

25回以上 非常に嗚呼とさえ思う。:)

それが8エントリーニューロンだったんです。 では、16エントリーのほうをご覧ください。

2012.03.02 01:32:32     Tester-512_Test_001 (EURUSD,M1) СPU time = 14618 ms
2012.03.02 01:32:32     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.22936 at 78 pass
2012.03.02 01:32:18     Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.02 01:32:18     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.22936 at 78 pass
2012.03.02 01:32:17     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.02 01:32:01     Tester-512_Test_001 (EURUSD,M1) СPU time = 14618 ms
2012.03.02 01:32:01     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.21085 at 143 pass
2012.03.02 01:31:46     Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.02 01:31:46     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.21085 at 143 pass
2012.03.02 01:31:46     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

その差は45倍。

その通り、計算が重くなればなるほど、定数オーバーヘッド(配列の送受信)は少なくなります。

 

しかも、それが1024パスも並行しているんです。

2012.03.02 01:45:04     Tester-512_Test_001 (EURUSD,M1) СPU time = 29282 ms
2012.03.02 01:45:04     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==0.73802 at 802 pass
2012.03.02 01:44:35     Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.02 01:44:35     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==0.73802 at 802 pass
2012.03.02 01:46:36     Tester-512_Test_001 (EURUSD,M1) СPU time = 29265 ms
2012.03.02 01:46:36     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.58618 at 821 pass
2012.03.02 01:46:06     Tester-512_Test_001 (EURUSD,M1) GPU time = 328 ms
2012.03.02 01:46:06     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.58618 at 821 pass
2012.03.02 01:46:06     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

注:GPUでは全く差がありません(1280コアあり、つまり全タスクが1パスで収まります)。

CPUのチェックはもちろん、逐次行われます。

つまり、必要な100倍は実質的に達成されているのです。その差は89.5474倍(!)。

 

はい、重いインループの計算はOpenCLに最適です。

あなたやあなたの知り合いに、A8-3850搭載のコンピュータが眠っているのではありませんか?ちなみに、グラフィックスパイプラインは400本(統合)です

 
Mathemat:

あなたやあなたの知り合いは、A8-3850ベースのコンピュートを身近に置いていないのですか?ちなみにGPUは400個(統合)搭載していますよ。

混乱はないのでしょうか? 以下、http://kazan.kompiko.info/priceshop.php?desc_id=111255

特に何もないようです、4コアのみ、コンベアについては一瞥もなし。

 

岩の解説はこちらで ご覧いただけます。この岩(というかGPU部分)がOpenCLに対応していないとはとても思えません。

CPUの観点からすると、石はあまり良くないですね。しかし、きちんとしたビデオ統合機能を備えており、「良い」ケースでは、ディスクリートのビデオモンスターを使用せずに数十倍のスピードアップを期待できます。経済的なスパコンではないか、え?

そして、「5」はそのようなもので、マルチコアストーンのパワーはほとんど意味がないことがわかりました。もちろん、最適化についてはカウントしていません。最適化を1日24時間実行しなければならないのであれば、コアの数が4つでも6つでも違いはないでしょう。それどころか、最速とは言えない正直なデュアルコアCeleron G530でもCloudを走らせる...。

追伸:私はどちらかというと、AMDのファンではありません。私は、このAMDの混乱が最終的にどこにつながるかを計算しているんです。

 

Volodya さん、このスクリプトを実行し、結果を報告してください。

MQL5 さんに感謝します。

ファイル: