OpenCL：MQL5中的内部实现测试

Dmitriy Parfenovich 2012.06.02 07:27 #651

Mathemat:

2012.06.02 05:49:25     OpenCL  CPU: GenuineIntel  Intel(R) Pentium(R) CPU G840 @ 2.80 GHz with OpenCL 1.2 (2 units, 2793 MHz, 8040 Mb, version 2.0 (sse2))
2012.06.02 05:49:25     OpenCL  GPU: Advanced Micro Devices, Inc. ATI RV770 with OpenCL 1.0 (10 units, 780 MHz, 512 Mb, version CAL 1.4.1720)
2012.06.02 05:49:25     OpenCL  CPU: Intel(R) Corporation  Intel(R) Pentium(R) CPU G840 @ 2.80 GHz with OpenCL 1.1 (2 units, 2800 MHz, 8040 Mb, version 1.1)

即先用英特尔CPU 使用英特尔的OCL引擎 然后是我的恐龙HD4870，然后又是石头，但用AMD引擎。脚本。

版本不同，也就是说，版本与硬件无关？

我的OCL AMD 1.1，有什么办法可以修复到1.2吗？也许会更快。

发现新的AMD APP SDK 2.7支持OCL 1.2，我将报告新的结果（如果改变）。

我已经安装了它，版本没有改变。可能是没有硬件支持或其他原因。

Sceptic Philozoff 2012.06.02 13:19 #652

fyords: 把它放进去，版本没有改变。可能是没有硬件支持或其他东西。

这不可能。应该是1.2。首先，AMD会照顾好自己的石头，然后再考虑其他的。它将在那些不属于自己的东西上站起来。另外，SSE2在这两个制造商中已经存在了很长时间。

但差别不是很大，大约10%，也许。

Dmitriy Parfenovich 2012.06.02 13:39 #653

Mathemat:

这不可能。它必须是1.2。至少AMD会首先照顾好自己的石头，然后再考虑其他人的石头。它将对那些不属于它的人起作用。另外，这两个制造商都有很长时间的SSE2。

但差别不是很大，大约10%，也许。

我一定是崩溃了。最近更新停止工作，现在它说 "版本不真实"。好吧，只要它在呼吸，就让它呼吸吧。然后我将重新安装并扔进一个新的OCL。

我有SSE2，甚至更多。当然，10%并不多，但仍然不错。

P.S.: 谢谢你的澄清。

Vladimir Gomonov 2012.06.02 15:55 #654

ilovebtc:

例如，我有一块Radeon 6930显卡，它有1280个流处理器。它将如何显示在代理人名单中？作为1个设备，或所有1280。

它本身的速度是10个处理器的数倍，而且奖金不是为了增加1个设备。

显卡不能与用mql编写的代码一起工作；它只能与用专门语言（在我们的例子中是OpenCL）编写的代码一起工作。因此，云端的视频卡只对使用OpenCL-API（有OpenCL插入）的mql程序有用。

如果你了解这些，请忽略我的评论。只是在我看来，论坛上的一些人期望提高大多数普通mql5程序的生产力，这些程序不使用OpenCL连接到云。事实并非如此。

Dimitar Manov 2012.06.07 16:13 #655

安装了英特尔和AMD的SDK。

2012.06.07 18:40:28 OpenCL CPU: Intel(R) Corporation Intel(R) Core(TM)2 Duo CPU T8100 @ 2.10GHz with OpenCL 1.1 (2 units, 2100 MHz, 2045 Mb, version 1.1)

2012.06.07 18:40:28 OpenCL CPU: GenuineIntel Intel(R) Core(TM)2 Duo CPU T8100 @ 2.10GHz with OpenCL 1.2 (2 units, 2094 MHz, 2045 Mb, version 2.0 (sse2))

2012.06.07 18:40:55 vect_v2_all_devices (EURUSD,H1) =======================================

2012.06.07 18:40:55 vect_v2_all_devices (EURUSD,H1) OCL martices mul: ROWS1 = 2000; COLSROWS = 2000; COLS2 = 2000

2012.06.07 18:50:04 vect_v2_all_devices (EURUSD,H1) CPUTime = 548.515

2012.06.07 18:50:04 vect_v2_all_devices (EURUSD,H1) ---------------

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) read = 4000000 elements

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) Device = 0: time = 15.975 sec.

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) CPUTime / GPUTotalTime = 34.336

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 1571,356 ) = 2.88011026; thirdCPU[ 1571,356 ] = 2.88011026; buf[ 1571,356 ] = 2.88010764

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 791,407 ) = 1.36050534; thirdCPU[ 791,407 ] = 1.36050534; buf[ 791,407 ] = 1.36050797

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 1920,1928 ) = 2.97455144; thirdCPU[ 1920,1928 ] = 2.97455144; buf[ 1920,1928 ] = 2.97455001

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 386,216 ) = -1.05270028; thirdCPU[ 386,216 ] = -1.05270028; buf[ 386,216 ] = -1.05269444

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 158,1896 ) = 2.30077577; thirdCPU[ 158,1896 ] = 2.30077577; buf[ 158,1896 ] = 2.30077529

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 1403,1477 ) = 5.44755507; thirdCPU[ 1403,1477 ] = 5.44755507; buf[ 1403,1477 ] = 5.44755411

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 190,97 ) = -0.19755134; thirdCPU[ 190,97 ] = -0.19755134; buf[ 190,97 ] = -0.19754831

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 694,1569 ) = 5.30565643; thirdCPU[ 694,1569 ] = 5.30565643; buf[ 694,1569 ] = 5.30566406

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 1084,703 ) = -0.40982622; thirdCPU[ 1084,703 ] = -0.40982622; buf[ 1084,703 ] = -0.40982300

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 613,1814 ) = -2.08050942; thirdCPU[ 613,1814 ] = -2.08050942; buf[ 613,1814 ] = -2.08050990

2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) ________________________

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) read = 4000000 elements

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) Device = 1: time = 14.868 sec.

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) CPUTime / GPUTotalTime = 36.892

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 726,1509 ) = -3.87149954; thirdCPU[ 726,1509 ] = -3.87149954; buf[ 726,1509 ] = -3.87148523

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 408,1551 ) = -3.54236746; thirdCPU[ 408,1551 ] = -3.54236746; buf[ 408,1551 ] = -3.54237366

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 837,1133 ) = -1.46401167; thirdCPU[ 837,1133 ] = -1.46401167; buf[ 837,1133 ] = -1.46400595

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 1885,1406 ) = 3.41383481; thirdCPU[ 1885,1406 ] = 3.41383481; buf[ 1885,1406 ] = 3.41383505

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 419,930 ) = -2.05204225; thirdCPU[ 419,930 ] = -2.05204225; buf[ 419,930 ] = -2.05204272

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 895,1065 ) = 2.29360199; thirdCPU[ 895,1065 ] = 2.29360199; buf[ 895,1065 ] = 2.29360104

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 1687,1449 ) = 2.12151670; thirdCPU[ 1687,1449 ] = 2.12151670; buf[ 1687,1449 ] = 2.12152243

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 1227,1863 ) = 4.48004580; thirdCPU[ 1227,1863 ] = 4.48004580; buf[ 1227,1863 ] = 4.48004818

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 1545,234 ) = 2.60638309; thirdCPU[ 1545,234 ] = 2.60638309; buf[ 1545,234 ] = 2.60638452

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 446,1500 ) = -8.61246967; thirdCPU[ 446,1500 ] = -8.61246967; buf[ 446,1500 ] = -8.61247253

2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) ________________________

它是好还是坏？

OpenCL: internal implementation tests VPS not working Experts: earlyTopProrate

Sceptic Philozoff 2012.06.07 16:42 #656

Manov: 那是坏事还是好事？

嗯，这是一个2核移动处理器，4.5年前发布。

进展仍在继续：似乎新的SSE指令和其他架构创新在其中发挥了主要作用。我的预算桩在这项任务中的速度是4-5倍:)

但它在OpenCL上给出了一个非常好的收益。没关系，应该是这样的。

Dimitar Manov 2012.06.07 17:15 #657

Mathemat:

嗯，这是一个4.5年前发布的2核移动处理器。

进展并非停滞不前：似乎新的SSE指令和其他架构创新在其中发挥了重要作用。我的预算桩在这项任务中的速度是4-5倍:)

但它在OpenCL上给出了一个非常好的收益。没关系，应该是这样的。

非常感谢您!

我是否正确理解，对于大型数学计算，如果我爬行OpenCL，计算时间将减少30多倍？

Sceptic Philozoff 2012.06.07 17:34 #658

Manov: 我是否正确理解，如果我使用OpenCL进行大型数学计算，运行时间将减少30多倍？

嗯，是的，大致如此--在一个独立的卡上。无论如何，我的HD4870在0.5秒内完成了同样的计算。

但应该理解的是，并不是所有的密集型计算都适合体面的加速。

vittt 2012.09.30 18:04 #659

晚上好。

试图了解OpenCL在Metatrader5中的使用，但无法进入其中的细微之处。

你能告诉我是否可以在MT5测试器中使用显卡进行额外的加速测试，以及如何做。

我也尝试了脚本 parallel_tester_00-01x_new_cycle，但它是如何工作的？

Anatoli Kazharski 2012.09.30 18:11 #660

vittt:

晚上好。

试图了解OpenCL在Metatrader5中的使用，但无法进入其中的细微之处。

你能告诉我是否可以在MT5测试器中使用显卡进行额外的加速测试，以及如何做。

我也试过脚本 parallel_tester_00-01x_new_cycle，但它是如何工作的呢？

本网站上有两篇关于这个主题的好文章，详细描述了一切。

OpenCL：MQL5中的内部实现测试 - 页 66