OpenCL:MQL5中的内部实现测试 - 页 66

 

Mathemat:

2012.06.02 05:49:25     OpenCL  CPU: GenuineIntel  Intel(R) Pentium(R) CPU G840 @ 2.80 GHz with OpenCL 1.2 (2 units, 2793 MHz, 8040 Mb, version 2.0 (sse2))
2012.06.02 05:49:25     OpenCL  GPU: Advanced Micro Devices, Inc. ATI RV770 with OpenCL 1.0 (10 units, 780 MHz, 512 Mb, version CAL 1.4.1720)
2012.06.02 05:49:25     OpenCL  CPU: Intel(R) Corporation  Intel(R) Pentium(R) CPU G840 @ 2.80 GHz with OpenCL 1.1 (2 units, 2800 MHz, 8040 Mb, version 1.1)

即先用英特尔CPU 使用英特尔的OCL引擎 然后是我的恐龙HD4870,然后又是石头,但用AMD引擎。脚本。

版本不同,也就是说,版本与硬件无关?

我的OCL AMD 1.1,有什么办法可以修复到1.2吗?也许会更快。

发现新的AMD APP SDK 2.7支持OCL 1.2,我将报告新的结果(如果改变)。

我已经安装了它,版本没有改变。可能是没有硬件支持或其他原因。

 
fyords: 把它放进去,版本没有改变。可能是没有硬件支持或其他东西。

这不可能。应该是1.2。首先,AMD会照顾好自己的石头,然后再考虑其他的。它将在那些不属于自己的东西上站起来。另外,SSE2在这两个制造商中已经存在了很长时间。

但差别不是很大,大约10%,也许。

 
Mathemat:

这不可能。它必须是1.2。至少AMD会首先照顾好自己的石头,然后再考虑其他人的石头。它将对那些不属于它的人起作用。另外,这两个制造商都有很长时间的SSE2。

但差别不是很大,大约10%,也许。

我一定是崩溃了。最近更新停止工作,现在它说 "版本不真实"。好吧,只要它在呼吸,就让它呼吸吧。然后我将重新安装并扔进一个新的OCL。

我有SSE2,甚至更多。当然,10%并不多,但仍然不错。

P.S.: 谢谢你的澄清。

 
ilovebtc:

例如,我有一块Radeon 6930显卡,它有1280个流处理器。它将如何显示在代理人名单中?作为1个设备,或所有1280。

它本身的速度是10个处理器的数倍,而且奖金不是为了增加1个设备。

显卡不能与用mql编写的代码一起工作;它只能与用专门语言(在我们的例子中是OpenCL)编写的代码一起工作。因此,云端的视频卡只对使用OpenCL-API(有OpenCL插入)的mql程序有用。

如果你了解这些,请忽略我的评论。 只是在我看来,论坛上的一些人期望提高大多数普通mql5程序的生产力,这些程序不使用OpenCL连接到云。事实并非如此。

 

安装了英特尔和AMD的SDK。

2012.06.07 18:40:28 OpenCL CPU: Intel(R) Corporation Intel(R) Core(TM)2 Duo CPU T8100 @ 2.10GHz with OpenCL 1.1 (2 units, 2100 MHz, 2045 Mb, version 1.1)

2012.06.07 18:40:28 OpenCL CPU: GenuineIntel Intel(R) Core(TM)2 Duo CPU T8100 @ 2.10GHz with OpenCL 1.2 (2 units, 2094 MHz, 2045 Mb, version 2.0 (sse2)) 

2012.06.07 18:40:55 vect_v2_all_devices (EURUSD,H1) =======================================
2012.06.07 18:40:55 vect_v2_all_devices (EURUSD,H1) OCL martices mul:         ROWS1 = 2000; COLSROWS = 2000; COLS2 = 2000
2012.06.07 18:50:04 vect_v2_all_devices (EURUSD,H1) CPUTime = 548.515
2012.06.07 18:50:04 vect_v2_all_devices (EURUSD,H1) ---------------
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) read = 4000000 elements
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) Device = 0: time = 15.975 sec.
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) CPUTime / GPUTotalTime = 34.336
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 1571,356 ) = 2.88011026;    thirdCPU[ 1571,356 ] = 2.88011026;    buf[ 1571,356 ] = 2.88010764
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 791,407 ) = 1.36050534;    thirdCPU[ 791,407 ] = 1.36050534;    buf[ 791,407 ] = 1.36050797
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 1920,1928 ) = 2.97455144;    thirdCPU[ 1920,1928 ] = 2.97455144;    buf[ 1920,1928 ] = 2.97455001
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 386,216 ) = -1.05270028;    thirdCPU[ 386,216 ] = -1.05270028;    buf[ 386,216 ] = -1.05269444
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 158,1896 ) = 2.30077577;    thirdCPU[ 158,1896 ] = 2.30077577;    buf[ 158,1896 ] = 2.30077529
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 1403,1477 ) = 5.44755507;    thirdCPU[ 1403,1477 ] = 5.44755507;    buf[ 1403,1477 ] = 5.44755411
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 190,97 ) = -0.19755134;    thirdCPU[ 190,97 ] = -0.19755134;    buf[ 190,97 ] = -0.19754831
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 694,1569 ) = 5.30565643;    thirdCPU[ 694,1569 ] = 5.30565643;    buf[ 694,1569 ] = 5.30566406
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 1084,703 ) = -0.40982622;    thirdCPU[ 1084,703 ] = -0.40982622;    buf[ 1084,703 ] = -0.40982300
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) sum( 613,1814 ) = -2.08050942;    thirdCPU[ 613,1814 ] = -2.08050942;    buf[ 613,1814 ] = -2.08050990
2012.06.07 18:50:22 vect_v2_all_devices (EURUSD,H1) ________________________
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) read = 4000000 elements
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) Device = 1: time = 14.868 sec.
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) CPUTime / GPUTotalTime = 36.892
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 726,1509 ) = -3.87149954;    thirdCPU[ 726,1509 ] = -3.87149954;    buf[ 726,1509 ] = -3.87148523
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 408,1551 ) = -3.54236746;    thirdCPU[ 408,1551 ] = -3.54236746;    buf[ 408,1551 ] = -3.54237366
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 837,1133 ) = -1.46401167;    thirdCPU[ 837,1133 ] = -1.46401167;    buf[ 837,1133 ] = -1.46400595
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 1885,1406 ) = 3.41383481;    thirdCPU[ 1885,1406 ] = 3.41383481;    buf[ 1885,1406 ] = 3.41383505
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 419,930 ) = -2.05204225;    thirdCPU[ 419,930 ] = -2.05204225;    buf[ 419,930 ] = -2.05204272
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 895,1065 ) = 2.29360199;    thirdCPU[ 895,1065 ] = 2.29360199;    buf[ 895,1065 ] = 2.29360104
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 1687,1449 ) = 2.12151670;    thirdCPU[ 1687,1449 ] = 2.12151670;    buf[ 1687,1449 ] = 2.12152243
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 1227,1863 ) = 4.48004580;    thirdCPU[ 1227,1863 ] = 4.48004580;    buf[ 1227,1863 ] = 4.48004818
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 1545,234 ) = 2.60638309;    thirdCPU[ 1545,234 ] = 2.60638309;    buf[ 1545,234 ] = 2.60638452
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) sum( 446,1500 ) = -8.61246967;    thirdCPU[ 446,1500 ] = -8.61246967;    buf[ 446,1500 ] = -8.61247253
2012.06.07 18:50:38 vect_v2_all_devices (EURUSD,H1) ________________________

它是好还是坏?

 
Manov: 那是坏事还是好事?

嗯,这是一个2核移动处理器,4.5年前发布。

进展仍在继续:似乎新的SSE指令和其他架构创新在其中发挥了主要作用。我的预算桩在这项任务中的速度是4-5倍:)

但它在OpenCL上给出了一个非常好的收益。没关系,应该是这样的。

 
Mathemat:

嗯,这是一个4.5年前发布的2核移动处理器。

进展并非停滞不前:似乎新的SSE指令和其他架构创新在其中发挥了重要作用。我的预算桩在这项任务中的速度是4-5倍:)

但它在OpenCL上给出了一个非常好的收益。没关系,应该是这样的。

非常感谢您!

我是否正确理解,对于大型数学计算,如果我爬行OpenCL,计算时间将减少30多倍?

 
Manov: 我是否正确理解,如果我使用OpenCL进行大型数学计算,运行时间将减少30多倍?

嗯,是的,大致如此--在一个独立的卡上。无论如何,我的HD4870在0.5秒内完成了同样的计算。

但应该理解的是,并不是所有的密集型计算都适合体面的加速。

 

晚上好。

试图了解OpenCL在Metatrader5中的使用,但无法进入其中的细微之处。

你能告诉我是否可以在MT5测试器中使用显卡进行额外的加速测试,以及如何做。

我也尝试了脚本 parallel_tester_00-01x_new_cycle,但它是如何工作的?

 
vittt:

晚上好。

试图了解OpenCL在Metatrader5中的使用,但无法进入其中的细微之处。

你能告诉我是否可以在MT5测试器中使用显卡进行额外的加速测试,以及如何做。

我也试过脚本 parallel_tester_00-01x_new_cycle,但它是如何工作的呢?

本网站上有两篇关于这个主题的好文章,详细描述了一切。