OpenCL:MQL5中的内部实现测试 - 页 37

 
joo: 而这很可能不是内存的问题,而是OpenCL驱动的任务并行机制本身的问题。你需要用苍蝇数量的倍数进行实验。
如果我不知道我有多少只苍蝇(Intel HD Graphics 1000)怎么办?无论是6个还是相当多的...如果有6个,那么执行速度提高25倍是怎么来的?
 
Mathemat:
如果我不知道我有多少只苍蝇(Intel HD Graphics 1000)怎么办?无论是6个还是相当多的...如果有6个,那么25倍的执行速度的提升从何而来?
x25的增益来自于我的天才,好吧,有一点来自于矢量操作。向量的标量乘积在GPU上的计数非常快。
 
MetaDriver: x25-增长是来自我的天才,好吧,有点来自矢量运算。向量的标量乘积在GPU上的计数非常快。

请记住,这6只蜜蜂的运行频率是1.1GHz,比石头的频率低2.5倍。因此,这就是2.5只有条件的蜜蜂以石头的频率运行。但 25倍从何而来?

 
Mathemat:

别忘了,这6只蜜蜂的运行频率是1.1GHz,比岩石频率低2.5倍。这就是2.5只有条件的蜜蜂在石头的频率上运作。但25倍从何而来?

SSE一次处理4个浮点*2个核心+编译器优化。
 
mql5: SSE一次处理4个浮点*2个核心+编译器的优化。

所以所有的工作都是在CPU核心上完成的--而不是在嵌入式GPU的蜜蜂上?

第二:如果不在蜜蜂上,那么如何使代码完全在蜜蜂上运行?

P.S.AMD用强大的板载GPU制造这种混乱是有原因的:A8-3850有多达400个蜜蜂...

P.P.S. 所以,开发商的代表出现了,又跑了 :(

 
2012.03.16 23:34:11 终端 GPU: NVIDIA公司GeForce GTX 590,OpenCL 1.1(16个单元,1225 MHz,1536 Mb,版本285.62)。
2012.03.16 23:34:11 终端 GPU: NVIDIA公司GeForce GTX 590,OpenCL 1.1(16个单元,1225 MHz,1536 Mb,版本285.62)。
^^^如何测试?
 
casinonsk:^^^^ 如何测试?
以脚本形式运行MetaDriver 发布的任何代码。
 
Mathemat:
以脚本形式运行MetaDriver 发布的任何代码。

运行OpenCL

1个核的平均负载率为50%。

2个核心根本就没有使用。

 
casinonsk:
2012.03.16 23:34:11 终端 GPU: NVIDIA公司GeForce GTX 590,OpenCL 1.1(16个单元,1225 MHz,1536 Mb,版本285.62)。
2012.03.16 23:34:11 终端 GPU: NVIDIA公司GeForce GTX 590,OpenCL 1.1(16个单元,1225 MHz,1536 Mb,版本285.62)。
^^^如何测试?

双增压GPU来了。非常有趣。是哪个CPU?

运行附件中的脚本。

附加的文件:
 
Mathemat:

所以所有的工作都是在CPU核心上完成的--而不是在嵌入式GPU的蜜蜂上?

第二:如果不在蜜蜂上,那么如何使代码完全在蜜蜂上运行?

P.S.AMD用强大的板载GPU制造这种混乱是有原因的:A8-3850里有多达400只蜜蜂...

P.P.S. 所以,开发商的代表出现了,又跑了 :(

关于在CPU上工作的事实,我可能是错的,但从你的帖子 和了解内部的特殊性来看,很有可能是在CPU上模拟AMD的工作。
不幸的是,在目前的实现中,设备的选择由终端决定,但在下一个版本中,将有可能由你自己选择一个可用的设备。