OpenCL：MQL5中的内部实现测试

Sceptic Philozoff 2012.05.19 16:30 #621

GKS: 如果AMD在几年前没有收购ATI Readon。

ATI是在6年前，即2006年被收购的。

唯一遗憾的是，英特尔的竞争对手没有类似于超线程的技术，希望AMD能发明它。

推土机是一种超线程的硬核实现：8个下核与明显稀缺的FPU，也在争夺资源。

令人惊讶的是，Bull的平均成绩比Thuban x6略好，甚至在多线程上也是如此。在整数较好的任务上，它算得上是快的（与i7稍有差距），但在其他方面，它输给了i7，最后平均来说，与i5-2400相当。简而言之，一个用于桌面的服务器处理器。而三一集团不太可能解决这种情况：核心区被推倒了。

根据ixbt,

CPU性能提高了29%，这归功于新的处理器内核，传统上称为Piledriver。

所以我错了。我想知道哪些应用程序会是这样的？

AMD �� APU �� A �� (Trinity)

www.ixbt.com

�� , �� AMD �� A �� , �� Trinity. �� , �� , �� , HTPC � �� . APU �� , �� ...

Konstantin Grebenshikov 2012.05.19 17:19 #622

Mathemat: 推土机是一种硬核的超交易实现：8个下核与明显稀缺的FPU，它们也在争夺资源。

就能源性能而言，它还是更糟糕。与4个物理核心执行8个独立线程时相比，运行每个物理核心要多花费多少能量...

/ 我已经更正了帖子，将引文与你的答案分开。为了能够在引文之外输入答案（如果你不能），请点击左边的HTML按钮，在标记的最末端输入几个字母，然后返回到视觉模式--Mathemat/。

Konstantin Grebenshikov 2012.05.19 17:51 #623

我想相信，在这个项目中...

Konstantin Grebenshikov 2012.05.19 20:14 #624

https://www.mql5.com/ru/articles/405 - 读完这篇文章后，我对GPU计算这个话题很感兴趣，虽然我不是一个程序员，但在这篇文章中我看到了一个链接http://www.ixbt.com/video3/rad.shtml，这又吸引了这篇文章--http://www.ixbt.com/video3/rad2.shtml。我认为这个主题可以zaiterezovat这个项目的开发人员，因为它描述了一个变体，以增加性能优化睾丸激素战略与复杂的操作。也许这将有助于项目的发展。

P.s 我还没有把这篇文章读到最后。

谢谢你的提示....

OpenCL: Мост в параллельные миры

2012.05.16
Sceptic Philozoff
www.mql5.com

В конце января 2012 года компания-разработчик терминала MetaTrader 5 анонсировала нативную поддержку OpenCL в MQL5. В статье на конкретном примере изложены основы программирования на OpenCL в среде MQL5 и приведены несколько примеров "наивной" оптимизации программы по быстродействию.

Vladimir 2012.05.19 22:33 #625

而这里的人对微软为其VS11实现的C++ AMP有什么看法。

http://msdn.microsoft.com/en-us/library/hh265136(v=vs.110).aspx

我们在 2011年6月的AMD Fusion开发者峰会上宣布了这项技术。同时，我们宣布了使该规范开放的意图，我们正在与其他编译器供应商合作，以便他们能够在其编译器中支持该规范（在任何平台上）。

请注意，MS希望这种语言扩展是开放的。我在VS11中试了一下，我必须说这是一件很酷的事情。在一个单独的.cu中没有繁琐的CUDA SDK代码，而只是在同一个.cpp中的几行。

我希望MQL5也有类似的功能。我从来没有使用过OpenCL，但我也听说在那里编程很困难。

C++ AMP Overview

msdn.microsoft.com

C++ Accelerated Massive Parallelism (C++ AMP) accelerates execution of C++ code by taking advantage of data-parallel hardware such as a graphics processing unit (GPU) on a discrete graphics card. By using C++ AMP, you can code multi-dimensional data algorithms so that execution can be accelerated by using parallelism on heterogeneous hardware...

Sceptic Philozoff 2012.05.19 22:39 #626

gpwr: 如果MQL5有同样的能力就好了。

OpenMP已经被问到了。他们不这样做。

Sceptic Philozoff 2012.05.24 16:00 #627

向终端开发者提问：是否有计划在OpenCL API中增加设置工作组大小的功能？这将是非常好的。可能，在CLExecute() 中，按照我的理解。

Andrey Dik 2012.05.24 16:39 #628

Mathemat:
向终端开发者提问：是否有计划在OpenCL API中增加设置工作组大小的可能性？这将是非常好的。可能，按照我的理解，是进入CLExecute()函数。

CLExecute(cl_krn,work_dim,offset,work) - 不是吗？

bool  CLExecute(
               int          kernel,                   // хендл на кернел OpenCL программы
               uint         work_dim,                 // размерность пространства задач 
               const uint&  global_work_offset[],     // начальное смещение в пространстве задач
               const uint&  global_work_size[]        // общее количество задач
               );

Sceptic Philozoff 2012.05.24 16:56 #629

joo: CLExecute(cl_krn,work_dim,offset,work) - 不是吗？

不，这只是全局工作空间的大小。

但在终端开发者的实现中，本地工作组的规模却无处可寻。嗯，你应该这样做。

在功能齐全的OpenCL API中，有一个clEnqueueNDRangeKernel( ) 函数，其类似物是CLExecute( )。需要的是它的第六个参数 - constsize_t*local_work_size。

Andrey Dik 2012.05.24 17:48 #630

我明白了。

OpenCL：MQL5中的内部实现测试 - 页 63