OpenCL:MQL5中的内部实现测试 - 页 63

 
GKS: 如果AMD在几年前没有收购ATI Readon。

ATI是在6年前,即2006年被收购的。

唯一遗憾的是,英特尔的竞争对手没有类似于超线程的技术,希望AMD能发明它。

推土机是一种超线程的硬核实现:8个下核与明显稀缺的FPU,也在争夺资源。

令人惊讶的是,Bull的平均成绩比Thuban x6略好,甚至在多线程上也是如此。在整数较好的任务上,它算得上是快的(与i7稍有差距),但在其他方面,它输给了i7,最后平均来说,与i5-2400相当。简而言之,一个用于桌面的服务器处理器。而三一集团不太可能解决这种情况:核心区被推倒了。

根据ixbt,

CPU性能提高了29%,这归功于新的处理器内核,传统上称为Piledriver。

所以我错了。我想知道哪些应用程序会是这样的?

AMD ����������� APU ����� A ������� ��������� (Trinity)
AMD ����������� APU ����� A ������� ��������� (Trinity)
  • www.ixbt.com
��� � ���������, �������� AMD ������� ����������� ��������� ���������� ����� A ������� ���������, ��������� ����� ��� �������� ������������ Trinity. ��� ������������� ��� ��������, ������� ������������ ������, ���������� �� ������������ � ����������� ����������, HTPC � ������������ ������. APU ������� ���������, �� ������ �������������...
 
Mathemat: 推土机是一种硬核的超交易实现:8个下核与明显稀缺的FPU,它们也在争夺资源。

就能源性能而言,它还是更糟糕。与4个物理核心执行8个独立线程时相比,运行每个物理核心要多花费多少能量...

/ 我已经更正了帖子,将引文与你的答案分开。为了能够在引文之外输入答案(如果你不能),请点击左边的HTML按钮,在标记的最末端输入几个字母,然后返回到视觉模式--Mathemat/。

 
我想相信,在这个项目 中...
 

https://www.mql5.com/ru/articles/405 - 读完这篇文章后,我对GPU计算这个话题很感兴趣,虽然我不是一个程序员,但在这篇文章中我看到了一个链接http://www.ixbt.com/video3/rad.shtml, 这又吸引了这篇文章--http://www.ixbt.com/video3/rad2.shtml。 我认为这个主题可以zaiterezovat这个项目的开发人员,因为它描述了一个变体,以增加性能优化睾丸激素战略与复杂的操作。也许这将有助于项目的发展。

P.s 我还没有把这篇文章读到最后。

谢谢你的提示....

OpenCL: Мост в параллельные миры
OpenCL: Мост в параллельные миры
  • 2012.05.16
  • Sceptic Philozoff
  • www.mql5.com
В конце января 2012 года компания-разработчик терминала MetaTrader 5 анонсировала нативную поддержку OpenCL в MQL5. В статье на конкретном примере изложены основы программирования на OpenCL в среде MQL5 и приведены несколько примеров "наивной" оптимизации программы по быстродействию.
 

而这里的人对微软为其VS11实现的C++ AMP有什么看法。

http://msdn.microsoft.com/en-us/library/hh265136(v=vs.110).aspx

我们 2011年6月的AMD Fusion开发者峰会上宣布了这项技术。同时,我们宣布了使该规范开放的意图,我们正在与其他编译器供应商合作,以便他们能够在其编译器中支持该规范(在任何平台上)。

请注意,MS希望这种语言扩展是开放的。我在VS11中试了一下,我必须说这是一件很酷的事情。 在一个单独的.cu中没有繁琐的CUDA SDK代码,而只是在同一个.cpp中的几行。

我希望MQL5也有类似的功能。 我从来没有使用过OpenCL,但我也听说在那里编程很困难。

C++ AMP Overview
C++ AMP Overview
  • msdn.microsoft.com
C++ Accelerated Massive Parallelism (C++ AMP) accelerates execution of C++ code by taking advantage of data-parallel hardware such as a graphics processing unit (GPU) on a discrete graphics card. By using C++ AMP, you can code multi-dimensional data algorithms so that execution can be accelerated by using parallelism on heterogeneous hardware...
 
gpwr: 如果MQL5有同样的能力就好了。

OpenMP已经被问到了。他们不这样做。

 
向终端开发者提问:是否有计划在OpenCL API中增加设置工作组大小的功能?这将是非常好的。可能,在CLExecute() 中,按照我的理解。
 
Mathemat:
向终端开发者提问:是否有计划在OpenCL API中增加设置工作组大小的可能性?这将是非常好的。可能,按照我的理解,是进入CLExecute()函数。

CLExecute(cl_krn,work_dim,offset,work) - 不是吗?

bool  CLExecute(
               int          kernel,                   // хендл на кернел OpenCL программы
               uint         work_dim,                 // размерность пространства задач 
               const uint&  global_work_offset[],     // начальное смещение в пространстве задач
               const uint&  global_work_size[]        // общее количество задач
               );
 
joo: CLExecute(cl_krn,work_dim,offset,work) - 不是吗?

不,这只是全局工作空间的大小。

但在终端开发者的实现中,本地工作组的规模却无处可寻。嗯,你应该这样做。

在功能齐全的OpenCL API中,有一个clEnqueueNDRangeKernel( ) 函数,其类似物是CLExecute( )。需要的是它的第六个参数 - constsize_t*local_work_size。

 
我明白了。