OpenCL: внутренние тесты реализации в MQL5 - страница 63

 
GKS: Если бы AMD не купила пару лет назад ATI Readon

ATI была куплена 6 лет назад, в 2006.

Единственное сожеление, что у конкурентов Intel пока нет похожей технологии ,как Hyper-threading хотелось б надеятся, что AMD придумает этакое. 

Бульдозер - это что-то типа хардовой реализации гипертрединга: 8 недоядер с явно дефицитными FPU, которые тоже дерутся за ресурсы.

Удивительно, что Буль в среднем вышел немного лучше Thuban x6, даже на многопоточке. На целочисленных хорошо распараллеливаемых задачах считает быстро (немного не дотягивается до i7), но на всем остальном сливает i7 и в итоге, в среднем, оказывается на уровне i5-2400. Короче, серверный процессор для десктопа. И в Тринити эта ситуация вряд ли будет исправлена: ядра-то бульдозерные. 

По данным с ixbt

Прирост производительности CPU достигает 29%, в чем заслуга нового процессорного ядра под условным наименованием Piledriver

Так что я ошибся. Интересно, в каких же приложениях так будет?

AMD ����������� APU ����� A ������� ��������� (Trinity)
AMD ����������� APU ����� A ������� ��������� (Trinity)
  • www.ixbt.com
��� � ���������, �������� AMD ������� ����������� ��������� ���������� ����� A ������� ���������, ��������� ����� ��� �������� ������������ Trinity. ��� ������������� ��� ��������, ������� ������������ ������, ���������� �� ������������ � ����������� ����������, HTPC � ������������ ������. APU ������� ���������, �� ������ �������������...
 
Mathemat: Бульдозер - это что-то типа хардовой реализации гипертрединга: 8 недоядер с явно дефицитными FPU, которые тоже дерутся за ресурсы. 

Это все же хуже в плане энергопроизводительности. Сколько уходит энергии на работу каждого  физическо ядра нежели ,когда 4-мя физическими ядрами исполняются 8 независмых потоков информации..

/Я подправил пост, отделив цитирование от Вашего ответа. Чтобы получить возможность вводить ответ за пределами цитаты (если не получается), жмите кнопку HTML слева, пишите пару букв в самом конце разметки и возвращайтесь в визуальный режим - Mathemat/

 
Хочеться верить что в этом проекте..
 

https://www.mql5.com/ru/articles/405 - прочитав эту статью меня заитересовала тема про вычисление на GPU, хотя я не програмист ,но в этой статье я наткнулся на ссылку http://www.ixbt.com/video3/rad.shtml которая в свую очередь привлекла эта статья -  http://www.ixbt.com/video3/rad2.shtml. Мне кажется эта тема может заитеросовать разработчиков этого проекта ,так как там описывается вариант для увеличение производительности оптимизации тестора стратегии со сложными операциями. Возможно это как то поможет в развитие проета.

P.s Я не читал эту статью до конца.

Спасибо за внимание.... 

OpenCL: Мост в параллельные миры
OpenCL: Мост в параллельные миры
  • 2012.05.16
  • Sceptic Philozoff
  • www.mql5.com
В конце января 2012 года компания-разработчик терминала MetaTrader 5 анонсировала нативную поддержку OpenCL в MQL5. В статье на конкретном примере изложены основы программирования на OpenCL в среде MQL5 и приведены несколько примеров "наивной" оптимизации программы по быстродействию.
 

А что народ тут думает насчёт C++ AMP, который Микрософт внедрил для их VS11:

http://msdn.microsoft.com/en-us/library/hh265136(v=vs.110).aspx

We announced this technology at the AMD Fusion Developer Summit in June 2011. At the same time, we announced our intent to make the specification open, and we are working with other compiler vendors so they can support it in their compilers (on any platform).

 

Заметьте что MS хочет это расширение языка быть открытым. Я попробовал его в VS11 и должен сказать что это классная штука. Вместо громоздкого CUDA SDK кода в отдельном .cu только несколыко строк в том же .cpp:

 

Неплохо бы если MQL5 имел такую же возможность. С OpenCL не работал, но там тоже как слышал сложно программировать. 

C++ AMP Overview
C++ AMP Overview
  • msdn.microsoft.com
C++ Accelerated Massive Parallelism (C++ AMP) accelerates execution of C++ code by taking advantage of data-parallel hardware such as a graphics processing unit (GPU) on a discrete graphics card. By using C++ AMP, you can code multi-dimensional data algorithms so that execution can be accelerated by using parallelism on heterogeneous hardware...
 
gpwr: Неплохо бы если MQL5 имел таке же возможности.

OpenMP уже просили. Не дают.

 
Вопрос разработчикам терминала: планируется ли добавить в OpenCL API возможность установки размера work group? Было бы очень неплохо. Наверно, в функцию CLExecute(), как я понимаю.
 
Mathemat:
Вопрос разработчикам терминала: планируется ли добавить в OpenCL API возможность установки размера work group? Было бы очень неплохо. Наверно, в функцию CLExecute(), как я понимаю.

CLExecute(cl_krn,work_dim,offset,work) - разве не оно?

bool  CLExecute(
               int          kernel,                   // хендл на кернел OpenCL программы
               uint         work_dim,                 // размерность пространства задач 
               const uint&  global_work_offset[],     // начальное смещение в пространстве задач
               const uint&  global_work_size[]        // общее количество задач
               );
 
joo: CLExecute(cl_krn,work_dim,offset,work) - разве не оно?

Нет, это просто размеры пространства глобальной работы.

А вот размер локальной рабочей группы - нигде нельзя в реализации разработчиков терминала. А надо.

В полноценном OpenCL API есть функция clEnqueueNDRangeKernel( ), аналогом которой является CLExecute(). Вот ее шестой аргумент - const size_t *local_work_size - и нужен.

 
Понятно.