Новая версия платформы MetaTrader 5 build 3390: Float в OpenCL и математических функциях, методы активации и потерь для машинного обучения - страница 13

 
Dmitriy Shal #:

В комнате, где стоит ес-но кондей работает)))

Зимой за обогреватель пойдет.

По практической пользе немного сомневаюсь, что потянул бы разбор результатов оптимизации такой числодробилки, т.к. не успевал разбирать даже результаты 20-ти ядерной машины. Правда, ухищрениями добился, что вычисления шли в десятки раз быстрее стандартного штатного варианта. Грубо говоря. вместо 20 ядер было штук 500 обычных по количеству результатов на единицу времени. Тупо не успевал все обработать.


Раньше не предполагал, но на практике столкнулся, что на хранение базы котировок для исследования требуются терабайты на диске.


Кстати, при таком количестве локальных Агентов, наверное, стоит bases-папку (Tester) перенести на RAM-drive, т.к. 256 раз прочитать котировки с диска для каждого Агента - очень долго. И грохнуть логи Агентов.

 
Dmitriy Shal #:

Он слаб для этого процессора, тест завершается менее чем за 1 секунду на всех ядрах, даже буст не успевает включиться с 2450 на 3250 (все ядра в бусте 3150-3250 работают), что там за 1 секунду можно оценить фиг знает.





стоит задать вопрос разработчикам)

 
Dmitriy Shal #:

Он слаб для этого процессора, тест завершается менее чем за 1 секунду на всех ядрах, даже буст не успевает включиться с 2450 на 3250 (все ядра в бусте 3150-3250 работают), что там за 1 секунду можно оценить фиг знает.

Не думаю, что не успевают - результат показывает просто с номинальной частотой.

А так результат не плохой, конечно расчетно должен быть 128*187=23936

PR, предполагаю, занижен.

Посмотрим тесты советников завтра.

 
Aleksey Vyazmikin #:

Не думаю, что не успевают - результат показывает просто с номинальной частотой.

А так результат не плохой, конечно расчетно должен быть 128*187=23936

PR, предполагаю, занижен.

Посмотрим тесты советников завтра.

Отдельное ядро разгоняется до 3500, если грузить все 256, то ядра 0 процессора в зависимости от задачи работают на частоте от 2950 до 3250, ядра 1 процессора всегда на 3250 (на 0 процессоре больше периферии висит, он основной)

fxsaber #:

Зимой за обогреватель пойдет.

....


Кстати, при таком количестве локальных Агентов, наверное, стоит bases-папку (Tester) перенести на RAM-drive, т.к. 256 раз прочитать котировки с диска для каждого Агента - очень долго. И грохнуть логи Агентов.

Пока локально не могу использовать, как службы через 127.0.0.1 использую, а так да, папку tester поместил на динамический RAM диск, как заметил нагрузку на SSD)))

Еще заметил, что агенты не очень охотно ипользуют оперативную память свыше 3-4гб на агента, начинают в папку temp писать файлы *.temp по 65МБ, зачем - загадка пока для меня, ведь еще от 50 до 25% оперативки физически свободно




Проц еще очень гибко настраивается на задачи, есть миллион настроек, какие то блоки процессора и функции можно включать и выключать и тем самым затачивать его под конкретную узкую задачу, пока разбираюсь. Есть готовые workload profile типа сервер БД, machine learning и т.д., их штук 20, но тестировани их всех отпугивает пока тем, что перезагрузка серверной мамы с 1TB оперативы занимает 5 минут))))


 

Тест R9 5950

На 1 ядро понятно, рвет, ибо 3500мгц vs 5000мгц в бусте, но все зависит опять от задачи, у EPYC 8-канальный контроллер


На всех ядрах тест ничтожный, потому что EPYC делает работу за мгновенье, буст не включается и т.д.

 
Dmitriy Shal #:

Еще заметил, что агенты не очень охотно ипользуют оперативную память свыше 3-4гб на агента, начинают в папку temp писать файлы *.temp по 65МБ, зачем - загадка пока для меня, ведь еще от 50 до 25% оперативки физически свободно

Ее тоже на RAM-drive.

 
Dmitriy Shal #:

Пока локально не могу использовать

Просьба (когда заработают), дайте знать, как отличаются результаты ГА при работе 256/128/64/32/16 включенных локальных Агентах.


Все таки 256 первых пачек заданий - это почти сразу 10К проходов, что ГА берет предварительно на себя.

 
fxsaber #:

Ее тоже на RAM-drive.

куда ее не засовывай, там все будет вертеться в RAM, вопрос только как быстро доставится

если писать каждый тик, есть смысл вместо диска писать в ram-drive
 
fxsaber #:

Просьба (когда заработают), дайте знать, как отличаются результаты ГА при работе 256/128/64/32/16 включенных локальных Агентах.


Все таки 256 первых пачек заданий - это почти сразу 10К проходов, что ГА берет предварительно на себя.

В целях науки и повышения образованности могу всеми агентами (256) поделиться))) через недельку, время можем согласовывать, [безвозмездно]

По предварительным ощущениям, multi-line (типа замудренной Hyper-Threading) дает прирост на процентов 30 в МТ5, но жрет памяти в 2 раза больше

 
Dmitriy Shal #:

В целях науки и повышения образованности могу всеми агентами (256) поделиться))) через недельку, время можем согласовывать, [безвозмездно]

RDP-доступ к локальным Агентам имеет смысл, когда починят. Но сама цель во благо приветствуется, спасибо.