Оцениваем ядра CPU для оптимизации - страница 10

 
Pavel Verveyko:

папку вернул на место, тормоза прошли, по  поводу мат вычислений почему то тестер сбивается нужно открывать его нажимая на что нибудь из значков и там выбирать настройки c мат. вычислением.
сейчас попробовал повторить без F
итог на картинке:

точно понятно что что то идёт не так)

Сотрите кэш Tester\cache

 
 
Aleksey Vyazmikin:

Сотрите кэш Tester\cache

так сработало, сейчас последний советник выложу.
готово. всё вложил в то сообщение

 
Pavel Verveyko:

так сработало, сейчас последний советник выложу.
готово. всё вложил в то сообщение

Занес данные. Из логов показалось, что при нагрузке возникает троттлинг и это причина разброса времени проходов агентов в одном режиме оптимизации. Поэтому прошу Вас, сделайте тесты и со штатными частотами, что полезней будет сообществу.

Публикую сводную таблицу без учета расходов на сборку. Фильтрация по предпоследнему столбцу, так как не все провели тесты с последним советником, напоминаю значение столбца показывает сколько проходов сделает процессор за 1 час, т.е. его эффективность.

 
Andrey Khatimlianskii:

@Aleksey Vyazmikin

Попробуйте мой вариант.

Спасибо, что уделили время!

Прирост производительности существенен с 28 секунд до 17 за проход! Возникает вопрос, за счет чего эффект - из кода я конечно видел, что по сути убрали "if"? Но хотелось бы комментарий, ибо не ясно за счет чего всё ж прирост в плане ускорения логики.

А вот размер скомпилированного файла неприятно вырос с 14 мегабайт до 24, т.е. фактически на 10 мегабайт - и как это объяснить - не ясно.

 
Aleksey Vyazmikin:

Занес данные. Из логов показалось, что при нагрузке возникает троттлинг и это причина разброса времени проходов агентов в одном режиме оптимизации. Поэтому прошу Вас, сделайте тесты и со штатными частотами, что полезней будет сообществу.

Публикую сводную таблицу без учета расходов на сборку. Фильтрация по предпоследнему столбцу, так как не все провели тесты с последним советником, напоминаю значение столбца показывает сколько проходов сделает процессор за 1 час, т.е. его эффективность.

нюанс в том что я не использовал разгон.. (ps вообще не занимаюсь разгоном , оно само)))
я только выставил на материнке заявленную частоту ОЗУ 3200, согласно контроллеру памяти и которую поддерживает материнка.
Процессоры AMD Ryzen (Matisse) поддерживают память DDR4 3200/2933/2667/2400/2133 ECC и non-ECC, безбуферную память

а винда другое видит) 


ps комп не шумит) веду к тому что похоже что он или работает на штатной частоте или считает её штатной
 
Pavel Verveyko:

нюанс в том что я не использовал разгон.. (ps вообще не занимаюсь разгоном , оно само)))
я только выставил на материнке заявленную частоту ОЗУ 3200, согласно контроллеру памяти и которую поддерживает материнка.
Процессоры AMD Ryzen (Matisse) поддерживают память DDR4 3200/2933/2667/2400/2133 ECC и non-ECC, безбуферную память

а винда другое видит) 


ps комп не шумит) веду к тому что похоже что он или работает на штатной частоте или считает её штатной

Тогда предположу, что при оптимизации частота падает просто по идеологии. Сделайте ради интереса прогон любого советника подольше - не 16 проходов, а допустим 160 - интересно, как там меняется время прохода - разница должна быть минимальна - в пределах 1 секунды.

 
3800х почти догнал по производительности на поток i7 8700. И оторвался от 2700.
Вероятно это связано с уменьшившимися задержками при работе с памятью и вдвое большим кэшем.
Вывод: для мт5 решающим фактором являются задержки при обращении к памяти и скорость чтения из памяти.
Это же подтвеждается низкой производительность на поток 2990 wx. У них большие задержки по памяти несмотря на 4-х канал и специфичная работа с кэшем.
То есть скорость самих ядер не так важна.
Возможно это так работает.
 
Aleksey Vyazmikin:

Возникает вопрос, за счет чего эффект...

...и как это объяснить - не ясно.

Новый билд, новый тестер, новый компилятор... в сводной таблице не хватает колонки "билд мт5"

 
Maxim Romanov:
3800х почти догнал по производительности на поток i7 8700. И оторвался от 2700.
Вероятно это связано с уменьшившимися задержками при работе с памятью и вдвое большим кэшем.
Вывод: для мт5 решающим фактором являются задержки при обращении к памяти и скорость чтения из памяти.
Это же подтвеждается низкой производительность на поток 2990 wx. У них большие задержки по памяти несмотря на 4-х канал и специфичная работа с кэшем.
То есть скорость самих ядер не так важна.
Возможно это так работает.

Думаю важным является не столько увеличение кэша, сколько изменение принципа работы с ним - тут в статье можно почитать подробней, плюс ускорение работы с инструкциями AVX2 и в целом повышенная тактовая частота процессора. Не уверен, что тут ОЗУ играет роль - нет тут работы с историей, нет операций на запись в большом объеме.

Кстати, обратите внимание, что разные процессоры по разному справляются с советниками

Показано среднее время на 1 проход в секундах.

Микроархитектура Zen 2: вот почему мы ждём Ryzen 3000
Микроархитектура Zen 2: вот почему мы ждём Ryzen 3000
  • 3dnews.ru
Через две недели с небольшим нас, по всей видимости, ожидает чудо. Такой вывод можно сделать, если обобщить все те предположения, которые высказывают пользователи в ожидании предстоящего анонса процессоров Ryzen третьего поколения. Но даже самые смелые высказывания о том, будто бы во второй половине года на рынке процессоров для ПК нас ждёт...