Avaliação de núcleos de CPU para otimização - página 10

 
Pavel Verveyko:

A pasta voltou ao seu lugar, os freios desapareceram, com respeito aos cálculos matemáticos por algum motivo o testador está confuso necessidade de abri-la clicando em algo dos ícones e lá selecionar as configurações c cálculos mate.
Agora eu tentei novamente sem F
O resultado é mostrado na figura:

é claro que algo está dando errado).

Apagar a cache do Testador.

 
Aleksey Vyazmikin:

Apagar a cache do testador

funcionou, vou postar o último EA agora.
Feito. Coloquei tudo nessa mensagem.

 
Pavel Verveyko:

funcionou, agora vou postar o último Expert Advisor.
Está feito. Coloquei tudo naquele posto.

Eu entrei com os dados. Dos registros, parece que há algum trote sob carga e esta é a razão da variação dos tempos de passagem dos agentes em um modo de otimização. Portanto, peço-lhes que façam testes também com frequências normais, o que será mais útil para a comunidade.

Estou publicando a tabela de resumo sem levar em conta os custos de construção. Filtragem por penúltima coluna, como nem todos fizeram testes com a última EA, lembro que o valor da coluna mostra quantos passes o processador fará em 1 hora, ou seja, sua eficiência.

 
Andrey Khatimlianskii:

@Aleksey Vyazmikin

Tente minha sugestão.

Obrigado por seu tempo!

O ganho de desempenho é significativo, de 28 segundos a 17 por passe! Surge a pergunta: o que causou o efeito - é claro que vi que "se" foi removido do código? Mas gostaria de fazer um comentário, porque não está claro qual é o ganho no sentido de uma lógica mais rápida.

E o tamanho do arquivo compilado cresceu desagradavelmente de 14 megabytes para 24, ou seja, na verdade 10 megabytes - e como explicá-lo - não é claro.

 
Aleksey Vyazmikin:

Eu registrei os dados. Dos registros, parece que há algum trote sob carga e esta é a razão da variação dos tempos de passagem dos agentes em um modo de otimização. Portanto, peço-lhes que façam testes também com frequências normais, o que será mais útil para a comunidade.

Estou publicando a tabela de resumo sem levar em conta os custos de construção. Filtragem pela penúltima coluna já que nem todos fizeram testes com a última EA, lembro que a coluna mostra quantos passes o processador faz em 1 hora, ou seja, sua eficiência.

A nuance é que não usei overclocking... (ps não é um overclocking, ele próprio funciona)))
Eu apenas ajustei a freqüência declarada de RAM da placa-mãe para 3200, de acordo com o controlador de memória e que é suportado pela placa-mãe.
Os processadores AMD Ryzen (Matisse) suportam DDR4 3200/2933/2667/2400/2133 ECC e não-ECC, memória sem buffer

e o software Windows suporta outros tipos de memória)


ps o computador não faz ruído) levando ao fato de que ele parece operar em sua freqüência padrão ou considerá-lo como padrão
 
Pavel Verveyko:

A nuance é que eu não usei overclocking... (ps não fazem overclocking, ele funciona por si só)))
Eu apenas defino a freqüência declarada da placa mãe de RAM 3200, de acordo com o controlador de memória e que é suportado pela placa mãe.
Os processadores AMD Ryzen (Matisse) suportam DDR4 3200/2933/2667/2400/2133 ECC e não-ECC, memória sem buffer

e o software Windows suporta outros tipos de memória)


ps o computador não faz ruído) levando ao fato de que ele parece operar em sua freqüência padrão ou considerá-lo como padrão

Então vou assumir que durante a otimização a freqüência cai simplesmente por ideologia. Por uma questão de interesse, faça um período mais longo de qualquer EA - não 16 passes, mas diga 160 - eu me pergunto como isso muda o tempo de execução - a diferença deve ser mínima - dentro de 1 segundo.

 
O 3800x quase alcançou o i7 8700 em termos de desempenho por rosca. E se afastou do 2700.
Isto é provavelmente devido à reduzida latência de memória e ao dobro do cache grande.
Conclusão: para o mt5 o fator decisivo é a latência de acesso à memória e a velocidade de leitura da memória.
Isto também é confirmado pelo baixo desempenho da rosca 2990 wx. Eles têm altas latências de memória apesar de 4 canais e manuseio de cache específico.
Ou seja, a velocidade dos núcleos em si não é tão importante assim.
Talvez seja assim que funciona.
 
Aleksey Vyazmikin:

Levanta-se a questão de saber o que explica o efeito...

...e como explicá-lo não está claro.

Nova construção, novo testador, novo compilador... falta a coluna "construir mt5" na tabela de resumo

 
Maxim Romanov:
O 3800x quase alcançou o i7 8700 em termos de desempenho por rosca. E se afastou do 2700.
Isto se deve provavelmente à redução da latência da memória e ao dobro do cache.
Conclusão: para o mt5, o fator decisivo é a latência de acesso à memória e a velocidade de leitura da memória.
Isto também é evidenciado pelo baixo desempenho da rosca 2990 wx. Eles têm altas latências de memória apesar dos 4 canais e do manuseio específico do cache.
Portanto, a velocidade dos núcleos em si não é tão importante.
Talvez seja assim que funciona.

Eu acho que o importante não é tanto o aumento do cache, mas a mudança do princípio de trabalho com ele - aqui no artigo é possível ler em detalhes, mais a aceleração do trabalho com instruções AVX2 e como um todo a freqüência elevada do relógio do processador. Não tenho certeza de que a RAM desempenhe um papel aqui - não há manuseio da história, não há grandes operações de escrita.

A propósito, note que processadores diferentes lidam com EAs de maneira diferente

Mostra o tempo médio por passe em segundos.

Микроархитектура Zen 2: вот почему мы ждём Ryzen 3000
Микроархитектура Zen 2: вот почему мы ждём Ryzen 3000
  • 3dnews.ru
Через две недели с небольшим нас, по всей видимости, ожидает чудо. Такой вывод можно сделать, если обобщить все те предположения, которые высказывают пользователи в ожидании предстоящего анонса процессоров Ryzen третьего поколения. Но даже самые смелые высказывания о том, будто бы во второй половине года на рынке процессоров для ПК нас ждёт...