OpenCL: testes internos de implementação em MQL5 - página 21
Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
Sim, acho que já percebi, não está satisfeito com
1. a complicação dos algoritmos e a sobrecarga de memória devido à sua utilização
2. e quer ser capaz de compensar na fase de cópia.
Assim não tem de copiar 100000 elementos e depois fazer 998000 offsets.
3. mas devemos deixar a variante com offset, que temos agora, porque nos permite não copiar um e os mesmos dados muitas vezes, mas levá-los para uma nova tarefa de um tampão CL já existente com um novo offset.
1. não. Não gosto de perder tempo com cópias extra. Embora, se utilizarmos o flutuador, teremos de copiar para o espaço de qualquer maneira.
2. Sim.
3. Sim.
Primeiras panquecas: https://www.mql5.com/ru/forum/138292/page7#601897
Boa. Impressionante. Deliciosas panquecas.
//---
Haverá um artigo sobre OpenCL? Ainda não cheguei perto deste tópico na prática, mas seria muito interessante lê-lo em perspectiva. Ou pelo menos um par de exemplos de scripts na ajuda sobre como utilizá-lo. Não há informação suficiente para se dar a volta.
Consegui obter um aumento de velocidade x200x no meu cartão em comparação com um único núcleo de CPU.
Por favor, testar e publicar os resultados.
Se o cartão não estiver a puxar memória, reduza o histórico (CountBars) ou o número de passes (CountPass), o que é menos desejável.
Reboque de testador multi-canal
O meu resultado, uma aceleração de 133 vezes:
É espantoso que num único núcleo o i7 funcione 2 vezes mais rápido que o X6 1100T - a frequências comparáveis (o i7 é cerca de 3,8 GHz, o 1100T é 3,7). É compreensível que se trate de tal computação, mas a diferença na velocidade da CPU em roscas baixas é monstruosa.
Pensar muito, ler google.
Tenho andado a coçar a cabeça.
Ou eles têm o mais avançado mql-compilador-optimizador fixado por eles próprios e não nos dão, ou já não sei mais.
Não funciona dessa forma. "Eu não acredito!" (c) KSS.
E o mais provável é que tenham um codogerador optimizado para a Intel.
É um ultraje de qualquer forma! Vou queixar-me à ONU.
Não consegui encontrar uma linha sobre o CPU nos registos por alguma razão.
Intel Celeron G530 2.4GHz
É aqui que não o obtenho:
Tenho uma GeForce GT 440 com OpenCL 1.1 (2 unidades, 1660 MHz, 1024 Mb, versão 295.73) tempo de GPU = 1513 ms
Tenho a GeForce GT 520 com OpenCL 1.1 (1 unidades, 1620 MHz, 512 Mb, versão 285.62) tempo de GPU = 234 ms
Como é que isto é possível?
Aqui a GeForce GT 440 e aqui a GeForce GT 520 compararam especificações, a minha é por todos os parâmetros mais, mas o tempo de execução é 6,5 vezes mais.