OpenCL: pruebas de implementación interna en MQL5 - página 21
Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
Sí, creo que lo entiendo, no estás satisfecho con
1. la complicación de los algoritmos y los excesos de memoria por el uso
2. y quiere poder compensar en la fase de copia.
Así que no tienes que copiar 100000 elementos y luego hacer 998000 desplazamientos.
3. Pero deberíamos dejar la variante con offset, que tenemos ahora, porque nos permite no copiar un mismo dato muchas veces, sino tomarlos para una nueva tarea desde un buffer CL ya existente con un nuevo offset.
1. no. No me gusta perder el tiempo con copias adicionales. Aunque, si usamos float, tendremos que copiar en el hueco de todos modos.
2. Sí.
3. Sí.
Primeras tortitas: https://www.mql5.com/ru/forum/138292/page7#601897
Muy bien. Impresionante. Deliciosos panqueques.
//---
¿Habrá un artículo sobre OpenCL? Todavía no me he acercado a este tema en la práctica, pero sería muy interesante leerlo en perspectiva. O al menos un par de scripts de ejemplo en la ayuda sobre cómo utilizarlo. No hay suficiente información para todos.
He conseguido un aumento de velocidad de x200x en mi tarjeta en comparación con un solo núcleo de la CPU.
Por favor, haz la prueba y publica los resultados.
Si la tarjeta no está tirando de la memoria, reduzca el historial (CountBars) o el número de pasadas (CountPass) que es menos deseable.
Remolque de probador multicanal
Mi resultado, una aceleración de 133 veces:
Es sorprendente que en un solo núcleo el i7 funcione 2 veces más rápido que el X6 1100T, a frecuencias comparables (el i7 ronda los 3,8 GHz, el 1100T los 3,7). Es comprensible que se trate de este tipo de computación, pero la diferencia de velocidad de la CPU en hilos bajos es monstruosa.
Pensando mucho, leyendo en Google.
Me he estado rascando la cabeza.
O tienen el mql-compilador-optimizador más avanzado cogido con pinzas para ellos y no nos lo dan, o ya no sé.
No funciona así. "¡No lo puedo creer!" (c) KSS.
Y lo más probable es que tengan un codogenerador optimizado para Intel.
De todas formas es una barbaridad. Me quejaré a la ONU.
Por alguna razón no pude encontrar una línea sobre la CPU en los registros.
Intel Celeron G530 2.4GHz
Aquí es donde no lo entiendo:
Tengo una GeForce GT 440 con OpenCL 1.1 (2 unidades, 1660 MHz, 1024 Mb, versión 295.73) Tiempo de GPU = 1513 ms
Tengo una GeForce GT 520 con OpenCL 1.1 (1 unidades, 1620 MHz, 512 Mb, versión 285.62) Tiempo de GPU = 234 ms
¿Cómo es posible?
Aquí GeForce GT 440 y aquí GeForce GT 520 especificaciones comparadas, la mía es por todos los parámetros más, pero el tiempo de ejecución es 6,5 veces más.