Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
Gracias, no me había dado cuenta de que se iba a abrir un informe.
La ganancia fue aún mayor.
Estoy sorprendido: ¡es una tarjeta económica por menos de 80 dólares! Por lo tanto, NVidia ha trabajado mucho en el controlador.
Y aquí están los nuevos resultados:
Entiendo: 1. CPU pura, 2. CPU con OpenCL, 3. ¿GPU con OpenCL?
Y sigue siendo 422.
Estoy sorprendido: ¡se trata de una tarjeta económica que cuesta menos de 80 dólares! Así que NVidia ha trabajado mucho en el controlador.
Y qué sorprendido estoy, de la suciedad a la riqueza. Uno tiene la impresión de que NVidia lee este foro, hace pruebas similares, encuentra fallos y los corrige.
Si el probador eligiera sobre qué simular, es decir, sin la escritura forzada de código, estaría muy bien. Aun así, 1 segundo (u 11 segundos si el vídeo no lo permite o no está disponible) contra 7 minutos es poder.
Los sistemas operativos modernos y los procesadores realmente multinúcleo han eliminado seriamente el problema de la dispersión de las mediciones a través de GetTickCount. Mi comentario original se refería únicamente a la afirmación errónea "el error medio de GetTickCount es de al menos decenas de ms".
en el registro se ve así:
"nvcuda.dll"=dword:00000000
"amdocl.dll"=dword:00000000
"amdocl64.dll"=dword:00000000
"IntelOpenCL64.dll"=dword:00000000
Son aproximadamente 1,5 veces más lentos (resaltados en rojo) que el controlador nativo de Intel (resaltados en verde).
Puede eliminar los valores de registro correspondientes, pero guarde la rama por si acaso.
Estimado administrador. No he estado en su foro por un tiempo, puede haber perdido este punto.
¿Se implementará la rendición de las tarjetas de vídeo a las necesidades de la nube?
Estimado administrador. No he estado en su foro por un tiempo, puede haber perdido este punto.
¿Habrá una implementación de intercambio de tarjetas de vídeo para las necesidades de la nube?
Casi terminado https://www.mql5.com/ru/forum/23/page15#comment_201948
Los programas OpenCL están pensados para realizar cálculos en tarjetas de vídeo compatibles con OpenCL 1.1 o superior. Las tarjetas de vídeo modernas contienen cientos de pequeños procesadores especializados que pueden realizar simultáneamente operaciones matemáticas sencillas sobre flujos de datos entrantes. El lenguaje OpenCL se encarga de la organización de esta computación paralela y ofrece un gran aumento de velocidad para una determinada clase de tareas.
Sí, así es.
¿Te importaría ejecutar el script adjunto y publicar los resultados? Es realmente interesante.
No tenga miedo de un gran número de dígitos. Sólo están ahí para comprobar que los cálculos son correctos.
El guión también pasa por todos los dispositivos. La tarea principal es multiplicar dos matrices grandes.
Los ajustes sólo se pueden cambiar dentro del código - el tamaño lineal de las matrices _size en esta línea:
#define _size 2000
Cámbielos sólo si se queda sin memoria. Una señal de ello son las discrepancias en los números de las matrices cuando se ejecutan en una GPU discreta: si la diferencia en los números es superior a 10^(-4), es un error evidente. Pero parece que tienes suficiente memoria.
Por ejemplo, tengo una tarjeta gráfica Radeon 6930 que tiene 1280 procesadores de flujo. ¿Cómo aparecerá en la lista de agentes? Como 1 dispositivo, o los 1280.
Por sí solo es más rápido que 10 procesadores, y la bonificación no es para un dispositivo añadido.
¿Te importaría ejecutar el script adjunto y mostrar los resultados? Es realmente interesante.
No, no es un aburrimiento. Yo también tengo curiosidad. No he cambiado nada en la configuración.
No entiendo ninguno de los números. ¿Puede explicarlo? Bueno, al menos en los dedos: ¿es bueno o no? Son diferentes entre los dispositivos, y en las líneas de 5-6 dígitos después del punto decimal ya es diferente en lugares.
Creo que lo tengo: es una prueba múltiple para operaciones repetitivas, el tiempo final es la media de cada dispositivo. ¿Verdad?
Estos son sólo dígitos de control. Si coinciden con 0,00001, todo está bien. Los índices se eligen al azar: es una comprobación aleatoria para asegurarse de que los cálculos son correctos. Bueno, no vamos a imprimir aquí los resultados de una comprobación completa de los 4 millones de elementos de la matriz resultante, ¿verdad?
Creo que lo tengo: es una prueba múltiple sobre operaciones repetidas, el tiempo final es la media de cada dispositivo. ¿Verdad?
No, se trata de una única operación de multiplicación de dos grandes matrices.
En cuanto a las cifras de rendimiento: muy buenas para esta tarjeta. Ahora mis resultados. Dispositivos (de abajo a arriba - orden de inicialización):
Es decir, primero una CPU Intel con el motor OCL de Intel, luego mi dinosaurio HD 4870, y luego una piedra de nuevo pero con el motor de AMD. Guión: