Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
IMC2 (complementario al IMC1).
Dado que MPX y SGX tienen que ver con la protección, me atrevería a suponer que el compilador utiliza activamente instrucciones/tecnologías BMI2 y que hay un efecto de TSX, lo cual es menos probable.
OpenCL en una tarjeta será a priori mucho más eficiente que varios procesadores.
Y olvídate del engorro de comparar procesadores.
Pero sí, tienes que averiguar cómo escribir código para OpenCL.
No puedo decir qué tan informativo es - he estado tratando de leerlo por mi cuenta.
Alexey, creo que sería más eficiente aprender a escribir código OpenCL y conseguir una buena tarjeta para ello.
OpenCL en una tarjeta será a priori mucho más eficiente que varios procesadores.
Y olvídate de ese engorro de comparar procesadores.
Pero sí, tienes que averiguar cómo escribir código para OpenCL.
No puedo decir qué tan informativo es - he estado tratando de leerlo por mi cuenta.
No es tan fácil escribir en OpenCL, he estudiado un poco la teoría, es más fácil hacer un agente con tecnología OpenCL, no como ahora, más fácil en términos de consumidores.
Y entonces, OpenCL no siempre es eficiente, por lo que estaba comparando en el software de Yandex(CatBoost) tarjeta 1060 y el procesador FX-8350 - resultó que el procesador es dos veces más rápido, y si esa tendencia es económicamente más rentable para comprar un potente procesador de cinco 1080i, de la que sin duda habrá un efecto, pero caro ... en general, no está claro y no es una solución para todos.
Y luego, creo que en el compilador se puede simplemente desactivar el soporte para las últimas tecnologías y para los veteranos todo funcionará más rápido, la opción de desactivar.No es tan fácil escribir en OpenCL, he estudiado un poco la teoría, es más fácil hacer un agente con tecnología OpenCL, no como ahora, más fácil en términos de consumidores.
Y entonces, OpenCL no siempre es eficiente, por lo que estaba comparando en el software de Yandex (CatBoost) tarjeta 1060 y el procesador FX-8350 - resultó que el procesador es dos veces más rápido, y si esa tendencia es económicamente más rentable para comprar un potente procesador de cinco 1080i, de la que sin duda habrá un efecto, pero caro ... en general, no está claro y no es una solución para todos.
Para los cálculos matemáticos, los verdes no son especialmente adecuados.
Los rojos son mejores para las matemáticas, incluso tienen un modo matemático de serie, que se puede configurar a través de la app oficial.
Tengo una vieja Radeon 7970 de referencia, todavía soporta la minería. Esto no quiere decir que mine con una sola tarjeta, no es rentable, sino que tira de los cálculos.
Para los cálculos matemáticos de la tarjeta, hay que fijarse en el número de shaders, cuantos más mejor, el resto de fps, etc. no importa, lo más importante son los bloques de shader.
Para los cálculos matemáticos, los verdes no son especialmente adecuados.
Para las matemáticas, son mejores las rojas, que incluso tienen un modo matemático de serie, que se puede configurar a través de la app oficial.
Tengo una vieja Radeon 7970 de referencia, todavía soporta la minería. Esto no quiere decir que mine con una sola tarjeta, no es rentable, sino que tira de los cálculos.
Para los cálculos matemáticos de la tarjeta, hay que fijarse en el número de shaders, cuantos más mejor, el resto de fps, etc. no importa, lo más importante son los bloques de shader.
Que yo sepa, los rojos sólo saben trabajar con el doble y los verdes no, eso lo sé. Pero, en el aprendizaje de la máquina (CatBoost) hay un afilado para las operaciones de comparación, que debería funcionar tan rápido como en el rojo y el verde. Y los rojos no son compatibles con CatBoost, por desgracia.
En cualquier caso, no puedo hacerlo yo mismo, y los artistas a encontrar no era tan fácil para un precio adecuado y la comprensión.
Se me sugirió que el código podría acelerarse utilizando la enumeración de interruptores.
Antes era así:
Y ahora es así:
Según las primeras estimaciones, el FX-8350 es un 30% más rápido, pero los procesadores Phenom II son unas 3 veces más rápidos. Haré pruebas de comparación más adelante, cuando las máquinas estén libres de optimización.
Adjunto la nueva versión de Tree_Brut_TestPL Expert Advisor, y he añadido "_Fast" a su nombre. Por favor, pruébenla también, ya que es muy interesante saber en qué arquitecturas se gana. Existe la esperanza de que estas investigaciones ayuden a mejorar el compilador ME.
He recibido datos adicionales del miembro del foroFast528 (actualmente no puede publicar en el foro)
Ryzen 2700 sin overclock, memoria 3333
Tree_Brut_TestPL 8 núcleos 16 hilos
Tree_Brut_TestPL_F8 núcleos 16 hilos
Esta prueba no está completa ya que necesitamos una variante con 8 núcleos y 8 hilos debido a la activación de 8 agentes y además se deben especificar 16 pases en la pestaña "Optimización" - según el número de hilos (Inicio 0, Paso 1, Parada 15).
Cuando vuelva a ejecutar la prueba, no olvide borrar la caché, que se encuentra en ..\NTester\Ncache
Añadiré los resultados intermedios a la tabla por ahora como 8 núcleos / 8 agentes.
Desgraciadamente ya no puedo editar el primer post, así que pongo la calificación aquí
Aquí está el resultado de fx8320e frecuencia 4GHz, memoria 1866 2 canales, rango 2.
Árbol_Rut_TestPL_F_Frápido
4 agentes 8 pases
8 agentes 8 pases
8 agentes casi 2 veces más rápidos
Aquí está el resultado de fx8320e frecuencia 4GHz, memoria 1866 2 canales, rango 2.
Árbol_Rut_TestPL_F_Frápido
4 agentes 8 pases
8 agentes 8 pases
8 agentes casi 2 veces más rápidos
Gracias, pero añade los resultados de Tree_Brut_TestPL_F y Tree_Brut_TestPL para su evaluación.