Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1269

 

De los creadores de AlphaGo Zero fresh, disfruta viéndolo :)


 
Maxim Dmitrievsky:

Recién salido de los creadores de AlphaGo Zero, disfruta viéndolo :)


¿Hay instrucciones detalladas sobre cómo crear/entrenar/conectar modelos para Star Kraft?

 
Maxim Dmitrievsky:

Creo que no juego, sólo veo los partidos.

A juzgar por las repeticiones, el Alpha Trader, si se hace, comerciará mejor que cualquier bolsa de dados

Me parece que hacer un robot de este tipo puede conseguir nuevas habilidades en MO, y es simplemente interesante. Yo mismo he jugado a StarCraft 2 un par de veces desde que salieron los nuevos capítulos (ahí la historia se divide en varias partes). Cuando se juega contra la IA, a menudo se gana no por la lógica de la acción, sino por el control de las unidades - una persona físicamente no puede controlar todo el mapa y todas las unidades a la vez.

 
Vladimir Perervenko:

No controlo la mía, no conozco la de los demás. El artículo citado anteriormente no tiene suficiente información para ser reproducible y el código es demasiado complicado. Creo que todo se puede implementar con capas estándar de los paquetes, sin usar R6.

Buena suerte

No entiendo qué suerte me deseas.

Por favor, haga una demostración al menos

Si el resultado del trabajo del experto con elementos de MO es aceptable, entonces releeré toda la rama de principio a fin.

 
Maxim Dmitrievsky:

Este no es el caso aquí, es exactamente parecido a lo que ve y hace un humano - campo de visión limitado, la apm media es inferior a la del jugador profesional. es decir, es la batalla de las inteligencias, es decir, de las estrategias, no de las velocidades (donde la máquina, por supuesto, siempre ganará)

Y la IA incorporada en SC no es más que oponentes revueltos y poco interesantes. Éste, por el contrario, juega como un ser humano. No distinguiría a un jugador profesional de esta IA, es decir, test de Turing superado )))

Incluso visualizó la nube de neuronas activas del cerebro electrónico


Desde la pantalla no se pueden sacar conclusiones inequívocas. Sí, tal vez para controlar sólo lo que cabe en la pantalla - no hay problema, para estos fines utilizar las teclas de acceso rápido en una unidad / estructura o grupo de unidades, entonces no es necesario observar visualmente en este punto, y se puede coordinar en el mapa, que también es siempre visible en la pantalla. Chisha todo en mikrokontrol, yo personalmente vi un par de videos y no vi algo inteligente allí en términos de estrategia, pero el uso del potencial de las unidades individuales allí se divulga en el pleno. Es decir, el énfasis está en la evaluación de la amenaza potencial y las opciones para contrarrestarlo - en función de la rama de desarrollo del enemigo se desarrolla una rama, además de un módulo separado en la economía - diferentes métodos han visto, y el control, y creo que los dos primeros módulos (rama de desarrollo y la economía) se programan o se aplica la lógica difusa, algo relativamente torpe para la estabilidad, pero el control se basa en la situación y aquí sólo funcionan AI en su totalidad. Por cierto, no está claro cómo se transmite la información sobre los objetos, cómo se resumen para tomar una decisión y tener en cuenta su movimiento, los chips y los objetivos no están claros.

 
Por cierto, a veces juego al Warcraft III en la red de blizard y allí me suelen acusar de IA, me pregunto si se puede aplicar allí también. Y si se utiliza, me pregunto cuántas veces he jugado con dicha IA.
 
Maxim Dmitrievsky:

Allí, por cierto, originalmente todo el mapa se colocó en la pantalla para el bot, y luego lo hicieron como un jugador y entonces el bot comenzó a estancarse y el hombre ganó (al final del video). Bien filmado mal mb por esta situación. Por otro lado cómo evaluar la eficacia - una vez que ciertos estratos conducen al éxito entonces el bot los eligió

Creo que si haces que las restricciones de control sean proporcionales a las de una persona, los bots ganarán al usuario medio, porque el comportamiento de la multitud es similar y será el más frecuente. Por cierto, cuando traté de jugar con mi hijo en la red para un clan contra los robots de juguete Warcraft 3, a continuación, en un primer momento fue tan difícil (y antes de que yo tenía una gran experiencia en los juegos de clan en la batalla contra los seres humanos), pero luego acostumbrarse al comportamiento del bot y poco a poco le superó utilizando soluciones no estándar (por ejemplo, cortar a través de los árboles a la mina, protegiendo así las unidades de ataque desde el suelo). Por eso me pregunto qué peso debe darse a las estrategias no estándar, para que puedan ser tenidas en cuenta durante la MdD, es decir, necesito separar los comportamientos estándar de los no estándar y tener un enfoque diferente para ellos, y al mismo tiempo que no interfieran entre sí. Es como una tendencia y un piso - un modelo es muy difícil de entrenar ambos a la vez, al menos no sé cómo.

 
Maxim Dmitrievsky:

No creo que tenga ningún peso. Si las situaciones son raras, el bot simplemente ignorará dichas opciones. Si una persona se adapta a las estrategias del bot, entonces el bot necesita entrenar todo el tiempo para adaptarse al estrato de una persona, de lo contrario no será una situación de igualdad).

No sé, entonces resulta que depende mucho de la muestra, si la muestra es diferente, entonces los bots se comportarán de manera diferente en una pelea entre sí, es decir, aquí no es sólo la formación, sino también el factor suerte (que entrenó en qué).

Así que no siempre es visible (posible estimar correctamente) el resultado del entrenamiento, ya que no hay una muestra válida para comparar los resultados.

 
Maxim Dmitrievsky:

Sí, así es como se aprende allí: a través de redes de adversarios, algo así. La IA juega contra la IA miles de veces, reproduciendo muchas estrategias diferentes. Con el tiempo, la red resuelve las mejores estrategias. Si el número de partidas supera al de un jugador profesional (lo que equivale a 200 años de juego, como se dice), la ventaja estadística estará muy probablemente del lado del bot, ya que ha considerado más combinaciones. Pero la probabilidad de encontrar un estrato ganador único sigue siendo, por supuesto, el hombre

El tema es interesante, pero está rodeado de misterio :) El trading es diferente en el sentido de que no podemos influir en el mercado con nuestro comportamiento y no tenemos la posibilidad de corregir errores, tal vez con el promediado de posiciones...

 
Maxim Dmitrievsky:

Si rompes el gráfico en miles y millones de trozos y haces que el bot juegue contra él tantas veces, quizá aprenda a ganarle siempre, de nuevo depende del fic

Yo lo veo de forma ligeramente diferente, el juego tiene convencionalmente una puntuación matemática para cada bando que consiste en muchos factores: el número de bots y su potencial, los activos, el dinero, y el objetivo del oponente de reducir esta puntuación para mantener su puntuación más alta que la del oponente, es decir, gastar menos energía en el resultado. Esto da lugar a un sistema de influencia mutua, en el que está claro que si al sacrificar una unidad se disminuye el valor estimado de los activos del adversario en mayor medida que el valor estimado de la unidad, entonces es la decisión correcta, y si no, entonces no es la correcta. En el comercio no tenemos garantías, sólo probabilidad, mientras que en los juguetes hay garantías matemáticas que se pueden calcular.

No podemos influir en la situación, mientras que en un juego sí podemos, incluso crear nosotros mismos situaciones provechosas.