Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1273

 
Aleksey Vyazmikin:

No sé cómo piensas, pero los términos sólo distorsionan la esencia del pensamiento, a menos que hablemos de axiomas, establecidos desde hace tiempo y no verificables.

No se puede dar una analogía, referirse a la terminología es improductivo.

Todas las analogías se harán añicos contra el muro de tus fantasías. Ayer te di muchas, pero no entendiste ni una.

Stirlitz se mantuvo firme, era la tortura favorita de Mueller.

Si le agrada pensar que un agente está influyendo en su oponente a propósito, que es una especie de estrategia especial, entonces piense

y simplemente repasa sus opciones, jugando muchas veces con los oponentes, y para cada caso señala las mejores estrategias (si gana obtiene recompensas), si pierde es penalizado. Como resultado, tiene experiencia en forma de un NS bien gastado que tiene en cuenta una gran cantidad de combinaciones de juego diferentes y puede predecir el resultado de cada una, por lo que actúa de acuerdo con las mejores predicciones. Si el adversario cambia el estrato, el SN lo ve y reacciona con otro estrato, activando otras neuronas. Y de la misma manera, cuando el mercado cambia el NS hace predicciones diferentes.

 
Aleksey Vyazmikin:

No sé cómo piensas, pero los términos sólo distorsionan la esencia del pensamiento, a menos que hablemos de axiomas, establecidos desde hace tiempo y no verificables.

No se puede dar una analogía, referirse a la terminología es improductivo.

Alexey, estás haciendo spam, y entiendo por qué, durante todo el tiempo que escribiste un montón de cartas aquí, ¿escribiste una sola línea de código que apoyara tus palabras y conjeturas?

Estoy bastante seguro de que no lo he hecho.

Lo triste es que cuando pides algún material para sensibilizarte sobre un tema de actualidad lo descartas fácilmente porque está en un idioma con el que no estás familiarizado, ¿tan difícil puede ser usar traductores?

En cuanto a las probabilidades, sólo una red neuronal se entrena en escenarios históricos con el 100% de resultado conocido y sólo después de la aplicación de la red entrenada, se obtiene una respuesta para la situación no 100%, pero probabilística, a continuación, basado en la lógica que será usted, usted (otra red) decidirá qué hacer, por lo que finalmente se obtiene una red viva, sus decisiones y los resultados no serán posibles de predecir.

 
Maxim Dmitrievsky:

todas las analogías romperán el muro de tus fantasías. Ayer te di muchas, pero no entendiste ni una.

Stirlitz se mantuvo firme, era la tortura favorita de Mueller.

Si le agrada pensar que un agente está influyendo en su oponente a propósito, que es una especie de estrategia especial, entonces piense

y simplemente repasa sus opciones, jugando muchas veces con los oponentes, y para cada caso señala las mejores estrategias (si gana obtiene recompensas), si pierde es penalizado. Como resultado, tiene experiencia en forma de un NS bien gastado que tiene en cuenta una gran cantidad de combinaciones de juego diferentes y puede predecir el resultado de cada una, por lo que actúa de acuerdo con las mejores predicciones. Si el adversario cambia el estrato, el SN lo ve y reacciona con otro estrato, activando otras neuronas. Del mismo modo, cuando el mercado cambia, la SN cambia sus previsiones.

Lo escribes correctamente, ¿estoy discutiendo eso? No, sostengo que la elección viene de aquellas acciones que pueden tener un impacto en el medio ambiente, la oposición o la inacción. Sí, uno recibe una recompensa por influir en el adversario y cambiar así la probabilidad del resultado global del evento (juego), mientras que el comerciante no tiene exactamente esa oportunidad en la acción y esto afecta significativamente al vector de acción. Tal vez si dividimos la acción en tres grupos, veamos que es el impacto sobre el oponente lo que más contribuye al resultado global, es decir, es la acción significativa que lleva al resultado positivo global lo que más afecta al resultado.

Si no he conseguido que se entienda mi punto de vista, creo que lo he intentado lo suficiente, ya que estoy creando una imposición, mientras que sólo quería compartir mis observaciones.

 
Farkhat Guzairov:

Alexey, para ser honesto sólo estás haciendo spam y entiendo por qué, durante todo el tiempo que has escrito aquí un montón de letras, ¿has escrito una sola línea de código que pueda apoyar tus palabras y conjeturas?

Estoy bastante seguro de que no lo he hecho.

Lo triste es que cuando pides algún material para sensibilizarte sobre un tema de actualidad lo descartas fácilmente porque está en un idioma con el que no estás familiarizado, ¿tan difícil puede ser usar traductores?

Acerca de las probabilidades, sólo una red neuronal se entrena en escenarios históricos con el 100% de resultado conocido y después de la aplicación de la red entrenada, se obtiene una respuesta a la situación no es 100%, pero probabilística, a continuación, basado en la lógica que será usted pone en su lugar, usted (otra red) decidirá qué hacer, por lo que finalmente se obtiene una red viva, las decisiones y los resultados no será posible predecir.

No he escrito ningún código en el juego StarCraft 2, ni siquiera podía encontrar cómo hacer que los robots, es decir, el intelecto no puede ser programado por los factores desencadenantes, y la intervención directa en el código, una especie de prohibido, que se informa, pero es posible acceder a la memoria utilizada StarCraft (1) y hay un tiempo largo competiciones. Sin embargo, ¿alguien de aquí ha puesto código en el juego?

Sí, me dieron el material (Maxim es buena en cuanto a trabajar con literatura/información extranjera), pero pedí una definición del término y, además, estimé que el material contenía más información de la que podía encontrar en las extensiones de Internet de habla rusa.

No he entendido su mensaje sobre los principios de la MdD. ¿Qué quieres decir con eso?

 
Aleksey Vyazmikin:

No, no he escrito ningún código en el juego StarCraft 2, ni siquiera he podido encontrar cómo se hacen los bots, es decir, la inteligencia allí se puede programar con disparadores, y la interferencia directa con el código está como prohibida, según se informa, pero es posible acceder a la memoria utilizada por StarCraft (1) y hay competiciones de larga duración allí. Sin embargo, ¿alguien de aquí ha puesto código en el juego?

Sobre StarCraft 2, nadie está manipulando directamente el código del juego, ni hay una API para recuperar datos del juego, las cosas son mucho más sencillas. Los robots aprenden basándose en imágenes gráficas, sólo capturas de pantalla, es decir, obtienen exactamente la misma información que una persona, pero la utilizan de forma mucho más eficiente que el jugador medio.

 
Farkhat Guzairov:

Sobre StarCraft 2, nadie está manipulando directamente el código del juego, ni hay una API para recuperar datos del juego, todo es mucho más sencillo. Los bots aprenden basándose en imágenes gráficas, simplemente capturas de pantalla, lo que significa que obtienen exactamente la misma cantidad de información que un humano, pero la gestionan de forma mucho más eficiente que un jugador estadístico medio.

Me refiero principalmente a la aplicación del modelo. Puede leerlo aquí.

История соревнований ИИ по Starcraft
История соревнований ИИ по Starcraft
  • habr.com
Начиная с первого Starcraft AI Competition, проведённого в 2010 году, тема искусственного интеллекта в стратегиях реального времени (RTS) становится всё более популярной. Участники таких соревнований представляют своих ИИ-ботов Starcraft, которые сражаются в стандартной версии Starcraft: Broodwar. Эти соревнования по играм RTS, вдохновлённые...
 
Aleksey Vyazmikin:

Me refiero principalmente a la aplicación del modelo. Puede leerlo aquí, por ejemplo.

En mi post sobre el código, hacía una pregunta retórica, porque se ha escrito mucho en este hilo, pero muy poca gente ha acabado siendo capaz de aplicar al menos el 5% de lo que se ha tratado aquí. ¿Ha hecho algo personalmente como resultado?

Sobre los modelos aplicables, sí, todos son similares (juegos, previsiones meteorológicas, mercados, etc.), la cuestión aquí es lo que se introduce en el modus operandi y no cómo se manejará dentro del modus operandi, la gente sigue sin entender cómo acabará con lo que obtiene del modus operandi, ese es todo el problema. En este sentido, es más fácil con los juegos, porque hay una matriz de datos de entrada ya preparada, pero en todos los demás ámbitos hay que inventar métodos propios de preprocesamiento.

 
Farkhat Guzairov:

En mi post sobre el código, hacía una pregunta retórica porque se ha escrito mucho en este hilo, pero muy poca gente ha acabado siendo capaz de aplicar al menos el 5% de lo que se ha tratado aquí. ¿Ha hecho algo personalmente como resultado?

Sobre los modelos aplicables, sí son todos similares (juegos, previsiones meteorológicas, mercados, etc.), la cuestión aquí es lo que se introduce en el modus operandi, no cómo se manejará dentro del modus operandi, la gente sigue sin entender cómo acabará con lo que obtiene del modus operandi, ese es todo el problema. En este sentido, es más fácil con los juegos, porque ya hay una matriz de datos de entrada preparada, pero en todas las demás áreas tienes que idear tus propios métodos de preprocesamiento.

Pues bien, tú mismo no has leído la información con la que has empezado a argumentar, y encima me has acusado. De acuerdo, todas las personas son iguales.

Nuevamente no entiendo la pregunta, sobre "usted personalmente hizo algo como resultado" - desdoblarlo, en qué tipo de resultado, y qué debería haber hecho personalmente? Si te refieres a mi aplicación de MO, entonces sí, estoy trabajando en este tema de varias maneras (creación de modelos, selección, aplicación) - he escrito mucho aquí sobre mis logros.

Esa es la cuestión, no todos los modelos son similares, pero los predictores son, sí, extremadamente significativos. Los mismos expertos de Yandex afirman, por ejemplo, que un sistema complejo se compone de diferentes modelos, incluyendo diferentes tipos (árboles/NS).

 

Por cierto, nótese que el hombre estaba perdiendo por cometer errores en las acciones (hacer clic torcido/olvidar activar una habilidad), pero pudo ganar utilizando un movimiento táctico no estándar: distraer constantemente al oponente aterrizando en la parte trasera de la base del oponente, lo que le obligó a desplegar sus tropas para atacar la base del hombre, lo que dio al hombre tiempo para desarrollar sus unidades a un nivel superior, como resultado pudo infligir un daño significativo al oponente y ganar la partida.

Así es también como los picos inesperados y los falsos proboys distraen al comerciante de su objetivo.

 
Aleksey Vyazmikin:

Por cierto, nótese que el hombre estaba perdiendo por cometer errores en las acciones (hacer clic torcido/olvidar activar una habilidad), pero pudo ganar utilizando un movimiento táctico no estándar: distraer constantemente al oponente aterrizando en la parte trasera de la base del oponente, lo que le obligó a desplegar sus tropas para atacar la base del hombre, lo que dio al hombre tiempo para desarrollar sus unidades a un nivel superior, como resultado pudo infligir un daño significativo al oponente y ganar la partida.

Así, los picos inesperados y los falsos proboys distraen al comerciante del objetivo.

Así que para la siguiente partida, este comportamiento no estándar ya será vencido por el bot, está claro que de momento un hombre puede vencer a la IA a costa de un comportamiento no estándar, pero en cuanto la IA "diga" "Por qué es posible hacerlo", el hombre lo tendrá difícil.