Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3049

 
Aleksey Nikolayev #:

Tenemos la influencia del entorno sobre el agente, pero ¿existe una influencia del agente sobre el entorno? Probablemente, es posible introducir esta segunda influencia artificialmente, pero ¿tiene sentido?

Todo depende de la tarea que tengamos entre manos.

Si pronosticamos un objetivo prefijado, como hace la inmensa mayoría, entonces no tenemos ninguna influencia sobre el entorno, y no hay necesidad de RL.

Pero si, por ejemplo, la tarea de gestión de posiciones, stops, take-outs...

La gestión de activos es el entorno que nosotros (agente) gestionamos.


El agente decide poner una orden o no ponerla.

a qué precio,

y cuándo retirarla o moverla,

y qué hará cuando la pérdida actual en la posición actual exceda n pips,

¿y qué hará si tiene cinco pérdidas seguidas?


Usted ve, este es un nivel completamente diferente de la tarea, con un montón de estados (salidas), no un primitivo arriba / abajo en la clasificación


Para hacerlo aún más simple - no podemos gestionar el mercado, pero podemos gestionar la posición y el riesgo, ¡porque podemos!


Aleksey Nikolayev #:

Suavidad de algún análogo de beneficio, probablemente, se puede lograr de alguna manera (por ejemplo, por algo así como suavizado de núcleo). Pero dudo mucho de la monotonicidad.

No entiendo muy bien qué se quiere decir con "suavidad" y por qué es necesaria la "suavidad" ....

Quizá podamos utilizar la optimización multicriterio para encontrar la mejor solución.

 
mytarmailS #:

todo depende de la tarea a realizar.

Si prevemos un objetivo prefabricado, como hace la inmensa mayoría de la gente, entonces no tenemos ninguna influencia en el entorno, y no hay necesidad de la propia RL....

Pero si, por ejemplo, la tarea de gestión de posiciones, paradas, tomas ...

La gestión de activos es el medio ambiente, que nosotros (el agente) gestionar ...


El agente decide poner una orden o no ponerla.

a qué precio,

y cuándo sacarla o moverla,

y qué hará cuando la pérdida en la posición actual supere los n puntos,

y qué hará cuando tenga cinco pérdidas seguidas...


Usted ve, este es un nivel completamente diferente de la tarea, con un montón de estados (salidas), no un primitivo arriba / abajo en la clasificación


Para decirlo de forma aún más sencilla: no podemos gestionar el mercado, pero podemos gestionar la posición y el riesgo, ¡sí podemos!


No entiendo muy bien en qué consiste la "suavidad" y para qué se necesita....

Quizá podamos aplicar la optimización multicriterio a la búsqueda.

Podríamos promediar el agente.
 
Valeriy Yastremskiy #:
Es posible que un agente promedie.
https://www.mql5.com/ru/code/22915
 
СанСаныч Фоменко #:

La base del resultado financiero de la negociación es el movimiento de los precios, un proceso aleatorio no estacionario.

¿Intentamos convertir un proceso aleatorio no estacionario en un proceso suave y monótono mediante algunos trucos? ¿Quizá estemos andando con pies de plomo? Sobre todo si tenemos en cuenta que un error de clasificación inferior al 20%(!) fuera del conjunto de entrenamiento es extremadamente difícil de conseguir. ¿Quizá deberíamos empezar por trabajar en la reducción del error de clasificación?

Me refería a las propiedades de la función de pérdida minimizada al entrenar el modelo. Más concretamente, de su forma ideal.

 
mytarmailS #:

No entiendo muy bien en qué consiste la suavidad ni por qué es necesaria.

Es la base de la optimización. La suavidad permite optimizar mediante un gradiente. De lo contrario, sólo quedan los algoritmos de fuerza bruta.

 
Aleksey Nikolayev #:

Son los fundamentos de la optimización

Sí, lo sé, pero hace poco se hablaba de la suavidad de la propia curva de capital, así que no entré en estas discusiones, por eso pregunto a qué te refieres.

 

Fuera de tema.

una de las mejores ofertas

oro

riesgo/recompensa 1 en 24

 
mytarmailS #:

Offtopic...

una de las mejores ofertas de la historia.

oro

riesgo/recompensa 1 en 24

"Cuerpo de agua" es un gran)
 

Esto es lo que pienso, necesitamos identificar los patrones que tienen los diferentes instrumentos. Es decir, o bien es una regla de una serie de predictores, o bien es un segmento cuántico del rango de predictores. Entonces, generamos un gráfico aleatorio y buscamos estos patrones allí. Se pueden generar 100 gráficos (más de uno para reducir la probabilidad de error). Si un patrón no se produce o se produce muy raramente, lo consideramos plausible; de lo contrario, consideramos que la regla se ha obtenido al azar, es decir, que no describe un patrón a largo plazo.

Así, obtenemos un conjunto de reglas+predictores que pueden detectar una regularidad en nuestra serie temporal.

¿Alguien intentará hacer esto en R o Python?

 
Aleksey Vyazmikin obtenido al azar, es decir, que no describe un patrón a largo plazo.

Así, obtenemos un conjunto de reglas+predictores, que puede revelar la regularidad en nuestras series temporales.

¿Alguien intentará hacer esto en R o Python?

Incluso he publicado capturas de pantalla........

Prácticamente escribí una conferencia sobre este tema en el foro (en posts)...

Hay un patrón, y es tan fuerte que es increíble.

Ni siquiera una regularidad, sino una dependencia directa.

Incluso publiqué la fórmula (ecuación) aquí en la rama.