Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1517
Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
Pregunta 01.
Los siguientes indicadores sólo tienen un parámetro de entrada externo
He elegido estos indicadores precisamente por los mínimos parámetros de entrada externos.
¿Es posible reproducir sus algoritmos con la ayuda de los métodos de MO? Es decir, tomar cualquier historia, ejecutar los indicadores con cualquier parámetro y alimentar a la MO. ¿Es posible obtener el algoritmo indicador adecuado en la salida?
La pregunta es sobre el establecimiento de la tarea para la MO, es decir, debemos marcar la historia, creo que el mismo PriceChannel es fácil de enseñar, ZZ puede ser el segundo en complejidad, pero Ekponential Smoothing - no es la clasificación, pero la regresión, probablemente, puede ser el mismo, pero no he trabajado con la regresión.
Pregunta 03.
En la práctica me he encontrado varias veces con este tipo de situaciones. El TS muestra el beneficio en el intervalo de prueba. Cuando ejecuto OOS durante varias veces más, muestra el mismo beneficio. Una vez que apuesto en la cuenta real el beneficio sigue siendo el mismo durante varios meses.
Y en un momento dado la sistemática se cae. La reoptimización de la misma ST no da resultados positivos. En el mejor de los casos frena la caída en picado.
Al cabo de un tiempo el programador entiende que todo es una mierda y deja la cuenta real. Durante varios meses se observa cómo el TS va perdiendo en el probador.
Y de repente, dos semanas de beneficio, un mes de beneficio, mes de OOS - beneficio. Este es el mismo TS. Lo pones en el real y obtienes todo lo mismo que se describe desde el primer párrafo.
No se trata de una situación hipotética, sino de un caso práctico. En este caso, la ST demostró su gravedad sólo en un pequeño número de símbolos. En otros, era una fuga durante todo el año.
Y, por supuesto, la ST no necesita operar las veinticuatro horas del día. Podría haber habido un intervalo de negociación intradía.
En cuanto a las prácticas comunes de aplicación de la MO, ¿era posible conseguir una ST con características similares?
Pregunta 02.
Dejemos que la ST con cuatro parámetros de entrada realice miles de operaciones en algún intervalo. Añadimos dos parámetros de entrada con bajo número de variantes posibles como filtro. En la salida tenemos un gráfico de líneas rectas hacia arriba con unas mil operaciones. Y todos ellos están distribuidos más o menos uniformemente en toda la zona de pruebas.
¿Cuál es la razón de la alta probabilidad de perder el 5% del intervalo inicial en OOS? Un intervalo enorme y sólo seis entradas dieron un resultado directo en un número realmente grande de operaciones. Y lo que salió fue un ataque de mala leche.
¿Significa que hay más de seis parámetros? Es una especie de referencia a la primera pregunta: ¿acaso los algoritmos que nos resultan sencillos no son en realidad complejos por naturaleza?
¿Y por qué no debería haber una ciruela? La similitud de los datos históricos es una cuestión distinta para evaluar la corrección del modelo.
Y luego lo que se dio como entrada, cómo se marcó la historia para la formación, lo que se enseñó - hay un montón de matices aquí.
Pregunta 03.
En la práctica me he encontrado varias veces con este tipo de situaciones. El TS muestra el beneficio en el intervalo de prueba. Cuando ejecuto OOS durante varias veces más, muestra el mismo beneficio. Una vez que apuesto en la cuenta real el beneficio sigue siendo el mismo durante varios meses.
Y en un momento dado la sistemática se cae. La reoptimización de la misma ST no da resultados positivos. En el mejor de los casos frena la caída en picado.
Al cabo de un tiempo el programador entiende que todo es una mierda y deja la cuenta real. Durante varios meses se observa cómo el TS va perdiendo en el probador.
Y de repente, dos semanas de beneficio, un mes de beneficio, mes de OOS - beneficio. Este es el mismo TS. Lo pones en el real y obtienes todo lo mismo que se describe desde el primer párrafo.
No se trata de una situación hipotética, sino de un caso práctico. En este caso, la ST demostró su gravedad sólo en un pequeño número de símbolos. En otros, era una fuga durante todo el año.
Y, por supuesto, la ST no necesita operar las veinticuatro horas del día. Podría haber habido un intervalo de negociación intradía.
En cuanto a las prácticas comunes de aplicación de la MO, ¿era posible conseguir una ST con características similares?
Así que esta es de nuevo una pregunta relacionada con las fases del mercado y lo que la ST/modelo MO aprendió. Por ejemplo, he entrenado el modelo en CatBoost - todo bien en la historia fuera de la formación, lo puso en el real y el silencio durante 3 meses el modelo estaba en silencio - lo quité y para el último mes a través de las pruebas que veo que me perdí un montón de operaciones rentables (el mes pasado), pero entonces, al parecer, el propio modelo ha tenido en cuenta algo y no el comercio, porque el mercado era realmente muy plana, y el modelo se establece en la tendencia (en los minutos).
¿Por qué no debería haber un desagüe? La similitud de los datos históricos es una cuestión aparte para evaluar la corrección del modelo.
Y luego, lo que se dio como entrada, cómo se marcó la historia para la formación, lo que se enseñó - hay muchos matices aquí.
¿Qué formación? Un simple Asesor Experto clásico con seis parámetros optimizables. El AG regular muestra excelentes resultados en el intervalo.
No me interesa la respuesta "¿por qué esperabas que fallara en OOS? ¿Y cuál es la razón por la que es razonable perder en OOS incluso con mil operaciones?
Mi razonamiento de aficionado es el siguiente.
El TC tiene muy pocos grados de libertad. Así, la probabilidad de ajuste disminuye.
Miles de operaciones distribuidas uniformemente en el intervalo - significa que se ha detectado el "patrón" de larga duración en este intervalo. Sobre todo porque el gráfico de equilibrio es casi una línea recta.
¿Qué hay de malo en este razonamiento? Supongo que, de hecho, los parámetros de entrada no son seis, sino convencionalmente un millón. Es el número de parámetros de entrada de la máquina universal que reproduce el algoritmo TC. Es decir, el propio algoritmo es un determinado conjunto de parámetros de entrada.
¿Qué entrenamiento? Un EA clásico normal con seis parámetros optimizables. El AG regular produce excelentes resultados en el intervalo.
No me interesa la respuesta "qué esperabas, claro que pierdo en OOS". ¿Y cuál es la razón para perder en OOS incluso con mil operaciones?
¿Y cuál es el intervalo de aprendizaje? 1000 operaciones pueden ser en una tendencia global donde la apertura de posiciones en su vector dará una ventaja en sí misma.
Por ejemplo, entreno los futuros de Si en la historia de 5 años para tener más situaciones diferentes. Desde el 2008 hasta el 2016 optimicé EAs para forex en 15 min, son lo suficientemente sobrevivientes para el promedio.
Y en esencia la optimización es el mismo método de MO, así que todo lo dicho anteriormente es cierto.
Mi razonamiento de aficionado es el siguiente.
Hay muy pocos grados de libertad en la CT. Así, la probabilidad de ajuste disminuye.
Miles de operaciones distribuidas uniformemente en el intervalo - significa que se ha detectado el "patrón" de larga duración en este intervalo. Sobre todo porque el gráfico de equilibrio es casi una línea recta.
¿Por qué no quieres pensar en la evaluación de la similitud de los mercados - Yo, por ejemplo, ver que en la volatilidad de Forex ha caído notablemente en los últimos años, incluso este año - que solía ganar 3-4 veces más por mes, y ahora sólo ningún movimiento y no hay ofertas en mi TS en forex.
Y luego, todo hay que mirarlo con objetividad, tratar de entender lo que hace el TS, si es realmente sencillo y pensar si sus acciones son razonables o si es una cuestión de azar.
¿Qué hay de malo en este razonamiento?
Un razonamiento erróneo, pues supone la estacionariedad del mercado, que no es lo mismo...
Supongo que, de hecho, los parámetros de entrada no son seis, sino convencionalmente un millón. Es el número de parámetros de entrada de la máquina universal que reproduce el algoritmo TS. Es decir, el propio algoritmo es un determinado conjunto de parámetros de entrada.
Si hablamos de indicadores, hay muchos más parámetros, porque debemos considerar la lógica del propio indicador, casi cada if en el código del indicador como una condición separada y esto, por supuesto, generará un número incontable de combinaciones. Sin embargo, personalmente creo que, por el contrario, el uso de indicadores es un enfoque sensato, porque supongo que muchos participantes en el mercado los utilizan, lo que significa que hay una probabilidad de captar un poco la lógica de la TS de un participante con dinero.
Pregunta 01.
Los siguientes indicadores sólo tienen un parámetro de entrada externo
He elegido estos indicadores precisamente por los mínimos parámetros de entrada externos.
¿Es posible reproducir sus algoritmos con la ayuda de los métodos de MO? Es decir, tomar cualquier historia, ejecutar los indicadores con cualquier parámetro y alimentar a la MO. ¿Es posible obtener el algoritmo del indicador correspondiente en la salida?
El suavizado tipo EMA se puede obtener exactamente, espero que te refieras al resultado y no al "algoritmo" en forma de código :)
No estoy tan seguro de PriceChannel y ZZ, estoy seguro de que van a ser defectuosos. En general, la tarea es interesante, gracias:)
Pregunta 02.
Supongamos que la ST con cuatro parámetros de entrada en algún intervalo realiza miles de operaciones. Añade como filtro dos parámetros de entrada con bajo número de variantes posibles. El resultado será un gráfico de líneas rectas con aproximadamente mil operaciones. Y todos ellos están distribuidos más o menos uniformemente en toda la zona de pruebas.
¿Cuál es la razón de la alta probabilidad de perder el 5% del intervalo inicial en OOS? Un enorme intervalo y sólo seis entradas dieron un resultado directo en un número realmente grande de operaciones. Y lo que salió fue un ataque de mala leche.
¿Significa que hay más de seis parámetros? Es una especie de referencia a la primera pregunta: ¿no son los algoritmos simples complicados por naturaleza?
Es más una cuestión del tipo de algoritmo de estrategia y de MM que de predicción. Si no sabe qué tipo de error puede encontrar en su estimación, puede calcular la probabilidad de error utilizando uno de los parámetros, puede calcular el valor máximo de la predicción matemática.
Pregunta 03.
Me he enfrentado a estas situaciones varias veces en la práctica. El TS muestra el beneficio en el intervalo de prueba. Cuando se abre OOS por varias veces más, el beneficio sigue siendo el mismo. Apuesta en una cuenta real y muestra el mismo beneficio durante varios meses.
Y en un momento dado la sistemática se cae. La reoptimización de la misma ST no da resultados positivos. En el mejor de los casos frena la caída en picado.
Al cabo de un tiempo el programador entiende que todo es una mierda y deja la cuenta real. Durante varios meses se observa cómo el TS va perdiendo en el probador.
Y de repente, dos semanas de beneficio, un mes de beneficio, mes de OOS - beneficio. Este es el mismo TS. Lo pones en el real y obtienes todo lo mismo que se describe desde el primer párrafo.
No se trata de una situación hipotética, sino de un caso práctico. En este caso, la ST demostró su gravedad sólo en un pequeño número de símbolos. En otros, era una fuga durante todo el año.
Y, por supuesto, la ST no necesita operar las veinticuatro horas del día. Podría haber habido un intervalo de negociación intradía.
En términos de prácticas comunes de aplicación de MO, ¿fue posible obtener una ST con tales características?
No creo que nadie pueda comentar tales características "con la mano en el corazón". En general, no hay que pensar en usar la MdD como algo separado, la MdD es sólo una extensión de la estadística, un algoritmo general es MdD, incluso la optimización de mallas es MdD, así que siempre ha habido MdD en el comercio algorítmico:)
Hay una tendencia de los perezosos a esperar la automatización total de la búsqueda de CT y dejar que IR lo haga todo por ellos, por suerte no ocurrirá en mucho tiempo, y cuando lo haga no tendrá sentido financiero, pero mientras tanto IR clásico es malo buscando señales sensatas y "profundo" es muy caprichoso en todos los aspectos, trabajar con él es doloroso y los resultados son nebulosos.
Mi razonamiento de aficionado es el siguiente.
Hay muy pocos grados de libertad en el TC. Así que la probabilidad de encajar cae.
Miles de operaciones distribuidas uniformemente en el intervalo - significa que se revela el "patrón" a largo plazo en este intervalo. Sobre todo porque el gráfico de equilibrio es casi una línea recta.
¿Qué hay de malo en este razonamiento? Supongo que, de hecho, los parámetros de entrada no son seis, sino convencionalmente un millón. Es el número de parámetros de entrada de la máquina universal que reproduce el algoritmo TC. Es decir, el propio algoritmo es un conjunto de parámetros de entrada.
Lo que ocurre es que al estimar una serie temporal (no importa si es un precio, una secuencia de tiradas de dados o números de la "rueda de la fortuna"... o incluso un gráfico de temperatura)
Usted (y todos los participantes de este foro) asume que las series temporales deben comportarse en el futuro de esta manera - ¡lo intentamos! Por desgracia, el ajuste siempre está presente, y cuanto más utilicemos los datos de entrada, mayor será el ajuste y nuestra confianza
lea la primera parte del artículo en el hubrahttps://habr.com/ru/company/ods/blog/322716/
antes del gráfico
me ha gustado mucho la presentación
bueno y sobre tu pregunta con MO, mi razonamiento diletante:
problema para preparar los datos de entrada para el entrenamiento, con ZigZag en general un problema - lo más simple es alimentar los precios de las torceduras ZZ - entrenado, probado - no funciona, ¿por qué? - porque está estrechamente ligado a datos específicos, no hay tales precios en el futuro, NS es un polinomio regular y = ax+bx+cx+dx+ex..... el número de polinomios es el número de neuronas, cuanto más neuronas, mejor calidad (error NS), pero más rápido reentrenamiento ocurre.... el sobreaprendizaje se combate inventando nuevos tipos de NS, pero también hay donde es mejor donde es peor....
pero con funciones periódicas NS funcionará, de hecho, perfectamente - una gráfica de seno/coseno a cualquier escala y con datos mínimos para el aprendizaje - porque tales funciones pueden ser escritas usando la expansión de series de Taylor? (no lo recuerdo ya) - y serían cinco polinomios y = ax+bx+cx+dx+ex
ZS: con las series de precios nadie ha conseguido inventar una fórmula polinómica - por eso NS no funciona perfectamente... Tal vez sólo una fórmula no existe ))))
Es más una cuestión de tipo de algoritmo de estrategia y de MM que de predicción. Yo diría que la mayoría de los griales de los probadores son reversibles con el promedio y a veces se sientan demasiado tiempo, usando tales configuraciones es muy fácil obtener un "grial" con un parámetro, usted debe eliminar el promedio con el fin de obtener una imagen más objetiva, aunque no es suficiente, IMHO expectativa de las previsiones debe ser medido correctamente (tendencias / giros), porque se puede engañar no sólo a los demás, sino a ti mismo también.
Estaba dando vueltas a algo esta noche. Como respuesta no citada, creo que será interesante que otros la lean.
https://www.mql5.com/ru/blogs/post/728196
1. Sí, con cierta precisión (error de aproximación)
2. Tome un polinomio de 3er grado (sólo 3 términos libres) y ajústelo a un trozo de gráfico de un kilómetro de largo. ¿Significa que funcionará en el OOS? Por supuesto que no. Las curvas empezarán a divergir casi inmediatamente, pero a veces puedes tener suerte con la dirección. Si se desconoce el patrón (teóricamente, conceptualmente, fundamentalmente... lo que sea) que se está explotando, entonces se puede descartar la pregunta, ya que siempre es un ajuste para SB
3. en términos de MdD puedes conseguir lo que quieras. Básicamente estas parcelas serán con ciertas tendencias, si son similares entonces funcionará. Es decir, en este caso es la tendencia global la que cambia, muy probablemente, o de nuevo el mercado se convierte en algo similar a lo que era, a medio plazo. Por eso funciona/no funciona.
Todas estas cuestiones se resuelven en econometría a nivel conceptual: la tendencia lineal es el componente principal, se predice primero. Luego, las fluctuaciones no lineales en torno a la vara recta, siempre que la tendencia persista. La mayor tendencia no puede predecirse debido a la falta de iteración, es decir, toda la incertidumbre procederá del plan a largo plazo. Sólo unos pocos términos libres, normalmente no más de 3, describen cualquier curva de mercado. La MOS ya puede ajustarse a los residuos de lo que queda sin predecir.