Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1120

 
No lo es:
En este caso, y con su conjunto de datos... lo siento, pero mucha gente te ha dicho muchas veces que necesitas al menos miles de muestras, y dado el ruido de los datos del mercado cientos de miles de puntos es lo deseable, pero cuando aprendas Java y uses XGB por ejemplo, te reirás de tu persistencia en el pasado))

esta es una afirmación incorrecta

 
Mihail Marchukajtes:

Así que se me ha ocurrido una métrica mejorada para el coeficiente de Matthews, pero qué puedo decir si soplas aquí y te vas. :-(

Estoy atascado con el paso de un array de una clase a otra, y el infierno... nadie a quien preguntar :-(

¿Por qué molestarse con las métricas cuando tienes las tuyas propias para la CT? por ejemplo, puedes medir el factor de beneficio en las muestras y ya está

y las estimaciones del modelo interno son secundarias, porque el menor error no significa la mayor estabilidad con nuevos datos

Sólo hay que elegir un criterio externo para la evaluación a través del rendimiento del comercio en los nuevos datos

si no tienes una muestra grande para la prueba solo lamerás el tornillo... una muestra pequeña para una bandeja no es crítica, todo está bien

 
Es que el modelo pesará un gigabyte:

Se podría discutir, pero en el mercado no se trata de la fidelidad en absoluto, es más importante hacer que funcione, y conmigo normalmente cuantas más muestras mejor es el resultado)))

solo toma timber o xgb - no les importa cuantas muestras reaprender :) es solo que el modelo pesará gigas

pero la enumeración recursiva de características con métricas externas ha empezado a dar resultados incluso en submuestras pequeñas, y ni siquiera externas
 
Vizard_:

Tendencia = 100k líneas. En los 8k+ restantes (prueba) se aplica el modelo. Los datos se barajan.
La métrica es logloss. Resultado, publíquelo. Tendencia =... prueba =...

Esto no se hace con las series temporales, por supuesto. Pero por el interés, lo puse en LightGBM casi por defecto sin tocar los datos en absoluto:

Tren: 0,6879388421499111

Prueba: 0,6915181677127092


Fuentes de prueba, bono con CatBoost:

https://yadi.sk/d/55DDn-hViNWP6Q


¿Cuáles son sus resultados?

test_xz.ipynb
test_xz.ipynb
  • disk.yandex.ru
Посмотреть и скачать с Яндекс.Диска
 
Maxim Dmitrievsky:

¿Por qué molestarse con las métricas cuando el ST tiene sus propias métricas? por ejemplo, medir el factor de beneficio en las muestras y ya está

la evaluación interna del modelo es secundaria, porque el menor error no significa la mayor estabilidad en los nuevos datos

Sólo hay que elegir un criterio externo para la evaluación a través del rendimiento del comercio en los nuevos datos

no tienes una muestra grande para la prueba estarás lamiendo el tornillo ... y una pequeña muestra para una bandeja no es crítica, todo está bien

Debe haber una cantidad ilimitada de espacio para la prueba en general.

Si alguien quiere comprobar la calidad de sus datos, debería ponerlos no en forma de unos oscuros archivos CSV, sino en forma de indicadores.

Puede utilizar una plantilla, aunque no es necesario marcar los objetivos, está claro que deben ser rentables.

Entonces podemos enseñar cualquier modelo, crear un Asesor Experto y probarlo objetivamente junto con el indicador inicial.

Bueno, esto es si quieres hacer algo, pero si sólo quieres hablar...

 
Es un poco más complicado, pero probablemente te ahorrarámuchos problemas:

Cuanto más ruido, más muestras, debería estar claro a nivel de estadística elemental, y los datos de mercado son muy ruidosos, el reentrenamiento es otro problema, si se enseñan características correctamente construidas y se orienta correctamente, entonces en una prueba con decenas o cientos de miles de muestras, el reentrenamiento es realmente difícil de lograr. Eso es lo bueno de los grandes conjuntos de datos, que son difíciles de reentrenar, a menos que el datascientist o el algotrader sean mazahistas o cuasi-mercaderes y mezclen objetivos con características. Razón obvia para preocuparse - el chip se correlaciona con el objetivo en más de un 3-5%, por lo que debe asomarse, y mejor construir fics para que no haya tal posibilidad en principio, complicará los algoritmos un poco, pero probablemente se librará de El principal error que cometen los algotraders principiantes.

Todos regañáis a los operadores cercanos al mercado, yo también, pero parece que sois guays, algotrader de mercado y, a juzgar por vuestros posts, sabéis qué periodo enseñar y cuál operar.

Pero no lo sé y cuando vi la discusión ayer no me involucré y decidí sólo probarlo, así que entrené la demo en EURUSD M1 desde el 8 al 18 de octubre, todo el tiempo que tenía en mi broker y corrí el EA en tiempo real.

Así que hasta ahora opera con beneficios, pero la pregunta para usted, como experto, es cuándo empezará a perder, login - 2096584180, password - na3tbvr, Tradize-Demo, pero específicamente, no sobre las naves espaciales que merodean por la vasta extensión del gran teatro (c)).


 
Tengo un probador de comercio en tiempo real МТ4, neuronet:

La muestra de aprendizaje es minúscula, la lógica del probador y del optimizador no es transparente (caja negra)...

Conclusión - 99,99999999999% que este EA es aleatorio, la equidad es un geométrico al azar vagando con una pendiente hacia abajo debido a los costos de comercio.

Dependiendo de la frecuencia de las operaciones, sólo puedo vang negativo SR<-0,5 para el año

1. Hay comercio en tiempo real, probador de MT4, red neural.

2. la respuesta es 100% errónea - el Asesor Experto no es aleatorio.

3. ¿entrenado en 8 días de datos comerciales, pero previsión para un año...?:)


ZS: Pregunté específicamente, por ejemplo - la relación entre el período de comercio y el período de formación al 30% y el asesor comenzará a perder el día después de mañana, o el 10% - hoy, pero ya que la ciencia está en silencio ...

 
No lo sé:

Conclusión - 99.999999999% que este EA es aleatorio, la equidad es aleatoria geométrica vagando con una pendiente hacia abajo debido a los costos de comercio.

hmm, esa es mi foto, ¿qué puedes ver ahí?

;)

 
No lo sé:

al azar te digo.

También diría que no puede ser porque nunca puede ser. (c) Y no es realista entrenar en 50 operaciones, sino que necesitamos ver otras 30-40 operaciones (eso es 3-4 días) para sacar conclusiones. Si los vemos, por supuesto.

Pero, en general, ya es extraño.

 
Te digoque esta es su carrera en el probador - y esto es al azar?

Al azar, te digo.

aquí está su prueba de funcionamiento - ¿y llamas a eso aleatorio?

Archivos adjuntos: