Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1248

 

Creo que si el sobreentrenamiento es una consecuencia de recordar el mercado debido al ruido, entonces recordar el mercado requiere una cierta cantidad de memoria en forma de bosque de árboles de decisión y boosting, y los modelos como el árbol único y la red neuronal con un pequeño número de neuronas deberían estar menos sobreentrenados. Entonces resulta que hay una cantidad crítica de datos que no puede ser descrita por, digamos, una hoja -cuál es esta cantidad del 1% o del 10%- de toda la muestra (entrenamiento, prueba, control) es la cuestión. Entonces, ¿quizás deberíamos evaluar los datos en términos de la cantidad de memoria necesaria para recordar estos datos e intentar que el modelo sea un orden de magnitud menor de este volumen crítico? Cómo hacerlo - no lo sé, tal vez debería haber algo similar con el archivado - si el archivador comprime una muestra de 10mb en 1mb, el modelo no debe ser más de 102,4 kb. Y, entonces, sabiendo que el modelo no se ha limitado a memorizar la muestra, sino que ha encontrado regularidades en ella, podemos ser menos críticos con las pruebas en una muestra independiente y concluir no sobre el sobreentrenamiento, sino sobre la falta de datos en la muestra para el entrenamiento, ya que no había situaciones que describieran el estado actual del mercado y, por tanto, simplemente no había posibilidad de encontrar ese patrón utilizando los predictores disponibles.

 
Ahora haciendo un modelo a mano en base a los pliegos recibidos y resulta que unos 20 pliegos para comprar y 5 pliegos como filtro puede generar cada año desde 2014 a 2018, y aquí estoy pensando, no puede ser sobreentrenamiento y no hay suficientes pliegos para encajar de alguna manera.... ¿es este un patrón que perderá su validez en 2019?
 
Maxim Dmitrievsky:

un patrón debe tener algunos prerrequisitos fundamentales, por ejemplo, algunos ciclos en el mercado son fundamentales, o la reacción a las noticias, la volatilidad intradía... cosas así

Y si las regularidades no están claras de dónde provienen, entonces no está claro qué pasará después.

Los modelos sobre árboles y tratan el tema de la identificación de patrones, un predictor habla de un evento y un conjunto de ciertos eventos da un patrón. Simplemente se trata de una regularidad que no pertenece al ámbito de los fenómenos físicos y que no puede ser constante porque puede verse afectada por factores desconocidos (fenómenos no descritos por los predictores disponibles).

En general, el punto es que el evento estadísticamente recurrente es detectado por los métodos de clasificación de MO, y es algo mejor que simplemente ajustar el mercado con los indicadores del optimizador, ¿o no?
 
Maxim Dmitrievsky:

La correlación entre el número de faldas cortas en verano y el bienestar financiero de los ciudadanos puede ser del 90 por ciento, pero no significa una correlación, y mucho menos un patrón

Bien, sustituyamos la palabra "patrón" por "presagio" como correlación desconocida del evento.

Maxim Dmitrievsky:

El optimizador también es un MO.

¿Así que equipara los dos métodos?

 
Maxim Dmitrievsky:

no soy yo, es la forma en que es... el optimizador minimiza cualquier función f, el optimizador de la red neuronal optimiza la función f de los pesos

Si estamos hablando de la optimización de los filtros de TC solamente, entonces podemos estar parcialmente de acuerdo sobre las mismas acciones, pero si el punto de entrada/salida también se optimiza, entonces la situación es ligeramente diferente del modus operandi habitual.

 
Maxim Dmitrievsky:

En este contexto, es necesario estudiar la minería de datos y la aplicación a los mercados, si es que es posible, porque la curva de minería de datos 1 también es una especie de la parte superior de la más tonta, pero se puede extraer alguna información )

¿Estudiar para aplicar en otro campo?

 
Maxim Dmitrievsky:

entender cómo extraer algo útil de los datos

Así que ya he apuntado antes que he extraído algo útil - tal vez sea un grano de oro, tal vez sea una casualidad... quién sabe... y no hay forma de saberlo con seguridad.

 
Asumiendo que los mercados son todos iguales y que el comportamiento de los precios tiene patrones similares, ¿por qué no combinar una docena de instrumentos en una muestra y buscar "señales" comunes en todos los mercados?
 
Vizard_:

Así es como se hace: se generaliza. Los "patrones" son patrones encontrados a partir de diferentes muestras... Así que acaba de coincidir en una muestra de tendencia, y ahora nos da un dolor de cabeza))))) Pero todavía hay que preparar los datos con cuidado, pues la idea... Aunque puede ser infalible, pero es poco probable...

Tenía la formación de 2016-2017 y luego sólo revisé las fichas de 2014-2018 y seleccioné las que eran rentables todos los años y cumplían otra serie de criterios (crecimiento global/sin grandes detracciones). Así que me pregunto si se puede utilizar un modelo de este tipo.

En cuanto a la combinación de diferentes instrumentos, tanto predictor aquí es la ganancia en pips en diferentes intervalos de tiempo, y no va a funcionar con diferentes instrumentos ...

 
Maxim Dmitrievsky:

Todos los mercados son diferentes, por supuesto, así como los patrones, y lo que funciona para uno es una pérdida para el otro.

Para suponer algo hay que suponer algo como base de dicha suposición aproximada

Supongo que el sujeto es el mismo en todas partes: un comerciante, así que ¿por qué iba a cambiar su comportamiento en función del instrumento? Si utiliza el análisis técnico o cualquier otro método, pero utiliza este método en todas partes, es diferente que puede utilizar un conjunto de métodos en diferentes momentos y es más fácil de ajustar un método en un instrumento y cuando el comerciante (imagen colectiva) cambia a otro, el modelo se romperá.