Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 110

 
Yury Reshetov:

El problema de la "explosión" combinatoria en jPrediction no se resolvió recorriendo todas las combinaciones posibles, sino mediante el método de búsqueda secuencial. La esencia del método es la siguiente:

Supongamos que hemos encontrado alguna combinación que contiene N predictores con la máxima generalizabilidad probando todas las combinaciones posibles de N y menos predictores. Tenemos que añadirle N+1 predictores. Para ello, añadimos uno a uno todos los predictores de la muestra que no se incluyeron en la combinación y medimos su capacidad de generalización. Si en el proceso de dicha búsqueda encontramos una combinación con N+1 predictores cuya capacidad de generalización es mayor que la mejor combinación de N predictores, podemos encontrar una combinación con N+2 predictores de la misma manera. Y si no lo encuentran, entonces está claro, que no tiene sentido seguir buscando y el algoritmo de probar combinaciones se detiene en la mejor combinación de N predictores. Como resultado, el algoritmo de búsqueda de combinaciones de predictores para el modelo se detiene mucho antes en comparación con el intento completo de todas las combinaciones posibles. Se produce un ahorro adicional de recursos computacionales debido a que la búsqueda parte de un número reducido de predictores en dirección a aumentar este número. Y cuantos menos predictores necesitemos para el entrenamiento, menos tiempo y potencia de cálculo necesitaremos para construir los modelos.

Hola, Yuri.

Hay preguntas )) sobre la búsqueda secuencial ...

Digamos que tenemos 10 predictores

1, 2, 3, 4, 5, 6, 7, 8, 9, 10

el grupoverde es el grupo de predictores que ha demostrado la mejor capacidad de generalización; a este grupo se añadirán otros predictores N+1

el gruporojo, es el grupo que es ligeramente peor que el verdey no participará en las pruebas, todas las pruebas se centran ya en el grupo verde

Pregunta: ¿y si después de todos los ensayos con otros N+1 predictores uno por uno, resulta que en el resultado final el grupo rojo tiene una mayor capacidad de generalización, es esto también bastante realista, o estoy entendiendo algo mal ???? por favor, explique

 
SanSanych Fomenko:

Todo es bueno, salvo una nimiedad: no hay comparación con otros modelos.

Comparación.

Apoyo... Sólo hay que tomar las citas como datos y no unos iris
 
SanSanych Fomenko:

Todo es bueno salvo una nimiedad: no hay comparación con otros modelos.

Ofrezco mis servicios para comparar

1. Se prepara un archivo Excel de entrada que contiene los predictores y la variable objetivo

2. Usted hace el cálculo

3. Me envías el archivo de entrada.

4. Hago los cálculos utilizando randomforest, ada, SVM

Comparamos.

No hace falta ir muy lejos, aquí está el archivo con las cotizaciones del mercado de divisas, la capacidad media de generalización cuando se entrena con el predictor reshetov es del 70% al 80%. Nusssss...... A la espera de su resultado.

P.D. Cambia el nombre del archivo a csv

Archivos adjuntos:
 
Mihail Marchukajtes:

No hace falta ir muy lejos, aquí hay un archivo con cotizaciones de divisas, la capacidad media de generalización cuando se entrena con el predictor de Reshetov es del 70% al 80%. Wellsssss...... A la espera de su resultado.

P.D. Cambia el nombre del archivo a ksv

¿No se podría empaquetar?

¿Y no es posible ver el resultado? En realidad, la generalización en la formación no es nada.

 
mytarmailS:
Secundado por... Sólo tome las citas como datos y no algunos iris
Lo que interesa son los dos archivos Reshetov con los resultados del algoritmo
 
SanSanych Fomenko:

¿No podría estar lleno?

¿No podemos ver el resultado? En realidad, la generalidad en el aprendizaje no es nada.

No podría estar más de acuerdo.

 
Mihail Marchukajtes:

No hace falta ir muy lejos, aquí hay un archivo con cotizaciones de divisas, la capacidad media de generalización cuando se entrena con el predictor de Reshetov es del 70% al 80%. Wellsssss...... A la espera de su resultado.

P.D. Cambia el nombre del archivo a csv

¿Qué es eso? ¿71 observaciones?

¿cómo ha comprobado la capacidad total?

 
mytarmailS:

¿Qué es eso? ¿71 observaciones?

¿cómo ha comprobado la capacidad total?

Y todavía estás tratando de frenar el mercado de los minutos en 5 años?????? Esas 71 observaciones, dos semanas de negociación en 5 minutos si todo...... Y sólo comprando. Así que vete a por ello..... ¿O te has desinflado?
 
Mihail Marchukajtes:
Y sigues intentando frenar el mercado de los minutos durante 5 años?????? Estas 71 observaciones, dos semanas de negociación en 5 minutos si todo...... Y sólo comprando. Así que vete a por ello..... ¿O te has desinflado?

Hablando sin cortesía europea, estás escribiendo un completo disparate...

Dé dos archivos normales, de al menos 500 observaciones cada uno, así como los resultados del programa.

 
Mihail Marchukajtes:

La capacidad media de generalización cuando se entrena con el predictor de Reshetov es del 70% al 80%.

Como he dicho antes, esta métrica es inútil.

Los datos se dividen aleatoriamente en 2 partes aproximadamente iguales, luego se entrena el modelo sólo en la primera parte y se prueba en ambas a la vez. La generalizabilidad de ~75% significa que el modelo al final predice correctamente el 75% de todos los ejemplos del archivo.
Hay varias variantes de cómo el modelo puede llegar al 75%:
1) El modelo se entrena con una precisión del 100% en los datos utilizados para el entrenamiento, y falla en absoluto en los nuevos datos de la segunda parte del archivo, donde obtiene el 50% (lo mismo que lanzar una moneda). La media sería exactamente el 75%. Esto es un desarrollo muy malo y será malo en el comercio.
2) El modelo fue entrenado con una precisión del 75% en los datos de entrenamiento y mostró el mismo 75% en los datos de prueba, lo que supone de nuevo un 75% de media. En esta situación, que es el mejor de los casos, existe la posibilidad de ganar algo.
3) Cualquier opción intermedia entre estas dos.

Su versión es probablemente más cercana a la primera. Hay que confiar mucho en la suerte para operar con esos resultados, supongo que aún no has perdido tu depósito sólo gracias al indicador que te sirve de señal principal (secuenciador, o lo que sea). Creo que un Asesor Experto basado en este indicador dará tan buen resultado como el indicador + jPrediction.