Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 84

 
Sigo diciéndoles que predecir el mercado para 5 años no es realista. Quieren construir un modelo adecuado para al menos una o dos semanas y estar contentos con él, pero quieren construir un modelo para 5 años. Esto es una utopía. Y una pregunta para el omnisciente Alexey: Dime cómo se comportará el modelo si se definen dos clases absolutamente idénticas y la corrección del mercado en ellas es diametralmente opuesta. Por así decirlo datos contradictorios.... cómo se comportaría el modelo en este caso???? Al fin y al cabo, la pauta en sí no es importante, lo que importa es la reacción del mercado a esta pauta....
 
Mihail Marchukajtes:
También les digo que predecir el mercado para 5 años no es realista...

Es inútil hablar y exhortar. Muchas personas tienen distorsiones cognitivas entre las que también se encuentran los filtros de información, como por ejemplo: si la información no se ajusta a la visión del mundo, no se percibe en absoluto o provoca una respuesta de despecho.

En otras palabras, la mayoría de los residentes aquí no prestarán atención a tus conversaciones en absoluto, o empezarán a refunfuñar y a llamarte troll.

Pero esa no es la cuestión. La cuestión es que en jPrediction desde la versión 7 ha aparecido la posibilidad de evaluar la significación de los predictores. Para ello, después de crear (entrenar) un nuevo modelo o cargar un modelo guardado anteriormente desde un archivo, es necesario llamar a la opción de menú "Ver un significativo de predictores" o pulsar la tecla "caliente" F5:

Y puedes ver un gráfico de la importancia de los predictores:

El mejor predictor es el mejor, el más significativo. Si se elimina la columna "Competitividad" de esta muestra, se obtiene el mensaje "Garbage in, Garbage out" después del entrenamiento.

El peor predictor es el peor, el menos significativo. Si eliminamos la columna "Riesgo operativo" de la muestra, la capacidad de generalización no empeorará.

Los restantes predictores marcados con "-" en la descripción son de importancia media. Si se eliminan de esta muestra, la capacidad de generalización se degradará notablemente.

 
Yury Reshetov:

Es inútil hablar y exhortar. Muchas personas tienen distorsiones cognitivas, entre las que también se encuentran los filtros de información, como por ejemplo: si la información no se ajusta a la visión del mundo, o bien no se percibe en absoluto, o bien provoca una respuesta de despecho.

Es decir, la mayoría de los habitantes de aquí no prestarán atención a tus conversaciones en absoluto, o empezarán a refunfuñar y a llamarte troll.

Pero esa no es la cuestión. La cuestión es que en jPrediction desde la versión 7 ha aparecido la posibilidad de evaluar la significación de los predictores. Para ello, después de crear (entrenar) un nuevo modelo o cargar un modelo guardado anteriormente desde un archivo, es necesario llamar a la opción de menú "Ver un significativo de predictores" o pulsar la tecla "caliente" F5:

Y puedes ver un gráfico de la importancia de los predictores:

El mejor predictor es el mejor, el más significativo. Si se elimina la columna "Competitividad" de esta muestra, se obtiene el mensaje "Garbage in, Garbage out" después del entrenamiento.

El peor predictor es el peor, el menos significativo. Si se elimina la columna de "Riesgo operativo" de esta muestra, la generalizabilidad no se deteriorará.

Los demás predictores marcados con "-" en la descripción tienen una importancia media. Si se eliminan de esta muestra, la capacidad de generalización se degradará notablemente.

¡¡¡Gracias!!! Una adición extremadamente útil. Seguir hilando.... girando...
 
Yury Reshetov:

Es inútil hablar y exhortar. Muchas personas tienen distorsiones cognitivas, entre las que también se encuentran los filtros de información, como por ejemplo: si la información no se ajusta a la visión del mundo, o bien no se percibe en absoluto, o bien provoca una respuesta de despecho.

Es decir, la mayoría de los habitantes de aquí no prestarán atención a tus conversaciones en absoluto, o empezarán a refunfuñar y a llamarte troll.

Pero esa no es la cuestión. La cuestión es que en jPrediction desde la versión 7 ha aparecido la posibilidad de evaluar la significación de los predictores. Para ello, después de crear (entrenar) un nuevo modelo o cargar un modelo guardado anteriormente desde un archivo, es necesario llamar a la opción de menú "Ver un significativo de predictores" o pulsar la tecla de acceso directo F5:

Y puedes ver un gráfico de la importancia de los predictores:

El mejor predictor es el mejor, el más significativo. Si se elimina la columna "Competitividad" de esta muestra, se obtiene el mensaje "Garbage in, Garbage out" después del entrenamiento.

El peor predictor es el peor, el menos significativo. Si se elimina la columna de "Riesgo operativo" de esta muestra, la generalizabilidad no se deteriorará.

Los demás predictores marcados con "-" en la descripción tienen una importancia media. Si se eliminan de esta muestra, la capacidad de generalización se degradará notablemente.

¿Cómo se calcula la significación de los predictores?
 
SanSan Fomenko:
¿Cómo se calcula la significación del predictor?

En pocas palabras (pero no muy claras), la significación del predictor se calcula mediante la ponderación de los coeficientes obtenidos tras el entrenamiento.

Para más detalles, consulte el algoritmo para calcular la importancia del predictor en el código fuente de jPrediction. O tendré que escribir un artículo entero para explicarlo más claramente.

 
Mihail Marchukajtes:
¡¡¡Gracias!!! Una adición extremadamente útil. Continuación de la gira .... ....

Lo más importante es que ahora puede calcular rápidamente los predictores de bajo valor y sustituirlos por otros predictores. Después de sustituirlos, es imprescindible ver si la generalidad ha aumentado o no. Si no ha aumentado, es que el cambio se ha realizado de forma incorrecta, es decir, se ha sustituido un predictor más significativo por otro menos significativo.

Ayer experimenté con las citas. Rápidamente encontró los osciladores TA más significativos. Pero resultó que sólo había 5 de ellos. Y además la capacidad de generalización no crece, pongas lo que pongas. Así que resulta que cualquier cosa que se mire a través de los indicadores y osciladores TA, pero de hecho todos ellos se basan en los mismos datos - un pequeño segmento de la historia anterior (varias barras), aunque procesan estos datos un poco diferente. Todos los indicadores y osciladores TA son los mismos "huevos", pero de lado. No importa cómo se baraje el mazo, contiene las mismas cartas. Todos los índices y osciladores se correlacionan demasiado entre sí y se correlacionan muy poco con el futuro.

Para aumentar la capacidad de generalización es necesario tomar algún otro dato de algún lugar que influya en las cotizaciones, pero que no se derive de ellas. Es decir, necesitamos algunas fuentes de información adicionales. ¿Dónde puedo conseguirlos? Por supuesto, podemos intentar utilizar los siguientes predictores: las fases de la luna, la cantidad de manchas solares, los resultados de los partidos del equipo de fútbol callejero, el nivel del agua en el río Wonchka o la cantidad de pulgas por centímetro cuadrado del perro Tuzyk. Pero, ¿es probable que sean significativas?

 
Yury Reshetov:

Lo más importante es que ahora puede calcular rápidamente los predictores de bajo valor y sustituirlos por otros predictores. Después de sustituirlos, es imprescindible ver si la generalizabilidad ha aumentado o no. Si no ha aumentado, entonces la sustitución no se ha hecho correctamente, el predictor más significativo ha sido sustituido por otro menos significativo.

Ayer experimenté con las citas. Rápidamente encontró los osciladores TA más significativos. Pero sólo había 5 de ellos. Y además la capacidad de generalizar no crece, me da igual lo que pongas. Así que resulta que cualquier cosa que se mire a través de los indicadores y osciladores TA, pero de hecho todos ellos se basan en los mismos datos - un pequeño segmento de la historia anterior (varias barras), aunque procesan estos datos un poco diferente. Todos los indicadores y osciladores TA son los mismos "huevos", pero de lado. No importa cómo se baraje el mazo, contiene las mismas cartas. Todos los índices y osciladores se correlacionan demasiado entre sí y se correlacionan muy poco con el futuro.

Para aumentar la capacidad de generalización es necesario tomar algún otro dato de algún lugar que influya en las cotizaciones, pero que no se derive de ellas. Es decir, necesitamos algunas fuentes de información adicionales. ¿Dónde puedo conseguirlos? Por supuesto, podemos intentar utilizar los siguientes predictores: las fases de la luna, la cantidad de manchas solares, los resultados de los partidos del equipo de fútbol callejero, el nivel del agua en el río Wonchka o la cantidad de pulgas por centímetro cuadrado del perro Tuzyk. ¿Pero es poco probable que sean significativos?

En cuanto a la astrología, yo no descartaría la práctica de miles de años. Como aficionado puedo decir que la pérdida de un equipo favorito tiene un impacto negativo en la productividad. Si la ciudad de las moscas es una monociudad con un monopolio de recursos como Nornickel, la producción puede bajar, como indica indirectamente el descenso del nivel del agua en el río Vonyuchka.

Es imposible adivinar qué mariposa, dónde y cuándo, provocará un tsunami con un movimiento de sus alas.

 
Yury Reshetov:

Lo más importante es que ahora puede calcular rápidamente los predictores de bajo valor y sustituirlos por otros predictores. Después de sustituirlos, es imprescindible ver si la generalidad ha aumentado o no. Si no ha aumentado, es que la sustitución se ha hecho de forma incorrecta, es decir, el predictor más significativo ha sido sustituido por otro menos significativo.

Ayer experimenté con las citas. Rápidamente encontró los osciladores TA más significativos. Pero sólo había 5 de ellos. Y además la capacidad de generalizar no crece, me da igual lo que pongas. Así que resulta que cualquier cosa que se mire a través de los indicadores y osciladores TA, pero de hecho todos ellos se basan en los mismos datos - un pequeño segmento de la historia anterior (varias barras), aunque procesan estos datos un poco diferente. Todos los indicadores y osciladores TA son los mismos "huevos", pero de lado. No importa cómo se baraje el mazo, contiene las mismas cartas. Todos los índices y osciladores se correlacionan demasiado entre sí y se correlacionan muy poco con el futuro.

Para aumentar la capacidad de generalización es necesario tomar algún otro dato de algún lugar que influya en las cotizaciones, pero que no se derive de ellas. Es decir, necesitamos algunas fuentes de información adicionales. ¿Dónde puedo conseguirlos? Por supuesto, podemos intentar utilizar los siguientes predictores: las fases de la luna, la cantidad de manchas solares, los resultados de los partidos del equipo de fútbol callejero, el nivel del agua en el río Wonchka o la cantidad de pulgas por centímetro cuadrado del perro Tuzyk. Pero es poco probable que sean significativos...

Prueba con el delta acumulativo. Distribución acumulada por volúmenes reales..... Zscore system/ Ye cjjndtcndtyyj dc` 'nj c hfpys[ gfh? vj;yj lf;t 'rpjnbxtcrb[? nfv rjhhtkzwbz ljk;yf jncencndjdfnm ^-)
 
Mihail Marchukajtes:
Prueba con el delta acumulativo. Distribución acumulada por volúmenes reales..... Sistema Zscore/ Ye cjjndtcndtyyj dc` 'nj c hfpys[ gfh? vj;yj lf;t 'rpjnbxtcrb[? nfv rjhhtkzwbz ljk;yf jncencndjdfnm ^-)
Y, por supuesto, datos de otros pares, incluso exóticos, no relacionados con la previsión...
 

Quizás a alguien le interese, he encontrado un paquete que puede simular el trading y construir sistemas de trading llamado quantstrat

http://www.rinfinance.com/agenda/2013/workshop/Humme+Peterson.pdf