Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 179

 
Dr.Trader:


¿Se refiere al análisis de componentes PCA o a otra cosa? No recuerdo todos los ejemplos que he puesto aquí :)

De todos modos, si se trata de PCA, no se puede hacer un dulce de la basura. Tienes que tener predictores bastante buenos mezclados con otros malos, entonces el PCA puede tamizar lo malo de lo bueno.

Subestima los resultados positivos de su experiencia. No hay griales. Pero existe una herramienta integral para combatir males como el sobreentrenamiento.

El primer paso es eliminar la basura, que es lo que tiene un impacto decisivo en el sobreentrenamiento. Y en este primer paso, el PCA es muy útil. Después de este paso, los predictores relevantes para la variable objetivo permanecerán, y toda la fantasía desaparecerá. Pero no sobreestime la importancia de este paso: es el primero. Tras ello, es necesario dar los siguientes pasos:

  • rfe antes de cada entrenamiento
  • reentrenamiento del modelo en cada nuevo bar (idealmente) o en los fines de semana.

Y sus experimentos con la rfa resultarán muy útiles.

PS.

Hay que tener en cuenta que he guardado silencio deliberadamente sobre el trabajo con los propios modelos.

 
SanSanych Fomenko:

Subestima los resultados positivos de su experiencia. No hay griales. Existe una herramienta completa para combatir la plaga del sobreentrenamiento.

El primer paso es eliminar la basura, que es lo que tiene un impacto decisivo en el reciclaje. Y en este primer paso, el PCA es muy útil. Después de este paso, los predictores relevantes para la variable objetivo permanecerán, y toda la fantasía desaparecerá. Pero no sobreestime la importancia de este paso: es el primero. Tras ello, es necesario dar los siguientes pasos:

  • rfe antes de cada entrenamiento
  • reentrenamiento del modelo en cada nuevo bar (idealmente) o en los fines de semana.

Y sus experimentos con la rfa resultarán muy útiles.

PS.

Hay que tener en cuenta que he guardado deliberadamente silencio sobre el trabajo con los propios modelos.

¿Puede explicar más sobre el PCA? ¿Cómo se elimina la basura de esta manera?
 
SanSanych Fomenko:

Subestima los resultados positivos de su experiencia. No hay griales. Existe una herramienta completa para combatir la plaga del sobreentrenamiento.

El primer paso es eliminar la basura, que es lo que tiene un impacto decisivo en el reciclaje. Y en este primer paso, el PCA es muy útil. Después de este paso, los predictores relevantes para la variable objetivo permanecerán, y toda la fantasía desaparecerá. Pero no sobreestime la importancia de este paso: es el primero. Tras ello, es necesario dar los siguientes pasos:

  • rfe antes de cada entrenamiento
  • reentrenamiento del modelo en cada nuevo bar (idealmente) o en los fines de semana.

Y sus experimentos con la rfa resultarán muy útiles.

PS.

Hay que tener en cuenta que he guardado deliberadamente silencio sobre el trabajo con los propios modelos.

Reentrenamiento del modelo en cada bar.... ¿Significa esto que una sola barra tiene un impacto en todo el modelo? A la luz de la importancia de cada compás en el aprendizaje, se hace comprensible su interminable lucha por el reciclaje...
 
Andrey Dik:
Reentrenamiento del modelo en cada bar.... ¿Significa esto que una sola barra afecta a todo el modelo? Debido a la importancia de cada barra en el entrenamiento, deja claro su interminable lucha con el reentrenamiento...

El modelo que estoy tratando de poner al día ahora - estoy, sí, estoy aprendiendo más en cada nuevo bar. Para ser honesto, no veo un gran impacto... A veces, durante decenas de barras seguidas, el modelo sigue siendo el mismo que antes (el mecanismo de protección contra el sobreajuste del modelo). Pero si algún banquero dice algo incorrecto en las noticias, y el precio se equivoca en algún punto, existe la esperanza de que el modelo se ponga al día con todos los cambios recientes en un par de compases. No tiene mucho sentido ajustar el modelo a cada bar, pero si hay una forma de reaccionar rápidamente a los cambios, es una pena no utilizarla.

Mihail Marchukajtes:
¿Puede explicar más sobre el PCA? ¿Cómo se elimina la basura de esta manera?

Hace unas cien páginas, Sannych publicó un enlace al artículo algo así como "Análisis de componentes principales" en este tema. Lo he utilizado para hacer un código y lo he introducido aquí también. Hay que leer muchas páginas para encontrarlo.

A mí también me ha gustado este artículo, pero no tiene ni R ni MQL, sólo contiene excel. Pero explica más claramente el principio de funcionamiento. h ttp://www.chemometrics.ru/materials/textbooks/pca.htm

 
Mihail Marchukajtes:
¿Puedo hablar más sobre el PCA? ¿Cómo se puede cribar la basura de esta manera?

Vea cómo funciona el método de componentes principales.

Pero también hay un comentario interesante de darkAlert que explica por qué este método no funciona en algunas tareas de aplicación. Cito:

"Olvidaste mencionar que el PCA (al igual que otros métodos clásicos de reducción de datos multivariantes) sólo busca dependencias lineales..."

Cuando se aplica al comercio, este método no es adecuado, ya que las propiedades de los predictores en forma de valores de índices y oscilaciones alimentados a las entradas son inherentemente no lineales.

Как работает метод главных компонент (PCA) на простом примере
Как работает метод главных компонент (PCA) на простом примере
  • habrahabr.ru
В этой статье я бы хотел рассказать о том, как именно работает метод анализа главных компонент (PCA – principal component analysis) с точки зрения интуиции, стоящей за ее математическим аппаратом. Максимально просто, но подробно. Математика вообще очень красивая и изящная наука, но порой ее красота скрывается за кучей слоев абстракции...
 

^GSPC viene de http://finance.yahoo.com, creo que es fiable

UNRATE, PAYEMS, GDP están tomados de FRED (probablemente https://fred.stlouisfed.org/) , esa es la parte complicada, gracias por el aviso.

Prefiero usar el eurusd horario más adelante.

*Alguien frotó algo, fue una respuesta al hecho de que todos esos índices gubernamentales a veces recalculan y cambian sus valores históricos.

 
Vizard_:
Puedes, pero no lo diré))
La significación se calcula a partir del peso de la despersión. Eso es todo. Si se usa o no,
si es necesaria la reducción dimensional, si no se acaba tirando el bebé con el agua,
se aplica a la abulia o al preprocesamiento... otra pregunta...

No estoy haciendo el preprocesamiento de una manera mucho más simple con algunos datos eliminados que creo que no es bueno..... Porque es necesario alimentar cada señal a TC sin borrar. Hay una sola idea, que es llevar la variable de salida a la de entrada. Tal, algún elemento de ajuste :-) PERO

si se tiene en cuenta que la variable de salida está controlada por la cantidad de beneficio de TC, entonces cambiando este parámetro, en cualquier caso, es posible saber qué calidad de datos de entrada tenemos. HM.... déjame explicarte. Hay una filosofía de selección de la variable de salida Un ejemplo sencillo tenemos dos señales:

La ganancia del azul es de 1 punto. En mis condiciones de configuración dice que hay que marcar con uno las señales con más de 50 pips. Este azul se marcará como 0, aunque el mercado tiende a subir y esta señal azul podría marcarse como 1. Ajustando el parámetro de beneficio, incluimos y excluimos otros en nuestro conjunto de salida para obtener la máxima capacidad de generalización..... Esto puede hacerse en un rango de menos 100 pips de spread. Con el método de fuerza bruta tarda muchísimo tiempo, incluso en incrementos de 10 debería ejecutarse al menos diez veces...... De todos modos, la cuestión sigue abierta.

 
Mihail Marchukajtes:
¿Puede dar más detalles sobre el PCA? ¿Cómo se criba la basura de esta manera?

No sólo me da pereza encontrar un enlace para ti en este hilo, sino que además no me hace falta.

Si es tan amable de navegar por este hilo. El PCA no criba la basura así como así: hay un matiz. Así que tiene sentido buscarlo.

 
Dr.Trader:

El modelo que estoy tratando de poner al día ahora - estoy, sí, estoy aprendiendo más en cada nuevo bar. Para ser honesto, no veo un gran impacto... A veces, durante decenas de barras seguidas, el modelo sigue siendo el mismo que antes (el mecanismo de protección contra el sobreajuste del modelo). Pero si algún banquero dice algo incorrecto en las noticias, y el precio se equivoca en algún punto, existe la esperanza de que el modelo se ponga al día con todos los cambios recientes en un par de compases. No tiene sentido ajustar el modelo a cada bar, pero si hay una forma de reaccionar rápidamente a los cambios, utilicémosla.


En repetidas ocasiones he tratado de impulsar una idea que para mí es obvia: no hay ninguna herramienta que pueda utilizarse sin reentrenar el modelo con un pequeño error.

Hay que ir a lo seguro: limpiar la basura obvia, escalar, tal vez Voh-Soh, seleccionar predictores, elegir un modelo..... y luego resulta que hay que desechar todo, ya que el objetivo es un completo fiasco....

En mi práctica hay literalmente un 3-5% de error en el menos en cada paso. Y si inicialmente el modelo daba un error de más del 40%, y se reentrenaba, conseguía que el modelo no reentrenado pasara al 20%. Unos seis meses de trabajo.

 

Bien, ¿hay algún experto en MQLs aquí???? Ya que estamos todos aquí :-)

Me pueden decir cómo optimizar una variable para que la otra llegue a 0 ???? O al menos cerca de cero .....

En general, la optimización de una variable en función de otra variable....