Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 584

 
Maxim Dmitrievsky:

Ni siquiera has sabido determinar la importancia de los predictores en la RF, dando alguna tontería sobre el recocido y demás sin explicación (¿qué tiene que ver eso?).

¿Quién ha dicho dónde están los bancos específicos para aplicaciones de Forex? ¿Por qué Ada y no GBM? tus respuestas son abstracciones demasiado difusas. en realidad la ganancia no será más del 5% con más sobreentrenamiento.

En el nivel en el que se desarrolla el debate

Permítanme aclarar el nivel de ALGLIB - el nivel de una granja colectiva, un pueblo cerca de Novgorod. Ha escrito repetidamente que este nivel le conviene. Puede ser que sea suficiente para sus tareas, pero ¿por qué ofenderse?


No eres tan bueno para empujar algunas tonteríassobre el recocido y elsoborno.

No deberías ser tan...

He probado casi todas las R y este recocido es el más efectivo.


¿Por qué Ada y no GBM? Demasiadas abstracciones vagas en tus respuestas. en realidad la ganancia no será más del 5% con más sobreentrenamiento.

Porque los he probado y no sólo a ellos. Todavía tengo los protocolos.

Sí, lo mejor es ada? Sí, en un 5%, máximo 7% en relación con el bosque. Y no conozco nada mejor que eso.

¿Y qué es "mucho sobreentrenamiento"? ¿De qué estás hablando? En cuanto al sobreentrenamiento, ¡no recuerdo un solo post tuyo en el que demuestres que tus modelos no están sobreentrenados!

Sólo puedo reiterar que el sobreentrenamiento no depende en absoluto del modelo, depende de:

  • conjunto de predictores
  • capacidad de coarsen los modelos

 
SanSanych Fomenko:

En el nivel en el que se desarrolla el debate

Aclaro el nivel de ALGLIB - el nivel de la granja colectiva, el pueblo cerca de Novgorod. Ha escrito repetidamente que este nivel le conviene. Es posible que sea suficiente para sus tareas, pero ¿por qué ofenderse?


No eres tan bueno para empujar algunas tonteríassobre el recocido y elsoborno.

No deberías ser tan...

He probado casi todas las R y este recocido es el más efectivo.


¿Por qué Ada y no GBM? tus respuestas son demasiadas abstracciones difusas. en realidad la ganancia no será más del 5% con más sobreentrenamiento.

Porque los he probado y no sólo a ellos. Todavía tengo los protocolos.

Sí, lo mejor es ada? Sí, en un 5%, máximo 7% en relación con el bosque. Y no conozco nada mejor que eso.

¿Y qué es "mucho sobreentrenamiento"? ¿De qué estás hablando? En cuanto al sobreentrenamiento, ¡no recuerdo un solo post tuyo en el que demuestres que tus modelos no están sobreentrenados!

Sólo puedo repetir que el sobreentrenamiento no depende en absoluto del modelo, sino de:

  • conjunto de predictores
  • la capacidad de refinar los modelos.


¿Cuál es la diferencia entre el binning y el boosting? En el binning hay menos encaje inicial y más elemento de azar, mientras que en el boosting se encaja en los restos del segundo, luego en el tercero y así sucesivamente. Y terminas con un sobrecalentamiento total. Es decir, la RF ya puede hacerse bastante "gruesa" desde el principio, pero tendré que volver a comprobarlo, aún no he tenido tiempo.

Todos mis modelos están reentrenados :) ya que todavía no he encontrado ningún patrón permanente para ellos

Alglib tiene casi todo - convolución, PCA, clustering, conjunto de redes neuronales, forrest... así que, según los clásicos, todo está ahí, qué más necesitas - no entiendo :) cosas más modernas, por supuesto que no

Y el autor escribe que no trata a las redes neuronales y etc. con gran reverencia, sino que las considera como herramientas habituales de casificación/regresión y no las destaca entre otros métodos. Me gusta este enfoque realista.

Sobre el recocido y demás, tampoco lo entiendo, ¿hay una forma universal de evaluar cada modelo?

 
Maxim Dmitrievsky:

¿Cuál es la diferencia entre golpear y fanfarronear? En el golpeo hay menos ajuste inicial y más elemento de azar, pero en la fanfarronería se ajusta en las sobras del segundo, luego en el tercero y así sucesivamente. Y terminas con un sobrecalentamiento total. Es decir, la RF ya puede hacerse bastante "gruesa" desde el principio, pero tendré que volver a comprobarlo, aún no he tenido tiempo.

Todos mis modelos están reentrenados :) ya que todavía no he encontrado ningún patrón permanente para ellos

Alglib tiene casi todo - convolución, PCA, clustering, conjunto de redes neuronales, forrest... así que, según los clásicos, todo está ahí, qué más necesitas - no entiendo :) cosas más modernas, por supuesto que no

Y el autor escribe que no trata a las redes neuronales y etc. con gran reverencia, sino que las considera como herramientas habituales de casificación/regresión y no las destaca entre otros métodos. Me gusta este enfoque realista.

En cuanto al annealing y demás, tampoco lo entiendo, ¿es algún método universal para todos los modelos? Cada modelo debería tener su propio método de evaluación, a través del cual se pueda entrenar de la mejor manera esta cosa en particular

He intentado varias veces explicarte algunas cosas elementales desde mi punto de vista. He fallado.


Sólo puedo aconsejar: pasa un par de meses en caret y tendrás una forma de pensar diferente, una perspectiva cualitativamente distinta.

 
Maxim Dmitrievsky:

En cuanto al recocido y demás, tampoco está claro: ¿es un método universal para todos los modelos o qué? Cada modelo debería tener su propia forma de evaluación, a través de la cual se pueda entrenar de la mejor manera.

El recocido es el recocido en África, y las metas/objetivos son más o menos los mismos. Permite que el modelo no encuentre mínimos locales, sino globales.

No sé si en el caso de ADA, pero en el caso de NS el recocido da muy buenos resultados. No me gusta el incorporado, porque los parámetros de recocido tienen que ser fijados de antemano, así que recocido manualmente, cambiando los parámetros en base a los resultados del aprendizaje anterior.

HZZ Por cierto, más o menos complicada NS sin recocido en general no enseñar nada.

 
Maxim Dmitrievsky:

sí, pero es tan superior que no lo arrastraré en este momento :) + escribió que es imposible ganar más del 20% anual... Supongo que siempre hay que empezar con esas afirmaciones y luego profundizar en los detalles :)

Maxim, deja de fumar. Sacar de contexto las palabras de otra persona, atribuirlas a otros, etc.
+ parte de los comentarios eliminados. Del mismo modo, no atribuya la autoría de la palabra cascabel a Fa (Fomenko)).

 
Vizard_:

Maximka, deja de fumar. Sacas las cosas de contexto, atribuyendo las palabras de otros a otros, etc. + algunos de los comentarios han sido borrados.
+ algunos de los comentarios han sido borrados. Tampoco se atribuye la autoría de la palabra cascabel Fa (Fomenko)).


Sólo digo :) lo que está en tu mente está en tu lengua

y entonces aparecerá algo... el flujo de trabajo es impersonal.

Me equivoqué con el traqueteo). SanSanych escribió lo mismo una vez... tonterías o algo así

 

(De la ociosidad y la falta total de ideas para seguir trabajando, decidí aprender algo nuevo, para mí mismo, por supuesto - tal vez ya es muy viejo). Comenzó con RF, y a través de RF llegó a Python, ya que es compatible (como dicen) en ambas direcciones con mi software SciLab. Ahora he venido a revisar los paquetes para Python.

En total, hay más de 120.000 paquetes. De ellos sobre Aprendizaje Automático - unos 70, sobre redes neuronales, incluyendo el aprendizaje profundo - unos 70. Posiblemente haya mucho más - he buscado en las rúbricas y algunos paquetes podrían aparecer en otras secciones.

Eso sin contar los paquetes distribuidos directamente por otras empresas. También los hay sobre temas interesantes para nosotros -yo mismo los he visto-, como el Ministerio de Defensa, la Asamblea Nacional de la RF y la ADA.

Entre otras empresas, hay aprendizaje automático, árboles, NS y algo relacionado con ADA.

Muchos paquetes están hechos en C/C++, por lo que no hay que preocuparse por el rendimiento: Python es sólo una interfaz (lenguaje de scripting). Y también lo es R, de hecho.

En definitiva, estoy pasando un rato interesante).

 
Maxim Dmitrievsky:

¿Por qué Ada y no GBM? hay demasiadas abstracciones vagas en tus respuestas. en realidad la ganancia no sería más del 5% con más sobreentrenamiento.

En la calificación, es muy común utilizar la "precisión" -el porcentaje de respuestas correctas- para evaluar un modelo. En mi opinión, esta es una de las evaluaciones más débiles e inapropiadas de los modelos de comercio y debería evitarse. He sugerido probar un montón de otros aquí en el hilo - kappa, f-score, logloss.

Ada en R (tal vez no sólo en R) utiliza una estimación del modelo de clasificación incorporado ligeramente diferente en el entrenamiento, que es mucho mejor en comparación con la "precisión".

 
Yuriy Asaulenko:

(De la ociosidad y la falta total de ideas para seguir trabajando, decidí aprender algo nuevo, para mí mismo, por supuesto - tal vez ya es muy viejo). Comenzó con RF, y a través de RF llegó a Python, ya que es compatible (como dicen) en ambas direcciones con mi software SciLab. Ahora he llegado a las revisiones de los paquetes.

En total hay más de 120.000 paquetes. De ellos unos 70 sobre Aprendizaje Automático y unos 70 sobre Redes Neuronales, incluyendo el aprendizaje profundo. Probablemente hay mucho más - estuve buscando por rúbricas y algunos paquetes podrían aparecer en otras secciones.

Eso sin contar los paquetes distribuidos directamente por otras empresas. También los hay sobre temas interesantes para nosotros -yo mismo los he visto-, como el Ministerio de Defensa, la Asamblea Nacional de la RF y la ADA.

Entre otras empresas, hay aprendizaje automático, árboles, NS y algo relacionado con ADA.

Muchos paquetes están hechos en C/C++, por lo que no hay que preocuparse por el rendimiento: Python es sólo una interfaz (lenguaje de scripting). De hecho, también lo es R.

En definitiva, estoy pasando un rato interesante).

ver más de este material https://cloud.google.com/datalab/

La dirección de AutoML se está desarrollando allí - el servicio recogerá el modelo por sí mismo para ciertas tareas.

Cloud Datalab - Interactive Data Insights Tool  |  Google Cloud Platform
Cloud Datalab - Interactive Data Insights Tool  |  Google Cloud Platform
  • cloud.google.com
Integrated Cloud Datalab simplifies data processing with Cloud BigQuery, Cloud Machine Learning Engine, Cloud Storage, and Stackdriver Monitoring. Authentication, cloud computation and source control are taken care of out-of-the-box. Multi-Language Support Cloud Datalab currently supports Python, SQL, and JavaScript (for BigQuery...
 
Dr. Trader:

En clasificación, es muy común utilizar la "precisión" -el porcentaje de respuestas correctas- para evaluar un modelo. En mi opinión, ésta es una de las evaluaciones más débiles e inapropiadas de los modelos de comercio, y debería evitarse. He sugerido probar un montón de otros aquí en el hilo - kappa, f-score, logloss.

Ada en R (tal vez no sólo en R) utiliza una estimación del modelo de clasificación incorporado ligeramente diferente en el entrenamiento, que es mucho mejor en comparación con la "precisión".


Para los de trading es difícil de evaluar de esa manera, hay que añadir a todo lo demás la duración de la operación y los niveles de stop loss, y el propio programa se rearma periódicamente... así que es una pena :)