Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3339

 
Los ensembles ya están más cerca de kozul, al menos puedes igualar el sesgo, con una mayor varianza.

Pero seguirás teniendo mucho ruido en las predicciones (porque la varianza es mayor), ¿qué harás con él? Es decir, el TS incluso en la traine tendrá, digamos, sólo el 60% de las operaciones rentables. Y lo mismo o menos en la prueba.

Sí, empezarás a apostar para corregir este ruido... bueno, pruébalo.
 
Maxim Dmitrievsky #:
Esto es para principiantes consejos, usted necesita un kozul y la capacidad de pensar

Aquí, ir a la oficina de estadística, no se agolpan en la recepción.

¿Puedo obtener una tesis sobre cómo construir el modelo final, de acuerdo con este libro? Estoy en mi teléfono, no puedo mirarlo ahora.

Un conjunto de modelos, en el que las predicciones de múltiples aprendices individuales se agregan para hacer una predicción, puede producir un modelo final de alto rendimiento. Los métodos más populares para crear modelos ensemble son bagging(Breiman1996a), random forest(Ho 1995;Breiman 2001a) y boosting(Freund y Schapire 1997). Cada uno de estos métodos combina las predicciones de múltiples versiones del mismo tipo de modelo (por ejemplo, árboles de clasificación). Sin embargo, uno de los primeros métodos para crear conjuntos es el apilamiento demodelos(Wolpert 1992;Breiman 1996b).

El apilamiento de modelos combina las predicciones de múltiples modelos de cualquier tipo. Por ejemplo, una regresión logística, un árbol de clasificación y una máquina de vectores de soporte pueden incluirse en un conjunto de apilamiento.

Este capítulo muestra cómo apilar modelos predictivos utilizando el paquete stacks. Reutilizaremos los resultados del capítulo15, en el que se evaluaron varios modelos para predecir la resistencia a la compresión de mezclas de hormigón.

El proceso de construcción de un conjunto apilado es:

  1. Ensamblar el conjunto de entrenamiento de predicciones retenidas (producidas mediante remuestreo).
  2. Crear un modelo para mezclar estas predicciones.
  3. Para cada miembro del conjunto, ajuste el modelo al conjunto de entrenamiento original.


20.5 RESUMEN DEL CAPÍTULO

En este capítulo se ha mostrado cómo combinar diferentes modelos en un conjunto para obtener un mejor rendimiento predictivo. El proceso de creación del conjunto puede eliminar automáticamente los modelos candidatos para encontrar un pequeño subconjunto que mejore el rendimiento. El paquete stacks dispone de una interfaz fluida para combinar los resultados del remuestreo y el ajuste en un metamodelo.



Esta es la visión del autor del problema, pero no es la única forma de combinar múltiples modelos - existen paquetes stacks en R para combinar modelos. Por ejemplo, caretEnsemble: Ensembles of Caret Models

20 Ensembles of Models | Tidy Modeling with R
20 Ensembles of Models | Tidy Modeling with R
  • Max Kuhn and Julia Silge
  • www.tmwr.org
The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases of the modeling process.
 
Necesitamos el ensemble y el stacking, es decir, el bousting sobre los clasificadores. El ensamblaje elimina el sesgo y el apilamiento elimina la varianza. En teoría puede funcionar, en la práctica no lo he hecho. Y serán muchos modelos, lo que es desagradable en producción.

Porque cuando llegues a producción, estarás atascado con un montón de modelos. Y tú quieres uno o dos.

Además, no resuelve el problema de que no siempre necesitas estar en el mercado. El modelo estará martilleando todo el tiempo. Debido a estos, digamos, matices, todo el ciclo desde el desarrollo hasta la implementación se rompe.
El probador tardará en probar, todo será lento, entre algodones.
 
También parece haber una confusión entre conjunto y apilamiento en el libro. En resumen, es un enfoque normal, pero puede ser loco en la producción. Y no requiere una montaña de paquetes.

Ah, tampoco resuelve el problema de marcado más importante.
 
Como el reciente enlace al artículo de Vladimir. Es un ejemplo de la creación TC más loco. Cuando usted ha hecho un montón de trabajo, transformaciones, y la salida es algún modelo que se puede obtener por la fuerza bruta al azar sin hacer nada. Es interesante, pero improductivo.
 
Maxim Dmitrievsky #:
todo será lento, algodón.
Maxim Dmitrievsky #:
También parece que el libro confunde conjunto y apilamiento. En resumen, este es un enfoque normal, pero puede ser de algodón en la producción.
Maxim Dmitrievsky #:
Como recientemente dio un enlace al artículo de Vladimir. Un ejemplo de la creación TC más loco .

¿Qué tipo de algodonoso?

 
Forester #:

¿A qué viene esa algodonosidad?

Un sinónimo de lento
 

Sugiero que volvamos a kozul, al aprendizaje estadístico y a la IA fiable.

P.Z.

Averigua los detalles más sutiles.

 
Lorarica #:

Sugiero que volvamos a kozul, al aprendizaje estadístico y a la IA fiable.

P.Z.

Averigua los detalles más sutiles.

Si va directo a los detalles, aquí tiene una lectura al respecto

 

¡Un libro maravilloso como monumento a la desvergüenza y a la falta de escrúpulos!

Lo principal es colgar el plato y cacarear - se encontrarán bobos (o tal vez gente muy calculadora), que caerán en el plato, sin entender, o darse cuenta de que todo lo que se presenta es bien conocido de las herramientas de la estadística matemática.

La estadística tiene varios miles de años. Desarrollando y enriqueciendo la estadística matemática, observando los procesos aleatorios que nos rodean, trató de responder a las siguientes preguntas;

1. ¿Cuáles son las características de estos procesos aleatorios?

2. 2. ¿Cuáles son las causas de estos procesos aleatorios?

3. ¿Cuál es el futuro de estos procesos aleatorios?

Ahora hay tipos listos que empiezan a vociferar sobre la "inferencia causal" como explicación del significado de este término innovador con toda seriedad y empiezan a presentar popularmente los fundamentos del análisis de regresión en el ejemplo de la regresión lineal.

¡Es alucinante!

Y este nuevo cuadro para cláusulas muy antiguas ¡está rodando!

Hoy en día en R, el único lenguaje para estadística bien estructurado y documentado, hay más de 10.000 paquetes y más de 120.000 funciones que son herramientas para responder a las preguntas anteriores, una de las cuales es averiguar Causas y Consecuencias.

¿Para qué necesitamos nuevas placas? Para que los listos se forren y no les hagan preguntas estúpidas por tener una educación básica.