Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 883

 
Maxim Dmitrievsky:

los bosques regulares y los bosques aleatorios y los bosques de árboles son la misma cosa :) El bosque es un conjunto de árboles

¿son los rasgos colapsados, es decir, hay menos de ellos o qué? por rasgos colapsados nos referimos a los que raramente cambian y/o son categóricos como los unos y los ceros (bueno, eso es una comprensión de alto nivel)

No, colapsado significa que una variable tiene muchos valores, pero el número de combinaciones sigue siendo el mismo. Adjunto un archivo, similar al del año pasado para las compras, pero en otra representación.

Archivos adjuntos:
 
Vizard_:

La binarización elimina mucha información útil.

¿Qué más da cómo se presente la información, no cambia...? ???

 
Maxim Dmitrievsky:

No tengo nada en contra de SanSanych personalmente, es un hombre muy competente y discreto, haciendo algo propio y desconocido, probablemente necesita R

Yo prefiero python intuitivamente, aunque no he inventado nada especial para hacerlo wow, pero lo sigo estudiando tranquilamente y a ver si me ayuda :D

R es un entorno maravilloso, que tiene muchas ventajas sobre Python. Lo más importante es que R es un entorno de modelado. En comparación con Python, en R se pueden obtener resultados más rápidos y sencillos.

Está claro que Python, en combinación con los módulos, tiene sus propias ventajas.

Por cierto, para la RF, parece que tanto aquí como en NS, podemos prescindir de la probada selección de predictores y utilizar directamente la PA normalizada como tal.

 
SanSanych Fomenko:

¿Bosque normal o bosque aleatorio, o ambos?

En rattle, ejecuta los dos modelos de bosque llamados tree y ada. Abra la pestaña de registro y vea el código R, las referencias a los paquetes utilizados y podrá entender sus diferencias.

Entiendo la diferencia entre árbol y andamiaje (o creo que sí) el andamiaje es mejor utilizarlo cuando hay más incertidumbre en los datos, es decir, un patrón menos estable ya que el andamiaje toma las decisiones por votación, cosa que sí hacen los árboles aleatorios (independientes debido al acortamiento), ¿o me equivoco? Y la opción "adad" no la tengo, no está en la captura de pantalla, hay "Bosque" - ¿no es así?

SanSanychFomenko:

Puse Rattle y R (bueno, y glitches todo esto ...),

No entiendo qué fallos, últimamente corrió un gran número de modelos - todos normales

He tenido algunos problemas con la descarga de paquetes - dice que ha empezado, pero no los descarga, luego los baja y dice que no tiene las librerías que necesita, luego se cuelga al leer datos de un archivo... Bueno, el proceso de trabajo no es visible - no está claro cuánto tiempo hay que esperar para la finalización. Hasta ahora estoy hablando de esos bichos. Una vez eliminada una tarea del despachador...

SanSanych Fomenko:


La foto de ratonera, la tienes sin terminar. Por lo menos hay que ir a la siguiente pestaña y ver los resultados allí.

Pero lo más importante es dividir el archivo fuente en dos partes con nombres diferentes (lo más probable es que tenga que hacerlo en R).

En el primer archivo se construyen TODOS los seis modelos y se mira su prueba de estimación, se valida. Luego se escribe el nombre del segundo archivo en el campo R Dataset. Y en ella se vuelven a poner marcas. Todas las estimaciones deben ser aproximadamente iguales.

Si estas estimaciones no coinciden, y el segundo archivo muestra peores resultados de los modelos, significa que los modelos están sobreentrenados y la razón de ello son los predictores de ruido (no relacionados con la variable objetivo).


Este es el momento de la verdad: o se tiene un conjunto de predictores relevantes para una determinada variable objetivo o no se tiene. Y ningún modelo puede arreglar esta desafortunada circunstancia. Entonces comienza el trabajo tonto de seleccionar un par de "predictores-objetivo", los modelos no son interesantes en absoluto, encontrar un par, entonces los modelos son sólo semillas en R, usted encontrará una docena de ellos en un día y hacer conjuntos de ellos.

Entonces, ¿cómo se corta un archivo con R, es necesario utilizar un algoritmo especial? Es interesante ver lo que ocurre al final.

 
SanSanych Fomenko:


2. No hay problema en usar R EA: todo funciona y es muy estable.

¿Funciona también para MT5? ¿Dónde puedo encontrar ejemplos de código? Creo que sería mejor usar el indicador para enviar la información ya que en el optimizador será más fácil compararlos al conectarse con el EA y mostrar visualmente lo que piensa el bosque sobre la situación del mercado en cada momento.

 
Yuriy Asaulenko:

R es un entorno maravilloso, con muchas ventajas sobre Python. La principal es que R es un entorno de modelización. En comparación con Python, los resultados en R pueden obtenerse más rápida y fácilmente.

Está claro que Python, en combinación con los módulos, tiene sus propias ventajas.

Por cierto, en cuanto a la RF, parece que aquí, al igual que en NS, es posible prescindir de la selección de predictores y utilizar directamente la PA normalizada como tal.

incluso se puede utilizar un sistema no normalizado

 
Maxim Dmitrievsky:

Incluso se puede hacer sin racionamiento.

No funcionará. Debe haber una referencia clara de la sección de BP a un determinado nivel, cero, por ejemplo.

 
Aleksey Vyazmikin:


Entiendo la diferencia entre árboles y bosques (o creo que la entiendo) los bosques son mejores para usar cuando hay más incertidumbre en los datos, es decir, un patrón menos estable ya que los bosques toman decisiones por votación, cosa que hacen los árboles aleatorios (independientes debido al acortamiento), ¿o me equivoco?

No sé, estoy juzgando por los resultados.

Y la opción "adad" no la tengo, no está en la captura de pantalla, hay "Bosque" - esto no es?

En orden:


Árbol

El paquete 'rpart' proporciona la función'rpart'.


Impulsar

# Extreme Boost

# El paquete `xgboost' implementa el algoritmo de refuerzo de gradiente extremo.


SVM

# Máquina de vectores de apoyo.

# El paquete 'kernlab' proporciona la función 'ksvm'.


Lineal

# Modelo de regresión

# Construir un modelo de regresión.


Red neuronal

# Red neuronal

# Construir un modelo de red neuronal utilizando el paquete nnet.

library(nnet, quietly=TRUE)


Por cierto, he hecho este trabajo por ti - puedes verlo todo en Log tú mismo. Si tienes otra versión de rattle, la lista puede ser diferente.


Entonces, ¿cómo cortar el archivo con R, es necesario utilizar un algoritmo especial? Es interesante ver cuál será el resultado.

Por índice, por ejemplo: [1:2000,], [2001:4000,]. Es importante no romper la secuencia temporal natural en el segundo archivo

 
Aleksey Vyazmikin:

¿Funciona también para MT5? ¿Dónde puedo encontrar ejemplos de código? Creo que sería mejor proporcionar la información por indicador, ya que el optimizador puede compararlos fácilmente cuando se conecta al EA, y ver visualmente lo que el bosque piensa sobre la situación del mercado en un momento dado.

La librería está modificada según mi petición - necesitaba un probador de MT5. Hice las cuentas, me da pereza buscarlas, a lo mejor las he limpiado.

Vea los artículosde Vladimir Perervenko

Si te interesan las redes, es lo último en esta área, R, asesores, el hombre está disponible en el sitio
 
Aleksey Vyazmikin:

No, colapsado, lo que significa que una variable tiene muchos valores, pero el número de combinaciones sigue siendo el mismo. He adjuntado un archivo análogo al último para comprar, pero en una representación diferente.

Pruébalo como quieras :) Lo principal es no olvidarse de leer la teoría que no haría algo estúpido, y el paquete que necesitas no es difícil, están llenos de ellos, e incluso en línea - no es necesario instalar nada. Hay un boom de datasens, "eso" está en todas partes

No tengo tiempo para analizar los archivos, estoy trabajando en mis cosas