Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1038

 
Roffild:
¿Qué tiene eso que ver con el "umbral" de un bosque aleatorio?

No recuerdo cuál es el umbral, debe ser su umbral para entrar en un comercio o algo así como 0,75 o lo que sea (tipo de probabilidad)

 
Roffild:
¿Qué tiene que ver el "umbral" con el bosque aleatorio?

En el caso de la regresión logit puedo imaginarme cuáles son las probabilidades de asignación de clase, en el caso del bosque, por desgracia. Por lo tanto, se trata de pseudoprobabilidades muy probables, y no debería funcionar así. Con un umbral de 0,75 no debería significar que la probabilidad de asignación a una clase sea mayor que con 0,6, por ejemplo.

al menos no he leído ninguna información al respecto
 

Y acepto la "probabilidad" como una parte importante del algoritmo del bosque aleatorio, porque la fórmula para calcular el resultado de todos los árboles se basa en ella.

Incluso he fijado el número de árboles teniendo en cuenta esta "probabilidad".

 
Roffild:

Y acepto la "probabilidad" como una parte importante del algoritmo del bosque aleatorio, porque la fórmula para contar el resultado de todos los árboles se basa en eso.

Incluso he fijado el número de árboles teniendo en cuenta esta "probabilidad".

¿Tienen en cuenta cuántas hojas ocupan la parcela de la muestra? El tamaño de la comisión que realmente vota la situación, dada la alta probabilidad de competencia de cada hoja de dicho árbol?

 
Aleksey Vyazmikin:

¿Se tiene en cuenta cuántas hojas ocupan la zona de la muestra? ¿El tamaño del comité que realmente vota la situación dada la alta probabilidad de competencia de cada hoja de dicho árbol?

La rama final es responsable de al menos 25 variantes de la muestra entrenada. Se establece en los parámetros de Spark. No existe tal parámetro en AlgLib.
 
Roffild:
La rama final es responsable de al menos 25 variantes de la muestra entrenada. Se establece en los parámetros de Spark. No existe tal parámetro en AlgLib.

Tal vez no lo haya expresado así.

Supongamos que tenemos 100 árboles, cada hoja de árbol a la vez (en el caso simple de 2 opciones) hace una clasificación, así que tenemos en cuenta el hecho de que la votación puede implicar árboles con un margen de error muy grande - por ejemplo, 49/51, lo que distorsionaría significativamente la predicción media. ¿Tal vez deberíamos eliminar por completo las hojas de votación? Porque la falta de capacidad de predicción dice más sobre un modelo de hoja de árbol pobre cuando se trata de datos específicos.

 
Nueva clasificación de los lenguajes de programación, incluidos Python y R
 
SanSanych Fomenko:
Nueva clasificación de los lenguajes de programación, incluidos python y R
Buen material. Pero tus propias conclusiones sobre R y Python son inverosímiles. No se pueden comparar en absoluto según su criterio: es como si fuera cálido y suave.
 
Yuriy Asaulenko:
Buen material. Pero tus propias conclusiones sobre R y Python son inverosímiles. No se pueden comparar en absoluto según tu criterio, es como si fuera cálido y suave.

¿Y más concretamente?

Estoy comparando el aparato de referencia de las lenguas.

¿Cómo lo quieres?

 
SanSanych Fomenko:

¿Y más concretamente?

Estoy comparando el aparato de referencia de las lenguas.

¿Cómo lo quieres?

Cuantitativamente, hay más vehículos de motor que tractores, pero no tiene sentido compararlos entre sí.
En términos de ayuda, ambos son extensos. En cuanto a los módulos, se solapan parcialmente.
Python tiene un puerto en R, creo, y R a Python.
Si tienes una tarea compleja, tienes que portar algo desde fuera si trabajas en cualquier entorno y en cualquier idioma. Te guste o no, debes tener además un camión, un tractor y una excavadora.