Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3385

 
Maxim Dmitrievsky #:
Bueno, en los árboles normalmente se puede calcular la influencia de cada observación de cada rasgo, su contribución al modelo, por ejemplo, mediante valores de forma. Si dejas sólo los útiles y entrenas algo sólo con ellos, obtendrás un análogo aproximado de la búsqueda de reglas. Con neuronas, por cierto, también es posible.

Es difícil de entender cuando sólo las reglas pueden ser las únicas útiles. Tal vez por la interpretabilidad del resultado. Aunque los valores de forma también dan buena interpretabilidad, más o menos.
La influencia de cada rasgo, la influencia de cada observación y la influencia de cada regla son todas diferentes
 
mytarmailS #:
El impacto de cada característica, el impacto de cada observación y el impacto de cada regla son diferentes
Las reglas son los elementos del modelo que vinculan las características y las etiquetas. Lo único es que las redes neuronales no tienen discontinuidad, pero se puede hacer artificialmente.

Lo que digo es que no le veo mucho sentido a las reglas (fumar en pipa con sentido).
 
Maxim Dmitrievsky #:
Las reglas son los elementos del modelo que vinculan atributos y etiquetas. Lo único es que las redes neuronales no tienen discontinuidad, pero se puede hacer artificialmente.

A lo que voy es que no le veo mucho sentido a las reglas.

Lo intentaré desde Khabarovsk...


cualquier modelo es una cierta suma de patrones, exageradamente un patrón puede ser etiquetado como una TS.


Imaginemos que un modelo consta de 100 TS.


Puede ser que en el modelo #1 100 TSs hicieran un trato.

Puede ser que en el modelo #2 una TS hiciera 100 operaciones, y las otras 99 no hicieran ni una sola operación.


¿Cómo calcular las estadísticas para cada TS?

Si el modelo es de reglas, es fácil y claro.

¿Si el modelo esneuronal?

 
mytarmailS #:

Lo intentaré desde cerca de Khabarovsk.

¿Si el modelo es neuronal?

/\
¡!
¡!

¿No trabajáis tú y Sanych en el mismo estudio?
Eliges ejemplos que son bien predichos por el NS. Entrenas a otro NS sólo con ellos. Repite varias veces, según tu gusto. Después de unas cuantas rondas tendrás el NS con las mejores "reglas".

También fácil y yo no diría incomprensible.
 
Maxim Dmitrievsky #:

Elige ejemplos que estén bien predichos por el NS. Entrena otra NS sólo con ellos. Repítelo varias veces, a tu gusto. Después de varias rondas, obtendrás el NS con las mejores "reglas".
Bien, tenemos una submuestra sobre la que neuronka predice bien. ¿Cómo sabes si es un patrón de esta submuestra, dos o veinte? ¿Realmente no sabes la diferencia?

 
mytarmailS #:
Bien, tenemos una submuestra donde las neuronas predicen bien. ¿Cómo sabes si es un patrón en esa submuestra, dos o veinte? ¿Realmente no sabes la diferencia?

Por el número de ejemplos que quedan. Hay tantos ejemplos como patrones. Es una regla aproximada, no digo que sea lo mismo que una regla estricta. Pero puedes dividir más la muestra, hasta una división completa para cada patrón.
 
Maxim Dmitrievsky #:
Por el número de ejemplos que quedan. Hay tantos ejemplos como patrones.
Puede haber 200 ejemplos y sólo 5 patrones.
Un ejemplo no es un patrón, un ejemplo es una observación.
 
mytarmailS #:
Puede haber 200 ejemplos y sólo 5 patrones.
Un ejemplo no es un patrón, un ejemplo es una observación
Si el error ya ha dejado de caer o es igual a cero, puede dividir los ejemplos restantes en patrones por alguna medida de proximidad :). Clustering, por ejemplo. Y contar cuántos quedan. E incluso escribir una condición promediada para cada patrón/cluster (tomar los centroides de los clusters), obtendrás una regla de salida.
 


mytarmailS #:

Lo intentaré desde Khabarovsk...


Cualquier modelo es una cierta suma de patrones, exageradamente, un patrón puede ser etiquetado como un TS.


Imaginemos que un modelo consta de 100 TS.


Puede ser que en el modelo nº 1 100 TS hayan hecho un trato.

Puede ser que en el modelo nº 2 una ST hiciera 100 tratos y las otras 99 no hicieran ningún trato.


¿Cómo calcular las estadísticas de cada ST?

Si el modelo es de las reglas, se puede hacer fácil y claramente.

¿Si el modelo esneuronal?

El problema no es el número de veces que se utiliza el modelo.

El problema es que el mismo modelo (¿árbol?) sobre los mismos datos predice una etiqueta en unos casos y otra diferente en otros. Es lo que se denomina error de clasificación. No hay predictores, al menos con nosotros, cuyos valores puedan clasificarse estrictamente en clases. y todos los problemas con hojas, árboles y demás se derivan de los valores de los predictores.

 
Maxim Dmitrievsky #:
Si el error ya ha dejado de caer o es igual a cero, puede dividir los ejemplos restantes en patrones según alguna medida de cercanía :) Clustering, por ejemplo. Y contar cuántos quedan. E incluso escribir una condición promediada para cada patrón/cluster (tomar los centroides de los clusters), obtendrás una regla en la salida.
Se puede hacer, pero ¿dónde está la garantía de que la partición se hizo correctamente, de acuerdo con la partición interna de la neurona?

¿Dónde está la garantía de que la medida de proximidad elegida para la agrupación se ha elegido correctamente?

Etc...

¿No sería más sencillo particionar el modelo de madera y no tener que crear un Franklinstein