Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3388

 
Aleksey Vyazmikin #:

1. ¿Cómo se obtiene esta matriz? ¿Qué números hay?

2. Estoy hablando de reglas. En mi enfoque no me importa cómo y de qué se deriva la regla, pero si la respuesta es similar a otra en la muestra de entrenamiento, no lleva información adicional.

1. ningún valor de característica

2. Te voy a sorprender, a nadie le importa cómo se crearon las características, todo el mundo evalúa las características basándose sólo en la respuesta
 
Maxim Dmitrievsky #:

¿Por qué es malo un gran número de signos? Interesante gráfico de un libro sobre kozulu.

Probabilidad de encontrar el mismo ejemplo en la muestra de entrenamiento, en función del número de características.

Si tienes más de 14 (e incluso 10) características, obtienes un montón de reglas que no puedes reducir sin pérdidas.


Todo ello dentro del marco casual.
En los modelos con características no estructuradas (texto, imágenes).
Lo normal son unos cuantos miles de atributos.
 
mytarmailS #:
Todo está dentro del ámbito de lo casual...
En modelos con características no estructuradas (texto, imágenes).
Unos cuantos miles de atributos son normales.

Utilizan algoritmos de compresión eficientes dentro de las neuronas, como sec2sec, así que también es cierto.

 
Maxim Dmitrievsky #:

Utiliza algoritmos de compresión eficientes dentro de las neuronas, como sec2sec, por lo que también es justo.

Si hablamos de texto, utiliza en el 95% de los casos el recuento de palabras habitual como - ¿cuántas veces ha aparecido una palabra en una observación determinada? 0, 1, 103..

Y para que la matriz de características ocupe menos espacio se mantiene en el formato de "matriz dispersa" es favorable porque el 95% de los valores de la matriz son ceros.

Las imágenes son convolución.

Y seq2seq es exótico para un problema raro.
 
mytarmailS #:
Si hablamos de texto, en el 95% de los casos se utiliza el habitual contador de palabras del tipo - ¿cuántas veces ha aparecido una palabra en esta observación? 0, 1, 103..

Y para hacer la matriz de características menos ocupado se mantiene en el formato de "matriz dispersa" es favorable porque el 95% de los valores de la matriz son ceros
.

En las imágenes, la convolución.

Y seq2seq es exótico para un problema raro.

Son arquitecturas diferentes, pasteles de capas. Es difícil comparar. Estamos hablando de clasificación normal o regresión. En este caso parece una ley universal.

 
Maxim Dmitrievsky #:

Son otras arquitecturas, pasteles de capas. Es difícil comparar. Estamos hablando de clasificación ordinaria o regresión. En este caso, parece una ley universal.

Es todo lo mismo.

No estoy hablando de neuronas, estoy hablando de la estructura del feedforward.

----------------------------------------------------------------------

Oh, lo recuerdo, se llama bolsa de palabras.



¿Qué es nuevo, desconocido, incomprensible, complicado?


La misma tabla de signos + cualquier MO


Esto es trabajar con datos no estructurados (texto) luego lo traducimos en una estructura de bolsa de palabras y luego cualquier otra cosa que queramos

 
mytarmailS #:
Es todo lo mismo.

No hablo de neuronas, hablo de la estructura de la alimentación del rasgo.

----------------------------------------------------------------------

Ah, ya me acuerdo, se llama bolsa de palabras.



¿Qué es nuevo, desconocido, incomprensible, complicado?


La misma tabla de signos + cualquier MO


Esto es trabajar con datos no estructurados (texto) luego lo traducimos en una estructura de bolsa de palabras y luego cualquier otra cosa que queramos

Esto es de otro tema. No importa cómo los transformes, la dimensionalidad del vector de entrada debe ser inferior al umbral especificado, de lo contrario no podrás determinar un patrón. Los categóricos probablemente tengan un límite mayor en la longitud del vector. Además, considere la dependencia del número de filas. En datos enormes, el número de características puede ser mayor.
 
Maxim Dmitrievsky #:
Eso es harina de otro costal. No importa cómo se transformen, la dimensionalidad del vector de entrada debe ser inferior al umbral especificado, de lo contrario no se puede detectar un patrón. Los categóricos probablemente tienen un límite mayor en la longitud del vector. Además, hay que tener en cuenta la dependencia del número de filas. En datos enormes, el número de características puede ser mayor.
Qué otro)))
Todo el mundo lo hace y todo el mundo es feliz)
 
mytarmailS #:
Que diferente)))
El mundo entero lo hace y todos contentos)
Pues haz como el resto del mundo. Ese es el tipo de respuestas que obtendrás.
Puedes coger 100500 optimizadores y embadurnarte con ellos, también es una opción :)
 
Maxim Dmitrievsky #:
Pues haz como el resto del mundo. Ese es el tipo de respuestas que obtendrás.
Puedes coger 100500 optimizadores y embadurnarte con ellos, también es una opción :)
¿De qué demonios estás hablando?

Si hay un algoritmo que resuelve tus problemas, ¿por qué demonios vas a inventarte tu propia rueda cuadrada con la cabeza bien alta?