Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1911
Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
Lo estás inventando sobre la marcha). 24 columnas, no 100. Tú mismo pediste el archivo. No hay errores (lo he explicado). 300 y un montón de líneas porque te di un año, por lo que su "generador" no caca a contar)) Pero continúa. No tuve tiempo de terminar de verlo, pero el principio es prometedor. Dejaré una reseña completa más tarde. Parece que tendré que responder en formato de vídeo.
Tengo un archivo sucio de 7700 columnas donde tomo 24 ligas, así que no sigas, sino que mira aquí. Aquí está su archivo.
Y aquí está la mía.
Cuál es la diferencia???? No te mantendré en suspenso. En el análisis de componentes principales, cuando cada columna es su propio sistema de coordenadas, es importante que puedan agruparse para que los puntos de diferentes columnas puedan representarse en el mismo sistema de coordenadas. La interpretación es sencilla. Cuantos más vectores verticales y horizontales, más frío es. Lo que tienes es una mancha uniforme y contundente.
Lo he ordenado un poco, esencialmente los ángulos entre los vectores muestran correlación (90g = 0 correlación). Alimento los rezagos incrementales, ahí no habrá correlación, es como ruido blanco.
Que te conformes con 50 ejemplos de entrenamiento (50 líneas) es sorprendente, es lo poco profunda que tiene que ser la cuadrícula. Se necesitan muchos ejemplos para eliminar funciones innecesarias (idealmente hasta una) que puedan describir datos.
Sí Maxim lo siento, ese no era tu archivo de formación, pero creo que el mensaje es claro. Bueno, 24 columnas no pueden explicar 2000 vectores sin repeticiones. Es físicamente imposible ....
La próxima vez haré un baile.
La próxima vez bailaré.
vtreet no utiliza rsa, no se trata de eso en absoluto. Yo mismo no entiendo lo que hacen ,
preprocesan los caracteres que faltan y demás + crean nuevas características pero no lo posicionan como una inducción de características así como cuentan como una característica pero no lo posicionan como una selección de características, así que no sé qué es ni cómo funciona.
Con respecto a "PCA es lineal y lo que has ptsashil allí se puede tirar a la basura.
Apuesto a que puedo obtener un precio a partir de una descomposición PCA en datos nuevos con una precisión de +-98%.
Puedo probarlo, así que aquí te equivocas, quizás hasta te mola que sea lineal, si no, no lo habría recogido.
la próxima vez bailaré
En general, estoy de acuerdo con la terminología en la que las columnas son entradas (variables explicativas), las filas son vectores de entrenamiento o ejemplos. Es posible que para algunos algoritmos de aprendizaje esto sea crítico cuando hay menos filas que columnas, pero cuando hay más filas que columnas te acercas a ejemplos idénticos que llevan al modelo a la zona de sobreaprendizaje. No es posible describir 350 ejemplos (filas) con 24 variables explicativas (columnas) y evitar las repeticiones.
No uso el PCA en general de ninguna manera, era sólo un ejemplo para otro usuario. Se puede utilizar para evaluar el conjunto resultante hasta donde sea posible dividirlo.
P.D. La vaina... joder con la canción está acreditada. ¡Bien hecho!
En general, estoy de acuerdo con la terminología en la que las columnas son entradas (variables explicativas), las filas son vectores de entrenamiento o ejemplos. Es posible que para algunos algoritmos de aprendizaje esto sea crítico cuando hay menos filas que columnas, pero cuando hay más filas que columnas se obtienen ejemplos casi idénticos que llevan al modelo a la zona de sobreaprendizaje. No es posible describir 350 ejemplos (filas) con 24 variables explicativas (columnas) y evitar las repeticiones.
No uso el PCA en general de ninguna manera, era sólo un ejemplo para otro usuario. Se puede utilizar para evaluar el conjunto resultante hasta donde sea posible dividirlo.
P.D. La vaina... joder con la canción está acreditada. ¡Bien hecho!
Sólo si el número de etiquetas de las clases es muy diferente (las clases no están equilibradas)
Te estaba torturando para nada. el más famoso mago y hechicero ))))
Te acercas a ejemplos idénticos, lo que lleva al modelo a la zona de sobreaprendizaje.
estos "ejemplos similares" crean estructuras estadísticamente significativas - ¿qué es la estadística? es cuando algo se repite y se pueden sacar conclusiones de ello
No es posible describir 350 ejemplos (filas) con 24 variables explicativas (columnas) y evitar las repeticiones.
Qué tiene de malo la repetición ????
estos "mismos ejemplos" son exactamente los que crean estructuras estadísticamente significativas - ¿qué es la estadística? es cuando algo se repite y se pueden sacar conclusiones de ello
cuál es su problema con la repetición????
Hay tres tipos de mentiras: las mentiras, las mentiras flagrantes y las estadísticas. - Mark Twain.
La repetición conduce al aprendizaje de memoria, necesitamos generalizar la red. Es decir, necesitamos alimentar un único vector para que cuando aparezca un nuevo vector, la red reaccione como se espera. Si un conjunto contiene un grupo de vectores cercanos, la red no los memorizará....
En otras palabras, el algoritmo asignará un factor de ponderación excesivamente alto a estos dos vectores próximos....
sólo si las etiquetas de las clases tienen un número muy diferente (las clases no están equilibradas)
El más famoso mago y hechicero ))))