Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 450

 
¿Reshetov se presentó a Dios?
Yo no...
Recientemente escribió algo como.... El invierno...
 
Alexander Ivanov:
¿Reshetov se presentó a Dios?
Yo no...
Recientemente escribió algo como.... En invierno...

Eso es lo que quería saber lo que pasó con él.

 
El fin del mundo se acerca. Y Dios está tomando su propio away....
Y el Anticristo aparecerá.....
 
La salida:

Hmmm... ¿usas el software del difunto Yury Reshetov? El XGB muele este conjunto hasta un 65-67% de precisión en un minuto. Cuando ML lleva más de una hora funcionando, asumo que algo va mal, así que tengo debilidad por las redes neuronales desde hace mucho tiempo.

No, no es la red neuronal de Jura. Pero no entreno el modelo una vez, sino que pruebo diferentes combinaciones de predictores y diferentes parámetros del modelo. La salida debe ser datos estadísticos sobre la importancia de cada predictor y los parámetros del modelo para que todo pueda ser entrenado sin ajuste.

 

Lo tengo hasta ahora, la selección de los parámetros del modelo y los pesos de los predictores aún está lejos de ser completa, debería ser mucho mejor en el futuro.

Tomé el 10% de train.csv (al azar) para el entrenamiento, por lo demás es un proceso bastante largo.
Los pesos de los predictores son.
0
0
3467.50163547078
0
0
184258.95892851
22315.6831463224
0.144079977475357
0
0
0.000324672622477092
39775.9969139879
6053.73861534689
0
0

Lo que es cero y se acerca a él es basura e inútil, cuanto mayor sea el peso mayor será la influencia del predictor en el resultado.

logloss en el entrenamiento (10% de las líneas del train.csv) - 0.6895723, precisión 0.6402786

El logloss de la prueba (todo el test.csv) es de 0,6928974, la precisión es de 0,6239073.
Necesito aumentar el número de ejemplos de entrenamiento, el 10% que tomé es muy bajo, por lo que el logloss bajó notablemente en la prueba. Por ejemplo, para numerai necesito tomar al menos el 50% de los ejemplos de entrenamiento, de lo contrario los resultados en los nuevos datos no son nada.


Tengo que tomar al menos el 50% de los ejemplos de entrenamiento, de lo contrario los resultados en los nuevos datos no son nada buenos:

El XGB muele este conjunto hasta un 65-67% de precisión en un minuto.

Respeto XGB, en manos capaces cosa fuerte. He empeorado en 4 horas.


¿Qué tipo de datos son? ¿Forex, bolsa, suscripciones de pago? ¿Sería realista que el 62% diera beneficios si yo mismo reuniera un conjunto similar de predictores?

 
Dr. Trader:

De todos modos, ¿qué tipo de datos son? ¿Forex, bolsa, suscripciones de pago? ¿Sería realista que el 62% de la población obtuviera un beneficio si recogiera un conjunto similar de predictores para mí?


Creo que esta pregunta debería hacerse al principio )) sin entender la fuente de datos es de alto nivel :)

Es como pasear con una chica, conocerla a través de conocidos, y luego sólo hacia el final de la noche - escucha, cómo te llamas :) y ella dice que tienes una buena reacción en la vida, llegarás lejos

 
Alexander Ivanov:
¿Reshetov se presentó a Dios?
No sabía...
Recientemente escribió algo como.... En invierno...

Me sorprendí a mí mismo.

Que descanse en paz.

 
Vladimir Gribachev:

Me sorprendí a mí mismo.

Que descanse en paz.

Que Dios haga descansar su alma.
 
Alexander Ivanov:
Que Dios lo tenga en su gloria.
Pero su causa seguirá viva, he leído su obra, un hombre muy interesante con un pensamiento poco convencional. Incluso me sorprendió que antes de sacar el tema de nuevo nadie lo había discutido mucho, excepto Mikhail.
 
Dr. Trader:

Para el entrenamiento tomó el 10%de train.csv

Logloss de entrenamiento (10% de las líneas de train.csv) - 0,6895723, precisión 0,6402786

El logloss de la prueba (todo el test.csv) es de 0,6928974, la precisión es de 0,6239073.

Necesito aumentar el número de ejemplos de entrenamiento, el 10% que tomé es muy bajo, por lo que el logloss bajó notablemente en la prueba.

No trató de tomar el 10%, pero creo que el 62% es bueno, tuve cerca de 66% en la prueba, Asistente dijo que tenía 67%, por supuesto, en el 100% de las muestras lerna en la formación.

Por ejemplo, para numerai necesito tomar al menos el 50% de las muestras de entrenamiento, de lo contrario los resultados en los nuevos datos no son nada.

Para ser honesto con ellos todo es bastante poco claro, no puedo entender que tan bueno es el medidor, lo hicieron muy nebuloso, no está claro por qué ponen respuestas en el torneo, por el cual cuentan loglos preliminares, no está claro por qué lo necesitan, gente que estaba en primer lugar de repente basura para 500-th con loglos >0.7, todo huele a azar ...

Respeto XGB, en las manos adecuadas una cosa fuerte. Lo he tenido peor en 4 horas.

Fuerte, especialmente cuando lo reconstruí yo mismo en C++.

¿Qué tipo de datos son? ¿Forex, bolsa, suscripciones de pago? ¿Sería realista que el 62% produjera un beneficio si yo mismo me bombeara un conjunto similar de predictores?

Los datos son todos de FORTS con Quicksilver, Metatrader y libres parsed de páginas web como http://www.investing.com etc. segundos, se firmó tipo de parámetros. Es realista, pero la infraestructura de trading para HFT moderado (10 seg-1min de mantenimiento de posición) debería hacerse en Quick o Plaz, desde cero esto es un trabajo de años-hombre. Prof. C++/Java/C# coder (25-50K$ si es local), pero hay que tener en cuenta que las perspectivas de HFT en el mundo están disminuyendo todo el tiempo, sobre todo ultra, es decir que están monopolizadas por organizaciones muy financiadas y no están disponibles para los pequeños comerciantes, debemos centrarnos en la previsión del próximo minuto, no segundo, hay ~ 55% de este es el límite de sueño