Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 82

 
mytarmailS:

Al entrenar el modelo, cuantos más árboles, más aprende la clase "0" y, a medida que la clase "0" aprende más y más, empieza a (absorber - exprimir) las clases "1" y "-1". Por eso, cuantos más árboles menos tratos

Algo está mal, el bosque está casi siempre entrenado al 100% de precisión con cualquier sesgo. En la validación con dichos datos puede haber problemas, pero al predecir los resultados sobre los datos de entrenamiento el bosque siempre será preciso. Puedo suponer que no está utilizando la clasificación sino la regresión, y que cuando prueba el modelo no obtiene las clases nítidas -1;0;1, sino números reales en el rango de -1 a 1. Con ese tipo de regresión sesgada, no saldrá nada bueno.

Una mejor manera de hacerlo es decir que tiene una tabla trainingData, donde la última columna es la variable objetivo y todas las demás columnas son predictores:

trainingData <- data.frame(trainingData) #на  всякий случай сконвертировать таблицу из матрицы в датафрейм, если не было сделано раньше
trainingData[,ncol(trainingData)] <- factor(trainingData[,ncol(trainingData)]) #тип  последней колонки сменить на фактор. Модели в R обычно сразу по этому типу понимают что нужна классификация, и работают чуть иначе чем при регрессии
 
mytarmailS:

En realidad no...

Lo que escribo sólo es aplicable a mi enfoque, es diferente para ti.

ya sabes cómo hago mi objetivo, es pivotar

tengo tres clases de pivote "arriba", "abajo" y "sin pivote" ( 1 , -1 , 0 )

También sabes que la asimetría de las clases es enorme, la clase "0" es decenas de veces mayor que "-1" y "1"

y esto significa que el modelo se entrena mejor en la clase "0" porque tiene la mayor cantidad de observaciones y mientras se entrena el modelo, cuantos más árboles se entrenan más clase "0" y a medida que la clase "0" se hace mejor y más fuerte comienza a (absorber - exprimir) las clases "1" , "-1" Por eso, cuantos más árboles menos tratos

¡Para mí escribes cosas increíbles!

Un enfoque muy original para las clases desequilibradas.

Entonces entiendo que su lista de predictores no sólo no contiene ruido, sino que tiene un poder predictivo muy alto.

Si es así, ¿cómo lo ha conseguido?

 
Dr.Trader:

Algo está mal, el bosque está casi siempre entrenado al 100% de precisión con cualquier sesgo. En la validación puede haber problemas con esos datos, pero el bosque siempre predecirá con precisión los resultados de los datos de entrenamiento. Puedo suponer que no está utilizando la clasificación, sino la regresión, y que cuando prueba el modelo no obtiene clases nítidas -1;0;1, sino números reales en el rango -1 a 1. Con ese tipo de regresión sesgada, no saldrá nada bueno.

Para ello, digamos que tiene una tabla trainingData, donde la última columna es la variable objetivo y todas las demás columnas son predictores:

El 100% para un árbol es un absoluto disparate.

Si todos los predictores son ruido, este resultado es muy difícil de conseguir: seguirá habiendo un error del 3%-5%. El ruido siempre da muy buenos resultados con toda la validación cruzada y otros trucos.

Una precisión del 100% significa lo único: que entre los predictores hay un duplicado de la variable objetivo (alguna modificación de la misma). Es decir, el modelo mira hacia el futuro.

 
SanSanych Fomenko:


Una precisión del 100% sólo significa una cosa: entre los predictores tienes un duplicado de la variable objetivo (alguna modificación de la misma). Es decir, el modelo mira hacia el futuro.

Esto es una fuga de datos. Hay que volver a comprobar los datos.
 
Alexey Burnakov:

¿Qué es lo que no le gusta de este enfoque? ¿Cómo vas a ajustar los parámetros?

Sí, el planteamiento es genial, es difícil pensar en algo mejor, el problema está en el propio mercado...

Recuerda que te hablé de mis experimentos, correlaciones y búsqueda de patrones en la historia (no en la SSA, sino antes), lo que hice:

Tomé la situación actual y busqué sus análogos en el pasado y miré cómo terminaron, si encontré una situación "X", cuando encontré 20 análogos de los cuales 17 terminaron con una caída y 3 con una subida, por lo que la ventaja estadística es obvia(hay que vender), por cierto, ¿por qué no es la validación cruzada? Sólo por un único patrón, ¿no te parece? Descubrimos que este patrón no funcionará, descubrimos que con un enorme porcentaje de probabilidad el mercado subirá, va en contra de sus propias estadísticas con una enorme probabilidad estadística.

Para hacerlo más simple, si ayer tuvimos el evento "x" y después de él tuvimos la caída y el día anterior tuvimos el evento"x" y después de él todo se cayó también y después de ayer hubo una caída después del evento"x"- así que si hoy tenemos el evento"x"- todo crecerá, ¿qué crosvalidación nos ayudará aquí?Nada, nunca.

Lo más importante es entender el proceso.

El mercado es un negocio cruel, en el que algunos que han construido este negocio se llevan legalmente el dinero de los demás. La multitud, la mayoría, siempre está obligada a perder, todo el mundo lo sabe, todo el mundo escribe sobre ello, nadie lo oculta, en definitiva, es un axioma -un patrón del 95% de los operadores que pierden dinero- el mercado se mueve en contra de la mayoría con la probabilidad de que los operadores pierdan dinero con ese 95%.

¿Y qué es lo que utiliza la multitud cuando negocia? De hecho, la multitud no tiene nada más que una cosa que les hace hacer tratos.

Cualquier acción , desde la navegación visual de los gráficos y la búsqueda de patrones en los desgloses hasta el entrenamiento de redes neuronales, no es más que operar por estadística, la misma estadística que no funciona en el mercado, ¿entiendes lo que digo?

el mercado se mueve en contra de las operaciones de la multitud ----- la multitud actúa según las estadísticas ------ todo lo que hay que hacer es predecir la acción de la multitud en el futuro y hacer lo contrario, la única manera de predecir es con las estadísticas

)))) empezar con uno y terminar con el tercero :) Bueno, ya está, al menos me lo he sacado de encima).

p.d. todo lo que he dicho aquí es mi opinión personal, no quiero imponer nada a nadie, puedo argumentar y demostrarlo, pero no estoy de humor para ello

 
Dr.Trader:

Algo está mal, el bosque está casi siempre entrenado al 100% de precisión con cualquier sesgo. En la validación puede haber problemas con esos datos, pero el bosque siempre predecirá con precisión los resultados de los datos de entrenamiento. Puedo suponer que no está utilizando la clasificación, sino la regresión, y que cuando prueba el modelo no obtiene clases nítidas -1;0;1, sino números reales en el rango -1 a 1. Con una regresión tan sesgada, nada bueno saldrá de ella.

Mejor aún, digamos que tiene una tabla trainingData donde la última columna es la variable objetivo y todas las demás columnas son predictores:

No, clasificación, tienes algo mal...

qqq

Lo tenía así, dos modelos, por separado clases de compra y venta (1, 0) y (-1, 0)

se ve feo ) estoy de acuerdo

 
mytarmailS:

Sí, el planteamiento es genial, es difícil pensar en algo mejor, el problema está en el propio mercado...

Recuerda que te hablé de mis experimentos, correlaciones y búsqueda de patrones en la historia (no en la SSA, sino antes), lo que hice:

Tomé la situación actual y busqué sus análogos en el pasado y miré cómo terminaron, si encontré una situación "X", cuando encontré 20 análogos de los cuales 17 terminaron con una caída y 3 con una subida, por lo que la ventaja estadística es obvia(hay que vender), por cierto, ¿por qué no es la validación cruzada? Sólo por un único patrón, ¿no te parece? Descubrimos que este patrón no funcionará, descubrimos que con un enorme porcentaje de probabilidad el mercado subirá, va en contra de sus propias estadísticas con una enorme probabilidad estadística.

Para hacerlo más simple, si ayer tuvimos el evento "x" y después de él tuvimos la caída y el día anterior tuvimos el evento"x" y después de él todo se cayó también y después de ayer hubo una caída después del evento"x"- así que si hoy tenemos el evento"x"- todo crecerá, ¿qué crosvalidación nos ayudará aquí?Nada, nunca.

Lo más importante es entender el proceso.

El mercado es un negocio cruel, en el que algunos que han construido este negocio se llevan legalmente el dinero de los demás. La multitud, la mayoría, siempre está obligada a perder, todo el mundo lo sabe, todo el mundo escribe sobre ello, nadie lo oculta, en definitiva, es un axioma -un patrón del 95% de los operadores que pierden dinero- el mercado se mueve en contra de la mayoría con la probabilidad de que los operadores pierdan dinero con ese 95%.

¿Y qué es lo que utiliza el público cuando negocia? De hecho, la multitud no tiene nada más que una cosa que les hace hacer tratos.

Cualquier acción , desde la navegación visual de los gráficos y la búsqueda de patrones en los desgloses hasta el entrenamiento de redes neuronales, no es más que operar por estadística, la misma estadística que no funciona en el mercado, ¿entiendes lo que digo?

el mercado se mueve en contra de las operaciones de la multitud ----- la multitud actúa según las estadísticas ------ todo lo que hay que hacer es predecir la acción de la multitud en el futuro y hacer lo contrario, la única manera de predecir es la estadística

)))) empezar con uno y terminar con el tercero :) así que ya está, al menos me lo he sacado de encima).

p.d. todo lo que he dicho aquí es solo mi opinión, nadie está imponiendo nada, puedo argumentar y demostrarlo, pero no el ánimo

Bien.

En cuanto a mí, Forex es una simple señal con ruidos. Si encuentro una adicción me quedo con el dinero, si me vuelvo a formar, el corredor me lo quita. Y sobre las multitudes, etc. no tengo información. No sé cómo conseguir suficiente.

Quiero empezar a tratar con las cotizaciones de las acciones cuando termine este experimento. Allí obtendré volúmenes reales, lo que también es una ventaja.

 
Alexey Burnakov:

DE ACUERDO.

Para mí el forex es una señal estúpida con ruido. Si encuentro una adicción, me llevo el dinero, si me reconvierto, el corredor se lleva el dinero. Y sobre las multitudes, etc. no tengo información. No sé cómo conseguir suficiente.

Quiero empezar a tratar con las cotizaciones de las acciones cuando termine este experimento. Quiero usar comillas reales.

Si negocia con el eurodólar en el mercado de divisas, tiene que entender qué es lo que impulsa su FX. Si operas en el EURUSD en el CME , la multitud real mueve las transacciones reales, y lo que tienes en la emisión del terminal es sólo una imagen que repite el movimiento del EURUSD real y nada más, tu transacción en MT4 no tiene impacto en el mercado, nadie se lleva tus 10 dólares (figuradamente) al Interbank, operas con tu casa de bolsa y ya está, más bien opera contra ti, porque tu pérdida es su beneficio neto
 
Alexey Burnakov:

Después de completar este experimento, quiero retomar las cotizaciones bursátiles. Habrá volúmenes reales allí, lo que también es una ventaja.

Siempre he operado sólo en el mercado real, sé de lo que hablo.
 
mytarmailS:
créeme, el volumen no te ayudará mucho, puedes sustituirlo por la volatilidad regular, yo casi siempre he operado sólo en el mercado real, sé de lo que hablo

Bien.

Intentaré hacer fichas de entrada del volumen y luego ya veremos.