Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 79

 
Dr.Trader:

He utilizado el método "repeatedcv" en trainControl, con una división por defecto. Hace poco escribí el código para la validación cruzada yo mismo, probé la validación cruzada tanto con barras tomadas al azar como con trozos tomados consecutivamente sin huecos. No vi ninguna diferencia en la prueba frontal, dio casi el mismo resultado en ambos casos. Dividí los datos para el entrenamiento/validación cruzada 50%/50%, tal vez en esa proporción ya no importa.
Voy a experimentar con eso en caret...

Recuerdo que en ese artículo que colgaste hace un tiempo, la comparación líder era árboles potenciados con el método de Platt (algo así). Todo lo que he encontrado en google sobre este método es que hay que pasar la salida del modelo a sigmoide y tomar su resultado. ¿Pueden gbm o xgboost hacer eso? Este enfoque parece ser mejor que el bosque, la neurona y algunos "árboles embolsados" que ocupan el segundo lugar.

Gbm y xgboost son árboles potenciados. Para una mejor convergencia en grpdient cada nuevo árbol se construye sobre observaciones ponderadas basadas en los resultados del aprendizaje del árbol anterior. Tanto los modelos lineales como los no lineales pueden ser potenciados...

En segundo lugar se encuentra un bosque aleatorio. Esto es el embolsamiento tal y como yo lo entiendo. Los resultados medios de varios modelos construidos con datos diferentes.

Lea sobre el aumento del gradiente. Es difícil encontrar uno mejor para la clasificación. Yo, por ejemplo, clasifico en base a los resultados de los predictores de regresión.
 
Sobre el CV. Por defecto, se realiza un particionamiento aleatorio... Para las series temporales, la separabilidad temporal es importante... En caret esto se puede hacer. Los pliegues personalizados de las series temporales de Caret CV... Búscalo. En mi código que he publicado antes. Está implementado en traincontrol allí.
 
Alexey Burnakov:
Sobre el CV. El valor por defecto es la partición aleatoria... Para las series temporales, la separabilidad temporal es importante... puedes hacerlo en caret. Los pliegues personalizados de las series temporales de Caret CV... Búscalo. En mi código que he publicado antes. Está implementado en traincontrol.

Te estoy mirando y estoy asombrado... Quieres sacar algo de la nada. No puedo mirar más, así que te echaré una mano. En realidad, la topología de la red es secundaria. En el aprendizaje automático, en forex y más allá, los datos son lo primero. Es decir, lo más importante en el diseño de redes neuronales no es la topología de la red ni el método de entrenamiento. Son datos de entrada y datos de salida. Si los datos son relevantes para el mercado - cualquier incluso un pequeño perseptrón resolverá su problema de clasificación y funcionará bien en el futuro, por una simple razón, porque los datos de entrada son relevantes para el mercado y estos datos son capaces de predecirlo. Y lo que se pretende es arañar la superficie de la información irrelevante. Lo siento, pero el resultado también será irrelevante.... En cuanto al mercado, en forex, lo principal es el volumen, y luego la reacción del mercado. Y no el volumen que está en MT (tick), sino el volumen real de los futuros, el mismo euro. Utiliza el delta del clúster para ayudarte. Hay mucha información útil. Por lo tanto, utilizando el volumen de las operaciones, aumentará significativamente el rendimiento de cualquier red, incluso el más simple perseptron. También tiene un delta, que también es extremadamente útil. Pero usted está tratando de construir un modelo sobre la base de indicadores que son secundarios, yo diría terciarios después del precio y espera un milagro de él. No habrá ningún milagro, se lo aseguro.....

P.D., sólo piensa en contra de quién estás tratando de correr... Corporaciones con equipos de programadores geniales, con más poder de procesamiento que tu quad-core. Con el dinero invertido en el desarrollo de nuevos métodos, etc. Y aquí Alexey, del simple campo ruso, decidió hackear el mercado en 5 años y conseguir el grial. Baja del cielo y quítate las gafas de color de rosa........

 
Mihail Marchukajtes:

En el aprendizaje automático, en forex y más allá, los datos son lo primero. Es decir, lo más importante a la hora de diseñar redes neuronales no es la topología de la red ni el método de entrenamiento. Son datos de entrada y datos de salida. Si los datos son relevantes para el mercado, cualquier incluso un pequeño perseptrón resolverá su problema de clasificación y funcionará bien en el futuro, por una simple razón, porque los datos de entrada son relevantes para el mercado y estos datos son capaces de predecirlo.

Ni siquiera tengo nada que discutir, eso es correcto. Eso también lo sabemos, y estamos discutiendo no sólo los modelos de clasificación, sino también los métodos de selección de predictores (datos de entrada), lee primero este hilo.

Supongo que espera seleccionar manualmente una docena de entradas, construir un modelo, operar durante una semana, empezar a perder, empezar a elegir entradas de nuevo. Yo también lo he hecho, a veces tengo estrategias divertidas como "toma un cierto grano para inicializar la neurona, entrénala exactamente 7777 iteraciones, todo estará bien, pero cada dos martes tienes que operar contra su señal". Optimizar la red con nuevos datos cada dos días". Este tipo de estrategias son reales, pero se necesita mucho tiempo para elegir algo así y sólo da beneficios durante un par de semanas. Todo porque dicha estrategia se basa en algún patrón a corto plazo.

En su lugar, selecciono un algoritmo para la selección automática de entradas. Es sencillo, hay unas 100 entradas en cada barra y un algoritmo que selecciona tal combinación de entradas que todas juntas dan consistentemente una señal de compra/venta válida durante todo el año. No es como la optimización de Asesores Expertos en mt5, donde un EA puede conseguir grandes resultados y fallar en el fronttest, sino que es más complicado, con validaciones cruzadas y diferentes criterios de estimación del resultado. Antes seleccionaba un centenar de entradas, ahora es más pequeño, sólo un par de docenas. Obtengo un 60%-70% de precisión en el fronttest, pero sigue siendo inestable, necesito deshacerme de los grados de libertad en todo el proceso de selección y entrenamiento para obtener aproximadamente los mismos resultados incluso partiendo de cero cada vez.

Mihail Marchukajtes:

P.D., sólo piensa en quién está tratando de enfrentarse... Corporaciones con equipos de programadores geniales, con más poder de procesamiento que tu quad-core. Con el dinero invertido en el desarrollo de nuevos métodos, etc. Y aquí Alexey, de un simple interior ruso, decidió hackear el mercado en 5 años y conseguir el grial. Baja del cielo y quítate las gafas de color rosa........

Las empresas con instalaciones y programadores propios utilizan el mismo software de análisis y modelización de datos del que disponemos nosotros. Digamos que entrenan el modelo perfecto y obtienen un 100% de beneficio al mes. Tengo menos poder, con los mismos datos podré construir un modelo más débil con, digamos, sólo un 50% de beneficio. Esto será suficiente para mí.

 
Mihail Marchukajtes:

Te miro y es increíble... Quieres sacar algo de la nada. Es decir, a partir de cero, se quiere obtener 0,00000000000000000000000000000000000000000000000000000000000000000000 resultado. No puedo mirar más, así que te echaré una mano. En realidad, la topología de la red es secundaria. En el aprendizaje automático, en forex y más allá, los datos son lo primero. Es decir, lo más importante en el diseño de redes neuronales no es la topología de la red ni el método de entrenamiento. Son datos de entrada y datos de salida. Si los datos son relevantes para el mercado - cualquier incluso un pequeño perseptrón resolverá su problema de clasificación y funcionará bien en el futuro, por una simple razón, porque los datos de entrada son relevantes para el mercado y estos datos son capaces de predecirlo. Y lo que se pretende es arañar la superficie de la información irrelevante. Lo siento, pero el resultado también será irrelevante.... En cuanto al mercado, en el mercado de divisas, lo principal es el volumen, y luego la reacción del mercado. Y no el volumen que está en MT (tick), sino el volumen real de los futuros, el mismo euro. Utiliza el delta del clúster para ayudarte. Hay mucha información útil. Por lo tanto, utilizando el volumen de operaciones, aumentará significativamente el rendimiento de cualquier red, incluso el más simple perseptron. También tiene un delta, que también es extremadamente útil. Pero usted está tratando de construir un modelo sobre la base de indicadores que son secundarios, yo diría terciarios después del precio y espera un milagro de él. No habrá ningún milagro, se lo aseguro.....

P.D., sólo piensa en contra de quién estás tratando de correr... Corporaciones con equipos de programadores geniales, con más poder de procesamiento que tu quad-core. Con el dinero invertido en el desarrollo de nuevos métodos, etc. Y aquí Alexey, del simple campo ruso, decidió hackear el mercado en 5 años y conseguir el grial. Baja del cielo y quítate las gafas de color rosa........

Demagogo, ouch. Ya es hora de que salgas de aquí. Construir una casa.

"El perro ladra, la caravana se va". С

 
Dr. Trader:

Ni siquiera tengo nada que discutir, es cierto. Eso también lo sabemos, y estamos discutiendo no sólo los modelos de clasificación, sino también los métodos de selección de predictores (inputs), lee primero este hilo.

Supongo que espera seleccionar manualmente una docena de entradas, construir un modelo, operar durante una semana, empezar a perder, empezar a elegir entradas de nuevo. Yo también lo he hecho, a veces tengo estrategias divertidas como "toma un cierto grano para inicializar la neurona, entrénala exactamente 7777 iteraciones, todo estará bien, pero cada dos martes tienes que operar contra su señal". Optimizar la red con nuevos datos cada dos días". Este tipo de estrategias son reales, pero se necesita mucho tiempo para elegir algo así y sólo da beneficios durante un par de semanas. Todo porque dicha estrategia se basa en algún patrón a corto plazo.

En su lugar, selecciono un algoritmo para la selección automática de entradas. Simplemente, tengo unas 100 entradas en cada barra y un algoritmo que selecciona tal combinación de entradas que todas juntas dan consistentemente una señal de compra/venta válida durante todo el año. No es como la optimización de Asesores Expertos en mt5, donde un EA puede conseguir grandes resultados y fallar en el fronttest, sino que es más complicado, con validaciones cruzadas y diferentes criterios de estimación del resultado. Antes seleccionaba un centenar de entradas, ahora es más pequeño, sólo un par de docenas. Obtengo un 60%-70% de precisión en el fronttest, pero sigue siendo inestable, necesito deshacerme de los grados de libertad en todo el proceso de selección y entrenamiento para obtener aproximadamente los mismos resultados incluso partiendo de cero cada vez.

Las empresas, con sus instalaciones y programadores, utilizan el mismo software de análisis y modelización de datos del que disponemos. Entrenarán un modelo perfecto y obtendrán un 100% de beneficios al mes. Tengo menos poder, con los mismos datos puedo construir un modelo más débil, con, digamos, sólo un 50% de beneficio. Estaré bien.

Permítanme decirlo de esta manera. Los mejores fondos presentan una rentabilidad media anual del 40-50%. Allí trabajan los inteligentes y los que son simplemente geniales. No veo nada raro que me acerque a la marca del 50% al año y tenga ese aumento.
 
Alexey Burnakov:
Permítanme decirlo de esta manera. Los mejores fondos presentan una rentabilidad media anual del 40-50%. Pueden trabajar allí tanto personas inteligentes como excelentes. No veo nada raro que me acerque al 50% al año y tenga este crecimiento.

En primer lugar - los fondos muestran un rendimiento tan miserable por una sola razón, la falta de liquidez en el mercado, es difícil poner una gran cantidad de dinero en la estrategia, que sin duda no tiene tales problemas

En segundo lugar, ¿por qué no aspirar al 100% mensual, por ejemplo?

Estoy totalmente de acuerdo conMihail Marchukajtes, para elevar la calidad del reconocimiento hay que elevar la calidad de los signos, y los modelos.... su influencia +/- 5% en el resultado global

 
mytarmailS:

En primer lugar - los fondos muestran un rendimiento tan miserable por una sola razón, la falta de liquidez en el mercado, es difícil poner una gran cantidad de dinero en la estrategia, no tiene tales problemas

En segundo lugar, ¿por qué no aspirar al 100% mensual, por ejemplo?

Estoy totalmente de acuerdo conMihail Marchukajtes, para elevar la calidad del reconocimiento hay que elevar la calidad de los signos, y los modelos.... su influencia +/- 5% en el resultado final

Usted también es un demagogo. Bien, muéstranos las entradas con este grado de información. ¿Por qué nos quedamos con los mejores modelos? Para exprimir las señales de los datos ruidosos, si tuviéramos datos sin ruido, también podríamos hacer una fórmula en Excel.

"100% al mes". Esforzarse, mostrar resultados, compartir ideas. Le escucharemos, cómo aumentar su rentabilidad en 20 veces y cómo no retirarse en el próximo mes de la detracción.

 
Alexey Burnakov:

Usted también es un demagogo. Bien, muéstranos las entradas con este grado de información. ¿Por qué nos quedamos con los mejores modelos? Para exprimir las señales de los datos ruidosos, si tuviéramos datos sin ruido, podríamos hacer la fórmula en Excel.

"100% al mes". Esforzarse, mostrar resultados, compartir ideas. Le escucharemos, cómo aumentar su rentabilidad en 20 veces y cómo no retirarse en el próximo mes de una reducción.

"long-livers" de forex. Más de 5 años de comercio. Clasificado por FS. Sí, algunos tienen rendimientos cósmicos, pero otras estadísticas son malas. Esta es la realidad. Y Stabiliti está cambiando de manos. Todos los demás muestran FS de 3 y menos.

 
Alexey Burnakov:

Usted también es un demagogo. Bien, muéstranos las entradas con este grado de información. ¿Por qué nos quedamos con los mejores modelos? Para exprimir las señales de los datos ruidosos, si tuviéramos datos sin ruido, podríamos hacer la fórmula en Excel.

"100% al mes". Esforzarse, mostrar resultados, compartir ideas. Vamos a escuchar cómo aumentar el rendimiento 20 veces y cómo no perderse en el próximo mes de un drawdown.

Aquí todos somos demagogos, sólo tú eres d'artagnan, ya está claro, menos mal que al menos no eres un troll.... bye..... :)


No creo que sea una estrategia real de trading, pero he aprendido que es un profundo practicante y no tengo ninguna pregunta sobre el mercado que no haya sido respondida... Quiero agradecérselo.

Este hombre es Ph. D. en ciencias técnicas, defendió su disertación sobre "AI" hace bastante tiempo (hace unos 20 años) Lleva más de 20 años construyendo robots y tiene mucha experiencia.

Y dice que no se puede predecir el mercado desde un enfoque de caja negra, sino que es necesario identificar los atributos que funcionan, entender cómo y por qué funcionan y filtrar los datos al máximo para dejar sólo lo que funciona, ignorando el ruido.

Tiene una red de alrededor de 100 signos (predictores), cada rasgo tiene una biblioteca completa o paquete como quieras.

Y ahora compara la diferencia de calidad entre un cartel que requiere toda una biblioteca y una tontería torcida cuyo nombre es "SMA" , "MACD" , "RSI", etc... Tienen un 0,00000001% de información útil, tal y como escribióMihail Marchukajtes, y es un hecho, de lo contrario los modelos mostrarían exactamente el rendimiento que pueden mostrar, lo que significa un 90% de respuestas correctas

El hombre recomienda la lectura de "MSUA" y el análisis espectral en particular Fourier

========================================================

Más allá de lo que los resultados que "demagogo" han logrado, pero en realidad muy modesto, buenas ideas como pienso mucho, mi investigación va en muchas direcciones simultáneamente y hay una gran falta de conocimiento en diversos campos, porque a menudo pedir ayuda a los participantes del foro, pero sobre todo para ayudar y nadie quiere, dicen que se aprende a sí mismo, y luego..... sólo si yo mismo he dominado todo, entonces ¿por qué hago esta comunicación, como sin lógica, me distraigo.


Aquí está lo mejor de la dan. mamá. que me las arreglé para exprimir de RF en los nuevos datos es el 50% por mes durante 2 meses en una fila, pero todo sigue siendo muy inestable, traté de llenar las fotos 10 veces, pero no lo entiendo (lo consiguió)

ww

www

La conclusión es que no hay que limitarse con plantillas como el 30% anual es genial, no es genial, es un marco para la mente y la creatividad