Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2787

 
JeeyCi #:

y el objetivo es siempre el mismo - la lógica y la adecuación en lugar de una búsqueda estúpida por un algoritmo codicioso de toda la basura y rugiendo acerca de la falta de poder para este negocio....

sí, las estimaciones deben ser válidas - usted lo llama "el error no debe cambiar", la predicción en sí va a cambiar en series de tiempo (en la dinámica) ...

no puedes ir más allá de tus comentarios publicitarios sobre herramientas -- sin saber como funcionan estas herramientas... te han dado un mazo en las manos - loestas agitando(eres Chapayev???? ) con referencia a tu umbral de IV=0.02 - ESO ES UNA CONEXION BAJA(!) - entonces por que estas agitando tus slogans aqui... y llamando mashka a las propuestas de analisis adecuados (donde nunca existieron en el pasado)... abre tu propio hilo publicitario

y MO si - funciona igual en todas partes y para el MISMO PROPOSITO - y en Py y otras librerias no es IV en absoluto -- pero la esencia no cambia -- tu, aparentemente, no entendiendo la esencia del analisis de datos - solo puedes gritar eslóganes sobre candidatos y herramientas y estúpidamente cargar basura en tu "caja negra" -- y ni siquiera te molestaste en usar tus predicciones para el proposito previsto....

bueno, abre una sucursal para tus campañas publicitarias y grita allí -- si no puedes hacer nada más que análisis de cháchara (ni siquiera conclusiones normales) -- pareces un puto coleccionista intentando conseguir ideas de otros para tu chatarra (excepto por la palabra "herramienta" - ni siquiera has entendido cómo funciona) -- ¿qué tenía de malo LogisticRegression?

=== ¡no tienes que responder! (tu Valor Informativo personal = 0 para mi)... tus interpretaciones del álgebra lineal son aún más bajas en IV

El texto anterior tenía sentido, pero reflejaba un malentendido de lo que se está haciendo aquí.

Te contesté NO a ti, sino a otros lectores que se olvidan constantemente del objetivo y de los criterios para conseguirlo, aunque aquí hay mucha gente que lo entiende con bastante profesionalidad y tiene las herramientas adecuadas.

Y este texto no tiene sentido, una especie de ofensa de niña pequeña. No veo el sentido de contestar.

 
JeeyCi #:

y el objetivo es siempre el mismo - la lógica y la adecuación en lugar de una búsqueda estúpida por un algoritmo codicioso de toda la basura y rugiendo acerca de la falta de poder para este negocio....

Supongamos que no sucedió)))))

Lógica y adecuación de las estimaciones y la comprensión de los procesos es sin duda mejor que su ausencia. Pero en estadística y teorización a menudo no hay explicaciones de por qué funciona tal o cual metodología. Una persona lanzó una aguja, midió algo allí y calculó el número de Pi, otra miró la historia de las inundaciones en el Nilo y encontró algo que medir que podría predecir la siguiente. La lógica en sus acciones es mínima.

De la misma manera en las filas, creo, hay que encontrar los signos adecuados, qué medir en general))))

 
los piquetes han vuelto a salir ... la concentración no está aquí y las conjeturas no están aquí. y no han aprendido a citar, atribuyendo sus especulaciones a otros.
 
Valeriy Yastremskiy #:

Lalógica y la adecuación de las estimaciones y la comprensión de los procesos son sin duda mejores que su ausencia. Pero en estadística y teorización no suele haber explicaciones de por qué funciona tal o cual metodología. Una persona tiró una aguja, midió algo allí y calculó el número de Pi, otra miró la historia de las inundaciones del Nilo y encontró algo que medir para predecir la siguiente. La lógica de sus acciones es mínima.

De la misma manera en las filas, creo, hay que encontrar los signos adecuados, qué medir en general))))

Es difícil no estar de acuerdo con esto.


Pero hay que darse cuenta de que sin entender el PROPÓSITO de toda la investigación uno se desliza muy rápidamente a la enseñanza, a la presentación del libro de texto correspondiente sin ninguna perspectiva de obtener el producto final.

 

sobre las agujas y las inundaciones... fue sólo una coincidencia:

generamos 100500*10^3 caminatas aleatorias 1D; si tomamos una sola trayectoria de todo el haz de caminatas aleatorias y la escudriñamos, no sigue realmente las conclusiones de la integral general. En algunos puntos las contradice.

Y aquí trabajamos/comerciamos/ocio siempre con una sola muestra. No tenemos ninguna otra

 

СанСаныч Фоменко #:
  ...

eso es lo que hacen los que han escrito un "articulo" y no pueden defenderse... como demuestran sus primeras afirmaciones contra el instituto de investigación.

... todo el mundo es gilipollas...

 
СанСаныч Фоменко #:

Es difícil no estar de acuerdo.


Pero hay que darse cuenta de que sin comprender el PROPÓSITO de todo el estudio, uno se desliza muy rápidamente hacia la enseñanza, hacia la presentación del libro de texto pertinente sin ninguna perspectiva de obtener un producto final.

La meta sin comprender el camino hacia ella es un sueño))))))

En general, la investigación de mercados sin herramientas globales de evaluación y análisis se asemeja a pensar en el cosmos o en la materia más simple, y son posibles teorías correctas, que pueden confirmarse con herramientas truncadas.))))))

Estoy más cerca de la búsqueda de ahora, qué y cómo medir en una serie de cosas nuevas que aún no se han notado.))))) Eso evaluaría más correctamente el estado. El paradigma de la predicción está más o menos cerca, pero aun así la tarea es diferente.

La lógica debería ser la siguiente. Medimos algo y esta es la definición del estado. Medimos diferentes parámetros para diferentes estados. Y simplemente declaramos el cambio de estado. Por supuesto, debe haber una biblioteca / conjunto de estados. Medimos en todas las escalas y ticks. Espero que la lógica de las mediciones en diferentes escalas será el mismo, y las escalas de garrapatas no difieren mucho de las escalas de velas. Así es)))))

 
Se obtienen muchas incoherencias, incluida la eliminación de valores atípicos. Suelen representar el 10% del tamaño del conjunto de datos, según distintos cálculos. ¿Los han eliminado y qué, y cómo negociará el modelo cuando se detecte el valor atípico? )
Con las transformaciones la situación es más o menos la misma.
Si se hace un preprocesamiento clásico, los resultados son peores que con los datos brutos.
O se pretende que las mejoras aleatorias de las métricas son sistémicas.
 
Maxim Dmitrievsky #:
Se obtienen muchas incoherencias, incluida la eliminación de valores atípicos. Suelen representar el 10% del tamaño del conjunto de datos, según distintos cálculos. ¿Suprimido y qué, y cómo va a negociar el modelo cuando se detecta el valor atípico? )
Lo mismo ocurre con las transformaciones.
Si se hace un preprocesamiento clásico, los resultados empeoran con respecto a los datos brutos.
O se hacen pasar por sistémicas mejoras aleatorias de las métricas.

No se puede hacer nada así como así, después de leer libros de texto y artículos - esto es una etapa aparte y se llama aprendizaje. Sin conocimientos sistemáticos de estadística no hay nada que hacer en MOE.

Siempre es necesario hacer, intentando alcanzar el objetivo.

Si tomamos un objetivo intermedio - máxima capacidad predictiva del predictor, entonces:

1. Es obligatorio eliminar los valores atípicos. Si los valores superiores al 0,5% del cuantil se consideran valores atípicos, entonces los valores atípicos son inferiores al 1%. Por cierto, este es el porcentaje de paradas activadas en el futuro. Desarrollamos el propio sistema de trading, tenemos limitaciones digitales.

2. El preprocesamiento es obligatorio, pero de nuevo depende de qué tipo. Si estamos hablando de la capacidad de predicción del predictor, entonces no se puede corregir pendientes que aumentan la capacidad de predicción. Este es un ejemplo. En general, tomamos algún algoritmo de preprocesamiento y evaluamos su efecto sobre la capacidad predictiva. La respuesta aquí es.

3. Tenga siempre presente el significado de MO, que en mi opinión es buscar algunos patrones. Más obviamente en RF. ¿Qué número de patrones contiene, por ejemplo, 5000 barras? ¿O a partir de qué valor de ventana el aumento del número de patrones no reduce el error? ¿O, para una ventana fija, a partir de qué valor del número de patrones deja de disminuir el error?

Respuestas para RF.

1. No tiene sentido aumentar la ventana por encima de 1500 compases.

2. La relación entre el error y el número de patrones (árboles) puede verse claramente en el gráfico:

Mínimo 50. Generalmente de 100 a 200. El gráfico no cambia al aumentar la ventana hasta 5000.

Siempre hay que formular claramente el objetivo y el criterio para alcanzarlo. Todo lo demás es bla bla.

 
СанСаныч Фоменко #:

No se puede hacer nada así como así, después de leer libros de texto y artículos: es una etapa aparte y se llama estudio. Sin conocimientos sistemáticos de estadística no hay nada que hacer en el ME.

Siempre hay que hacer, intentando alcanzar el objetivo.

Si tomamos un objetivo intermedio - máxima capacidad predictiva del predictor, entonces:

1. Es obligatorio eliminar los valores atípicos. Si los valores superiores al 0,5% del cuantil se consideran valores atípicos, entonces los valores atípicos son inferiores al 1%. Por cierto, este es el porcentaje de paradas activadas en el futuro. Estamos desarrollando el propio sistema de comercio, tenemos restricciones digitales.

2. El preprocesamiento es obligatorio, pero de nuevo depende de qué tipo. Si estamos hablando de la capacidad de predicción del predictor, entonces usted no puede corregir las pendientes, lo que aumenta la capacidad de predicción. Este es un ejemplo. En general, tomamos algún algoritmo de preprocesamiento y evaluamos su influencia en la capacidad predictiva. Aquí está la respuesta.

3. Tenga siempre presente el significado de MO, que en mi opinión es buscar algunos patrones. Más obviamente en RF. ¿Qué número de patrones contiene, por ejemplo, 5000 barras? ¿O a partir de qué valor de ventana el aumento del número de patrones no reduce el error? O para una ventana fija, ¿a partir de qué valor del número de patrones dejará de disminuir el error?

Respuestas para RF.

1. no tiene sentido aumentar la ventana por encima de 1500 bar.

2. la relación entre el error y el número de patrones (árboles) puede verse claramente en el gráfico:

Mínimo 50. Generalmente de 100 a 200. El gráfico no cambia cuando se aumenta la ventana hasta 5000.

Siempre es necesario formular claramente el objetivo y el criterio para alcanzarlo. Todo lo demás es bla bla.

Detecté emisiones a través del bosque de aislamiento, las borré, el resultado del entrenamiento no cambió. Intenté entrenar sobre las emisiones - ningún cambio. Tengo la impresión de que al modelo (catbust) no le importan las emisiones. Como si fueran bien reconocidas a través de la búsqueda de anomalías, pero su eliminación no es necesaria.