Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2758

 
СанСаныч Фоменко #:

1. El remuestreo de valores atípicos no se elimina. Hay programas, pero podemos hacerlo a la manera kolkhoz: cambiamos todo lo que sea superior a +/- 0,005 del cuantil correspondiente a este valor. La estadística cambia sorprendentemente.

2. Extremadamente interesante, especialmente sobre la entropía. Me encantaría ver el resultado . La correlación es para series estacionarias, puedes olvidarte de ella.

El remuestreo a través de todo con gaussianos dentro lo elimina
 
elibrarius #:

¿Qué es la ventana no comprometida? ¿Diferente número de características/columnas en cada fila? Pero siempre debe introducir el mismo número de columnas en el modelo.

Escribí por encima en algún lugar hace un tiempo, si los modders no lo han limpiado.
 
Maxim Dmitrievsky #:
Y lo anterior fue escrito en algún lugar recientemente, si los mods no lo han limpiado

Buscar en "ventana sin arreglar" sólo da esta página

 
Maxim Dmitrievsky #:
Remuestreo a través de cualquier cosa con gaussianos en su interior - lo elimina

Curioso, pero muy inteligente.

 
elibrarius #:

Una búsqueda sobre "ventana no fija" sólo da esta página

Se pensaba en algún sitio sobre fractales y esas cosas, que el último precio no siempre tiene el mejor poder predictivo. Es decir, que a veces es necesario parar la ventana por condiciones o a través de otra ns para fijarla, de forma que las barras anteriores participen en la predicción, no las últimas. Y así debe correr hacia adelante y hacia atrás a través de la historia.
 
СанСаныч Фоменко #:

Curioso, pero muy complicado.

Prueba con mezclas gaussianas, tengo un artículo sobre ello. Es un modelo generativo. Funciona mejor en incrementos que el autoencoder.
 
Maxim Dmitrievsky #:
El remuestreo se realiza para eliminar los valores atípicos y gaussianizar la muestra.

En general sugería un muestreo significativo por entropía o correlación. Para hacer las fichas más informativas. Además de tomar los incrementos y añadirles la máxima información de la serie original mediante todo tipo de transformaciones. Más una ventana de tartamudeo no fija. Es un enfoque frosh y nadie ha hecho esto. Pero tengo una mierda de coronavirus y estoy descansando ☺️.

Casual infernnce se suponía que iba a ayudar a elegir fiches informativos como una opción, pero resultó que no se trataba de que allí

Completamente confuso.

Sé exactamente que necesito diferentes ventanas en diferentes partes de la serie temporal. Pero el problema es viejo: si eliges una ventana en un segmento, no es necesariamente la misma ventana en el segmento siguiente, alguna variante de la no estacionariedad de la anchura de la ventana.

 
СанСаныч Фоменко #:

No está nada claro.

Sé con certeza que es necesario tener una ventana diferente en diferentes partes de la serie temporal. Pero el problema es viejo: si coges una ventana en alguna sección, entonces no necesariamente esta ventana estará en la siguiente sección, alguna variante de no estacionariedad del ancho de la ventana.

Mi cabeza es de madera, haré un ejemplo más tarde
Por ejemplo, había un conjunto de fichas que predecían un largo declive. Entonces no tiene sentido mover la ventana con cada barra, sino presentar las mismas características en una nueva barra. Y así sucesivamente hasta un cierto punto, cuando se moverá de nuevo. Estos puntos también deben poblarse.
 
Maxim Dmitrievsky #:
En algún sitio se pensaba sobre fractales y otras cosas, que el último precio no siempre tiene el mejor poder predictivo. Es decir, a veces es necesario parar la ventana por condiciones o a través de otra ns para fijarla de manera que las barras anteriores participen en la predicción, no las últimas. Y así tiene que ir y venir por la historia.

Es más una ventana no fija en el tiempo. Y como alimentamos 10 columnas, entonces seremos 10.
Traté de alimentar a una docena de columnas ZZ (obtuvo 50%50 como de costumbre). El tiempo de su formación es siempre diferente y la última rodilla se formó de 1 a varios bares atrás. Se podría decir que es una conversión de barras regulares a su propia. En mi caso la rodilla en zigzag formaba una barra. Hace un año se recordó aquí a Prado, sugirió reconstruir las barras no por tiempo, sino por volumen negociado por ejemplo por 100 lotes.


Ejemplos de precios brutos, tiempo, "volumen" y "dólar" velas

 
Maxim Dmitrievsky #:
Mi cabeza es de madera, haré un ejemplo más tarde
Por ejemplo, había un conjunto de características que predijo un largo declive. Entonces no tiene sentido mover la ventana con cada barra, sino presentar las mismas señales en una nueva barra. Y así sucesivamente hasta un cierto punto, cuando se moverá de nuevo. Estos puntos también deben poblarse.

Sobrevaloras la importancia de los resultados "fuera de muestra".

No te puedes fiar ni un céntimo.


"Fuera de muestra" podría tener algo que ofrecer para identificar el sobreentrenamiento del modelo si hay una diferencia demasiado grande (más del 20% probablemente) entre la muestra de entrenamiento y la muestra fuera de muestra. Hasta ahora, la única prueba que conozco es una pequeña variación, no superior al 20%, en la sd de la capacidad predictiva del predictor.