Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2729

 
mytarmailS #:

Alexei, aprende a formular tus pensamientos si quieres que te entiendan.

¿Y dónde has perdido mi hilo de pensamiento?

Mis pensamientos están formulados - entiendo de lo que hablo, si alguien no lo entiende - que pregunte. Tal vez necesites aprender a entender mejor la esencia, sin aferrarte a los terminos....

 
Aleksey Vyazmikin #:

Vale, si te haces el listo, entonces no quieras pensar en esa dirección. No me molestaré.

O no puedes formular una idea o no quieres compartirla. En ambos casos no tiene sentido seguir desarrollando el tema y prescindamos de entrar en lo personal.

 
Aleksey Vyazmikin #:

¿Cree que el Criterio no tiene sentido? Tomamos diez muestras de diferentes tamaños y las comparamos: elegimos la que obtenga las mejores puntuaciones en varios indicadores responsables de la similitud/semejanza/homogeneidad de las muestras.

Tomamos y mezclamos las muestras, obtenemos puntuaciones diferentes... nos entristecemos

* las mezclamos entre sí. Como nadie lo prohíbe, como no se está entrenando un modelo secuencial, la secuencia de las muestras no importa. Sólo importa el error de clasificación, que siempre se puede reducir mezclando.

Para buscar algo, hay que saber muy bien lo que se busca, de lo contrario se estará jugando con las muestras hasta la estupefacción. Bueno, nadie sabe lo que se busca, si alguien lo averigua, que me avise.
 
Hay otro truco. Cuanto menos informativas sean las características, más pequeña debe ser la muestra de entrenamiento.

Cuanto más informativos sean los atributos y haya menos, mayor puede/debe ser la muestra. Y casi todo el mundo piensa lo contrario.
 
Aleksey Nikolayev #:

O no puedes formular una idea o no quieres compartirla. En ambos casos no tiene sentido seguir desarrollando el tema y prescindamos de entrar en lo personal.

¿No escribí que la idea es comparar muestras (de formación y de aplicación), que si tu teoría es correcta, la muestra dejará de ser similar a medida que aumente, y que para entender esto necesitas criterios para evaluar su cambio, que se derivan de los métodos de evaluación de la similitud?

Además, he hablado de dividir toda la muestra en secciones de acuerdo con alguna característica de tendencia comparable, y clasificarlas dentro de estos grupos. Y tal clasificación puede hacerse de nuevo mediante criterios de "similitud" de las muestras.

No me estoy poniendo personal - veo el estilo de la respuesta, y sólo estoy desconcertado - ¿qué está haciendo la gente aquí - quieren mostrar su singularidad? Me interesa encontrar formas de resolver el problema, me interesa utilizar los conocimientos de otras personas y compartir los míos.

 
Maxim Dmitrievsky #:
Tomar y mezclar muestras, obtener diferentes estimaciones... triste

* mezclarlas entre sí. Como nadie lo prohíbe, como no se está entrenando un modelo secuencial, la secuencia de las muestras no importa. Sólo importa el error de clasificación, que siempre se puede reducir mezclando.

Para buscar algo, hay que saber muy bien lo que se busca, de lo contrario se estará jugando con las muestras hasta la estupefacción. Bueno, nadie sabe lo que se busca, así que si alguien lo averigua, que me avise.

Sólo se puede mezclar dentro de una muestra, si se mezclan dos muestras, significa negar que el mercado está cambiando.

 
Maxim Dmitrievsky #:
Tomar y mezclar muestras, obtener diferentes estimaciones... triste

* mezclarlas entre sí. Como nadie lo prohíbe, como no se está entrenando un modelo secuencial, la secuencia de las muestras no importa. Sólo importa el error de clasificación, que siempre se puede reducir mezclando.

Para buscar algo, hay que saber muy bien lo que se busca, de lo contrario se estará jugando con las muestras hasta la estupefacción. Bueno, nadie sabe lo que se busca, así que si alguien lo averigua, que me avise.

No me gusta mucho lo que tenéis en común Alexey y tú en vuestros razonamientos: los tenéis en el contexto de un modelo concreto y estudiando su comportamiento cuando cambia la muestra de entrenamiento. Idealmente, me gustaría ser independiente de un modelo concreto a la hora de seleccionar la muestra de entrenamiento - por eso me he decidido a usar vértices en zigzag por ahora. Pero es probable que ambos tengáis razón y que la independencia total del tipo de CT sea difícilmente posible.

 
Aleksey Vyazmikin #:

¿No escribí que la idea al comparar muestras (formación y aplicación) es que si tu teoría es correcta, la muestra dejará de ser similar a medida que aumente, y para darte cuenta de ello necesitas criterios para evaluar su cambio, que se derivan de los métodos para evaluar la similitud?

Aquí aparentemente estás hablando de muestras multivariantes (cada elemento es una fila de una tabla, un vector), mientras que los criterios de homogeneidad de tus tres enlaces se refieren a muestras numéricas. Los criterios de homogeneidad multivariante en matstat son un tema aparte y no me queda muy claro.

Aleksey Vyazmikin #:

Además, yo estaba hablando de la partición de toda la muestra en secciones de acuerdo con alguna característica de tendencia comparables, y la clasificación dentro de estos grupos. Y esa clasificación puede hacerse de nuevo según el criterio de "similitud" de las muestras.

Es similar a la tarea de buscar la detección de muchos puntos de cambio. De nuevo resulta que tenemos que trabajar con un caso multidimensional (vectorial), lo que complica mucho el asunto.

Bueno, y en general, no me gusta la dependencia de qué atributos se eligen para el estudio. Si tomamos diferentes conjuntos de ellos, los resultados pueden diferir.

 
Aleksey Nikolayev #:

Aquí aparentemente estás hablando de muestras multivariantes (cada elemento es una fila de una tabla, un vector), mientras que los criterios de homogeneidad de tus tres enlaces son sobre muestras numéricas. Los criterios de homogeneidad multivariante en matstat son un tema aparte y no me queda muy claro.

Cada predictor por separado es una muestra numérica, así que ¿por qué no evaluarlos por separado y promediar los resultados? Si hay dinámicas de deterioro en la mayoría de los predictores, la muestra es redundante.

Aleksey Nikolayev

Parece que la tarea de búsqueda de detección de muchos puntos de cambio. De nuevo, resulta que tenemos que trabajar con un caso multivariante (vectorial), lo que complica mucho las cosas.

Bueno, y en general, no me gusta la dependencia de los atributos que se eligen para el estudio. Si tomamos diferentes conjuntos de ellos, los resultados pueden diferir.

Quizá deberíamos encontrar las variantes que den los mejores resultados en cuanto a la identificación de la pertenencia de segmentos a un grupo concreto y la eficacia del entrenamiento sobre una población agrupada.

 
Aleksey Vyazmikin #:

Sólo puedes mezclar dentro de una muestra, si mezclas dos muestras, estás negando que el mercado esté cambiando.

¿No ves la lógica otra vez?
No tiene sentido comparar series para determinar la longitud óptima de la muestra de formación, porque el mercado está cambiando

Puedes mezclarlas en cualquier momento, no cambiará nada.