Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3325

 
mytarmailS #:

así

Por mi parte se trataba de un lugar en Internet, es decir, un enlace.

 
Aleksey Vyazmikin #:

Por mi parte, se trataba de un lugar en Internet, es decir, un enlace.

No recuerdo el artículo exacto,

pero no hay un millón de ellos, búscalo.

 
mytarmailS #:

No recuerdo qué artículo,

pero no hay un millón de ellos, búscalo.

Así que hice una búsqueda, y no he encontrado nada todavía.

 
Aleksey Vyazmikin #:

De eso me he dado cuenta. Sólo preguntaba si se ha determinado la causa de esto. No lo que está roto, pero ¿por qué las señales se pierden.

La razón es simple, como se pretendía - las señales faltan porque en los nuevos datos las señales están fuera de un estrecho rango aceptable.

Puede compararse con la clasificación: hay patrones claros conocidos y otros oscuros desconocidos. A medida que pasa el tiempo, cada vez hay más incógnitas y no queda nada en la clase "conocida".

 
Aleksey Vyazmikin #:

Se afirma que con este algoritmo era posible ganar primeros puestos en cagle, no creo que hubiera tareas sencillas...

¿Intentamos averiguarlo? No entiendo de fórmulas - muy a mi pesar.

A mí tampoco me van las fórmulas, sino las ideas.
Y si desglosas la idea, es muy mala para los datos de mercado.

Sugiere eliminar pares de ejemplos de clases diferentes que estén muy próximos entre sí. Si nos fijamos en el tercer ejemplo, lo ideal sería eliminar todos los ejemplos de 0,2 a 0,8 y que sólo quedaran las zonas por debajo de 0,2 y por encima de 0,8 con pureza absoluta de clases. Además, cualquier modelo las clasificaría fácilmente.
Anteriormente ya he demostrado que un ejemplo tan simple y el árbol se dividirán fácilmente, si se utilizan hojas con alta pureza de clases (y no se dividen las hojas hasta 1 ejemplo en una hoja).
Pero este es un ejemplo artificial.

En los datos de mercado no habrá bloques tan puros con predominio de una clase. Es decir, tendrás que limpiar casi todo. Por ejemplo, había 1000 puntos, 900 fueron limpiados, el resto de ellos de alguna manera llegó a la limpieza de las hojas, por ejemplo 70% - no parece malo, y se puede ganar dinero. Pero cuando usted comienza a operar realmente, entonces habrá ejemplos, que nos deshicimos de la limpieza (9 basura para 1 restante) y los indicadores de 70% caerá a 53%, por ejemplo, y usted perderá en la propagación, deslizamientos, etc

Yo prefiero un árbol y una hoja con honestidad 53% de pureza de una de las clases. Y no lo utilizará.
 
Aleksey Vyazmikin #:

Así que he hecho una búsqueda y aún no ha aparecido nada.

sucede

 
Aleksey Vyazmikin #:

No veo la conexión aquí. ¿De qué se deduce?

Leyendo el texto de tu enlace, había incluso un teorema sobre su conexión. No seas perezoso y lee al menos tus enlaces.
 
Forester #:
Tampoco utilizo fórmulas, sino ideas.
Y si desglosamos la idea, no es tan buena para los datos de mercado.

Sugiere eliminar pares de ejemplos de clases diferentes que estén muy próximos entre sí. Si nos fijamos en el tercer ejemplo, lo ideal sería eliminar todos los ejemplos de 0,2 a 0,8 y que sólo quedaran las zonas por debajo de 0,2 y por encima de 0,8 con pureza absoluta de clases. Además, cualquier modelo las clasificaría fácilmente.
Anteriormente ya he demostrado que un ejemplo tan simple y el árbol se dividirán fácilmente, si se utilizan hojas con alta pureza de clases (y no se dividen las hojas hasta 1 ejemplo en una hoja).
Pero este es un ejemplo artificial.

En los datos de mercado no habrá bloques tan puros con predominio de una clase. Es decir, tendrás que limpiar casi todo. Por ejemplo, había 1000 puntos, 900 fueron limpiados, el resto de ellos de alguna manera llegó a la limpieza de las hojas, por ejemplo, 70% - parece que no está mal, y se puede ganar dinero. Pero cuando se empieza a comerciar de verdad, entonces habrá ejemplos, de los que nos deshicimos al limpiar (9 basura por 1 restante) y los indicadores de 70% caerán a 53% por ejemplo y usted perderá en spread, deslizamientos, etc.

prefiero un árbol y una hoja con honestidad 53% de pureza de una de las clases. Y no lo usaré.

En este punto nuestros pensamientos están de acuerdo, en cuanto al resultado. Sí, espero una muestra muy adelgazada, pero según tengo entendido el proceso es iterativo, lo que significa que se puede conocer la medida y parar mucho antes y utilizar los mismos datos para construir los mismos modelos de madera, que tendrán menos divisiones y valores más fiables en las hojas.

¿Entiendo correctamente que los centros iniciales están situados aleatoriamente?

 
Aleksey Nikolayev #:
Leyendo el texto de tu enlace, había incluso una especie de teorema sobre su conexión. No te dé pereza leer al menos tus enlaces.

Por eso te he pedido que cites....

 
Andrey Dik #:

La razón es sencilla, como se pretendía: las señales desaparecen porque están fuera del estrecho margen aceptable en los nuevos datos.

Puede compararse con la clasificación: hay patrones claros conocidos y otros oscuros desconocidos. A medida que pasa el tiempo, cada vez hay más incógnitas y no queda nada en la clase "conocida".

Gracias por la aclaración.