¿Qué alimentar a la entrada de la red neuronal? Tus ideas... - página 63

 
Forester #:

Si consideramos el caso de datos con patrones. Las tablas de multiplicar, por ejemplo. Cuantos más ejemplos se den, más precisas serán las respuestas sobre los nuevos datos.
Los nuevos datos no deben ser completamente diferentes, sino estar entre los ejemplos de entrenamiento. Es decir, la interpolación irá más o menos bien. 1 árbol dará el ejemplo de entrenamiento más cercano. Si por otros datos se entiende datos fuera de los límites de los datos de entrenamiento, esto ya es extrapolación. El árbol dará el ejemplo más externo, porque es el más cercano.


Si consideramos datos de mercado, entonces con un gran valor de ruido, cualquier pico del patrón verdadero se mezclará con picos de ruido y necesitamos elegir de alguna manera el pico verdadero y no el pico de ruido. Sus afirmaciones son correctas aquí.


I van Butko #:







Otra vez el ruido. Todo el mundo habla del ruido. Pero, ¿cómo podemos definir el ruido si no conocemos las reglas y las leyes? ¿Y si cada tick es un componente de reglas y leyes y el problema es la incapacidad de las arquitecturas para descifrar el "código" de un gráfico?

Parece un postulado (la idea del ruido en un gráfico de precios)

Sobre el ruido y los patrones

No se sabe cuál es la presencia y la cantidad de ruido en los datos del mercado, ni si existen patrones y en qué medida.

Sobre el aprendizaje, la memorización y la retención

Preservación- Si los datos se escriben simplemente en variables sin evaluar su calidad, se puede hablar de preservación. Un ejemplo es la escritura normal de datos en variables (base de datos, tabla, matriz, etc.).

Memorización: si la evaluación de la calidad se realiza durante el proceso de grabación, ya se trata de memorización. Por ejemplo, la estimación del porcentaje de respuestas correctas sobre el número de preguntas que hay que memorizar. En este caso, cuantos más ejemplos, mayor será el ámbito de posibles aplicaciones. Por ejemplo, para una tarea de 2 x 8 la respuesta sería 16, pero para 18 x 67 la respuesta podría ser cualquiera, ya que esta pregunta no estaba incluida en los ejemplos.

Aprendizaje: el aprendizaje a partir de datos almacenados y memorizados es posible con la evaluación de la calidad. El entrenamiento es el proceso de formación de reglas para procesar los datos memorizados. Por ejemplo, practicar la aplicación de la regla de multiplicación por columna. Aquí sólo hay que recordar la información mínima necesaria (tabla de multiplicar), y utilizando la regla de la columna se puede multiplicar cualquier combinación de números, incluido 18 x 67 e incluso 1,657875 x 3,876754.

Un ejemplo de aprendizaje serían los modelos tipo GPT, que no sólo memorizan datos, sino que también aplican reglas para procesar distintos datos realizando cálculos como la multiplicación por columnas.

Ahora, una vez tratados los conceptos de aprendizaje, memorización y retención, podemos preguntarnos: ¿en qué parte del aprendizaje automático (que no implique modelos tipo GPT) se aplica el aprendizaje para analizar los datos del mercado?

P.D. Esto es lo básico, más adelante abordaremos la importancia de la valoración y otros aspectos interesantes.

P.P.S. El sobreaprendizaje , el infraaprendizaje y estados similares no pueden evaluarse ni cuantitativa ni cualitativamente, por lo que no tiene mucho sentido hablar de ellos de forma significativa y con sentido.

 
Andrey Dik #:

Memorización: si la evaluación de la calidad se realiza durante el proceso de conservación, ya es memorización.

Las bases de datos, los árboles y los clusters que memorizan la información al 100% no necesitan evaluación. Pero puedes comprobar a qué equivalen 3*3 probando todas las variantes posibles. Depende de ti y de tu tiempo... Yo haré cosas más importantes.

P.P.D. El sobreentrenamiento , el infraentrenamiento y estados similares no pueden evaluarse ni cuantitativa ni cualitativamente, por lo que prácticamente no tiene sentido hablar de ellos de forma significativa y con sentido.

Sólo es necesario evaluar los modelos infraentrenados.

 
Forester #:

1. bases de datos, árboles y clusters que recuerdan información al 100% no necesitan ser evaluados.

2. Sólo es necesario evaluar los modelos poco entrenados.

1. Si no hay evaluación, se trata de un proceso de retención, no de memorización. Arriba se muestra la diferencia.

2. ¿Cómo determinar qué modelo está "infraaprendido" y en qué medida?

 
Probablemente se salga del tema, pero mi experiencia me dice que sólo los osciladores (probabilidades, winrates, etc.) pueden predecirse cualitativamente. Los que sueñan con predecir los movimientos de los precios, mi opinión personal es que todavía no es posible (¡o tal vez ni siquiera sea posible!).
 
Sergey Pavlov #:
Probablemente se salga del tema, pero mi experiencia me dice que sólo los osciladores (probabilidades, winrates, etc.) pueden predecirse cualitativamente. Aquellos que sueñan con predecir los movimientos de los precios, mi opinión personal es que ¡todavía no es posible (o quizás ni siquiera sea posible)!

¿qué significa winrate?

 
Andrey Dik #:

1. Si no hay evaluación, se trata de un proceso de retención, no de memorización. Más arriba he mostrado la diferencia.

2. ¿Cómo determinar qué modelo está "infraaprendido" y en qué medida?

1) Sólo para ti la memorización consiste en recorrer las posibles variantes y evaluar cada una de ellas. No hace falta que impongas esto a los demás y lo hagas pasar por verdad.

2) No hace falta definirlo, antes del entrenamiento se fija en los parámetros - entrenar al 100% o subentrenar.

 
Forester #:

1) sólo para ti la memorización consiste en repasar las opciones posibles. No lo impongas a los demás y lo hagas pasar por verdad.

2) No hace falta definirlo, antes de entrenar se establece en los parámetros - entrenar al 100% o subentrenar.

1. ¿Qué tiene que ver la memorización y el "repaso de las opciones posibles"? No hace falta que te inventes algo que yo no he afirmado y que, por tanto, no podría imponer a nadie)).

2. En la forma en que aplicas MO, y mucha gente en general, el aprendizaje sólo está presente condicionalmente. Porque no hay formación de reglas para procesar nuevos datos desconocidos. Hay memorización. Lo he demostrado más arriba.


Me doy cuenta de que algunas cosas pueden ser dolorosas de aceptar porque echan por tierra creencias establecidas. Pero si se aceptan, queda claro por qué algunos métodos no dan los resultados esperados y, por lo tanto, permiten cambiar la dirección de la investigación.

 
Andrey Dik #:

1. ¿Qué tiene que ver la memorización y el "repaso de las opciones"? No hace falta que te inventes algo que yo no he afirmado y que, por tanto, no podría imponer a nadie).

2. En la forma en que aplicas MO, y mucha gente en general, el aprendizaje sólo está presente condicionalmente. Porque no hay formación de reglas para procesar nuevos datos desconocidos. Hay memorización. Lo he demostrado más arriba.


Me doy cuenta de que algunas cosas pueden ser dolorosas de aceptar, porque arruinan las creencias establecidas. Pero si se aceptan, queda claro por qué algunos métodos no dan los resultados esperados y, por lo tanto, permiten cambiar la dirección de la investigación.


¿Cuál es la diferencia entre una base de datos ordinaria y un sistema inteligente?

 
Ivan Butko #:


¿Cuál es la diferencia entre una base de datos ordinaria y los sistemas inteligentes?


Por ejemplo, el mismo gpt no sólo recuerda la tabla de multiplicar, sino que está entrenado para utilizar la regla de la columna. Eso significa que puede multiplicar cualquier número, no sólo dentro de la tabla de multiplicar.

Esta es la diferencia entre una base de datos ordinaria y los sistemas inteligentes. Estos sistemas pueden aplicar reglas conocidas para procesar nueva información como lo hace un ser humano. Un nivel aún más alto de inteligencia es la capacidad de desarrollar nuevas reglas utilizando las antiguas como base.

El "entrenamiento" convencional de una red neuronal no crea reglas y, por tanto, no funciona bien con datos desconocidos. Es simplemente una aproximación de los datos y esperamos que esta aproximación funcione igual de bien con datos nuevos que con datos de entrenamiento.