¿Qué alimentar a la entrada de la red neuronal? Tus ideas... - página 39

 
Aleksey Vyazmikin #:
Así es como las ramas se spammed....



No me importa Eres constructivo.

 
Alexey Volchanskiy #:

Teniendo en cuenta que tengo un scalper funcionando con una frecuencia de muestreo ask/bid de 1 Hz, operar en barras mensuales me parece una aberración mental. Sin el menor ánimo de trolear.

recordando cualquier DSP: en el sandbox local, los ticks tienen una frecuencia de 3-5 Hz ... extremadamente desagradable para una muestra de 1.

 
Andrey Dik #:


... decenas de miles* de densas líneas de código....

decenas de miles de densas líneas de código...

Alexei, te responderé más tarde.
 
He estado pensando ¿Por qué la salida de una red neuronal es sólo COMPRAR y VENDER?

Bueno, digamos MANTENER. Después de todo, el mismo SoftMax puede elegir...

cualquier cosa, no hay límites para el vuelo de la fantasía. Por ejemplo, tomamos dos estrategias diferentes. Una es plana, la otra es de tendencia. Empujamos a la entrada como de costumbre - lo que empujamos antes.




En la salida, decidimos qué estrategia va a operar ahora (o supervisar sus señales). Y aquí Softmax muestra la estrategia plana: la estrategia plana comprueba la presencia de una señal, TP, SL y así sucesivamente de acuerdo con sus reglas ya formalizadas. Entonces otra vez: análisis de los datos de entrada.



El NS decide que ahora el gráfico es más adecuado para una estrategia de tendencia y le pasa el control. UPD Voy a hacer algo simple. Si hay algo interesante, lo publicaré.
 
Ivan Butko #:


He estado pensando ¿Por qué la salida de una red neuronal es sólo COMPRAR y VENDER?

Bueno, digamos MANTENER. Después de todo, el mismo SoftMax puede elegir...

cualquier cosa, no hay límites para el vuelo de la fantasía. Por ejemplo, tomamos dos estrategias diferentes. Una es plana, la otra es de tendencia. Empujamos a la entrada como de costumbre - lo que empujamos antes.




En la salida, decidimos qué estrategia va a operar ahora (o supervisar sus señales). Y aquí Softmax muestra la estrategia plana: la estrategia plana comprueba la presencia de una señal, TP, SL y así sucesivamente de acuerdo con sus reglas ya formalizadas. Y de nuevo: análisis de los datos de entrada.



El NS decide que ahora el gráfico es más adecuado para una estrategia de tendencia y le pasa el control. UPD Voy a hacer algo simple. Si hay algo interesante, lo publicaré.

Es posible distribuir las salidas en rollback (límite) y breakdown (stop), pero por regla general la red es demasiado... o bien añadir neuronas al estado cuando se obtiene el GPT, o viceversa, para simplificar las opciones de posibles acciones de la red. la primera opción fue expresada por mí hace varios años, pero fue lanzada con tomates en la rama MO, aunque las mismas personas que se oponían a aumentar el número de neuronas están ahora incluso tratando de dominar LLM en relación con los mercados.

En resumen, hay que intentar no hacer caso a nadie. puedes hacerme caso a mi (referencia a la famosa frase 😊).

 
Andrey Dik #:

Es posible distribuir las salidas en rollback (límite) y breakdown (parada), pero por regla general la red es demasiado... ya sea para añadir neuronas al estado cuando se obtiene GPT, o viceversa, para simplificar las opciones de posibles acciones de la red. la primera opción fue expresada por mí hace varios años, pero fue lanzada con tomates en la rama de MO, aunque las mismas personas que se oponían a aumentar el número de neuronas están ahora incluso tratando de dominar LLM en relación con los mercados.

En resumen, hay que intentar no hacer caso a nadie. puedes hacerme caso a mi (referencia a la famosa frase 😊).



Gracias por la idea. Límite y stop son esencialmente direcciones diferentes. En algunos una estrategia, o también de los dos: donde negocia el mejor precio, el otro en una ruptura.



A ndrey Dik #:

La primera opción fue expresada por mí hace varios años, pero fue lanzado con tomates en el hilo de MO, aunque las mismas personas que se oponían a aumentar el número de neuronas están ahora incluso tratando de dominar LLM aplicado a los mercados.


Bien hecho.

Bandera en sus manos y quizás compartan el grial con nosotros cuando el chat se lo escriba. Yo me resisto obstinadamente a dibujar el grial.

 
Aleksey Vyazmikin #:

1. Y pensé que usted hizo una referencia al hilo MO, porque algunos participantes tenían opiniones críticas sobre los algoritmos discutidos en sus artículos. Sólo decidí aclarar, según entendí, cuál es el motivo de desacuerdo en el fondo, en mi opinión. No quiero sacar el tema de las personalidades.

2. Sé lo que hay que buscar - dependencias estadísticamente estables en los segmentos cuánticos de los predictores, pero no sé todavía lo que indican los signos de esto. Al construir un modelo, es necesario tener una alta probabilidad de dar el paso correcto en una nueva iteración - eso es todo :)

3. ...

4. Sigues sin entender lo que quiero decir. Para simplificar, imagina que puedes, en un enfoque iterativo, de acuerdo con el algoritmo de optimización, comprobar forzosamente todos los resultados de las variantes entre las que necesitas hacer una elección, y tal elección acercará el modelo a un objetivo particular en todas las muestras disponibles. Y, aquí en el bolsillo es un modelo de este tipo (o coeficientes - como quieras llamarlo), que es bueno en los datos disponibles, pero no es necesariamente la mejor opción. Es decir, el algoritmo se asoma a lo que el FF será en los datos finales al elegir un paso para resolver en una iteración. Eso es lo que estoy diciendo, cuando usted no peek, accidentalmente puede obtener un buen resultado que dependía de pasos aleatorios. Estamos hablando de datos de mercado. Y el resultado puede volverse malo cuando se alimentan nuevos datos. De todos modos, mi punto es que la comprensión de si usted tiene un buen modelo por casualidad, o debido a un algoritmo no es fácil en una submuestra no representativa.

5. Así que el uso es el mismo que el del optimizador estándar con su genética y sus FF estándar. La admisibilidad se refiere aquí a la probabilidad de obtener un modelo estable (ajustes) sobre nuevos datos. Está claro lo que se buscará y se encontrará....

6. Por cierto, ¿has evaluado cómo se las arreglan los algoritmos con las características categóricas?

7. Muchos algoritmos utilizan la aleatorización para la variabilidad, ¿no has encontrado ninguno fuera del MOE? Si quieres que el resultado se repita, fija la semilla.

Es necesario comparar no sólo un modelo, sino al menos un centenar de ellos - de acuerdo con algunos criterios estadísticos descriptivos. Sólo la probabilidad de elegir la configuración correcta (modelo) se puede estimar en los nuevos datos ...

8. El descenso gradiente se utiliza como método eficiente de utilización de recursos informáticos. Hay métodos más complicados y pesados, como mencionó el conferenciante en un vídeo, pero no me acordé, sólo entendí el fundamento.

1. El desacuerdo, según me parece, es que los opositores a los algoritmos de optimización niegan su aplicabilidad en los datos de mercado, aunque no notan activamente (o fingen no notar) que los AO están presentes de una forma u otra en las mismas redes neuronales y otras herramientas de MO.

2. ¿Qué grado de robustez se requiere? ¿Un poco, o un poco más? Se requiere alcanzar la máxima estabilidad posible sobre nuevos datos, esta es la función de aptitud que hay que maximizar.

3. ...

4. El algoritmo de optimización no es el único componente del proceso de optimización (por alguna razón todo el mundo lo olvida). La propia OA puede compararse con la gasolina de un coche, a la que no le importa a dónde vaya el coche, si la gasolina es mala el coche puede no ir en absoluto, y cuanto mejor sea la gasolina, más rápido puede ir el coche (es decir, llegar antes a la meta). Ya he puesto varias veces un ejemplo para entender el papel de la OA en el proceso de optimización, he dado un esquema. Permítanme recordarles de nuevo, imaginemos que es posible hacer una búsqueda completa de parámetros (ya sea un simple TC o utilizando métodos MO) y obtener el valor de la función de aptitud de estos parámetros, entonces como podemos ver, el algoritmo de optimización no está involucrado en este ejemplo en absoluto, pero todavía hay una necesidad de elegir entre todos los parámetros de la búsqueda completa. Se puede ver que AO siempre actúa como un acelerador del resultado, él mismo no participa en la corrección de la selección del resultado (la función de aptitud es sólo un parámetro externo para AO). Sólo la función de aptitud participa en la corrección de la selección de resultados (por corrección se puede entender cualquier cosa, incluida la capacidad de operar con éxito la ST con nuevos datos). Por lo tanto, en el contexto de hablar de robustez o de la capacidad del sistema para funcionar con éxito con nuevos datos, no hay que fijarse en el AO, sino en la función de aptitud, en qué consiste y en todo lo que precede a la actuación de la función de aptitud (la actuación de la evaluación de la decisión).

5. Véanse los apartados anteriores.

6. En proceso de investigación sobre este tema. En este momento hay un artículo sobre este tema. Pensando en seguir exponiéndolo (el tema).

7. Aleatorizar el estado inicial de los parámetros del sistema no para obtener resultados aleatorios en la salida, sino para cubrir un área lo más amplia posible de posibles variantes de los parámetros. La salida no debe ser aleatoria, sino un resultado bastante definido (en términos de robustez: el máximo de la función de aptitud que se describe a sí misma y el índice de robustez). Aquí es conveniente utilizar el método de límites, la primera iteración - parámetros aleatorios, la última iteración - parámetros requeridos. Entre ellos el área de valores de la función de fitness, encontrando en la que muestra la eficiencia del algoritmo de optimización, cuanto más a la derecha del resultado aleatorio, el peor AO, respectivamente, cuanto más a la izquierda, más cerca del máximo requerido del resultado óptimo (repito, el resultado óptimo, satisfaciendo la máxima robustez posible del sistema), el más eficiente AO. Si la red neuronal muestra resultados diferentes, y con una gran dispersión, significa que el algoritmo utilizado como parte de la red neuronal está estúpidamente atascado en algún lugar del extremo local en la función de aptitud (se utilizó la función de pérdida).

8. ¿Le habrá dicho el profesor que los algoritmos que se utilizan a menudo para entrenar redes se atascan elementalmente? - Probablemente no, pero supongo que hizo hincapié en que son muy rápidos. Sí, son rápidos porque no tienen población y, por tanto, reducen el número de ejecuciones necesarias en los datos de entrenamiento, pero para eso se diseñaron: para ser rápidos, pero la convergencia se ve afectada (nada en este mundo es gratis).

Alexey, espero que ahora veas el tema planteado desde un ángulo ligeramente distinto, diferente del aceptado en la rama MO, y en general, en muchos otros lugares. Los MOSistas son muy parecidos a los creyentes que toman muchas cosas por fe (no es ni malo ni bueno, sólo que a veces impide mirar muchas cosas desde el punto de vista de la lógica), o como alquimistas fanáticos que combinan métodos MOS con la esperanza de obtener la piedra filosofal - un sistema MOS que funciona en OOS. No soy un opositor de MO, pero siempre intento desmontar las cosas para entender el impacto de cada engranaje de la máquina en el resultado.

 
Andrey Dik #:

1. El desacuerdo, tal y como yo lo veo, es que los detractores de los algoritmos de optimización niegan su aplicabilidad a los datos de mercado, aunque ignoran activamente (o fingen no darse cuenta) de que los RA están presentes de una forma u otra en las mismas redes neuronales y otras herramientas de MO.

2. ¿Qué grado de robustez se requiere? ¿Un poco, o un poco más? Se requiere alcanzar la máxima estabilidad posible con nuevos datos, ésta es la función de aptitud que hay que maximizar.

3. ...

4. El algoritmo de optimización no es el único componente del proceso de optimización (por alguna razón todo el mundo lo olvida). La propia OA puede compararse con la gasolina de un coche, a la que no le importa adónde vaya el coche, si la gasolina es mala el coche puede no ir en absoluto, y cuanto mejor sea la gasolina, más rápido puede ir el coche (es decir, llegar antes a la meta). Ya he puesto varias veces un ejemplo para entender el papel de la OA en el proceso de optimización, he dado un esquema. Permítanme recordarles de nuevo, imaginemos que es posible hacer una búsqueda completa de parámetros (ya sea un simple TC o utilizando métodos MO) y obtener el valor de la función de aptitud de estos parámetros, entonces como podemos ver, el algoritmo de optimización no está involucrado en este ejemplo en absoluto, pero todavía hay una necesidad de elegir entre todos los parámetros de la búsqueda completa. Se puede ver que AO siempre actúa como un acelerador del resultado, él mismo no participa en la corrección de la selección del resultado (la función de aptitud es sólo un parámetro externo para AO). Sólo la función de aptitud participa en la corrección de la selección del resultado (por corrección se puede entender cualquier cosa, incluida la capacidad de operar con éxito la ST con nuevos datos). Por lo tanto, al hablar de robustez o de la capacidad del sistema para funcionar con éxito con nuevos datos, no hay que fijarse en el AO, sino en la función de aptitud, en qué consiste y en todo lo que precede a la actuación de la función de aptitud (la actuación de la evaluación de la decisión).

5. Véanse los apartados anteriores.

6. En proceso de investigación sobre este tema. En este momento tengo un artículo sobre este tema en revisión. Creo que seguiré explorándolo (el tema).

7. Aleatorizar el estado inicial de los parámetros del sistema no con el fin de obtener resultados aleatorios en la salida, sino con el fin de cubrir la mayor área posible de posibles variantes de los parámetros. La salida no debe ser aleatoria, sino un resultado bastante definido (en términos de robustez - el máximo de la función de aptitud que describe en sí misma y el índice de robustez). Aquí es conveniente utilizar el método de límites, la primera iteración - parámetros aleatorios, la última iteración - parámetros requeridos. Entre ellos el área de valores de la función de fitness, encontrando en la que muestra la eficiencia del algoritmo de optimización, cuanto más a la derecha del resultado aleatorio, el peor AO, respectivamente, cuanto más a la izquierda, más cerca del máximo requerido del resultado óptimo (repito, el resultado óptimo, satisfaciendo la máxima robustez posible del sistema), el más eficiente AO. Si la red neuronal muestra resultados diferentes con una gran dispersión, significa que el algoritmo utilizado en la red neuronal está atascado en algún lugar del extremo local en la función de aptitud (se utilizó la función de pérdida).

8. ¿Es probable que el profesor te haya dicho que los algoritmos utilizados a menudo para entrenar redes se atascan de forma elemental? - Probablemente no, pero supongo que hizo hincapié en que son muy rápidos. Sí, son rápidos porque no tienen población y, por tanto, reducen el número de ejecuciones necesarias sobre los datos de entrenamiento en un factor de uno, pero para eso se diseñaron: para ser rápidos, pero la convergencia se ve afectada (nada en este mundo es gratis).

Alexey, espero que ahora veas el tema planteado desde un ángulo ligeramente distinto, diferente del aceptado en la rama MO, y en general, en muchos otros lugares. MOSists son muy similares a los creyentes que toman muchas cosas en la fe (no es ni malo ni bueno, sólo que a veces impide mirar muchas cosas desde el punto de vista de la lógica), o como alquimistas fanáticos que combinan métodos MOS con la esperanza de obtener la piedra filosofal - un trabajo sobre OOS sistema MOS. No soy un opositor de MO, pero siempre intento desmontar las cosas para entender el impacto de cada engranaje de la máquina en el resultado.

1. Más arriba, ya he escrito sobre la aplicación frontal, sobre el hecho de que los artículos se consideran no como algoritmos abstractos, sino como un reemplazo para el algoritmo del optimizador estándar, que se supone que se utiliza con FFs estándar. Y este enfoque no es muy eficaz, como mucha gente ya se ha dado cuenta. Esto sucede porque en cada artículo de cualquier autor, el lector trata de encontrar algo útil para el trading. Solo hay que tenerlo en cuenta y no ofenderse con los lectores por ello. Tal vez debería dar ejemplos de FF en el artículo que tengan en cuenta no sólo los indicadores que describen el resultado financiero, sino también otros indicadores que lo afectan, que están implícitos pero no se nombran?

2. La resiliencia en este contexto es una variable binaria que procede de medir el sesgo de la probabilidad de encontrar una de las clases en un segmento predictor cuantificado en relación con el número de todos los representantes de la clase en la muestra. Cuando se cambian las submuestras, el sesgo de la probabilidad no debería cambiar, por lo que ésa sería la estabilidad. Es como encontrar estacionariedad en procesos no estacionarios. A continuación, se construye el modelo a partir de estos datos, y cuanto más correctamente se detecten dichos segmentos cuánticos, mayor será la probabilidad de elegirlo en cada paso del algoritmo de construcción del modelo y, por tanto, mayor será la probabilidad de construir el modelo necesario. Es evidente que la sección de validación de resultados no se evalúa inicialmente. Como resultado, hay un objetivo, hay una métrica para la evaluación, pero lo que afecta al resultado no está del todo claro - necesitamos métricas de evaluación adicionales.

A continuación se muestra un gráfico que muestra la probabilidad (porcentaje) de seleccionar un segmento cuántico estable de la piscina en cada iteración del algoritmo de construcción de modelos para cada una de las dos clases.

4. Ya he escrito en el primer párrafo, y aquí sólo voy a repetir que la gente trate de entender por qué lo necesitan, y llegar a comprender la alternativa al optimizador estándar con su genética. 6. ¿Qué otros parámetros que están lejos del mercado deben establecerse en FF - no está claro para la mayoría de la gente.

7. No he escrito que el objetivo sea obtener resultados aleatorios en la salida. El objetivo es considerar diferentes maneras de encontrar una solución, incluyendo el cambio del paisaje abstracto de diferentes dimensiones.

8. Creo que no es correcto suponer que las personas entendidas en su campo no tienen los conocimientos y la experiencia necesarios. Esto se aplica tanto al conferenciante abstracto como a muchos miembros del foro. A veces, antes de probar tu posición, deberías entender la lógica de tu oponente. Estamos inmersos en una dirección en desarrollo, puede haber diferentes puntos de vista sobre la situación, que pueden cambiar, por lo que no es productivo pensar categóricamente. Y si afirmas algo refiriéndote a tu experiencia - hice tal y tal cosa, pero el resultado fue triste, creo que es porque "eso...". - entonces tal vez alguien sugiera una solución, o comparta su resultado con datos iniciales similares.

Todo lo que has escrito sobre tu trabajo hasta ahora aquí, he leído tus artículos, como creo que muchos otros que han escrito comentarios sobre ellos. Es la suposición de que la gente es subdesarrollada, que se hace evidente en sus creencias, lo que lleva a conflictos con usted. Observo que el hilo de MO es sólo un ejemplo de uno en el que se cuestiona cualquier afirmación o enfoque, buscando una razón por la que un método es ineficaz, aunque parezca eficaz. Por eso veo parcialidad en los juicios por tu parte. Muchos participantes en el hilo de MO no razonan sus afirmaciones, pero no siempre es por no tener esos argumentos. Creo que es una deformidad profesional. Sí, puede ser frustrante.

Si crees que tienes un conocimiento más profundo del tema, entiendes bien las matemáticas del proceso y quieres beneficiar a la gente, entonces presta atención a los planteamientos de los misioneros en la antigüedad, encuentra puntos en común y dialoga desde ahí. Y si no quieres hacerlo, puedes simplemente ignorar a otros representantes con sus puntos de vista y creencias. Quién necesita leer sus pensamientos inteligentes y hará las conclusiones necesarias para sí mismo.

En general, he tratado de mostrar el otro lado de la causa del conflicto, con la esperanza de que se detendrá, y sus participantes se escuchan entre sí, y comenzar a tratar adecuadamente la crítica, sin insultos mutuos.

 
Aleksey Vyazmikin #:

8.

¿No te das cuenta de que con este mensaje no estás apagando el conflicto, sino echando más leña al fuego?

Si no lo has hecho intencionadamente, entonces sugiero que todo el mundo haga como si el punto 8. del mensaje de Aleksey Vyazmikin simplemente no existiera.

 
Me gusta la interpretación de Alexei, se acerca mucho a la realidad. Pero también podemos añadir que no se debe enseñar agresivamente lo que uno mismo aún no ha comprendido del todo. Sobre todo si no tienes resultados que lo respalden. Puedes probar tu punto con referencias a artículos científicos autorizados (como se hace en el hilo de MO) o de otras formas que deberían resumir la esencia de la narrativa, sin dogma subjetivo. Como que llevo 20 años haciendo redes neuronales y ahora soy el más listo.