Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1709

 
Aleksey Nikolayev:

No se puede prescindir de los experimentos. La idea principal, por lo que entiendo, es simplemente reducir de forma significativa la lista de sustancias permitidas para los experimentos. Aquí hay un enlace a un relato más sensato en ruso sobre esta investigación, con énfasis en la biología y sin los detalles del modus operandi.

Un artículo bueno y científico, sin el entusiasmo "burbujeante" sobre la omnipotencia de la IA y la proximidad de una panacea. Muestra lo "tramposa" que es la naturaleza y lo ingenuo que es uno al pensar que ya ha encontrado la clave y ahora...

El resultado de utilizar el MO para encontrar una opción adecuada a partir de las vastas "bibliotecas" de compuestos y los datos sobre sus efectos en diferentes cepas ha sido exitoso. Pero es un resultado casi aislado y no garantiza victorias similares en el futuro. ¿Por qué? - Porque el MOE utiliza un enfoque estadístico y probabilístico. Otras aplicaciones de esta búsqueda pueden no tener ningún éxito.

Me centraría en aprender los principios generales de la replicación microbiana y en crear una herramienta para el bloqueo selectivo en determinadas cepas. Esta es la diferencia entre un enfoque inteligente, y uno estadístico y probabilístico. (Es decir, una solución universal, frente a una particular).

 
Reuter Konow:

Un artículo bueno y científico, sin el entusiasmo "burbujeante" sobre la omnipotencia de la IA y la proximidad de una panacea. Muestra lo "astuta" que es la naturaleza y lo ingenuo que es el hombre al pensar que ya ha encontrado la clave y ahora...

El resultado de utilizar el MO para encontrar una opción adecuada a partir de las vastas "bibliotecas" de compuestos y los datos sobre sus efectos en diferentes cepas ha sido exitoso. Pero es un resultado casi aislado y no garantiza victorias similares en el futuro. ¿Por qué? - Porque el MOE utiliza un enfoque estadístico y probabilístico. Otras aplicaciones de esta búsqueda pueden no tener ningún éxito.

Me centraría en aprender los principios generales de la replicación microbiana y en crear una herramienta para el bloqueo selectivo en determinadas cepas. Esto es lo que distingue el enfoque inteligente, del enfoque estadístico y probabilístico. (Es decir, la solución universal, frente a la particular).

A nivel de las moléculas individuales de ADN, son inevitables los efectos cuánticos, que son intrínsecamente probabilísticos por naturaleza y que, en principio, no pueden considerarse sin un teórico y un matemático. Y en todos los niveles superiores, hasta los ensayos clínicos de medicamentos, estas ciencias son indispensables. Por tanto, métodos como los utilizados en este estudio no son en absoluto ajenos a la biología e incluso han llevado a acuñar el término in silico (similar a in vivo e in vitro).

 
Aleksey Nikolayev:

A nivel de las moléculas individuales de ADN, son inevitables los efectos cuánticos, que son intrínsecamente probabilísticos por naturaleza y que, en principio, no pueden considerarse sin un teórico y un matemático. Y en todos los niveles superiores, hasta los ensayos clínicos de medicamentos, estas ciencias son indispensables. Por tanto, métodos como los utilizados en este estudio no son en absoluto ajenos a la biología e incluso han propiciado la aparición del término in silico (análogo a in vivo e in vitro).

Sí, yo también me fijé en un artículo del Zen sobre las "fluctuaciones" cuánticas en el ADN que generan sus mutaciones. Ciertamente, la MO es una buena herramienta en muchos ámbitos de la investigación. Pero, personalmente, me he dado cuenta de que la MO no es la IA y no debe confundirse con ella. La IA buscará una solución absoluta, mientras que el modus operandi busca una solución privada. Tienen métodos de trabajo absolutamente diferentes y la MO no "crecerá" en la IA.

 
buenas noches, algún consejo para un novato...


Si compro un EA (5 copias), ¿estarán disponibles todas las actualizaciones posteriores? ¿Serán gratuitas para las 5 copias?

 
Aleksey Nikolayev:

¿Qué opina de la Idea Absoluta de Hegel?)

No me suena o no me acuerdo :) Ahora estoy más metido en el cristianismo, resolviendo puzles
 
3565832:
buenas noches, ¿pueden aconsejar a un novato-...


Si se compra un EA (5 copias), ¿estarán disponibles todas las actualizaciones posteriores? ¿Serán gratuitas para las 5 copias?

 
Maxim Dmitrievsky:
No me es familiar o no lo recuerdo :) Ahora estoy más metido en el cristianismo, resolviendo rompecabezas

Con Alexander-Toddler se crea una doctrina del Grial).

 
elibrarius:

Alexei, tú haces análisis de hojas, aparentemente puedes responder... o alguien que lo haga.

Aquí hay una descripción de las divisiones de un árbol tan profundo como 2 de kaboos


¿Qué significa "valor"? ¿Es la respuesta de la hoja? ¿Qué significan los números negativos?

Si es así, ¿qué valor tiene la clasificación multiclase? A continuación se muestran las divisiones de uno de los árboles entrenados en 3 clases.
En cada hoja vemos un array de 3 valores de valor. ¿Cuál es la respuesta? ¿El valor más alto? Entonces, ¿por qué almacenar dos valores redundantes? ¿Qué significan los valores negativos?

Curiosamente, la suma de los tres valores es 0.

Sí, en la clasificación binaria es el valor de la probabilidad de pertenecer a la clase "principal".

No he hecho la multiclasificación en CatBoost, pero creo que es la probabilidad de pertenecer a una clase concreta.

Es necesario transformar la cifra para obtener el valor real de la probabilidad: existe una función logística.

Las hojas activas en el modelo se suman - por lo que, entre otras cosas, los signos pueden ser con diferentes signos - este es un proceso de equilibrio, sólo que puede ser adelgazado después de que el modelo se construye y las hojas de basura y los árboles pueden ser descartados.

 
Aleksey Vyazmikin:

Sí, en la clasificación binaria es el valor de la probabilidad de pertenecer a una clase "principal".

No he hecho la multiclasificación en CatBoost, pero creo que es la probabilidad de pertenecer a una clase concreta.

Es necesario transformar la cifra para obtener el valor real de la probabilidad: existe una función logística.

Las hojas activas en el modelo se suman - por lo que, entre otras cosas, los signos pueden ser con diferentes signos - este es un proceso de equilibrio, sólo puede ser adelgazado después de que el modelo se construye y las hojas de basura y los árboles pueden ser descartados.

Gracias. Eso es más o menos lo que pensé.
No estoy seguro de cómo calculan este valor.
Por ejemplo, he entrenado 1 árbol con profundidad 1:

    "left": {
      "value": -0.5202020202020202,
      "weight": 384
    },
    "right": {
      "value": -0.0019267822736030828,
      "weight": 507
    },
    "split": {
      "border": 12.587499618530273,
      "float_feature_index": 0,
      "split_index": 0,
      "split_type": "FloatFeature"
    }

Cuando solicito una respuesta del árbol obtengo:

cmodel.predict(X, prediction_type='RawFormulaVal') = -0.520202020202 - este es el valor de la descripción de la hoja

cmodel.predict_proba(X)=0.372805 es la probabilidad de la clase 1
comprobado con la fórmula
x1=-0.52020202
prob=math.exp(x1)/(1+math.exp(x1))=0.3728049958676699

Calculado correctamente.

Hay 891 líneas en total en el conjunto de datos.

He contado el número de ocurrencias de la primera clase en
frontera < 12.587499618

Obtuve 384 ejemplos en total, que corresponden a pesos de la descripción de la hoja, de los cuales 89 son ejemplos de clase 1.

La probabilidad de la clase 1 debe ser
89 / 384 = 0,2317708

Pero el modelo da una probabilidad de 0,372805.

Resulta que allí se utiliza algún otro algoritmo para obtener la probabilidad.

 
elibrarius:

Resulta que allí se utiliza algún otro algoritmo de probabilidad.

Sí, los resultados son extraños. ¿No toman la probabilidad de la muestra de la prueba involucrada en la formación? Pero parece que hay un error aquí.

¿Cuántas unidades (líneas de objetivo) hay en total en la muestra?