L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1709

 
Aleksey Nikolayev:

Vous ne pouvez pas vous passer des expériences. L'idée principale, pour autant que je la comprenne, est simplement de réduire considérablement la liste des substances autorisées pour les expériences. Voici un lien vers un compte rendu plus sensé de ces recherches en russe, mettant l'accent sur la biologie et sans les détails du mode opératoire.

Un bon article, scientifique, sans l'enthousiasme "bouillonnant" sur la toute-puissance de l'IA et la proximité d'une panacée. Montre à quel point la nature est "délicate" et combien on est naïf de penser avoir déjà trouvé la clé et maintenant...

L'utilisation de la MO pour trouver une option appropriée parmi les vastes "bibliothèques" de composés et de données sur leurs effets sur différentes souches a donné de bons résultats. Mais il s'agit d'un résultat presque isolé qui ne garantit pas des victoires similaires à l'avenir. Pourquoi ? - Parce que le MEO utilise une approche statistique et probabiliste. D'autres applications de cette recherche peuvent ne pas aboutir du tout.

Je me concentrerais sur l'apprentissage des principes généraux de la réplication microbienne et sur la création d'un outil permettant le blocage sélectif de certaines souches. C'est la différence entre une approche intelligente et une approche statistique et probabiliste (c'est-à-dire une solution unique par rapport à une solution privée).

 
Reuter Konow:

Un bon article, scientifique, sans l'enthousiasme "bouillonnant" sur la toute-puissance de l'IA et la proximité d'une panacée. Il montre à quel point la nature est "rusée" et à quel point l'homme est naïf en pensant qu'il a déjà trouvé la clé et maintenant...

L'utilisation de la MO pour trouver une option appropriée à partir de vastes "bibliothèques" de composés et de données sur leurs effets sur différentes souches a donné de bons résultats. Mais il s'agit d'un résultat presque isolé qui ne garantit pas des victoires similaires à l'avenir. Pourquoi ? - Parce que le MEO utilise une approche statistique et probabiliste. D'autres applications de cette recherche peuvent ne pas aboutir du tout.

Je me concentrerais sur l'apprentissage des principes généraux de la réplication microbienne et sur la création d'un outil permettant le blocage sélectif de certaines souches. C'est ce qui distingue l'approche intelligente de l'approche statistique et probabiliste (c'est-à-dire la solution universelle par rapport à la solution particulière).

Au niveau des simples molécules d'ADN, des effets quantiques sont inévitables, qui sont par nature probabilistes et ne peuvent en principe être envisagés sans un théoricien et un mathématicien. Et à tous les niveaux supérieurs, jusqu'aux essais cliniques des médicaments, ces sciences sont indispensables. Par conséquent, les méthodes telles que celles utilisées dans cette étude ne sont en rien étrangères à la biologie et ont même conduit à l'invention du terme in silico (similaire à in vivo et in vitro).

 
Aleksey Nikolayev:

Au niveau des simples molécules d'ADN, des effets quantiques sont inévitables, qui sont par nature probabilistes et ne peuvent en principe être envisagés sans un théoricien et un mathématicien. Et à tous les niveaux supérieurs, jusqu'aux essais cliniques des médicaments, ces sciences sont indispensables. Par conséquent, des méthodes telles que celles utilisées dans cette étude ne sont en rien étrangères à la biologie et ont même conduit à l'émergence du terme in silico (analogue à in vivo et in vitro).

Oui, j'ai aussi remarqué un article sur le Zen concernant les "fluctuations" quantiques de l'ADN qui génèrent ses mutations. Il est certain que la MO est un bon outil dans de nombreux domaines de recherche. Mais, personnellement, je me suis rendu compte que le MO n'est pas l'IA et qu'il ne faut pas le confondre avec elle. L'IA cherchera une solution absolue, tandis que le MO cherche une solution privée. Ils ont des méthodes de travail absolument différentes et le MO ne va pas "grandir" dans l'IA.

 
Bonsoir, un conseil pour un débutant...


Si j'achète un EA (5 copies), toutes les mises à jour ultérieures seront-elles disponibles ? Seront-elles gratuites pour les 5 copies ?

 
Aleksey Nikolayev:

Que pensez-vous de l'Idée Absolue de Hegel ?)

Je ne connais pas ou je ne me souviens pas :) Je suis plus dans le christianisme maintenant, je résous des puzzles.
 
3565832:
Bonsoir, pouvez-vous conseiller un débutant...


Si vous achetez un EA (5 copies), toutes les mises à jour ultérieures seront-elles disponibles ? Seront-elles gratuites pour les 5 copies ?

Oui
 
Maxim Dmitrievsky:
Pas familier ou ne me souviens pas :) Je suis plus dans le christianisme maintenant, résoudre des énigmes.

Avec Alexander-Toddler, vous créez une doctrine du Graal).

 
elibrarius:

Alexei, tu fais des analyses de feuilles, apparemment tu peux répondre... ou quelqu'un qui le fait.

Voici une description des fentes d'un arbre aussi profond que 2 de kaboos


Que signifie le terme "valeur" ? Est-ce la réponse de la feuille ? Que signifient les nombres négatifs ?

Si oui, quelle est la valeur de la classification multi-classes ? Ci-dessous, les divisions d'un des arbres formés sur 3 classes.
A chaque feuille, nous voyons un tableau de 3 valeurs de valeur. Quelle est la réponse ? La valeur la plus élevée ? Alors pourquoi stocker deux valeurs redondantes ? Que signifient les valeurs négatives ?

Il est intéressant de noter que la somme des trois valeurs est égale à 0.

Oui, dans une classification binaire, c'est la valeur de la probabilité d'appartenir à la classe "principale".

Je n'ai pas fait de multi-classification dans CatBoost, mais je pense que c'est la probabilité d'appartenir à une classe particulière.

Le chiffre doit être transformé pour obtenir la valeur réelle de la probabilité - il existe une fonction logistique.

Les feuilles activées dans le modèle sont additionnées - ainsi, entre autres, les signes peuvent être avec des signes différents - c'est un processus d'équilibrage, juste il peut être éclairci après que le modèle soit construit et les feuilles et les arbres inutiles peuvent être jetés.

 
Aleksey Vyazmikin:

Oui, en classification binaire, c'est la valeur de la probabilité d'appartenir à une classe "principale".

Je n'ai pas fait de multiclassification dans CatBoost, mais je pense que c'est la probabilité d'appartenir à une classe particulière.

Le chiffre doit être transformé pour obtenir la valeur réelle de la probabilité - il existe une fonction logistique.

Les feuilles activées dans le modèle sont additionnées - ainsi, entre autres, les signes peuvent être avec des signes différents - c'est un processus d'équilibrage, juste il peut être éclairci après que le modèle soit construit et les feuilles et les arbres inutiles peuvent être jetés.

Merci. C'est à peu près ce que je pensais.
Je ne sais pas exactement comment ils calculent cette valeur.
Par exemple, j'ai formé un arbre avec une profondeur de 1 :

    "left": {
      "value": -0.5202020202020202,
      "weight": 384
    },
    "right": {
      "value": -0.0019267822736030828,
      "weight": 507
    },
    "split": {
      "border": 12.587499618530273,
      "float_feature_index": 0,
      "split_index": 0,
      "split_type": "FloatFeature"
    }

Lorsque je demande une réponse de l'arbre, j'obtiens :

cmodel.predict(X, prediction_type='RawFormulaVal') = -0.520202020202 - c'est la valeur de la description de la fiche

cmodel.predict_proba(X)=0.372805 est la probabilité de la classe 1
vérifié à l'aide de la formule
x1=-0.52020202
prob=math.exp(x1)/(1+math.exp(x1))=0.3728049958676699

Calculé correctement.

Il y a 891 lignes au total dans l'ensemble de données.

J'ai compté le nombre d'occurrences de la 1ère classe à
bordure < 12.587499618

J'ai obtenu 384 exemples au total, ce qui correspond aux pesées de la description de la feuille, dont 89 sont des exemples de classe 1.

La probabilité de la classe 1 doit être
89 / 384 = 0,2317708

Mais le modèle donne une probabilité de 0,372805.

Il s'avère qu'un autre algorithme est utilisé pour obtenir la probabilité.

 
elibrarius:

Il s'avère qu'un autre algorithme de probabilité est utilisé à cet endroit.

Oui, les résultats sont étranges. Ne prennent-ils pas la probabilité de l'échantillon test impliqué dans la formation ? Mais il semble y avoir une erreur ici.

Combien d'unités (lignes de cible) y a-t-il au total dans l'échantillon ?