L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2729

 
Aleksey Nikolayev #:

La signification n'est pas dans les critères, mais dans la manière dont ils sont utilisés. Votre façon de les utiliser n'est pas claire du tout - qu'est-ce que vous comparez avec quoi et dans quel but).

D'accord, puisque vous faites le malin, vous n'êtes pas prêt à réfléchir dans cette direction. Je ne m'y attarderai pas.

 
Aleksey Vyazmikin #:

D'accord, si vous êtes intelligent, alors vous ne voulez pas penser dans cette direction. Je ne m'en préoccuperai pas.

Alexei, apprends à formuler tes pensées, si tu veux vraiment être compris...

 
mytarmailS #:

Alexei, apprends à formuler tes pensées si tu veux être compris.

Et où avez-vous perdu le fil de mes pensées ?

Mes pensées sont formulées - je comprends ce dont je parle, si quelqu'un ne comprend pas - demandez-lui. Peut-être devriez-vous apprendre à mieux comprendre l'essence, sans vous accrocher aux termes....

 
Aleksey Vyazmikin #:

D'accord, si vous êtes intelligent, alors vous ne voulez pas penser dans cette direction. Je ne m'en préoccuperai pas.

Soit vous n'arrivez pas à formuler une idée, soit vous ne voulez pas la partager. Dans les deux cas, il n'y a pas lieu de développer davantage le sujet et évitons d'en faire une affaire personnelle.

 
Aleksey Vyazmikin #:

Pensez-vous que le critère n'a pas de sens ? Prenez dix échantillons de tailles différentes et comparez-les - choisissez celui qui obtient les meilleurs résultats sur plusieurs indicateurs responsables de la similarité/similarité/homogénéité des échantillons.

Nous prenons et mélangeons les échantillons, nous obtenons des scores différents... nous sommes tristes.

* les mélangent entre eux. Puisque personne ne l'interdit, puisque ce n'est pas un modèle séquentiel qui est entraîné, la séquence des échantillons n'a pas d'importance. Seule compte l'erreur de classification, qui peut toujours être réduite en les mélangeant.

Pour chercher quelque chose, il faut comprendre très précisément ce que l'on cherche, sinon on joue avec les échantillons jusqu'à la stupeur. Personne ne sait ce que l'on cherche, si quelqu'un le découvre, qu'il me le fasse savoir.
 
Il existe une autre astuce. Plus les caractéristiques sont peu informatives, plus l'échantillon de formation doit être petit.

Plus les attributs sont informatifs et moins ils sont nombreux, plus l'échantillon peut/doit être important. Or, presque tout le monde pense le contraire.
 
Aleksey Nikolayev #:

Soit vous n'arrivez pas à formuler une idée, soit vous ne voulez pas la partager. Dans les deux cas, il n'y a pas lieu de développer davantage le sujet et évitons d'en faire une affaire personnelle.

N'ai-je pas écrit qu'il s'agit de comparer des échantillons (formation et application), que si votre théorie est correcte, l'échantillon cessera d'être similaire au fur et à mesure qu'il augmentera, et que pour le comprendre il faut des critères d'évaluation de son changement, qui sont dérivés des méthodes d'évaluation de la similarité ?

En outre, j'ai parlé de diviser l'ensemble de l'échantillon en sections en fonction de certaines caractéristiques de tendance comparables, et d'établir un classement à l'intérieur de ces groupes. Et ce classement peut à nouveau être effectué à l'aide de critères de "similarité" des échantillons.

Je ne m'en prends pas à vous - je vois le style de la réponse et je suis simplement perplexe - qu'est-ce que les gens font ici - veulent-ils montrer leur caractère unique ? Ce qui m'intéresse, c'est de trouver des moyens de résoudre le problème, d'utiliser les connaissances des autres et de partager les miennes.

 
Maxim Dmitrievsky #:
Prélever et mélanger des échantillons, obtenir différentes estimations... triste

* les mélanger entre eux. Comme personne ne l'interdit et qu'il ne s'agit pas d'un modèle séquentiel en cours d'apprentissage, l'ordre des échantillons n'a pas d'importance. Seule compte l'erreur de classification, qui peut toujours être réduite en mélangeant les échantillons.

Pour chercher quelque chose, il faut comprendre très précisément ce que l'on cherche, sinon on joue avec les échantillons jusqu'à la stupeur. Personne ne sait ce que l'on cherche, alors si quelqu'un le découvre, qu'il me le fasse savoir.

Vous ne pouvez mélanger qu'à l'intérieur d'un échantillon, si vous mélangez deux échantillons, cela signifie que vous niez que le marché est en train de changer.

 
Maxim Dmitrievsky #:
Prélever et mélanger des échantillons, obtenir différentes estimations... triste

* les mélanger entre eux. Comme personne ne l'interdit et qu'il ne s'agit pas d'un modèle séquentiel en cours d'apprentissage, l'ordre des échantillons n'a pas d'importance. Seule compte l'erreur de classification, qui peut toujours être réduite en mélangeant les échantillons.

Pour chercher quelque chose, il faut comprendre très précisément ce que l'on cherche, sinon on joue avec les échantillons jusqu'à la stupeur. Personne ne sait ce que l'on cherche, si quelqu'un le découvre, qu'il me le fasse savoir.

Je n'aime pas vraiment ce que vous et Alexey avez en commun dans votre raisonnement - vous les avez dans le contexte d'un modèle spécifique et de l'étude de son comportement lorsque l'échantillon d'entraînement change. Idéalement, j'aimerais être indépendant d'un modèle particulier lors de la sélection de l'échantillon d'entraînement - c'est pourquoi j'ai décidé d'utiliser des sommets en zigzag pour l'instant. Mais vous avez probablement raison tous les deux et une indépendance totale par rapport au type de CT est difficilement possible.

 
Aleksey Vyazmikin #:

N'ai-je pas écrit que l'idée de comparer des échantillons (formation et application) est que si votre théorie est correcte, l'échantillon cessera d'être similaire au fur et à mesure qu'il augmentera, et pour réaliser cela, vous avez besoin de critères pour évaluer son changement, qui sont dérivés des méthodes d'évaluation de la similarité ?

Ici, vous parlez apparemment d'échantillons multivariés (chaque élément est une ligne d'un tableau, un vecteur), alors que les critères d'homogénéité mentionnés dans vos trois liens concernent des échantillons numériques. Les critères d'homogénéité multivariés dans matstat sont une autre chanson et ne sont pas tout à fait clairs pour moi.

Aleksey Vyazmikin #:

Par ailleurs, je parlais de diviser l'échantillon entier en sections en fonction d'une caractéristique de tendance comparable, et d'établir un classement à l'intérieur de ces groupes. Et ce classement peut à nouveau être effectué selon les critères de "similarité" des échantillons.

Il s'agit d'une tâche similaire à celle qui consiste à rechercher de nombreux points de changement. Une fois de plus, il s'avère que nous devons travailler avec un cas multidimensionnel (vecteur), ce qui complique beaucoup la question.

D'une manière générale, je n'aime pas la dépendance à l'égard des attributs choisis pour l'étude. Si nous prenons des ensembles différents d'attributs, les résultats peuvent différer.