L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 3104

 

Toute la douleur des tests A/B en une seule vidéo

(ne pas regarder pour les personnes particulièrement impressionnables)


 
Maxim Dmitrievsky #:

Toutes les difficultés des tests A/B en une seule vidéo

(ne pas regarder pour les personnes particulièrement impressionnables)


Ne pensez-vous pas qu'au début, il parle d'un exemple binaire, mais que dans le code, il prend une série de nombres issus d'une distribution normale ?

De plus, tous les tests de ce type dépendent d'un générateur de nombres aléatoires, vous devez également en tenir compte. La nature de l'apparition des nombres peut être plus complexe pour chaque phénomène, bien qu'il puisse avoir une distribution normale.

Dans cette approche du problème, comme il le montre, il est alors plus raisonnable de ne pas mesurer des "jours", mais d'évaluer la dynamique d'arrivée au seuil et le temps de dépassement du seuil.

En général, il serait plus utile d'observer le phénomène sur des données réelles pour en tirer des conclusions.

 
Aleksey Vyazmikin #:

Ne pensez-vous pas qu'il parle d'un exemple binaire au début, mais que dans le code il prend exactement la plage de nombres d'une distribution normale ?

De plus, tous les tests de ce type dépendent d'un générateur de nombres aléatoires, ce qui doit également être pris en compte. La nature de l'apparition des nombres peut être plus complexe pour chaque phénomène, bien qu'il puisse avoir une distribution normale.

Dans une telle approche du problème, comme il le montre, il est plus raisonnable de ne pas mesurer des "jours", mais d'estimer la dynamique d'arrivée au seuil et le temps de dépassement du seuil.

En général, il serait plus utile d'observer le phénomène sur des données réelles pour en tirer des conclusions.

Cela doit être très difficile quand on ne sait jamais de quoi on parle et dans quel contexte).

et le point ici est que même si vous avez une trace et un test provenant de la même distribution, vous ne pouvez pas toujours confirmer ou infirmer une hypothèse, par exemple, sur la robustesse du modèle. sans parler du fait qu'ils proviennent de distributions différentes.

Ajoutez à cela des tests multiples et multipliez la signification statistique de ces tests par zéro.

 
Maxim Dmitrievsky #:

cela doit être très difficile quand on ne sait jamais de quoi on parle ? et le contexte )

et le point ici est que même si vous avez une trace et un test de la même distribution, vous ne pouvez pas toujours confirmer ou infirmer une hypothèse, par exemple, sur la robustesse du modèle. sans parler du fait qu'ils proviennent de distributions différentes.

Ajoutez à cela des tests multiples et multipliez la signification statistique de ces tests par zéro.

Je vois. Il parle de l'essentiel, et il se contente d'accrocher ses oreilles....

 
Aleksey Vyazmikin #:

Je vois. Il parle de l'essence, et il se contente d'accrocher ses oreilles....

vous ne comprenez pas.

 
Maxim Dmitrievsky #:

vous n'avez pas compris.

Ce qu'une personne dit ici, en tirant des conclusions d'une grande portée, est déjà clair, mais elle ne se rend pas compte que le résultat dépend de l'algorithme du générateur de nombres aléatoires.

La seule conclusion valable est que la modélisation informatique sous une forme primitive ne permet pas de se rapprocher des processus réels sans les comprendre.

S'il divisait la distribution en deux parties avec 0 et 1 et montrait qu'il avait un ordre de grandeur d'unités en plus, je serais surpris. Vous voyez, il dit une chose et en fait une autre.

Je suis en train d'essayer de prédire la probabilité de distribution (j'ai une classification) dans le segment quantique pour les 3 prochains mois par le changement réel de la distribution dans le temps, et par des tests j'ai réussi à augmenter la précision de 15% grâce à ces métriques, et je pense que ce n'est pas la limite.

D'une manière générale, l'auteur de la vidéo a trouvé une bonne "excuse" pour expliquer les conclusions erronées de son expérience. Oui, c'est pratique, mais ce n'est pas fonctionnel. Je veux dire que d'après ce qu'il dit, il est nécessaire de fixer le temps/le nombre d'observations et d'en tirer une conclusion. En général, je ne comprends vraiment pas ce qu'il dit - à quoi cela sert-il, si ce n'est à justifier l'employeur ?

 
Aleksey Vyazmikin #:

Ce que l'homme dit là, en tirant des conclusions d'une grande portée, est déjà clair, mais il ne se rend pas compte que son résultat dépend de l'algorithme du générateur de nombres aléatoires.

Le piratage est un problème connu, qu'il a tenté d'expliquer à des intellos qui n'en comprenaient pas l'essence.

Ne pouvons-nous pas faire des tonnes de lettres sans signification ? il est déjà clair qu'il n'y a pas eu de compréhension.
 
Maxim Dmitrievsky #:

le p-hacking est un problème connu, qu'il a essayé d'expliquer à des intellos qui n'ont pas compris.

Ne pouvons-nous pas faire des tonnes de lettres sans signification ? il est déjà clair qu'il n'y a pas eu de compréhension.

Il est dommage que vous ne compreniez toujours pas ce que j'essaie de vous faire comprendre.

 
Ne jurez pas.
 
Maxim Dmitrievsky #:

Toutes les difficultés des tests A/B en une seule vidéo

(ne pas regarder pour les personnes particulièrement impressionnables)


Il est grand temps que nous passions tous du côté de la lumière - au matstat).

Le côté obscur, comme toujours, s'y oppose) Obscur dans le sens où il essaie toujours de tout réduire à l'obscurité et au flou - dans la version extrême à un certain "flair").