L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3030

 
Forester #:

C'est une description compliquée. Trier la colonne et la diviser en 32 parties, par exemple, s'il y a des doublons, ils sont tous jetés dans le quantum. Si la colonne n'a que 0 et 1, il y aura 2 quanta, et non 32 (à cause des doublons).

Vous parlez de la méthode, et moi de l'objectif. Les méthodes peuvent être différentes. Je dirais même que les méthodes empiriques sont souvent meilleures que les méthodes mathématiques. Peut-être parce que nous ne disposons pas de données complètes sur l'échantillon général.

 
Aleksey Nikolayev #:

Essentiellement, il s'avère qu'un arbre est construit sur chaque prédicteur séparément.

Oui, c'est ainsi que les arbres C4.5 sont construits pour les valeurs discrètes. Une seule division.

 
Aleksey Vyazmikin #:

Vous parlez de la méthode, je parle de l'objectif. Il peut y avoir différentes méthodes. Je dirais même que les méthodes empiriques sont souvent meilleures que les méthodes mathématiques. Probablement parce que nous ne disposons pas de données complètes sur l' échantillon général.

Pour les données non stationnaires, il n'y a pas du tout de concept d'"échantillon principal", il n'y a que des queues. C'est là le problème, et c'est pourquoi toute estimation à partir de l'entraînement est extrêmement difficile à obtenir à l'avenir.

 
СанСаныч Фоменко #:

Pour les données non stationnaires, il n'y a pas du tout de concept d'"échantillon maître", il n'y a que des queues. C'est là tout le problème, et c'est pourquoi toute estimation obtenue lors de l'entraînement est extrêmement difficile à obtenir à l'avenir.

Nous ne le savons pas. Plus précisément, nous ne connaissons pas la véritable densité de la distribution, et nous n'observons que des extraits - c'est pourquoi de telles fluctuations...

Je ne vis pas de concepts :)

Alors dites-moi comment on appelle un tel phénomène, que nous ne pouvons pas observer, parce que nous sommes en train de le faire, et qu'il a été achevé il y a longtemps dans les confins de l'espace....

 
СанСаныч Фоменко #:

Pour les données non stationnaires, il n'y a pas du tout de concept d'"échantillon maître", il n'y a que des queues. C'est là tout le problème, et c'est pourquoi toute estimation obtenue lors de l'entraînement est extrêmement difficile à obtenir à l'avenir.

C'est exact, SanSanych.

Les données non stationnaires sont toujours soumises aux effets cumulatifs d'autres donnéesnon stationnaires. C'est de ces effets que dépendront les queues.

 
Aleksey Vyazmikin #:

Plage de valeurs du prédicteur décrivant les données.

J'ai décritici l'algorithme de manière pratique - il y a également une image avec le RSI.

J'ai compris : séparez tout et tout et étudiez-le séparément.

Je ne comprends pas pourquoi ils sont quantiques.
 
Maxim Dmitrievsky #:
Je ne comprends pas pourquoi ils sont quantiques.

C'est parce que le gamin ne respecte pas les règles qu'il a écrit)

 
Maxim Dmitrievsky #:

J'ai compris : séparez tout et tout le monde et étudiez-les séparément.

Je ne comprends pas pourquoi ils sont quantiques.

C'est probablement à cause des traductions. la terminologie.

Il y a la quantification et ses différentes méthodes, le tableau contenant les points de division - tableau quantique - c'est déjà de l'instruction CatBoost.

Segments quantiques - de la table quantique, mais les extrêmes ont des limites. C'est déjà mon invention.

 
Aleksey Vyazmikin #:

C'est probablement la faute des traducteurs. la terminologie.

Il y a la quantification et ses différentes méthodes, le tableau contenant les points de division - tableau quantique - c'est déjà de l'instruction CatBoost.

Segments quantiques - de la table quantique, mais les extrêmes ont des limites. C'est déjà mon invention.

pas quantique, probablement quantifié, comme ici.

5.4 Quantification des réseaux neuronaux convolutionnels

Classiquement, en raison de difficultés d'optimisation évidentes, lors de la quantification des réseaux neuronaux, on n'utilise pas simplement des entiers, mais plutôt une approximation des nombres à virgule flottante par des entiers. Une approchelargement utilisée dans la littérature [52, 54, 60] pour l'approximation des nombres à virgule flottante par des entiers de profondeur arbitraire est l'algorithme proposé dans la bibliothèque GEMMLOWP de Google [59]. Avec un tableau d'entrée 𝑋, des valeurs limites [𝑣􏰲􏰭􏰠,𝑣􏰲􏰈􏰂] et un nombre de bits 𝑀, le résultat est défini comme suit :

𝑠𝑐𝑎𝑙𝑒 =(𝑣􏰲􏰈􏰂 - 𝑣􏰲􏰭􏰠)/2􏰳,(14) 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡 = 𝑟𝑜𝑢𝑛𝑑(min(max(-𝑣􏰲􏰭􏰠/𝑠𝑐𝑎𝑙𝑒, 0), 2􏰳)),(15)𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡 = 𝑟𝑜𝑢𝑛𝑑(𝑋/𝑠𝑐𝑎𝑙𝑒 + 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡).(16)

Ainsi, pour chaque tableau de nombres à virgule flottante, nous obtenons un tableau d'entiers 𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡, d' entiers 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡, représentant exactement zéro, un nombre de double précision𝑠𝑐𝑎𝑙𝑒 qui définit l'échelle de quantification.


https://dspace.susu.ru/xmlui/bitstream/handle/0001.74/29281/2019_401_fedorovan.pdf?sequence=1&isAllowed=y

 
Maxim Dmitrievsky #:

pas quantique, quantifié, comme ici.

5.4 Quantification des réseaux neuronaux convolutifs

Classiquement, en raison de difficultés d'optimisation évidentes, la quantification des réseaux neuronaux n'utilise pas seulement des entiers, mais plutôt une approximation des nombres à virgule flottante par des entiers. Une approchelargement utilisée dans la littérature [52, 54, 60] pour l'approximation des nombres à virgule flottante par des entiers de profondeur arbitraire est l'algorithme proposé dans la bibliothèque GEMMLOWP de Google [59]. Avec un tableau d'entrée 𝑋, des valeurs limites [𝑣􏰲􏰭􏰠,𝑣􏰲􏰈􏰂] et un nombre de bits 𝑀, le résultat est défini comme suit :

𝑠𝑐𝑎𝑙𝑒 =(𝑣􏰲􏰈􏰂 - 𝑣􏰲􏰭􏰠)/2􏰳,(14) 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡 = 𝑟𝑜𝑢𝑛𝑑(min(max(-𝑣􏰲􏰭􏰠/𝑠𝑐𝑎𝑙𝑒, 0), 2􏰳)),(15)𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡 = 𝑟𝑜𝑢𝑛𝑑(𝑋/𝑠𝑐𝑎𝑙𝑒 + 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡).(16)

Ainsi, pour chaque tableau de nombres à virgule flottante, nous obtenons un tableau d'entiers 𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡, d' entiers 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡, un nombre entier représentant exactement zéro, un nombre de double précision𝑠𝑐𝑎𝑙𝑒 définissant l'échelle de quantification.


https://dspace.susu.ru/xmlui/bitstream/handle/0001.74/29281/2019_401_fedorovan.pdf?sequence=1&isAllowed=y

Je vous le dis, c'est une question de traduction - ce sont tous des synonymes. Voici les paramètres de CatBoost.