L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 3179

 
Maxim Dmitrievsky #:
Voici, car si vous ne recevez pas de modèle dans la série originale, le chemin hilbertien ne vous mènera pas au but que vous chérissez. Vos efforts se transformeront en diablerie, et vous trouverez un ignoble massacre au lieu d'un paradis.

😁😁

 

J'ai demandé aux développeurs de boost ce qu'il fallait faire avec la multicollinéarité et la sélection des caractéristiques (prétraitement).

J'ai reçu une réponse sans ambiguïté : mec, oublie ça :)

 
Maxim Dmitrievsky #:

et pourquoi demander si la conversion de flots en ints est nécessaire principalement pour l'accélération sur de très grandes données ?

Le bonus peut être un petit calibrage du modèle pour le meilleur ou pour le pire, comme le veut la chance.

ils vous donneront simplement la même réponse, donc vous avez probablement peur de demander parce que cela dévalorisera toutes vos années de dur labeur :)

Comment mon travail peut-il être dévalorisé en répondant à une question si je le juge par le résultat ?

Oui, le résultat n'est pas super en termes de croissance métrique, mais il est là, y compris dans d'autres manifestations.

Par exemple, il y a des échantillons pour lesquels, sans prétraitement à l'aide de ma méthode, je ne pourrais pas du tout obtenir un modèle rentable sur de nouvelles données.

 
Maxim Dmitrievsky #:

J'ai demandé aux développeurs de boost ce qu'il fallait faire en matière de multicolinéarité et de sélection des caractéristiques (prétraitement).

J'ai reçu une réponse sans ambiguïté : mec, oublie ça :)

Et s'il y a un milliard de traits, devons-nous les oublier ? Ou devons-nous quand même sélectionner ceux qui ne sont pas corrélés ?
 
mytarmailS #:
Et s'il y a un milliard de traits, pouvons-nous simplement les oublier ? Ou devons-nous encore sélectionner ceux qui ne sont pas corrélés ?
À volonté.
 
Maxim Dmitrievsky #:
À volonté
Plutôt par nécessité, doit être filtré, pas d'option
 
Maxim Dmitrievsky #:

J'ai demandé aux développeurs de boost ce qu'il fallait faire en matière de multicolinéarité et de sélection des caractéristiques (prétraitement).

J'ai reçu une réponse sans ambiguïté : mec, oublie ça :)

Il y a là une fonctionnalité dont peu de gens parlent, à en juger par les informations sur les exemples réels de son application.

Par exemple, la possibilité de regrouper des prédicteurs et de leur attribuer des poids. Je vois également le potentiel d'amélioration du modèle, mais je ne suis pas en mesure d'expérimenter ici - cela nécessite beaucoup de recherche.

Il est tout à fait possible que des collègues et d'autres personnes améliorent l'algorithme lui-même en termes de vitesse d'exécution et corrigent les bogues. Il arrive que de petits copeaux apparaissent.

 
mytarmailS #:
C'est plutôt par nécessité qu'il faut filtrer, sans option.
Il est probablement plus facile de ne pas créer un milliard de fonctionnalités en premier lieu.
 
Aleksey Vyazmikin #:

Il y a là une fonctionnalité dont peu de gens parlent, à en juger par les informations sur les exemples réels de son application.

Par exemple, la possibilité de regrouper des prédicteurs et de leur attribuer des poids. Je vois également le potentiel d'amélioration du modèle, mais je ne suis pas en mesure d'expérimenter ici - cela nécessite beaucoup de recherches.

Il est tout à fait possible que des collègues et d'autres personnes améliorent l'algorithme lui-même en termes de vitesse d'exécution et corrigent les bogues. Il arrive aussi que de petits copeaux apparaissent.

Tout cela est facultatif
 
Maxim Dmitrievsky #:
Il est probablement plus facile de ne pas créer un milliard de signes dès le départ.
Pour se rendre compte qu'une fonctionnalité est mauvaise, il faut la vérifier, pour la voir, il faut avoir une fonctionnalité, pour avoir une fonctionnalité, il faut l'avoir....