L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2569

 
mytarmailS #:
Qui sait s'il existe un test pour le déterminisme des tendances...
Vous devez savoir si c'est vraiment une tendance ou une fluctuation aléatoire...

Peut-être le même Hearst ?


Des tests pour différents types de tendances dès le départ

R meilleur !!!!

Il existe un bon paquetage de tendance dans R. Pour une tendance linéaire, sens.slope() est bon à partir de là.

 
mytarmailS #:

Qu'y a-t-il à comprendre des mathématiques financières et de la RI, il faut connaître les mécanismes du marché et de ses acteurs...

La foule est condamnée à perdre dans la plupart des cas, car son contre-agent est un "acteur majeur".

1) ils doivent constater un déséquilibre entre les acheteurs et les vendeurs de détail : s'il y a beaucoup de vendeurs, le "gros joueur" (l'acheteur) se trouve de l'autre côté de l'affaire.

Comme maintenant sur le juif, par exemple, beaucoup de vendeurs

2) Il y a aussi le trading en temps réel contre la foule, c'est le market maker.

On constate toujours que le prix évolue à contre-courant de la foule (corrélation inverse).

Tant que la foule achète et croit en la croissance, le prix va baisser et vice versa...

C'est tout le marché...


p.s. Et je vais regarder la vidéo, c'est sûr.

Il y a aussi des problèmes avec cela, et pas des moindres. Nous ne disposons que d'une petite tranche du marché, dont on ne connaît pas la représentativité et la fiabilité. La deuxième image (sentiment général) ne sert à rien du tout. Tout d'abord, les renversements de tendance se produisent régulièrement à des extrêmes où il semblerait que la tendance "à contre-courant" aurait dû se poursuivre. Deuxièmement, la sanction répète simplement le prix (à l'envers et moins la tendance) - inversez n'importe quel oscillateur et vous obtenez une image très similaire. Eh bien, si l'indicateur répète le prix, cela signifie que sa prédiction n'est pas plus facile que le graphique des prix lui-même, n'est-ce pas ? La première image (le verre et les positions ouvertes) et la valeur du ratio de profit ont plus de valeur, mais c'est aussi si... très discutable.


 
Aleksey Nikolayev #:

La manière exacte dont il est codé ne fait pas grande différence (d'un point de vue combinatoire). Le point est le même - chaque ligne a comme caractéristiques les règles qui sont appliquées et celles qui ne le sont pas. Il s'agit toujours de 2^N variantes, où N est le nombre de règles. Ensuite, chacune de ces règles sera incluse dans l'ensemble final de 2^(2^N) variantes. Il est clair qu'il est impossible d'essayer formellement un si grand nombre de variantes. C'est pourquoi il est logique de les organiser de manière raisonnable. Par exemple, nous prenons d'abord toutes les variantes décrites par une seule règle, puis toutes les variantes décrites par deux règles seulement et ainsi de suite. Ou quelque chose comme ça.

Peut-être que je ne l'explique pas bien, mais je veux souligner une fois de plus que nous travaillons avec l'échantillon initial, qui, dans l'algorithme d'apprentissage CatBoost, est quantifié une fois, c'est-à-dire. Disons que nous avons 1000 prédicteurs, nous les avons quantifiés chacun en 10 segments, en conséquence nous avons 10000 segments - ensuite l'algorithme CatBoost tire aléatoirement les prédicteurs et en parcourant les bords/quantiques fait un split/split, pour sélectionner un quantum qui est au milieu, il doit construire 3 inégalités ou créer 8 feuilles, où 7 feuilles diront des bêtises et une feuille des informations précieuses. Il n'est pas non plus certain que l'algorithme construise un tel arbre, car il y a une part d'aléatoire et un quantum voisin peut entrer dans une feuille. Et que ce soit un seul arbre. Dans ma méthode une inégalité sera suffisante - 2 feuilles. Même si tous les prédicteurs sont utilisés et que chacun a 1 feuille utile, le nombre de combinaisons lors de la création du modèle sera bien moindre. Mais surtout, il y aura aussi moins de bruit, car il n'y aura pas autant de partitions d'échantillons erronées à stabiliser qui nécessitent de construire un nouvel arbre (principe de boosting).

Aleksey Nikolayev # :

Tôt ou tard, de nombreux autres joueurs les trouveront, par exemple.

Alors il faudrait peut-être tester cette théorie d'une manière ou d'une autre ? Selon laquelle il existe une fréquence minimale de récurrence d'un avantage, après l'augmentation de laquelle il a plus de chances de disparaître, que de continuer à exister ?

Par exemple, nous mesurons chaque semestre, il y a un avantage de 1,5 an - nous considérons que la moitié d'une année va fonctionner, et si c'est déjà 2,5 ans, il n'y a pas de sens et le prendre - la probabilité est plus que cela cesse de fonctionner.

Je ne suis pas doué pour les formules scientifiques, pouvez-vous me dire comment faire ce calcul et vérifier l'hypothèse ?

 
Aleksey Nikolayev #:

Il y a un bon paquetage de tendance dans R. Pour une tendance linéaire, sens.slope() est bon à partir de là.

merci

vladavd #:

Il y a aussi des problèmes avec cela, et même plusieurs. Nous ne disposons que d'une petite tranche du marché, dont nous ne savons pas dans quelle mesure elle est indicative et fiable. La deuxième image (sentiment général) n'est pas du tout utile. Tout d'abord, les renversements de tendance se produisent régulièrement à des extrêmes où il semblerait que la tendance "à contre-courant" aurait dû se poursuivre. Deuxièmement, la sanction répète simplement le prix (à l'envers et moins la tendance) - inversez n'importe quel oscillateur et vous obtenez une image très similaire. Eh bien, si l'indicateur répète le prix, cela signifie que sa prédiction n'est pas plus facile que le graphique des prix lui-même, n'est-ce pas ? La première image (le verre et les positions ouvertes) et la valeur du ratio de profit ont plus de valeur, mais c'est aussi... très discutable.

Vous vous perdez dans beaucoup de choses, vous êtes trop superficiel et vous avez une perception irréfléchie de l'information.

 
Aleksey Vyazmikin #:

Peut-être que je ne l'explique pas bien, mais je veux insister à nouveau sur le fait que nous travaillons avec l'échantillon original, qui, dans l'algorithme d'apprentissage CatBoost, est quantifié une fois, à savoir Disons que nous avons 1000 prédicteurs, nous les avons quantifiés chacun en 10 segments, en conséquence nous avons 10000 segments - ensuite l'algorithme CatBoost tire aléatoirement les prédicteurs et en parcourant les bords/quantiques fait un split/split, pour sélectionner un quantum qui est au milieu, il doit construire 3 inégalités ou créer 8 feuilles, où 7 feuilles diront des bêtises et une feuille des informations précieuses. Il n'est pas non plus certain que l'algorithme construise un tel arbre, car il y a une part d'aléatoire et un quantum voisin peut entrer dans la feuille. Et que ce soit un seul arbre. Dans ma méthode une inégalité sera suffisante - 2 feuilles. Même si tous les prédicteurs sont utilisés et que chacun a 1 feuille utile, le nombre de combinaisons lors de la création du modèle sera bien moindre. Mais surtout, il y aura aussi moins de bruit, car il n'y aura pas autant de partitions d'échantillons erronées à stabiliser dont vous aurez besoin pour construire un nouvel arbre (principe de boosting).

Vous devriez peut-être décrire votre approche sur un exemple d'un seul arbre de décision. Pourtant, en soi, le boosting construit déjà une structure assez complexe - une séquence d'arbres de raffinage. Et vousfaites toujours autre chose avec).

Aleksey Vyazmikin #:

Alors peut-être que vous devez vérifier cette théorie d'une manière ou d'une autre ? Selon laquelle il existe une fréquence minimale de récurrence de l'avantage, après l'augmentation de laquelle il y a plus de probabilité de sa disparition que de la continuation de son existence ?

Par exemple, nous mesurons chaque semestre, il y a un avantage de 1,5 an - nous considérons que la moitié d'une année fonctionnera encore, et si c'est déjà 2,5 ans, il n'y a pas de sens et le prendre - la probabilité est plus élevée que cela cesse de fonctionner.

Je ne suis pas fort en formules scientifiques, pouvez-vous me dire comment faire un tel calcul et vérifier l'hypothèse ?

Quelque chose comme la formule de radioactivité avec la demi-vie) Je ne pense pas que l'activité des gens soit décrite par une formule aussi simple) Votre "fréquence d'avantage" changera, très probablement d'une manière très imprévisible.

 
Aleksey Nikolayev #:

Vous auriez peut-être dû exposer votre approche en utilisant un seul arbre de décision à titre d'exemple. Cependant, le boosting lui-même construit déjà une structure assez complexe - une séquence d'arbres qui se raffine. Et vousfaites toujours autre chose avec).

Oui, je comprends qu'il n'est pas facile de comprendre immédiatement la méthode. Je prévois de le décrire plus en détail. Et les données sont traitées avant d'être soumises à CatBoost, mais je veux créer mon propre algorithme, qui tiendra compte de la dynamique changeante de la "décroissance", comme vous l'avez appelée, lors du fractionnement.

Aleksey Nikolayev #:

Un peu comme une formule de radioactivité avec une demi-vie) Je ne pense pas que l'activité humaine soit décrite par une formule aussi simple) Votre "fréquence d'avantage" est susceptible de changer d'une manière hautement imprévisible.

Il n'y a peut-être rien, mais comment le vérifier ?

 
mytarmailS #:

merci

Tu te perds dans beaucoup de choses, tu es trop superficiel et tu ne réfléchis pas à ces informations.

Oui, je travaille avec cet outil depuis des années et je n'y ai pas vraiment réfléchi.

Sur quoi exactement êtes-vous en désaccord ?

 
Aleksey Vyazmikin #:

Oui, disons-le.

Non, maintenant, prenez l'exécution de la règle d'inégalité comme une seule et regardez la valeur moyenne de la cible (disons pour une classification binaire) lorsque la règle est déclenchée par l'échantillon, si la valeur moyenne initiale est, disons, 0,45 dans l'échantillon, et après évaluation uniquement par les réponses est 0,51, alors considérez que le prédicteur (son tracé/quantique) a un pouvoir prédictif de 0,06, c'est-à-dire 6%.

Nous rassemblons un grand nombre de ces prédicteurs avec des sections, qui sont déjà des prédicteurs binaires indépendants, et nous les utilisons pour construire un modèle.

Combiner tous ces quanta avec tous (avec ou sans pouvoir prédictif) n'est effectivement pas une tâche rapide, mais elle n'est peut-être pas déraisonnable si elle est faite avec un prédicteur de base sur lequel un quantum avec pouvoir prédictif est identifié.

Mais, même en théorie, cette reconversion serait moindre, car il y a moins de combinaisons possibles que dans l'échantillon complet.

Ce qui reste à comprendre, c'est pourquoi de tels schémas quantiques peuvent fonctionner pendant 7 ans et s'arrêter soudainement...

Est-ce que je comprends bien ce que vous faites ?


1) On obtient 1 arbre.
2) Chaque noeud peut donner jusqu'à 10 branches (dans l'image nous en avons trouvé moins, disons 10 branches), chaque branche est générée par 1 quantum (un quantum est un morceau de prédicteur en 10% : soit en centile, soit en 10% d'amplitude, cela dépend de la méthode de quantification utilisée).
3) après la première division, nous trouvons 3 quanta, qui mènent ensuite à une feuille réussie
4) les divisions suivantes trouvent d'autres bonnes divisions/quantités menant à des feuilles réussies
5) nous mémorisons les quanta réussis avant les feuilles réussies
6) nous construisons un nouvel arbre, qui utilise comme prédicteurs uniquement les quanta que nous avons sélectionnés.

Pour le faire avec la même méthode que nous avons quantifié le premier arbre, quantifier les prédicteurs avec notre script, nous obtenons 1000 prédicteurs sur 100, ils sont déjà binaires 0 ou 1. Si la valeur du prédicteur se situe dans cette plage, elle = 1, sinon, elle = 0.
Comme nous ne sélectionnons que les chemins/quantiques réussis, toutes les valeurs des quanta sélectionnés = 1. Si tous les prédicteurs = 1, alors le nouvel arbre ne peut pas apprendre. La réponse est déjà connue.

Ou n'y a-t-il plus besoin de construire un nouvel arbre ? Si la valeur du prédicteur tombe dans le quantum sélectionné, le ferons-nous immédiatement ?

 
vladavd #:

Oui, je travaille avec cet outil depuis des années, alors je n'y ai pas du tout pensé.

En désaccord avec quoi, exactement ?

Avec quel outil exactement ?

 
mytarmailS #:

avec quel type d'outil ?

Eh bien, qu'est-ce qu'il y a sur la photo ? Le verre et la sanction.