L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 82

 
mytarmailS:

Lors de la formation du modèle, plus il y a d'arbres, plus la classe "0" apprend et, au fur et à mesure que la classe "0" apprend, elle commence à (absorber - évincer) les classes "1" et "-1". C'est pourquoi plus il y a d'arbres, moins il y a de transactions.

Quelque chose ne va pas, la forêt est presque toujours entraînée à une précision de 100% avec tous les biais. Lors de la validation avec de telles données, il peut y avoir des problèmes, mais en prédisant les résultats sur les données de formation, la forêt sera toujours précise. Je suppose que vous n'utilisez pas la classification mais la régression, et que lorsque vous testez le modèle, vous n'obtenez pas des classes nettes -1;0;1, mais des chiffres réels compris entre -1 et 1. Avec ce genre de régression biaisée, rien de bon n'en sortira.

Une meilleure façon de procéder est de dire que vous avez un tableau de données de formation (trainingData), où la dernière colonne est la variable cible et toutes les autres colonnes sont des prédicteurs :

trainingData <- data.frame(trainingData) #на  всякий случай сконвертировать таблицу из матрицы в датафрейм, если не было сделано раньше
trainingData[,ncol(trainingData)] <- factor(trainingData[,ncol(trainingData)]) #тип  последней колонки сменить на фактор. Модели в R обычно сразу по этому типу понимают что нужна классификация, и работают чуть иначе чем при регрессии
 
mytarmailS:

pas vraiment...

Ce que j'écris ne s'applique qu'à mon approche.

Tu sais comment je fais ma cible, c'est des inversions.

J'ai trois classes de pivot ( 1 , -1 , 0 )

Vous savez également que l'asymétrie des classes est énorme, la classe "0" est des dizaines de fois plus grande que "-1" et "1".

et cela signifie que le modèle est mieux entraîné sur la classe "0" parce qu'elle a le plus d'observations et pendant l'entraînement du modèle, plus il y a d'arbres, plus la classe "0" est entraînée et comme la classe "0" devient meilleure et plus forte, elle commence à (absorber - évincer) les classes "1" , "-1". C'est pourquoi plus il y a d'arbres, moins il y a de transactions.

Pour moi, tu écris des choses incroyables !

Une approche très originale pour les classes déséquilibrées.

Si je comprends bien, votre liste de prédicteurs non seulement ne contient pas de bruit, mais a également un pouvoir prédictif très élevé.

Si oui, comment y êtes-vous parvenu ?

 
Dr. Trader:

Quelque chose ne va pas, la forêt est presque toujours entraînée à 100% de précision sans aucun biais. Lors de la validation, il peut y avoir des problèmes avec ces données, mais la forêt prédit toujours les résultats sur les données d'apprentissage avec précision. Je suppose que vous n'utilisez pas la classification mais la régression, et que lorsque vous testez le modèle, vous n'obtenez pas des classes nettes -1;0;1, mais des chiffres réels compris entre -1 et 1. Avec ce genre de régression biaisée, rien de bon n'en sortira.

Pour mieux le faire, disons que vous avez un tableau de données de formation (trainingData), où la dernière colonne est la variable cible et toutes les autres colonnes sont des prédicteurs :

100% pour un arbre, c'est un non-sens absolu !

Si tous vos prédicteurs sont du bruit, ce résultat est très difficile à atteindre : il y aura toujours une erreur de 3 à 5 %. Le bruit donne toujours de très bons résultats avec toutes les validations croisées et autres astuces.

Une précision de 100 % ne signifie qu'une chose : parmi les prédicteurs, vous avez un double de la variable cible (une modification de celle-ci). C'est-à-dire que le modèle est tourné vers l'avenir.

 
SanSanych Fomenko:


Une précision de 100 % ne signifie qu'une chose : parmi les prédicteurs, vous avez un double de la variable cible (une modification de celle-ci). C'est-à-dire que le modèle est tourné vers l'avenir.

C'est une fuite de données. Vous devez vérifier les données à nouveau.
 
Alexey Burnakov:

Qu'est-ce qui ne vous plaît pas dans cette approche ? Comment allez-vous ajuster les paramètres ?

Oui, l'approche est excellente, il est difficile de trouver quelque chose de mieux, le problème est dans le marché lui-même...

Rappelez-vous, je vous ai parlé de mes expériences, des corrélations et de la recherche de modèles dans l'histoire (pas le SSA, mais avant), ce que j'ai fait :

J'ai pris la situation actuelle et j'ai cherché ses analogues dans le passé et j'ai regardé comment ils se sont terminés, si j'ai trouvé une situation "X", alors j'ai trouvé 20 analogues dont 17 se sont terminés avec une baisse et 3 avec une hausse, donc l'avantage statistique est évident(nous devons vendre),d'ailleurs, pourquoi n'est pas la validation croisée ? juste par un seul modèle, n'êtes-vous pas d'accord ? Nous avons découvert que ce modèle ne fonctionne pas, nous avons découvert qu'avec un énorme pourcentage de probabilité, le marché va monter, il va à l'encontre de ses propres statistiques avec une énorme probabilité statistique.

Pour simplifier, si hier nous avons eu l'événement "x" et après cela nous avons eu une chute et le jour avant nous avons eu l'événement"x" et après cela tout est tombé aussi et après hier il y a eu une chute après l'événement"x"- donc si aujourd'hui nous avons l' événement"x"- tout va croître, quelle crosvalidation nous aidera ici ?Rien, jamais.

Le plus important est de comprendre le processus.

Le marché est un business cruel, où certaines personnes qui ont construit ce business prennent légalement l'argent des autres. La foule, la majorité, est toujours obligée de perdre, tout le monde le sait, tout le monde l'écrit, personne ne le cache, bref, c'est un axiome - un schéma de 95% des traders qui perdent de l'argent - le marché évolue contre la majorité avec la probabilité que les traders perdent de l'argent avec ces 95%.

Et qu'utilise la foule pour trader ? En fait, la foule n'a rien d'autre qu'une chose qui lui permet de faire des affaires.

Toutes les actions qui partent de l'observation visuelle des graphiques et de la recherche de modèles dans la ventilation et qui se terminent par la formation de réseaux neuronaux ne sont rien d'autre que du trading par les statistiques, les statistiques mêmes qui ne fonctionnent pas sur le marché, vous voyez de quoi je parle ?

le marché évolue à l'encontre des transactions de la foule ----- la foule agit en fonction des statistiques ------ tout ce que vous devez faire est de prédire l'action de la foule dans le futur et faire le contraire, la seule façon de prédire est la statistique

)))) commencer par un et finir par le troisième :) Bon, c'est tout, au moins je l'ai fait sortir de mon système).

p.s. tout ce que j'ai dit ici est mon opinion personnelle, je ne veux pas imposer quoi que ce soit à qui que ce soit, je peux argumenter et le prouver, mais je ne suis pas d'humeur à le faire.

 
Dr. Trader:

Quelque chose ne va pas, la forêt est presque toujours entraînée à 100% de précision sans aucun biais. Lors de la validation, il peut y avoir des problèmes avec ces données, mais la forêt prédit toujours les résultats sur les données d'apprentissage avec précision. Je suppose que vous n'utilisez pas la classification mais la régression, et que lorsque vous testez le modèle, vous n'obtenez pas des classes nettes -1;0;1, mais des chiffres réels compris entre -1 et 1. Avec une régression aussi biaisée, rien de bon n'en sortira.

Mieux encore, disons que vous disposez d'un tableau trainingData dont la dernière colonne est la variable cible et toutes les autres colonnes sont des prédicteurs :

Non, la classification, vous avez un problème...

sqq

Je l'avais comme ceci, deux modèles, séparément des classes d'achat et de vente (1, 0) et (-1, 0)

c'est moche) d'accord

 
mytarmailS:

Oui, l'approche est excellente, il est difficile de trouver mieux, le problème réside dans le marché lui-même...

Rappelez-vous que je vous ai parlé de mes expériences, des corrélations et de la recherche de modèles dans l'histoire (pas le SSA, mais avant), ce que j'ai fait :

J'ai pris la situation actuelle et j'ai cherché ses analogues dans le passé et j'ai regardé comment ils se sont terminés, si j'ai trouvé une situation "X", alors j'ai trouvé 20 analogues dont 17 se sont terminés avec une baisse et 3 avec une hausse, donc l'avantage statistique est évident(nous devons vendre),d'ailleurs, pourquoi n'est pas la validation croisée ? juste par un seul modèle, n'êtes-vous pas d'accord ? Nous avons découvert que ce modèle ne fonctionne pas, nous avons découvert qu'avec un énorme pourcentage de probabilité, le marché va monter, il va à l'encontre de ses propres statistiques avec une énorme probabilité statistique.

Pour simplifier, si hier nous avons eu l'événement "x" et après cela nous avons eu une chute et le jour avant nous avons eu l'événement"x" et après cela tout est tombé aussi et après hier il y a eu une chute après l'événement"x"- donc si aujourd'hui nous avons l' événement"x"- tout va croître, quelle crosvalidation nous aidera ici ?Rien, jamais.

Le plus important est de comprendre le processus.

Le marché est un business cruel, où certaines personnes qui ont construit ce business prennent légalement l'argent des autres. La foule, la majorité, est toujours obligée de perdre, tout le monde le sait, tout le monde l'écrit, personne ne le cache, bref, c'est un axiome - un schéma de 95% des traders qui perdent de l'argent - le marché évolue contre la majorité avec la probabilité que les traders perdent de l'argent avec ces 95%.

Et qu'utilise la foule pour trader ? En fait, la foule n'a rien d'autre qu'une chose qui lui permet de faire des affaires.

Toutes les actions allant de l' exploration visuelle des graphiques et de la recherche de modèles dans les ruptures à la formation de réseaux neuronaux ne sont rien d'autre que du trading par les statistiques, les statistiques mêmes qui ne fonctionnent pas sur le marché, vous voyez de quoi je parle ?

le marché évolue à l'encontre des transactions de la foule ----- la foule agit en fonction des statistiques ------ tout ce que vous devez faire est de prédire l'action de la foule dans le futur et faire le contraire, la seule façon de prédire est la statistique

)))) commencer par un et finir par le troisième :) Bon, c'est tout, au moins je l'ai fait sortir de mon système).

p.s. tout ce que j'ai dit ici est juste mon opinion, personne n'impose quoi que ce soit, je peux argumenter et le prouver, mais pas l'humeur.

ok.

Pour moi, le Forex est un simple signal avec des bruits. Si je trouve une dépendance, je prends l'argent, si je me reconvertis, le courtier me le retire. Et concernant les foules, etc., je n'ai aucune information. Je ne sais pas comment en avoir assez.

Je veux commencer à traiter les cotations boursières après avoir terminé cette expérience. J'y obtiendrai de vrais volumes, ce qui est aussi un plus.

 
Alexey Burnakov:

OK.

Pour moi, le forex est un signal stupide avec du bruit. Si je trouve une dépendance, je prends l'argent, si je me reconvertis, le courtier prend l'argent. Et concernant les foules, etc., je n'ai aucune information. Je ne sais pas comment en avoir assez.

Je veux commencer à traiter les cotations boursières après avoir terminé cette expérience. Je veux utiliser de vraies citations.

Si vous négociez des devises en eurodollars, vous devez comprendre ce qui motive vos opérations de change. Si vous négociez l'EURUSD sur le CME, la foule réelle effectue les transactions réelles, et ce que vous avez dans le terminal de diffusion est juste une image qui répète le mouvement de l'EURUSD réel et rien de plus, votre transaction dans MT4 n'a aucun impact sur le marché, personne ne prend vos 10 $ (au sens figuré) à l'interbancaire, vous négociez avec votre maison de courtage et c'est tout, plutôt qu'elle négocie contre vous, parce que votre perte est son bénéfice net.
 
Alexey Burnakov:

Après avoir terminé cette expérience, je veux me lancer dans les cotations boursières. Il y aura de vrais volumes, ce qui est aussi un plus.

J'ai toujours négocié uniquement sur le marché réel, je sais de quoi je parle.
 
mytarmailS:
croyez-moi, le volume ne vous aidera pas beaucoup, vous pouvez le remplacer par une volatilité régulière, j'ai presque toujours tradé uniquement sur le marché réel, je sais de quoi je parle.

ok.

Je vais essayer de faire des fiches d'entrée à partir du volume et on verra.