L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1068

 
FxTrader562:
Au fait, j'essaie d'utiliser 1000 fonctions et la formation dure depuis une heure maintenant.

vous pouvez définir seulement 1 agentCRLAgents *ag1=new CRLAgents("RlExp1iter",1,100,50,regularize,learn) ;


et dans le jeu de bibliothèques #define _models 1

donc il sera rapide

 
Maxim Dmitrievsky:

Bien sûr, vous pouvez utiliser des valeurs différentes pour chaque prédicteur, c'est juste un exemple simple, chaque valeur proche = 1 valeur de prédicteur divergent.

Donc le nombre 100 ou 1000 ou 500 etc. doit être le même dans les deux codes copyclose et dans la déclaration, n'est-ce pas ?

 
FxTrader562:

Donc le nombre 100 ou 1000 ou 500 etc. doit être le même dans les deux codes copyclose et dans la déclaration, n'est-ce pas ?

oui

 
Maxim Dmitrievsky:

oui

Ok, mais dans votre exemple de code et votre implémentation actuels, je ne suis pas sûr de ce qui se passe exactement pendant la formation et quelle est la différence entre les agents et les modèles :))

J'espère que vous expliquerez cela dans votre article lorsque vous le publierez. Je veux dire ce qu'un agent fait et ce qu'un modèle fait en utilisant des noyaux...

 
FxTrader562:

Ok, mais dans votre exemple de code et votre implémentation actuels, je ne suis pas sûr de ce qui se passe exactement pendant la formation et quelle est la différence entre les agents et les modèles :))

J'espère que vous expliquerez cela dans votre article lorsque vous le publierez. Je veux dire ce qu'un agent fait et ce qu'un modèle fait en utilisant des noyaux...

chaque agent RL peut avoir des prédicteurs uniques, alors nous faisons la moyenne des résultats de tous les agents.

nombre de modèles - nombre d'itérations des transformations de l'œuf avec cos. Oubliez ça maintenant, parce que nous faisons du gdmh

 
Maxim Dmitrievsky:

chaque agent RL peut avoir des prédicteurs uniques, alors nous faisons la moyenne des résultats de tous les agents.

nombre de modèles - nombre d'itérations des transformations de l'œuf avec cos. Je n'ai pas envie d'en parler maintenant, parce qu'on fait du GDMH.

Oui, c'est vrai... Vous pouvez essayer d'utiliser GDMH et me faire savoir si vous progressez ou si vous êtes bloqué dans la mise en œuvre, parce que de toute façon, finalement, après avoir vu les résultats de LIVE, nous pouvons tirer des conclusions sur l'algo.

À propos, essayez d'utiliser le logarithme naturel dans le cas des formules d'optimisation et de formation. D'après mon expérience, l'utilisation de Mathpow() des exposants semble convertir une solution assez rapidement.

 
FxTrader562:

Oui, c'est vrai...Vous pouvez essayer d'utiliser GDMH et me faire savoir si vous progressez ou si vous êtes bloqué dans la mise en œuvre, parce que de toute façon finalement après avoir vu les résultats de LIVE nous pouvons faire quelques conclusions sur l'algo.Mais en regardant l'algo de GDMH, il semble très prometteur....

À propos, essayez d'utiliser le logarithme naturel dans le cas des formules d'optimisation et de formation. D'après mon expérience, l'utilisation de Mathpow() des exposants semble convertir une solution assez rapidement.

Vous pouvez également utiliser des polynômes trigonométriques. C'est quelque chose comme "recursive feature eilimination", pas vraiment gdmh... quelque chose de moyen )

parce que gdmh son algorithme linéaire quadratique, mais nous utilisons RDF
 
Maxim Dmitrievsky:

peut également utiliser des polynômes trigonométriques. Ce sera quelque chose comme "recursive feature eilimination", pas vraiment gdmh... quelque chose de moyen )

Je n'en sais rien...Je dois lire pour comprendre :))...En fait, je ne savais rien de GDMH et vous m'en avez parlé hier et je viens d'apprendre et d'écrire le code...Je pense que j'apprends vite :)))))

ce à quoi je me réfère, c'est quand on fait une approximation d'une fonction aléatoire pour obtenir une solution, alors en utilisant le log naturel ou l'exposant, on converge généralement rapidement... pourquoi ? parce que c'est la définition et le but du log naturel ou ln ou exponentiel() ou e

Voici un exemple de code auquel je fais référence :

double x=MathRandomUniform(0,1,unierr) ;

double probabilité = 1/(1+exp(MathPow(x,3))) ;

Je comprends un peu le GDMH... mais le RDF n'est toujours pas clair à 100%. J'essayais juste d'implémenter Monte Carlo au lieu de RDF, mais si nous pouvons le faire avec RDF, alors je ne vois pas l'utilité de Monte Carlo. A votre avis, lequel est le meilleur, Monte Carlo ou RDF ?

Mais je vais résumer ici ce que j'attends de cet algo :

Il prendra les indicateurs ou les prix de clôture et les décomposera en m petits morceaux pour créer des polynômes ou des fonctions approximatives pendant la formation.

Lorsque nous l'exécutons dans le trading, pour chaque bougie, il vérifie les données d'entraînement passées et trouve la pièce polynomiale qui correspond au prix actuel et prédit ce qui va se passer ensuite et il doit itérer.

 
FxTrader562:

Je n'en sais rien... je dois lire pour comprendre :))

ce à quoi je me réfère, c'est quand on fait une approximation d'une fonction aléatoire pour obtenir une solution, alors en utilisant le log naturel ou l'exposant, on converge généralement rapidement... pourquoi ? parce que c'est la définition et le but du log naturel ou ln ou exponentiel() ou e

Voici un exemple de code auquel je fais référence :

double x=MathRandomUniform(0,1,unierr) ;

double probabilité = 1/(1+exp(MathPow(x,3))) ;

Je comprends un peu le GDMH... mais le RDF n'est toujours pas clair à 100%. J'essayais juste d'implémenter Monte Carlo au lieu de RDF, mais si nous pouvons le faire avec RDF, alors je ne vois pas l'utilité de Monte Carlo. A votre avis, lequel est le meilleur, Monte Carlo ou RDF ?

Mais je vais résumer ici ce que j'attends de cet algo :

Il prendra les indicateurs ou les prix de clôture et les décomposera en m petits morceaux pour créer des polynômes ou des fonctions approximatives pendant la formation.

Lorsque nous l'exécutons dans le trading, pour chaque bougie, il vérifie les données d'entraînement passées et trouve la pièce polynomiale qui correspond au prix actuel et prédit ce qui va se passer ensuite et il doit itérer.

RDF approxime directement la polisie de l'agent, par contre l'apprentissage Q avec monte carlo ou TD et les chaînes de Markov le font avec trop d'itérations, ce qui peut prendre beaucoup plus de temps.

1,2 oui, tout à fait exact

 
Maxim Dmitrievsky:

RDF approxime directement le polysyllabus de l'agent, par contre le q-learning avec monte carlo ou TD le fait avec trop d'itérations, ce qui peut prendre beaucoup plus de temps.

1,2 oui, tout à fait exact.

Vous voulez donc dire que le RDF est meilleur et plus rapide que le Monte Carlo, qui est absolument nécessaire pour prendre des décisions de trading instantanées à la clôture des bougies. ..... Nous sommes donc sur la bonne voie pour créer la version forex.

de "ALPHA ZERO" ...voyons voir :)))))))))