L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1806

 

Bonjour à tous

J'utilise l'apprentissage par renforcement profond (en utilisant Python) et l'apprentissage est déjà en cours (comme indiqué) :

Trabalho de aprendizado por reforço profundo


Aujourd'hui, je n'utilise les moyennes mobiles que pour observer le marché et apprendre.

Ce modèle effectue plusieurs actions (acheter, vendre et attendre). Ainsi, après l'entraînement, le modèle converge vers de nombreuses actions pour ne "attendre" que les meilleures actions.

Cependant, dans ce modèle, l'apprentissage est très lent car il utilise tous les ticks.

Que suggérez-vous comme données d'observation du marché pour améliorer la précision et réduire les pertes ?

Toutes mes excuses pour mes erreurs de traduction.

 
ipsec:

Que proposez-vous comme données d'observation du marché pour améliorer la précision et réduire les pertes ?


1) Créez un modèle de marché et formez-y un agent, cela réduira la dimensionnalité et accélérera la formation, même ici cela a été fait ainsi

2) Choix des caractéristiques, c'est comme on dit une tâche créative, s'il y en a beaucoup, cela aidera aussi à réduire la dimensionnalité, il y en a beaucoup, du clustering au pca, umap etc.

Si nous prenons des niveaux de soutien et de résistance et décidons d'acheter ou de vendre uniquement si le prix se situe à ce niveau, nous pouvons réduire l'échantillon d'entraînement de plusieurs ordres de grandeur.

Vous pourriez combiner tous les points ensemble .

 
ipsec:

Bonjour à tous

J'utilise l'apprentissage par renforcement profond (en utilisant Python) et l'apprentissage est déjà en cours (comme indiqué) :


Aujourd'hui, je n'utilise les moyennes mobiles que pour observer le marché et apprendre.

Ce modèle effectue plusieurs actions (acheter, vendre et attendre). Ainsi, après l'entraînement, le modèle converge vers de nombreuses actions pour ne "attendre" que les meilleures actions.

Cependant, dans ce modèle, l'apprentissage est très lent car il utilise tous les ticks.

Que suggérez-vous comme données d'observation du marché pour améliorer la précision et réduire les pertes ?

Pardonnez mes erreurs de traduction

Réduisez les tics à une erreur acceptable.

Identifiez les zones où l'erreur dépasse l'erreur acceptable lorsque toutes les tiques sont retirées.

Entraînez le modèle à trouver ces zones, s'il le peut, de cours)))).

 
Maxim Dmitrievsky:

Eh bien, ce sont des modèles d'espace d'état, ils fonctionnent aussi de temps en temps.

Et vous pouvez lier l'objectif à un changement de tendance. La tâche n'est pas de faire du profit, mais de reconnaître et de prévoir. Il est clair qu'il s'agit de tâches complètement différentes, NS n'est pas capable de reconnaître et de prédire en même temps)))). Le bénéfice cible, l'équilibre reconnaît les points d'inflexion indirectement, sans reconnaissance directe.

Si nous prenons des renversements en zigzag quotidiens, quadri-horaires, horaires (ou tout autre) et que nous examinons par exemple chaque cadre temporel 120 barres et 120 ticks avant et après le point de retournement. Les quotidiens et les 4h ne regardent que jusqu'au prochain et précédent renversement ou ne savent pas comment faire mieux. Il faut alors bien sûr écrire quelque chose manuellement pour préparer les données.

Ou existe-t-il quelque chose de similaire ?

 
Valeriy Yastremskiy:

Vous pouvez aussi lier l'objectif à un changement de tendance. La tâche n'est pas de faire du profit, mais de reconnaître et de prévoir. Il est clair qu'il s'agit de tâches complètement différentes, NS ne peut pas reconnaître et prédire en même temps)))). Le bénéfice cible, la balance reconnaît les points d'inflexion indirectement, sans reconnaissance directe.

Si nous prenons des renversements en zigzag quotidiens, quadri-horaires, horaires (ou tout autre) et que nous examinons par exemple chaque cadre temporel 120 barres et 120 ticks avant et après le point de retournement. Les quotidiens et les 4h ne regardent que jusqu'au prochain et précédent renversement ou ne savent pas comment faire mieux. Il faut alors bien sûr écrire quelque chose manuellement pour préparer les données.

Ou existe-t-il quelque chose de similaire ?

Elle est très facilement vérifiée par la présence d'une régularité entre les ruptures en zigzag, c'est-à-dire une réduction de l'entropie. S'il y a une différence avec qqn, alors vous pouvez regarder. Mais je n'ai pas trouvé de telles choses. Il existe des progiciels spéciaux, utilisés en médecine pour analyser l'ADN et dériver des formules de médicaments. Entropie de réarrangement, par exemple, ou cas plus compliqués avec des approximateurs, des optimiseurs comme le q-learning.
 
ipsec:

Bonjour à tous

J'utilise l'apprentissage par renforcement profond (en utilisant Python) et l'apprentissage est déjà en cours (comme indiqué) :


Aujourd'hui, je n'utilise les moyennes mobiles que pour observer le marché et apprendre.

Ce modèle effectue plusieurs actions (acheter, vendre et attendre). Ainsi, après l'entraînement, le modèle converge vers de nombreuses actions pour ne "attendre" que les meilleures actions.

Cependant, dans ce modèle, l'apprentissage est très lent car il utilise tous les ticks.

Que suggérez-vous comme données d'observation du marché pour améliorer la précision et réduire les pertes ?

Désolé pour mes erreurs de traduction.

Je pense que le renforcement profond n'est utilisé que pour des tâches à plusieurs variables, et non pour des tâches à 1-5 dimensions, comme les marchés financiers. Vous pouvez donc essayer des méthodes plus simples et plus rapides comme REINFORCE avec un réseau neuronal ou un approximateur linéaire.

 
Maxim Dmitrievsky:
Cela se vérifie très facilement par la présence d'une régularité entre les ruptures en zigzag, c'est-à-dire une réduction de l'entropie. S'il y a une différence avec qqn, alors vous pouvez regarder. Mais je n'ai pas trouvé de telles choses. Il existe des progiciels spéciaux, utilisés en médecine pour analyser l'ADN et dériver des formules de médicaments. Par exemple, l'entropie de permutation ou des cas plus compliqués avec des approximateurs, des optimiseurs comme le q-learning.

Non, la régularité des fractures ne fonctionne pas. )))) Il faut attraper quelque chose avant une fracture sans tenir compte de la régularité). En général, il y a une chance d'attraper les fractures qui présentent les mêmes différences que la SB avant la fracture. Vous ne pouvez pas faire ça avec les paquets ordinaires. Et je ne pense pas qu'il y ait quoi que ce soit de significatif pour une rupture au milieu de la tendance, à part une durée de tendance trop longue)))).

 
Valeriy Yastremskiy:

Non, la régularité des fractures ne fonctionne pas. )))) Il faut attraper quelque chose avant la fracture, sans tenir compte de la régularité) En général, il y a une chance d'attraper les fractures qui présentent les mêmes différences que le SB avant la fracture. Vous ne pouvez pas faire ça avec les paquets ordinaires. Et je ne pense pas qu'il y ait quoi que ce soit de significatif pour une rupture au milieu de la tendance, si ce n'est que la tendance est trop longue)))).

Je vois, par analogie avec la corrélation TF. Peut essayer

 
Maxim Dmitrievsky:

Je pense que le renforcement profond n'est utilisé que pour des tâches à plusieurs variables, pas pour des tâches à 1-5 dimensions, comme les marchés financiers. Vous pouvez donc essayer des méthodes plus simples et plus rapides comme REINFORCE avec un réseau neuronal ou un approximateur linéaire.

Si vous examinez différentes TF, vous obtiendrez davantage de dimensions)))).

 
Maxim Dmitrievsky:

Je vois, par analogie avec la corrélation TF. On peut essayer.

Oui. Toutes les TF doivent être examinées, il est impossible de déterminer lesquelles sont nécessaires en même temps. Peut-être qu'une ou deux TF seraient mieux, ou peut-être que toutes sont nécessaires))). Il est difficile d'y réfléchir.))