L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2017

 
mytarmailS:

Quelqu'un a-t-il essayé d'utiliser des "niveaux ronds" comme panneaux ?

Ou comme un moyen de traiter les prix ?

Vous pouvez marquer les prix avec des valeurs circulaires, par exemple...

Il est possible de supprimer les valeurs qui sont identiques dans une ligne...

Il s'agit d'une bonne compression de l'information, plus un filtrage ... Peut-être sera-t-il plus facile de rechercher des modèles sur un tel graphique pour un modèle ...

Je prévois de faire des prédicteurs, la logique ici est qu'il y a des grèves d'options aux niveaux, donc cela peut être utile pour le Moex.

Les graphiques sont intéressants, MQL aimerait obtenir un algorithme rapide...
 
Aleksey Vyazmikin:

À propos du brouillage - peut-être faut-il changer la façon dont l'erreur est corrigée.

Pourquoi une boîte noire, s'il n'y a que 2-3 couches, alors il est tout à fait réaliste de démêler par les coefficients. Les petits coefficients peuvent ici être grossièrement réduits et mis à zéro, ce qui réduira le nombre d'entrées du neurone.

Que voulez-vous dire par "vous devriez peut-être changer" ? Apprenez les mathématiques et le fonctionnement des polices d'activation. Ou les développeurs du réseau sont-ils si stupides qu'ils ne sauraient pas...

Pourquoi se lancer dans tout cela et réinventer la roue sans diplôme ni formation mathématique ? C'est une stupide perte de temps. Il existe des technologies et il est écrit comment elles doivent être utilisées.

 
Maxim Dmitrievsky:

Que voulez-vous dire par "peut avoir besoin de changer" ? Apprenez les mathématiques et le fonctionnement des fonctions d'activation. Ou les développeurs du réseau sont si stupides qu'ils n'auraient pas compris.

parce que c'est une perte de temps, rien que des spéculations et rien de précis. Vous avez simplement modifié l'auto-codeur, ajouté des touches de raccourci à un regroupement ou à NS et nous avez montré les résultats. C'est tout. Vous n'avez pas besoin d'élaborer quoi que ce soit. Les architectures profondes ne sont pas construites pour être analysées, mais pour réduire la routine analytique.

Pourquoi se lancer dans tout cela et réinventer la roue sans diplôme ni formation mathématique ? C'est une stupide perte de temps. Il existe des technologies et il est écrit comment elles doivent être utilisées, c'est tout. Beaucoup de gens y travaillent.

Si des solutions prêtes à l'emploi résolvaient les tâches que je leur ai assignées, je n'aurais rien à inventer.

Je prépare actuellement un grand échantillon et je vais entraîner de nombreux modèles sur CatBoost. J'ai quelques idées sur la façon d'estimer la qualité du modèle pour une application en temps réel réussie - je partagerai les résultats de mes recherches.

 
Aleksey Vyazmikin:

Si des solutions prêtes à l'emploi pouvaient résoudre les tâches que je leur ai confiées, il n'était pas nécessaire d'inventer quoi que ce soit.

Maintenant, je prépare le grand échantillon et je vais former un grand nombre de modèles sur CatBoost, il y a des idées sur la façon d'estimer la qualité du modèle dans le but de leur application ultérieure réussie en temps réel - je vais partager les résultats de la recherche.

Je ne pense pas que catboost soit la meilleure solution pour la prévision des séries temporelles, il ne fonctionne pas avec les séquences.

vous pouvez jouer avec la classification, mais cela ne servira à rien
 
Maxim Dmitrievsky:

Catbust n'est pas adapté à la prévision des séries chronologiques, il ne fonctionne pas avec les séquences.

purement pour jouer avec la classification, mais cela ne sert à rien

Et comment déterminez-vous si ça marche ou pas ?

J'ai des modèles qui sont rentables depuis un an (formés il y a environ un an) dans le testeur - suggérez-vous qu'ils sont aléatoires ?

Oui, CatBoost est inférieur à un arbre génétique avec des feuilles de post-traitement, mais il est très rapide à entraîner.

Et qu'est-ce qui fonctionne ? La N.S. ?

 
Aleksey Vyazmikin:

Comment savoir si ça marche ou pas ?

J'ai des modèles qui ont été rentables pendant un an (formés il y a environ un an) dans le testeur - suggérez-vous qu'ils sont un coup de chance ?

Oui, CatBoost est inférieur à un arbre génétique avec des feuilles de post-traitement, mais il est très rapide à entraîner.

Et qu'est-ce qui marche - NS ?

Je ne l'ai pas définie, l'architecture elle-même est destinée à d'autres tâches.

Oui, c'est tout à fait aléatoire.

rien ne fonctionne encore)

 
Aleksey Vyazmikin:

Les prédicteurs ne sont pas des prix à l'état brut - beaucoup de points relatifs qui peuvent être similaires...

Je ne suis pas sûr que le dépistage par corrélation soit efficace...

Pourquoi ne pas essayer ? Un résultat négatif est également un résultat (dans le sens d'une réflexion à poursuivre).

J'ai même proposé une fois la formule du coefficient de corrélation : C = (n1 - n2)/n, où n est le nombre de barres où au moins un des deux systèmes donne le signal de la transaction, n1 est le nombre de barres où les signaux sont donnés par les deux systèmes simultanément et dans la même direction et n2 est le nombre de barres où les signaux sont donnés par les deux systèmes simultanément et dans des directions opposées.

Cette matrice peut être utilisée pour le regroupement, l'éclaircissement et la formation de portefeuilles.

 
Maxim Dmitrievsky:

Je ne l'ai pas déterminé, mais l'architecture elle-même est destinée à d'autres tâches.

Oui, c'est tout à fait aléatoire.

jusqu'à présent, rien ne fonctionne)

Bien sûr, il n'y a pas d'affinage des séries temporelles ici, donc les prédicteurs doivent contenir des informations sur les coordonnées X, et pas seulement sur les coordonnées Y.

Si l'on apprend à identifier ces modèles aléatoires, on devient un pro.

J'ai plus de 60% des feuilles échantillonnées les années précédentes qui fonctionnent, ce qui est très, et à mon avis, confirme le bien-fondé de l'idée d'une approche de traitement des données mal classées. Si plus de gens travaillaient sur l'idée, le résultat serait meilleur, mais tout le monde a son bling.

 
Aleksey Vyazmikin:

Bien sûr, il n'y a pas d'affinage des séries temporelles ici, donc les prédicteurs doivent contenir des informations sur les coordonnées X, et pas seulement sur les coordonnées Y.

Si l'on apprend à identifier de tels modèles aléatoires, on fera des bénéfices.

J'ai plus de 60% des feuilles échantillonnées les années précédentes qui fonctionnent, ce qui est très, et à mon avis, confirme le bien-fondé de l'idée d'une approche de traitement des données mal classées. Si plus de personnes travaillaient sur l'idée, le résultat serait meilleur, mais chacun a son bling-bling.

Comme, l'article voulait... Esquissez l'essentiel de l'approche. Je ne comprends toujours pas ce que vous faites :D

Je suis d'avis que les caractéristiques doivent être extraites automatiquement par le modèle lui-même à partir des séries temporelles (s'il y en a). Et il n'est pas nécessaire de faire quoi que ce soit manuellement. Les incréments sont suffisants. La question est celle de l'architecture. Par exemple, comme dans le PNL (traitement neuronal du langage), le réseau neuronal détermine lui-même le contexte dans les séquences de mots, c'est-à-dire la relation entre les échantillons de séries temporelles.

 
Aleksey Nikolayev:

Pourquoi ne pas essayer ? Un résultat négatif est également un résultat (dans le sens d'une réflexion à poursuivre).

Je crois même avoir proposé une fois la formule du coefficient de corrélation : C = (n1 - n2)/n, où n est le nombre de barres où au moins un des deux systèmes donne un signal de négociation, n1 est le nombre de barres où les signaux sont donnés par les deux systèmes simultanément et dans la même direction et n2 est le nombre de barres où les signaux sont donnés par les deux systèmes simultanément et dans des directions opposées.

La matrice de ces ratios peut être utilisée pour le regroupement, l'éclaircissement et la constitution de portefeuilles.

Qu'est-ce que cela a à voir avec les prédicteurs ?

Je fais quelque chose de similaire pour la sélection des feuilles, mais il y a un hic : le nombre de réponses des feuilles est différent dans l'échantillon et nous devons prendre en compte le fait que des feuilles avec des réponses similaires mais de longueur différente peuvent appartenir au même groupe.