L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 582

 
Grigoriy Chaunin:

J'ai appris que l'apprentissage automatique utilise une chose comme la construction de caractéristiques. Le prix ne suffit pas pour aller loin. Dans notre cas, l'attribut est une fonction du prix. La question est de savoir quelles fonctions utiliser. Il n'est pas possible de se contenter de passer par des indicateurs avec des paramètres différents. Je suis intéressé par des documents sur ce sujet. Google produit généralement beaucoup de bêtises, ou plutôt ne donne rien sur le sujet. J'ai cherché sur Runet. Peut-être que quelqu'un connaît les documents sur le sujet.

PS. Vous devez commencer par le début. C'est alors que vous avez appris à construire des signes non aléatoires, vous pouvez passer à leur sélection.

Regarde ça, ça, ça et peut-être ça.

Bonne chance et lisez la suite.

 
Maxim Dmitrievsky:

Maxim, lisez-vous attentivement les messages deVizard_? Ce type fait des trucs géniaux - regardez mon fil de discussion.

 
Vladimir Perervenko:
Tu devrais voir ça, ça, ça et peut-être ça.

Bonne chance et lisez la suite.


J'ai tout lu, le problème est que l'importance des caractéristiques varie beaucoup d'un échantillon à l'autre, et toutes ces manipulations sont bonnes pour l'analyse statistique et non pour le trading réel.

une simple optimisation, en d'autres termes.

Désolé :D

 
Alexander_K2:

Maxim, lisez-vous attentivement les messages deVizard_? Ce type fait des trucs géniaux - regardez mon fil de discussion.


oui, mais il est tellement excellent que je ne le comprends pas à ce stade :) + il a écrit qu'il est impossible de gagner plus de 20% par an... Je suppose qu'il faut toujours commencer par de telles déclarations et ensuite entrer dans les détails :)

 
Vladimir Perervenko:
Regarde ça, ça, ça et peut-être ça.

Bonne chance et lisez la suite.


Je me suis rendu compte que je ne trouvais pas de réponse à ma question. Là où j'ai pu lire, on dit que c'est un art. Le problème est qu'il y a beaucoup d'indicateurs et encore plus de paramètres qui peuvent être définis. Dois-je essayer toutes les combinaisons possibles en utilisant la méthode de recherche ? Je ne sais pas comment faire. Je ne sais pas comment faire. Vous devez toujours créer des règles de sélection initiales et ensuite vous devez travailler avec les indicateurs sélectionnés par la méthode de sélection des caractéristiques.

 
Maxim Dmitrievsky:

J'ai tout lu, le problème est que l'importance des caractéristiques varie beaucoup d'un échantillon à l'autre,

Vous êtes sûr que les signes existent ? Ou, par exemple, il peut y en avoir plusieurs. Naturellement, dans ce cas, vous ne pourrez pas les repérer par une recherche et des combinaisons, et le seul moyen est que le système les détermine par lui-même. Dans cette optique, la recherche de certains prédicteurs et de leurs combinaisons ressemble à une entreprise folle (enfin, nous les trouverons toujours avec succès dans l'histoire, bien sûr)).

Je ne vois qu'une seule solution : le système doit identifier cet ensemble d'attributs par lui-même au cours de la formation, et non pour vous, mais pour lui-même. Et notre tâche consiste uniquement à préparer les données pour la formation. La seule tâche de cette préparation est d'indiquer au système certaines données a priori, réduisant ainsi le champ d'application du système. Ou, en d'autres termes, de couper les intervalles où les transactions sont clairement inappropriées.

Nous devons seulement énoncer clairement le problème, mais ne pas essayer de le résoudre pour le système. À mon avis, c'est trop compliqué pour essayer de le résoudre par la force brute.

 
SanSanych Fomenko:

Je tiens à souligner que l'ada donne de meilleurs résultats que le rf : à la fois plus précis et moins enclin au surentraînement. Et vous devriez utiliser ada, pas rf.

Il ne s'agit donc pas seulement d'empiler des choses.

GARCH est trop compliqué. Jusqu'à présent, j'ai parcouru ARIMA, ainsi que GARCH et la distribution.

SanSanych nous a emmenés dans les forêts denses et aléatoires et nous y a laissés. Il dit maintenant qu'il n'était pas du tout nécessaire d'aller dans la forêt. Eh bien, tout comme Susanin.

Et j'étais sur le point de les faire).

 
Yuriy Asaulenko:

Vous êtes sûr que les signes existent ? Ou, par exemple, il peut y en avoir plusieurs. Naturellement, dans ce cas, vous ne pourrez pas les repérer par une recherche et des combinaisons, et le seul moyen est que le système les détermine par lui-même. Dans cette optique, la recherche de certains prédicteurs et de leurs combinaisons ressemble à une entreprise folle (enfin, nous les trouverons toujours avec succès dans l'histoire, bien sûr)).

Je ne vois qu'une seule solution : le système doit identifier cet ensemble d'attributs par lui-même au cours de la formation, et non pour vous, mais pour lui-même. Et notre tâche consiste uniquement à préparer les données pour la formation. La seule tâche de cette préparation est d'indiquer au système certaines données a priori, réduisant ainsi le champ d'application du système. Ou, en d'autres termes, de couper les intervalles où les transactions sont clairement inappropriées.

Nous devons seulement énoncer clairement le problème, mais ne pas essayer de le résoudre pour le système. Je pense que c'est trop compliqué pour essayer de le résoudre par la force brute.

Je ne suis jamais sûr de rien :)

Bon, disons que la principale caractéristique est le prix lui-même. Notre tâche (disons, la classification) est de trouver une telle combinaison d'achat/vente, qui serait stable sur l'historique et donnerait du profit, n'est-ce pas ? et le correspondant à ces transactions revient sous la forme d'un certain modèle. Dans le même temps, vous utilisez, par exemple, un certain nombre de fonctionnalités (une vingtaine). Et comment faire pour que le système lui-même sélectionne ces attributs ?

Il s'agit essentiellement d'une simple tâche d'optimisation qui n'a rien à voir avec l'"intelligence artificielle". J'ai beaucoup de versions de ces systèmes, j'ai terminé la dernière hier. Le résultat est le même - des performances hors échantillon instables, et la possibilité d'atteindre une précision de presque 100 % lors de l'apprentissage, et n'importe quelle précision (à choisir), mais une précision réduite ne signifie pas moins de surentraînement. Et vous n'avez pas besoin d'utiliser R et des modèles complexes et abscons, le résultat sera exactement le même.

 
Maxim Dmitrievsky:

oui, mais c'est tellement supérieur que je ne vais pas m'y attarder à ce stade :) + il a écrit qu'il est impossible de gagner plus de 20% par an... Je suppose qu'il faut toujours commencer par de telles déclarations et ensuite entrer dans les détails :)

Je ne sais pas. J'ai gagné 20% en 2,5 jours. Et je l'ai fait sur deux transactions perdantes.
 
Maxim Dmitrievsky:

Je ne suis jamais sûr de rien :)

Bon, disons que l'attribut principal est le prix lui-même. Notre tâche (disons les classifications) est de trouver une telle combinaison d'achat/vente, qu'elle soit stable sur l'historique et donne du profit, n'est-ce pas ? Dans le même temps, vous utilisez, par exemple, un certain nombre de fonctionnalités (une vingtaine). Quelle en est la raison ? Et comment faire pour que le système sélectionne ces attributs ?

Où as-tu trouvé ça ? Où l'avez-vous trouvé ?

Je n'utilise pas de signes pour le système. Je n'utilise les signes que pour couper des zones de la série temporelle (et de la formation et du fonctionnement), où il n'est pas nécessaire d'analyser quoi que ce soit.

Le NS lui-même mâche directement les séries temporelles.

J'ai déjà écrit et même cité un livre -NS effectue des tâches hautement spécialisées en combinaison avec les méthodes habituelles.