L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1016

 
SanSanych Fomenko:

J'ai apporté le lien à cause du tableau : un regard neuf sur les prédicteurs et comme un développement de la pensée d'Alexander sur l'ACF.

Fresh, tu es sérieux ? Vieux comme ... le mammouth. En quoi est-elle meilleure que la décomposition de Fourier ou autre ou que les coefficients autorégressifs et leurs valeurs ou les filtres ?

Rien de tout cela ne fonctionne.

 
Maxim Dmitrievsky:

Fresh, tu es sérieux ? Vieux comme ... le mammouth. En quoi est-il meilleur que la décomposition de Fourier ou autre ou que les coefficients autorégressifs et leurs valeurs ou les filtres

Rien de tout cela ne fonctionne.

Frais pour ce fil.

Alors, qu'avez-vous essayé ?

Quoi exactement ? Pour quelle cible ?

 
SanSanych Fomenko:

Frais pour cette branche.

Alors, qu'avez-vous essayé ?

Quoi en particulier ? Pour quelle cible ?

J'ai essayé différentes décompositions, autorégressives (pas de différence avec acf) ainsi que des coefficients.

Fonctionne sur des séries bien corrélées (prendre la 2ème ligne comme fixture, construire un VAR par exemple entre instruments, la prendre comme prédicteur et entraîner le modèle). Cela fonctionne - tant que la corrélation n'est pas rompue.

Sur le 1er instrument, il fonctionne de la même manière que beaucoup d'autres prédicteurs, avec un overfit. Les cibles sont automatiquement sélectionnées.

 
Ivan Negreshniy:

Merci, je ne m'intéresse pas tant à l'adhésion, dont je comprends qu'elle comporte des difficultés importantes, qu'au niveau, qui n'est probablement pas moins important.

"adhésion" est correct))) toute adhésion est généralement le résultat d'une connaissance fortuite et/ou d'une coïncidence, et il y a quelques gars avancés qui improvisent leur "kuklusklan" avec sa culture et ses rituels, je n'y suis que depuis quelques mois, jusqu'à ce que les informations super précieuses soient remontées, mais le fait que l'écosystème soit au moins relativement fermé est un grand plus pour de telles discussions et l'échange de pièces de rechange pour leurs infrastructures algorithmiques. je ne pense pas que cela durera longtemps avec un tel bizutage, je dois chercher des groupes similaires qui ne font pas si honte aux geks.

Vous avez écrit que ce groupe cherche une représentation unifiée des modèles du MoD, ce sont les modèles que j'aimerais voir.

Oui de telles pensées ont été exprimées à haute voix et pas seulement là, j'en ai entendu parler d'ailleurs, sur le rappel elite-trader a parlé, peut-être ici a entendu quelque chose de similaire, je propose de discuter en privé si vous voulez établir un format pour le partage des modèles, j'ai aussi des pensées sur ce sujet, en fait tous les codeurs le savent.comment le faire à leur manière, juste une question de standards, quelque chose comme le modèle fullstack C++ dll-grall qui prend des données brutes et sort des prévisions et quelques lignes de code à brancher depuis le peyton de sharp et ainsi de suite. Peu importe où.

Pour comparaison comme prêt à montrer leurs, modestes développements, j'ai formé des modèles sérialiser en format binaire ou texte et sous la forme d'un code source.

L'idée principale est d'utiliser le mécanisme de la stratégie de sortie.

 

Zhenya:

Vous avez écrit que dans ce groupe, une représentation unifiée des modèles MoD est envisagée, ce sont les modèles que j'aimerais voir.

Oui de telles pensées ont été exprimées à haute voix et pas seulement là, j'en ai entendu parler d'ailleurs, sur elit-trader je me souviens, peut-être qu'ici j'ai entendu quelque chose de similaire, je propose de discuter en privé si vous voulez comment nous pouvons ajuster le format de l'échange de modèle, j'ai aussi des pensées sur ce sujet, en fait tous les codeurs le savent.comment le faire à leur manière, juste une question de standards, quelque chose comme le modèle fullstack C++ dll-grall qui prend des données brutes et sort des prévisions et quelques lignes de code à brancher depuis le peyton de sharp, etc. Peu importe où.

Il existe par exemple PMML.

https://ru.wikipedia.org/wiki/Язык_разметки_прогнозного_моделирования

Il existe une bibliothèque pour R (également appelée pmml) qui peut convertir la plupart des modèles populaires dans ce format.

il est possible de :
1) former le modèle en R comme d'habitude
2) Convertir le modèle en pmml
3) sauvegarder le modèle pmml dans un fichier xml et le partager

Il y a quelque temps, j'ai voulu faire un script pour mql qui pourrait lire des fichiers xml avec des modèles pmml. Ensuite, je pourrais intégrer dans mon EA la prédiction de gbm formés à partir de r avec quelques lignes de code (inclure le script + pmml comme ressource). Mais je n'ai pas eu le temps de le faire.


Cela ne convient pas si vous voulez garder le modèle lui-même secret, car dans le fichier xml seront prescrits les poids des neurones ou des branches de la forêt.

Pour une confidentialité totale de l'arrangement du modèle, vous pouvez utiliser une idée d'un concours de datascientist - ils exigent un fichier contenant des centaines de milliers de prédictions. À partir de là, ils peuvent utiliser ce fichier pour interpoler les prédictions afin d'obtenir une prédiction à côté de celle qui existe déjà.

 
Dr. Trader:

Il y a le PMML, par exemple.

https://ru.wikipedia.org/wiki/Язык_разметки_прогнозного_моделирования

Il existe une bibliothèque pour R (également appelée pmml) qui peut convertir la plupart des modèles populaires dans ce format.

vous pourriez le faire de cette façon :
1) former le modèle en R comme d'habitude
2) convertir le modèle en pmml
3) sauvegarder le modèle pmml en tant que fichier xml et le partager

Il y a quelque temps, j'ai voulu faire un script pour mql qui pourrait lire des fichiers xml avec des modèles pmml. Ensuite, je pourrais intégrer dans EA la prédiction de gbm formés à partir de r avec quelques lignes de code (y compris le script + pmml comme ressource). Mais je n'ai pas eu le temps de le faire.

Il ne convient pas si vous voulez garder le modèle lui-même secret, car dans le fichier xml seront prescrits les poids des neurones ou des branches de la forêt.

Malheureusement, le secret est une exigence majeure ici))) Il s'agit du protocole d'échange obfusqué par des modèles C++ qui prennent des données brutes à l'entrée et des prévisions de sortie, de sorte que vous pouvez prendre un modèle avec la description de ses entrées et sorties, l'utiliser par exemple un mois ou pour combien de temps il est conçu sans modification (formation supplémentaire, etc.) et en tirer des conclusions (acheter, louer, etc.).

Il est souhaitable que ce soit juste un dossier avec les fichiers, différents binaires dans lesquels comprendre les détails n'est pas rentable.

Pour une confidentialité totale du dispositif de modélisation, vous pouvez utiliser l'idée d'un concours de datascientist - ils exigent un fichier avec des centaines de milliers de prédictions. À partir de là, ils peuvent utiliser ce fichier pour interpoler les prédictions afin d'obtenir une prédiction à côté de celle qui existe déjà.

Si vous voulez parler de numerai, leur approche ne fonctionnera pas, dans ce cas, par "modèle", ils entendent l'ensemble des transformations des données brutes en une prédiction, tout d'abord ce sont des signes, numerai a un concours d'étudiants pour la commercialisation de leur pièce (NMR), il ne peut pas être connecté d'une manière ou d'une autre avec les marchés réels, la dernière chose dont le fonds spéculatif aura besoin est d'externaliser la classification pure. Si vous parlez d'une autre compétition, dites-le moi.

 
Quelqu'un peut-il dire quelque chose sur cette utilisation du MO pour les séries non stationnaires : les modèles combinés? On introduit un paramètre supplémentaire qui correspond à l'état du processus et dont dépendent les paramètres du modèle. Ce paramètre est également prédit. Cette approche est utilisée dans l'article pour prédire la température. Il est certain qu'une telle complication du modèle risque d'entraîner un ajustement excessif, mais au moins nous pouvons traiter la non-stationnarité d'une manière ou d'une autre.
 

Oui.

Leur démarche n'est pas sans fondement. J'ai essayé mes modèles pour prédire des centaines de milliers d'instances aléatoires. Ensuite, pour les prédictions de la boîte noire, j'ai cherché le point le plus proche en coordonnées et j'ai utilisé son résultat comme la prédiction elle-même. Ce prototype a fonctionné, mais je pourrais l'améliorer pour de vrai - trouver 3 points les plus proches et trianguler le résultat moyen. Mais cela est coûteux en calcul, même avec un widget opencl, cela peut prendre quelques secondes pour faire la prédiction.

 
Aleksey Nikolayev:
On introduit un paramètre supplémentaire qui correspond à l'état du processus et dont dépendent les paramètres du modèle. Ce paramètre est également prédit.

C'est très similaire à la mémoire des RNN ( réseaux de neurones récurrents).

Les prédicteurs et une autre valeur (mémoire) sont introduits dans le modèle. Le modèle produit deux nombres dans la prédiction - la cible elle-même, et une nouvelle valeur de mémoire qui sera utilisée avec les prédicteurs dans la prédiction suivante. C'est pourquoi il s'agit d'un réseau récurrent, sa sortie sera utilisée comme entrée pour la fois suivante, et ainsi de suite en cercle à chaque fois.

Les RNNs dans le forex sont très suralimentés, c'est mauvais, on ne peut pas tout faire par textbook et put trades.
Mais pour un modèle ne comportant que quelques paramètres, la précision est assez bonne, comparable à celle d'un neurone normal avec une grande couche cachée, ce qui me surprend toujours.

 
Dr. Trader:

Ceci est très similaire à la mémoire dans les RNN (réseaux de neurones récurrents).

Les prédicteurs et une autre valeur (mémoire) sont introduits à l'entrée du modèle. Le modèle produit deux nombres dans la prédiction - la cible elle-même, et une nouvelle valeur de mémoire à utiliser avec les prédicteurs dans la prédiction suivante. C'est pourquoi c'est un réseau récursif, sa sortie sera utilisée comme entrée la fois suivante, et ainsi de suite en cercle à chaque fois.

Les RNNs dans le forex sont très suralimentés, c'est mauvais, vous ne pouvez pas tout faire par le manuel et mettre des trades.
Mais pour un modèle ne comportant que quelques paramètres, la précision est assez bonne, comparable à celle d'un neurone ordinaire avec une grande couche cachée, ce qui me surprend toujours.

Merci, ça y ressemble vraiment.