L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 221

 
Andrey Dik:
Probablement l'opinion la plus sensée et la plus objective de R que j'ai vue dernièrement. La pensée conventionnelle c'est ce dont souffrent les vieux fans de R, qui que vous preniez même de ce forum, ils pensent tous pareil, vous pouvez même les confondre entre eux si ce n'est de regarder les surnoms, ils raisonnent de la même façon.

Lorsque l'on discute de R, il est impossible de se passer de vous, bien que l'on ne sache pas du tout ce que vous faites ici.

Mais puisque vous êtes ici, sur votre exemple.

Vous avez développé un algorithme génétique, vous savez comment, peut-être mieux que quiconque dans le monde.

Je ne sais pas comment écrire des algorithmes génétiques. Et ce n'est pas parce que je ne peux pas le faire, mais parce que je n'en ai pas besoin.

Laissez-moi vous expliquer.

Dans un système de trading réel, j'utilise la fonction rfe (backtesting des prédicteurs de caret). Ne donne pas de très bons résultats. Dois-je utiliser votre algorithme génétique ? Cent fois non, car le même caret a la fonction gaf (sélection de prédicteurs par algorithme génétique). Mais en plus de cela caret a une autre fonction saf (sélection de prédicteurs par robustesse simulée - recuit), qui est beaucoup plus efficace dans MON PROBLÈME, QUE l'ALGORITHME GÉNÉTIQUE. Le problème dans mes systèmes de trading est un, et les outils sont trois, avec la difficulté de remplacer l'un par l'autre par trois lettres. En outre, et c'est peut-être le plus important, ces trois fonctions sont liées à d'autres fonctions dont j'ai besoin.

Je n'ai pas du tout le problème de la programmation d'un algorithme génétique. Mais lorsque je résous mes propres problèmes, je peux facilement utiliser divers algorithmes, y compris l'algorithme génétique. En réalité, le problème est la sélection des prédicteurs, c'est un problème de grande capacité de calcul et pour le résoudre, outre le R répertorié, il y a un grand nombre d'outils qui sont programmés NON en R.

 
J.B :

Cela dépend du type de recherche. Si l'étudiant fait des recherches pour réussir son travail de fin d'études, alors oui, il est beaucoup plus facile de prendre une fonction dans l'étagère, de l'exécuter et d'obtenir un rapport standard avec de beaux graphiques, pas de questions ici.

Si la recherche d'un ingénieur quantique, dans un bureau financier qui prend de l'argent du marché, pas seulement par des commissions, ou par une technologie proche du marché, la situation est différente. En règle générale, dans les bons bureaux, vous construisez en 5 ans votre propre infrastructure de trading, où il y a 95 % de tous les outils nécessaires, qui sont emballés de manière pratique et que vous pouvez utiliser pas beaucoup plus compliqué que dans R...........

Oui tout est clair et je suis d'accord avec vous, mais vous parlez de production, mais il n'y a pas de quons ici, et il n'y a pas de personnes avec des infrastructures qui sont faites depuis 5 ans.... et avant que cette infrastructure ne soit faite, il y a eu une recherche initiale, c'est là que la plupart des gens sont, ils cherchent des idées, vous parlez de production...

comme je le vois, le schéma est

1) recherche d'une idée de travail

2) recherche d'une idée de travail

3) la recherche d'une idée de travail

4) réaliser des ventes et autres infrastructures pour l'idée (production)

Maintenant, vous opposez le premier point au quatrième - et c'est un peu une imposture, vous voyez ce que je veux dire ?

et bien, pour le premier point, lorsque vous avez besoin de passer rapidement en revue un tas d'idées, R est une chose, pour le quatrième point c'est c++ naturellement.

 

SanSanych Fomenko:

Je ne sais pas comment écrire des algorithmes génétiques. Et pas parce que je ne peux pas le faire, mais parce que je n'en ai pas besoin.

Je m'en suis souvenu parce que lors de la présélection, on m'a demandé d'écrire une bulle de tri ou plus rapidement, sans regarder sur internet bien sûr, je l'ai écrit, cela semblait être une tâche enfantine, mais ensuite on m'a dit que 70% des gens ne peuvent pas le faire. Je pense que c'est correct, il ya un certain ensemble d'algorithmes de base qui devrait savoir comme 2 + 2 = 4 spécialiste dans tel ou tel domaine, car il augmente considérablement, au moins la capacité à les utiliser efficacement, sans parler que de modifier et de créer des analogues plus efficaces. Quantum devrait être capable d'écrire MLP, baes, Knn, forest, etc. sans regarder. C'est 2+2=4 pour le quant.

SanSanych Fomenko:

J'utilise la fonction rfe (back selection des prédicteurs à partir de caret). Ne donne pas de très bons résultats. Il y a une fonction gaf...

Eh bien, oui, c'est exactement le genre de discours que tiennent les consommateurs avec des "dizaines de milliers de fonctions" qu'ils ne comprennent pas mais qu'ils essaient. Malheureusement tout ce qu'ils vous donnent est déjà essayé et il n'y a "pas de poisson là", surtout en ce qui concerne l'algotrading, toute cette richesse de fonctions est illusoire, l'algotrading dans son essence ne peut pas être coquelicot, il faut être capable et aimer inventer une nouvelle génération de vélo, sinon ils vous emmèneront dans une "voiture de luxe" seulement dans une décharge ou au cimetière, vous ne conduisez pas))).

 
mytarmailS:

Oui tout est clair et je suis d'accord avec vous, mais vous parlez de production, mais il n'y a pas de quons ici, et il n'y a pas de personnes avec l'infrastructure qui est faite depuis 5 ans.... et avant que cette infrastructure ne soit faite, il y a eu une recherche initiale, c'est là que la plupart des gens sont, ils cherchent des idées, vous parlez de production...

comme je le vois, le schéma est

1) recherche d'une idée de travail

2) recherche d'une idée de travail

3) la recherche d'une idée de travail

4) réaliser des ventes et autres infrastructures pour l'idée (production)

Maintenant, vous opposez le premier point au quatrième - et c'est un peu une imposture, vous voyez ce que je veux dire ?

Eh bien, pour le premier point, lorsque vous avez besoin de passer rapidement en revue un tas d'idées, R est une chose, sur le quatrième point c'est c++ naturellement.

Schéma erroné, comme dans l'algotradition, de nombreux processus sont entrelacés et interdépendants. Vous ne pouvez pas chercher une idée en faisant abstraction des données et d'une compréhension approfondie des algorithmes qui les traitent. Ainsi, par exemple, "chercher des idées" sur les chandeliers minute d'une paire de devises, c'est..... Rien n'est"un", le carnet d'ordres du marché russe en est un autre, le carnet d'ordres de dizaines de bourses et de fournisseurs de données macroéconomiques de premier plan dans le monde en est un autre, etc. Il en va de même pour le traitement, l'idée et les outils sont étroitement liés, l'approche incrémentale a du sens, mais pas celle du "vide", lorsqu'une idée est recherchée comme un cheval sphérique et mise en œuvre avec C++. Par exemple, comment pensez-vous que l'idée demodéliser la dynamique du carnet d'ordres à haute fréquence avec des machines à vecteurs de support sera pratique à mettre en œuvre ? Essayez-le et dites-moi ce que vous en pensez. Je peux seulement dire que dans l'article c'est aussi 2+2+4 mais en réalité c'est beaucoup plus compliqué.

 
J.B :

Une fois a travaillé à un bureau gamediver un an, je me suis souvenu de cela, comme il ya à l'entretien préliminaire a demandé d'écrire une bulle de tri ou plus rapide, sans regarder l'Internet bien sûr, j'ai écrit, je pensais que c'était enfantin TOR, mais alors j'ai été éclairé que 70% des gens ne peuvent pas le faire. Je pense que c'est correct, il ya un certain ensemble d'algorithmes de base qui devrait savoir comme 2 + 2 = 4 spécialiste dans tel ou tel domaine, car il augmente considérablement, au moins la capacité à les utiliser efficacement, sans parler que de modifier et de créer des analogues plus efficaces. Quantum devrait être capable d'écrire MLP, baes, Knn, forest, etc. sans regarder. C'est 2+2=4 pour le quant.

Je ne veux pas passer pour un non-détective, mais c'est un peu bizarre qu'un pro comme vous, et même travaillant à la fondation quantique cette année, ne sache pas ce qu'est la corrélation croiséehttps://www.mql5.com/ru/forum/71816.

Индикатор опережения\отставания временного ряда
Индикатор опережения\отставания временного ряда
  • www.mql5.com
Индикатор опережения\отставания временного ряда.
 
J.B :

Ce n'est pas le bon schéma, car dans le trading algorithmique, de nombreux processus sont entrelacés et interdépendants. Vous ne pouvez pas chercher une idée indépendamment des données et d'une compréhension profonde des algorithmes pour les traiter. Ainsi, par exemple, "chercher des idées" sur les chandeliers minute d'une paire de devises, c'est..... Rien n'est"un", le carnet d'ordres du marché russe en est un autre, le carnet d'ordres de dizaines de bourses et de fournisseurs de données macroéconomiques de premier plan dans le monde en est un autre, etc. Il en va de même pour le traitement, l'idée et les outils sont étroitement liés, l'approche incrémentale a du sens, mais pas celle du "vide", lorsqu'une idée est recherchée comme un cheval sphérique et mise en œuvre avec C++. Par exemple, comment pensez-vous que l'idée demodéliser la dynamique du carnet d'ordres à haute fréquence avec des machines à vecteurs de support sera pratique à mettre en œuvre ? Essayez-le et dites-moi ce que vous en pensez. Je peux seulement dire que dans l'article c'est aussi 2+2+4, en réalité tout est beaucoup plus compliqué.

Je suis d'accord à propos de hft, mais je ne comprends pas pourquoi vous le citez toujours en exemple, vous ne pouvez pas vous empêcher de savoir que de telles dates ne sont pas disponibles pour tout le monde, aucun de ceux présents ici n'a d'argent pour acheter des porteurs d'ordre de l'Ouest et des chaînes rapides.

Pourquoi en parler et en faire un exemple ?

 
mytarmailS:

Je ne veux pas passer pour un détective, mais il est étrange qu'un pro comme vous, qui travaille dans un fonds quantique, ne sache pas ce qu'est la corrélation croisée cette annéehttps://www.mql5.com/ru/forum/71816.

Oh, allez... Je résolvais un problème assez complexe à l'époque, et j'étais assis à la maison, malade, ce n'était pas commode de demander à des collègues, j'avais un mois pour trouver un emploi, puis je me suis débrouillé tout seul, et après un certain temps Rev. Combinator a nommé exactement la même solution. L'autre question est que si vous aviez été confronté à un tel problème, vous ne l'auriez probablement pas résolu, car ici vous devez savoir comment la corrélation croisée entre les lignes est mise en œuvre à des niveaux bas et deviner comment l'utiliser, R n'a pas de telle fonction "lagging row", et surtout, vous n'auriez tout simplement pas posé un tel problème)))). Donc vous n'êtes pas un quant dans un fonds de couverture.

 

SanSanych Fomenko:


Lorsque vous faites la promotion du langage R comme moyen de résoudre efficacement les tâches commerciales, vous mentionnez constamment la facilité d'utilisation de ses outils et le large éventail de ses capacités. Personne ne le conteste. Mais vos déclarations montrent clairement votre ignorance des principes de cette langue.

Bien sûr, vous êtes un bon navigateur de ses fonctions, et vous savez lesquelles sont nécessaires à la résolution de vos tâches, mais vous êtes évidemment complètement ignorant des mécanismes cachés derrière ces noms. Vous ne savez pas comment ils fonctionnent. De plus, vous ne voulez pas le savoir et vous dissuadez les autres de le faire.

Vous êtes un utilisateur de R. Vous aimez cet outil parce qu'il est facile à utiliser mais pas pour son efficacité à résoudre des tâches concrètes dont vous ne savez rien et que vous n'aspirez pas à connaître.

Comprenez qu'un développeur se distingue d'un utilisateur précisément par son désir de comprendre le mécanisme et d'atteindre une efficacité maximale de son fonctionnement.

Cet objectif ne peut être atteint qu'avec une connaissance absolue du sujet. La facilité de créer quelque chose n'est pas pertinente ici.

En fait, vous invitez les développeurs à oublier leur travail et à devenir de simples utilisateurs. Profitez de la facilité d'utilisation des outils que vous leur fournissez et oubliez complètement d'étudier les principes de leur travail.

Avec une telle approche, l'efficacité peut être oubliée, et les développeurs ne peuvent pas l'oublier.

Si vous commencez à comprendre les rouages des mécanismes voilés dans R, vous découvrirez peut-être qu'ils ne sont pas aussi parfaits qu'ils peuvent le paraître pour un dilettante enthousiaste.

Avec ce post, j'essaie d'articuler un point de vue qui s'oppose au vôtre, mais je pourrais me tromper sur d'autres. Cependant, c'est ainsi que je vois le problème.

 
mytarmailS:

Je suis d'accord sur le hft, mais je ne comprends pas pourquoi vous le citez toujours en exemple, vous savez que de telles dates ne sont pas accessibles à tout le monde, personne ici n'a l'argent pour acheter des order-getters de l'ouest et des chaînes rapides.

Pourquoi en parler et le donner en exemple ?

Ne généralisez pas. Vous pouvez commencer par l'OL du marché russe. Et le HFT comme il ne fonctionne que. HFT et initiés.
 
J.B :

Allez... Je résolvais un problème assez complexe à l'époque, et j'étais assis chez moi, malade, ce n'était pas pratique de demander à des collègues, j'avais un mois pour trouver un emploi, puis j'ai trouvé la solution moi-même, et après un certain temps, M. Kombinator a dit exactement la même solution. Combinator a nommé exactement la même solution. L'autre question est que si vous aviez été confronté à un tel problème, vous ne l'auriez probablement pas résolu, car ici vous devez savoir comment la corrélation croisée entre les lignes est mise en œuvre à des niveaux bas et deviner comment l'utiliser, R ne dispose pas d'une telle fonction "lagging row", et surtout, vous n'auriez tout simplement pas posé un tel problème)))). Donc vous n'êtes pas un quant dans un hedge fund.

Je ne suis pas aussi bête que tu le penses, note le mot corrélation croisée, je l'ai dit dans ta branche, mais c'est ce que tu as fait, quand j'ai appris la corrélation croisée j'ai eu la même idée que toi sur la comparaison de séries(donc tu n'es pas seul et pas unique dans ce domaine) et c'était bien avant ta branche, mais je n'ai jamais eu l'occasion de le faire....

J.B :
Ne pas généraliser. Vous pouvez commencer par l'OL sur le marché russe. Et le HFT comme il ne fonctionne que. HFT et initiés.

vous avez peut-être raison.... mais il me semble que les OL disponibles sont écrites à des vitesses plus rapides que plaza, et obtenir ce test sur un et la réalité sera différente, je peux me tromper mais c'est l'impression que j'ai eu.