L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1762

 
Aleksey Vyazmikin:

J'ai maintenant 16 cellules 4x4, il y a une fenêtre dynamique, et je compte combien de barres se sont fermées dans chacune des cellules - pour dire les choses de manière primitive.

Oui, c'est à peu près ce que j'ai compris, c'est +- comme dans "text mining" quand on compte les fréquences des mots ou des lettres dans un texte.

Aleksey Vyazmikin:

La cible doit être générée par le conseiller expert, sinon on ne sait pas comment obtenir de nouveaux prédicteurs - à partir de quelles données.

Nous n'avons pas besoin de nouvelles données pour l'instant ; nous pouvons prendre 60 000 observations et les diviser en valeurs de test et de trace et aller au combat.

Même chose avec la cible, par exemple si nous créons à la fois ZZ et le binariser en 1001100 et aller de l'avant aussi.

Aleksey Vyazmikin:

On peut alors charger un grand nombre de cibles, ce qui permettra de montrer le pouvoir prédictif des prédicteurs, car un bon prédicteur sera performant sur différentes cibles.

Je ne suis pas d'accord, nous avons besoin de prédicteurs différents pour des cibles différentes, si nous prédisons l'augmentation d'une minute alors nous avons les mêmes signes, si nous prédisons quel niveau sera franchi en semaines et lequel ne le sera pas alors les signes sont complètement différents.

Mais je soutiens la collaboration dans les objectifs ! Mais vous pouvez le faire comme un signe, par exemple, une prévision par la cible Y..n. doit être utilisée comme un signe pour la cible principale

Aleksey Vyazmikin:

L'instrument doit être le même pour tous - les futures ou la colle Moex sont préférables. J'aime bien Si.

Je suis d'accord, c'est pourquoi il est préférable de prendre quelque chose d'universel à partir du forex sans coller...

Les futures ont des données limitées, les colles sont des distorsions dans les prix + un manque de liquidité au début et à la fin des colles.

 
mytarmailS:

Pourquoi ? Nous n'avons pas encore besoin de nouvelles données, il suffit de prendre 60 000 observations, de les répartir entre les tests et les pistes et de partir au combat.

De même pour la cible, par exemple pour créer ZZ en une fois, binarisez-la en 1001100 et allez-y.

Je suis d'accord, c'est pourquoi il est préférable d'utiliser le forex universel sans collage.

Il n'y a pas assez de données dans un seul contrat à terme et les collages peuvent conduire à des distorsions de prix + un manque de liquidité au début et à la fin des collages.

Si l'on travaille avec un échantillon prêt, on tente de tirer quelque chose d'utile des données collectées, mais qui garantit que les données sont collectées de manière utile ? Je souhaite avant tout travailler avec mes prédicteurs, sinon il ne sert à rien de perdre du temps. C'est pourquoi le balisage doit être reproductible par tous, afin que chacun puisse ajouter ses propres prédicteurs pour la formation.

Pour ZZ, je ne sais pas quel est votre objectif - comment en tirer de l'argent ? Après tout, en plus de la majoration, vous avez également besoin du résultat financier des actions de classification.

Eh bien, je ne suis pas intéressé par le Forex, et sur Si il n'y a pas d'écarts de liquidité sur le collage. S'il est mal collé, j'exclue le jour de l'échantillon. Le Forex est différent pour chaque société de courtage...

 

Quelque chose que vous avez mal compris....

Aleksey Vyazmikin:

Si l'on travaille avec un échantillon prêt à l'emploi, on tente d'extraire quelque chose d'utile des données collectées, mais qui garantit que les données sont collectées de manière utile ?

Que voulez-vous dire par "données utiles collectées" ? Les données initiales sont ohlcv + time + Y(ces données sont les mêmes pour tout le monde)elles ne peuvent pas être utiles ou non, elles sont juste là, ce sont les caractéristiques initiales, puis à partir de ces données nous générons les caractéristiques nous-mêmes selon le critère d'amélioration de la prédiction. L'avez-vous amélioré ? Vous avez ajouté ohlcv+my.feature+.... et l'avez rendu aux gens, un autre l'a ouvert, a inventé une nouvelle fonctionnalité, a vérifié si elle améliore l'erreur sur le test, a ajouté ohlcv+my.feature+his.featue... l'a donné aux gens et ainsi de suite...

Aleksey Vyazmikin:

Pour ZZ, je ne sais pas quel est votre objectif - comment en tirer de l'argent ? Après tout, en plus de la majoration, vous avez besoin du résultat financier des actions de classification.

J'étais contre ZZ avant, mais c'était à cause d'un malentendu... Écoutez, vous parlez d'un résultat financier, l'idéal à atteindre est le trade parfait, ce sont les profits maximums par unité de temps, si vous prenez ZZ, alors c'est précisément le même trade idéal, former AMO sur ZZ est juste l'approche du trading le plus efficace, plus nous nous rapprochons de ZZ, meilleur est le résultat financier.

 
Aleksey Vyazmikin:

Je souhaite avant tout travailler avec mes propres prédicteurs, sinon il est inutile de perdre du temps.

C'est pourquoi le balisage doit être reproductible par tous, afin que chacun puisse ajouter ses propres prédicteurs d'apprentissage.

Travaillez avec vos puces, mais sur un ensemble de données commun, c'est tout l'intérêt, et il n'y aura pas seulement vos puces, mais aussi les meilleures puces que les autres meilleurs membres du forum ont trouvées, pouvez-vous imaginer la synergie que cela représente ? Combien de nouvelles idées ? Dans quelle mesure cela améliorera-t-il vos caractéristiques au total ?

Et ce ne sera pas juste un service de pure forme, juste du bla-bla vide, mais du vrai... Vous savez ce que vous dites, prouvez-le sur le jeu de données, l'ohlc est votre cible, faites un meilleur travail que les autres.... Tu ne peux pas le faire ? Alors, pssh et p.d.)) Vous voyez ce que je veux dire ?

ZZ est reproductible par tous.

 
mytarmailS:

Il y a quelque chose que vous ne comprenez pas.....

Que voulez-vous dire par "données utiles collectées" ? Les données initiales sont ohlcv + time + Y(ces données sont les mêmes pour tout le monde)elles ne peuvent pas être utiles ou non, elles existent simplement, ce sont les caractéristiques initiales, puis à partir de ces données nous générons déjà les caractéristiques nous-mêmes selon le critère d'amélioration de la prédiction. L'avez-vous amélioré ? Vous avez ajouté ohlcv+my.feature+.... et l'avez rendu aux gens, un autre l'a ouvert, a inventé une nouvelle fonctionnalité, a vérifié si elle améliore l'erreur sur le test, a ajouté ohlcv+my.feature+his.featue... l'a donné aux gens et ainsi de suite...

Alors pourquoi prendre les données d'un ensemble de données quand on peut les prendre d'un graphique ? De plus, la cible de tout le monde n'est pas générée sur chaque barre.

mytarmailS:

J'étais contre ZZ, mais c'était à cause d'un malentendu... Écoutez, vous parlez du résultat financier, de l'idéal, qui devrait s'efforcer d'être un commerce idéal, ce sont les profits maximums par unité de temps, si vous prenez ZZ, c'est exactement le même commerce idéal, former l'AMO sur ZZ, c'est juste se rapprocher du commerce le plus efficace, plus nous nous rapprochons de ZZ, meilleur sera le résultat financier...

Il ne s'agit pas d'un résultat idéal, mais de la conséquence d'une décision. Et le résultat financier peut être différent pour le même objectif, si le système n'est pas inversé, et nous sortons par TP\SL.

Et puis, je ne comprends toujours pas quel est votre objectif - écrivez plus de détails.

 
mytarmailS:

Travaillez avec vos propres puces, mais sur un ensemble de données commun,

C'est gênant.

 
Aleksey Vyazmikin:

Alors pourquoi prendre les données dans l'ensemble de données quand on peut les prendre dans le graphique ? De plus, la cible de tout le monde n'est pas générée sur chaque barre.

Le résultat financier n'est pas l'idéal, mais la conséquence de la décision. Et le résultat financier peut être différent pour le même TP/SL, si le système n'est pas inversé et que nous sortons par TP/SL.

Et puis, je ne comprends toujours pas quel est votre objectif - écrivez plus de détails.

Aleksey Vyazmikin:

C'est gênant.

Je suis désolé, mais à en juger par vos questions, vous ne comprenez pas de quoi je parle. Savez-vous ce qu'est kaggle ? Je veux faire quelque chose de similaire, ou plutôt dans ce format. Prends-le tout de suite et tu n'auras pas de questions ridicules comme...

Pourquoi avons-nous besoin d'un seul ensemble de données pour tous ?

Pourquoi ne pouvons-nous pas prendre des données à partir du tableau) ?

Pourquoi ne pouvons-nous pas générer un objectif ? chacun de son côté))

ect....

 
mytarmailS:

Désolé, mais à en juger par vos questions, vous ne comprenez pas de quoi je parle ici, vous savez ce qu'est le kaggle ? C'est quelque chose de similaire, ou plutôt dans ce format que je veux faire. Prends-le tout de suite et tu n'auras pas de questions ridicules comme...

Pourquoi avons-nous besoin d'un seul ensemble de données pour tous ?

Pourquoi ne pouvons-nous pas prendre des données à partir du tableau) ?

Pourquoi ne pouvons-nous pas générer un objectif ? chacun de son côté))

etc....

Ne comprenez-vous pas que les concours n'ont aucun sens (les gagnants et les seconds du concours le disent eux-mêmes) ?

Ce qui m'intéresse, c'est de travailler à l'amélioration du système, et non de bricoler un ensemble de données particulier.

 
Aleksey Vyazmikin:

Ne savez-vous pas que les concours sont inutiles (comme le disent les gagnants et les finalistes des concours eux-mêmes) ?

C'est quoi cette absurdité ? Où est-ce qu'ils disent ça ? Ces concours sont tellement insignifiants que les clients de ces concours paient 5 000 à 50 000 dollars chacun pour la meilleure solution. C'est le genre d'argent qu'ils paient pour des solutions inutiles.

Aleksey Vyazmikin:

Je suis intéressé par l'amélioration du système, et non par son adaptation à un ensemble de données spécifique.

Et votre amélioration n'est pas un ajustement ? Expliquez-moi pourquoi votre solution n' est pas un ajustement, mais que si vous prenez vos données d'entrée, les écrivez au format csv et synthétisez votre solution à partir de ces données, c'est déjà un ajustement? N'avez-vous pas entendu parler de la validation croisée ?

Awesome....

Eh bien, oubliez ça, ne prenez même pas la peine de répondre, cela n'a aucun sens.

 
mytarmailS:

C'est quoi cette absurdité ? Où est-ce qu'ils disent ça ? Ces concours sont tellement insignifiants que les clients de ces concours paient 5 000 à 50 000 dollars pour la meilleure solution. Ils paient ce genre d'argent pour des solutions inutiles.

Ils paient pour des idées dans le code source, qui sont ensuite vérifiées et rejetées. Ce n'est pas un fait qu'ils prennent les résultats du gagnant au travail. L'autre résultat du concours est d'offrir aux gagnants un travail réel sur le problème, avec des données complètes et leur interprétation.

mytarmailS:

Et votre amélioration n'est pas un ajustement ? Expliquez-moi pourquoi la solution que vous avez trouvée n' est pas un ajustement, et si vous prenez vos données d'entrée, les écrivez en csv et synthétisez à partir de ces données votre solution est soudainement un ajustement? N'avez-vous pas entendu parler de la validation croisée ?

Awesome....

Ok, oubliez ça, ne prenez même pas la peine de répondre, la conversation est inutile.

Pouvez-vous lire attentivement - j'ai écrit précédemment que la cible peut ne pas être capturée sur chaque barre, ce qui vous empêche d'obtenir des données intermédiaires à partir du fichier CSV.

Qu'est-ce qui vous fait penser qu'une cible publique sera votre cible ?

L'échantillon aura toujours les données ajustées à l'échantillon - une vérification est nécessaire sur les données en dehors de l'échantillon, et pour cela il devrait être possible de créer un nouvel échantillon d'entraînement.

Regardez la situation de manière plus pratique sans être trop égoïste. Et dans les négociations, vous devez apprendre à concéder, en cherchant un moyen d'atteindre l'objectif principal, plutôt que de vous accrocher à des points qui ne sont pas pertinents pour la concession.


Voici d'ailleurs une vidéo et une chaîne sur les concours - regardez ce que disent les participants.