L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 2426

 
mytarmailS:

Maintenant, la réponse à la première question.

Merci !

J'essaierai de comprendre, mais c'est difficile d'y arriver tout de suite - la syntaxe du code est assez différente de celle du C++, cependant.

 
elibrarius:

Ne pensez-vous pas que vous adaptez votre modèle à la version la plus aboutie du test ?

A quel moment pensez-vous que je vais m'accorder pour tester ? L'échantillonnage "test" est utilisé pour arrêter la formation, dans les projets, sauf un, il n'existe pas du tout, puis je l'ai utilisé dans la formation finale - bien, vous pouvez le remplacer par un nombre fixe d'arbres - 50/100/300/500/800 et voir le résultat sur tous les échantillons, alors vous croyez que vous obtiendrez des résultats significativement plus mauvais ?

 
Aleksey Vyazmikin:

Merci !

Je vais essayer de trouver une solution, mais il est difficile d'y arriver tout de suite, car la syntaxe du code est très différente de celle du C++.

Beaucoup de fonctions peu familières car le langage est de haut niveau.
Mais ce que vous écrivez en 300 lignes en C++, je peux l'écrire en 3 lignes).

 
Aleksey Vyazmikin:

A quel moment dois-je m'accorder pour tester, selon vous ? L'échantillon "test" est utilisé pour arrêter la formation, dans les projets, sauf un, il n'est pas là du tout, puis je l'ai utilisé dans la formation finale - bien vous pouvez le remplacer par un nombre fixe d'arbres - 50/100/300/500/800 et voir le résultat sur tous les échantillons, alors pensez-vous que le résultat sera beaucoup plus mauvais ?

Oui - l'arrêt de la formation est aussi un test d'ajustement. Je ne connais pas les autres détails de votre système, je ne peux rien dire de plus.
Dans la validation croisée, toutes les données sont des tests et toutes les données sont également des trains. C'est juste un à la fois. Vous vouliez juste augmenter la parcelle de plateau de 40%.
 
mytarmailS:
Beaucoup de fonctions peu familières, car le langage est de haut niveau.
Mais ce que vous écrivez en 300 lignes en c++ je peux l'écrire en 3 lignes ;))

Je ne pense pas que toutes mes perversions puissent être facilement implémentées en R :)

 
elibrarius:
Oui - l'arrêt de la formation est aussi un test d'ajustement. Je ne connais pas les autres détails de votre système, je ne peux rien dire de plus
.

Je suis d'accord que cela augmente en théorie le résultat sur l'échantillon d'examen, mais j'évalue le résultat sur l'échantillon d'examen !

Bon, je pense avoir couvert tous les détails, si vous avez des questions, n'hésitez pas à les poser.

elibrarius:
En crosvalidation, toutes les données sont un test et toutes les données sont aussi un stage. C'est juste un à la fois. Vous vouliez juste augmenter la parcelle de plateau de 40%.

Quel est le but de l'utilisation de la crosvalidation ? Je vois son intérêt dans la mesure où il s'agit de rechercher les hyper-paramètres du modèle, car il montrera en moyenne les paramètres qui sont les meilleurs de tous sur des tracés aléatoires.

 
Aleksey Vyazmikin:

Je ne pense pas que vous puissiez facilement implémenter toutes mes perversions en R :)

Ahahaha))))

Si je peux réaliser mes perversions, les tiennes sont comme un repos)

 
Aleksey Vyazmikin:

OK, quel est le but de l'utilisation de la crosvalidation ? Je considère que son objectif est de trouver les hyperparamètres du modèle, car il montrera en moyenne quels paramètres sont les meilleurs de tous sur des graphiques aléatoires.

C'est exactement ce à quoi ça sert. Avez-vous besoin d'autre chose ? Et un ensemble de caractéristiques spécifiques. Avec des attributs différents, les hyperparamètres sont susceptibles d'être différents. Si vous choisissez ceux qui ont les meilleurs hyperparamètres, vous devez travailler avec eux.

Aleksey Vyazmikin:
Bien, je pense avoir décrit tous les détails, si vous avez des questions.

Je suis trop paresseux pour entrer dans les détails.

 
mytarmailS:

Ahahaha))))

Si je peux mettre en œuvre mes propres perversions, les vôtres sont comme un repos).

Eh bien, voilà, depuis que je fais un script pour préparer les données, je dois encore faire un fichier listant les colonnes exclues, qui comprennent :

1. Colonnes avec prédicteurs corrélés (à propos, comment choisit-on la colonne à écarter, disons 5 prédicteurs corrélés ?)

2. Colonnes écartées du premier fichier-tableau, à l'exception de la colonne avec la cible.

De plus, la colonne avec l'étiquette cible doit être écrite dans le fichier, de préférence recherchée par le nom de la colonne.

La structure du fichier est la suivante

5336    Auxiliary
5337    Auxiliary
5338    Label
5339    Auxiliary
5340    Auxiliary
 
elibrarius:

C'est exactement à ça que ça sert. Avez-vous besoin d'autre chose ? Et un ensemble de caractéristiques spécifiques. Avec des attributs différents, les hyperparamètres sont susceptibles d'être différents. Ceux que vous sélectionnez avec les meilleurs hyperparamètres sont ceux que vous devez mettre au travail.

Je suis trop paresseux pour creuser trop profondément.

Je dois sélectionner les bons prédicteurs en moins de temps. Passer à nouveau par les prédicteurs revient à multiplier par cent le temps de traitement. Ma méthode est basée sur la logique selon laquelle un bon prédicteur (y compris un prédicteur adapté à une méthode d'apprentissage particulière) sera demandé par le modèle à tous les intervalles d'échantillonnage, ce qui exclut l'ajustement à la zone d'échantillonnage.