Y a-t-il un modèle dans ce chaos ? Essayons de le trouver ! Apprentissage automatique sur l'exemple d'un échantillon spécifique. - page 3

 
Aleksey Vyazmikin #:

Pouvez-vous vérifier le modèle exactement sur le fichier exam.csv ?

Avez-vous essayé de manipuler l'échantillonnage ?

Voici le solde de l'échantillon d'examen après élimination de certains prédicteurs.

Bien sûr, les graphiques de la distribution des réponses du modèle montrent que l'entraînement a été limité - le rappel est très faible, mais il s'agit déjà d'un certain résultat.

train.csv


exam.csv

Il y a 9046 lignes dans l'examen. J'en ai 9000. Il n'y aura pratiquement aucune différence.

Votre courbe est bien meilleure. Je vais essayer de modifier les paramètres.
 
elibrarius #:

Quel est votre meilleur équilibre ?

J'ai cherché différentes variantes, et il s'avère que ce résultat - il y a également 3 points sur l'idée dans le tour de la commission - est très satisfaisant.


 
elibrarius #:
Il y a 9 046 lignes. J'en ai 9000. Cela ne changera pas grand-chose.

Votre courbe est bien meilleure. Je vais essayer de modifier les paramètres.

S'il s'agit des données du fichier d'examen, alors oui, il n'y a pas beaucoup de différence, je pensais juste que c'était peut-être le fichier de train. Avez-vous fusionné les trois fichiers à l'origine ?

Essayez.

 
Aleksey Vyazmikin #:

S'il s'agit des données du fichier d'examen, alors oui - cela ne fait pas grande différence, j'ai juste pensé qu'il pouvait s'agir du fichier de train. Avez-vous fusionné les trois fichiers à l'origine ?

Essayez.

Oui, j'ai fusionné les trois, puis j'ai spécifié les longueurs des sections.
 
elibrarius #:
Oui, je combine les trois, puis j'entre les longueurs des sections.

Je vois, c'est parfait.

Je pense qu'il est possible d'améliorer la formation en réduisant l'échantillon, disons pour former sur 1/10 - cela permettra de former une phase/structure du marché - je ne l'ai pas encore demandé.

 

Ce n'est qu'en modifiant le taux d'apprentissage qu'il a été possible d'obtenir deux modèles sur 100 qui répondaient au critère.

Le premier.

Le second.

Il s'avère que oui, CatBoost est capable de beaucoup, mais qu'il est nécessaire de régler les paramètres de manière plus agressive.

 
Aleksey Vyazmikin #:

Bon, eh bien, c'est très bien alors.

Je pense qu'il est possible d'améliorer la formation en réduisant l'échantillon, disons en formant 1/10 - cela permettra de former une phase/structure du marché - ce qui n'est pas encore nécessaire.

J'ai essayé de m'entraîner avec le valking forward à 1000 et à 20000 - tout échoue.
 
Wo enseigne à une seule classe commerce/non commerce ?
Ou séparer l'achat et la vente ?
 
elibrarius #:
Ou enseigner à une classe à faire ou à ne pas faire du commerce ?
Ou séparer l'achat et la vente ?

Les résultats sont présentés à partir d'échantillons sans transformation de la cible, c'est-à-dire oui - négocier et ne pas négocier.

Mais en réalité, il serait plus facile de former des échantillons séparés pour l'achat et la vente.

elibrarius #:
a essayé d'apprendre en évaluant en avant à 1000 et à 20000 - tous les résultats sont nuls.

Hmm, c'est étrange. Quelle méthode utilisez-vous pour l'apprentissage - forêt aléatoire ?

 
Aleksey Vyazmikin #:

Hmm, c'est bizarre. Quelle méthode utilisez-vous pour l'entraînement - forêt aléatoire ?

Redessinée à partir d'Alglibow.
Je fais tourner plus d'arbres maintenant. D'ici demain matin, je pense qu'une nouvelle version sera calculée.

Ou peut-être que j'ai fait quelque chose de mal, si le résultat est bien pire que le vôtre.

Raison: