L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2113

 
Maxim Dmitrievsky:


Je préfère Near-Miss (d'après les photos).

Les photos sont belles - mais il faut essayer.

 
Aleksey Vyazmikin:

J'ai dû mal le changer - c'est le combat.

Vérifiez ce qui ne va pas.

ce n'est pas X, y mais data_X, data_y

si vous utilisez le sous-échantillonnage (diminution du nombre d'échantillons de la classe principale), vous avez intérêt à collecter beaucoup de données, sinon le résultat sera trop petit (par la taille de la classe secondaire)

 
Maxim Dmitrievsky:

ce n'est pas X, y c'est data_X, data_y

cc = ClusterCentroids(random_state=0)
x_resampled, y_resampled = cc.fit_resample(data_X, data_y)
NameError                                 Traceback (most recent call last)
<ipython-input-7-29177f78bed3> in <module>()
      1 cc = ClusterCentroids(random_state=0)
----> 2 x_resampled, y_resampled = cc.fit_resample(data_X, data_y)

NameError: name 'data_X' is not defined
 
Aleksey Vyazmikin:

Aleksey ... )))

Le jeu de données doit être téléchargé et toutes les étapes doivent être effectuées dans le carnet de notes. Ce qui est imprimé là maintenant est une information stockée, ces objets n'existent plus.

 
Maxim Dmitrievsky:

Alexei... )))

Le jeu de données doit être chargé et toutes les étapes de l'ordinateur portable doivent être effectuées. Ce qui est imprimé là maintenant est une information stockée, ces objets n'existent plus.

Et l'archive peut y être téléchargée et décompressée ?

 
Aleksey Vyazmikin:

L'archive peut-elle être téléchargée et décompressée à cet endroit ?

https://stackoverflow.com/questions/3451111/unzipping-files-in-python Je suis sur mon téléphone. Si tu ne peux pas le faire, demain le fera. Vous pouvez également télécharger une fois l'archive sur le disque Google, puis la copier sur GoogleClub. Si vous avez une mauvaise connexion Internet. Vous pouvez ouvrir les fermetures éclair en même temps.https://stackoverflow.com/questions/18885175/read-a-zipped-file-as-a-pandas-dataframe. Et sauverhttps://www.google.ru/amp/s/cmdlinetips.com/2020/05/how-to-save-pandas-dataframe-as-gzip-zip-file/amp/
 
Maxim Dmitrievsky:
https://stackoverflow.com/questions/3451111/unzipping-files-in-python Je suis sur mon téléphone. Si je ne peux pas le faire demain. Vous pouvez également télécharger l'archive sur google disk une fois, puis la copier sur google colab. Si vous avez une mauvaise connexion Internet. Vous pouvez ouvrir les fermetures éclair en même temps.https://stackoverflow.com/questions/18885175/read-a-zipped-file-as-a-pandas-dataframe. Et sauverhttps://www.google.ru/amp/s/cmdlinetips.com/2020/05/how-to-save-pandas-dataframe-as-gzip-zip-file/amp/

Rien n'a fonctionné jusqu'à présent - je vais réessayer demain.

 
Aleksey Vyazmikin:

Cela n'a pas fonctionné jusqu'à présent - je vais réessayer demain.

lecture

données = pd.read_csv('exam.zip', sep=';')

écrire

to_save.to_csv('oversamled_exam.zip', sep =';',

compression=dict(method='zip', archive_name='exam.csv'))


mis à niveau l'ordinateur portable

 
Maxim Dmitrievsky:

lire

données = pd.read_csv('exam.zip', sep=';')

écrire

to_save.to_csv('oversamled_exam.zip', sep =';',

compression=dict(method='zip', archive_name='exam.csv'))


ordinateur portable modernisé

Merci ! Tout s'est arrangé.

Je pense que j'ai raison - seulement le train transforme, parce que sur le test va juste le contrôle - donc je l'ai fait, mais le résultat est très étrange - erreur logloss dépasse 1 sur l'échantillon de test et augmente - comment cela peut-il être - je suis choqué.

 

Maxim, comment on installe ce truc ?

from imblearn.under_sampling import TomekLinks

tl = TomekLinks(return_indices=True, ratio='majority')
X_tl, y_tl, id_tl = tl.fit_sample(X, y)

Qu'est-ce que id_tl ?