トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2113

 
マキシム・ドミトリエフスキー


ニアミスの方が好きです(写真より)

写真もいいですが、実際にやってみないとわからないですね。

 
Aleksey Vyazmikin:

間違えて変えてしまったのでしょう......戦闘中です。

何が問題なのか確認してください。

X, y ではなく、data_X, data_y です。

アンダーサンプリング(メジャークラスのサンプル数を減らす)を使う場合、多くのデータを集めなければ、出力が(マイナークラスの大きさによって)小さくなりすぎる。

 
マキシム・ドミトリエフスキー

X, y ではなく、data_X, data_y です。

cc = ClusterCentroids(random_state=0)
x_resampled, y_resampled = cc.fit_resample(data_X, data_y)
NameError                                 Traceback (most recent call last)
<ipython-input-7-29177f78bed3> in <module>()
      1 cc = ClusterCentroids(random_state=0)
----> 2 x_resampled, y_resampled = cc.fit_resample(data_X, data_y)

NameError: name 'data_X' is not defined
 
Aleksey Vyazmikin:

アレクセイ ...)))

データセットがロードされ、ラップトップでのすべてのステップが完了している必要があります。今そこに印刷されているのは保存された情報であり、これらのオブジェクトはもはや存在しない。

 
マキシム・ドミトリエフスキー

アレクセイ...)))

データセットがロードされ、ラップトップのすべてのステップが実行される必要があります。今そこに印刷されているのは保存された情報であり、これらのオブジェクトはもはや存在しない

そして、アーカイブはそこでダウンロードし、解凍することができるのですか?

 
Aleksey Vyazmikin:

そこでアーカイブをダウンロードし、解凍することは可能ですか?

https://stackoverflow.com/questions/3451111/unzipping-files-in-python スマホでやってます。もし、あなたができないなら、明日はできる。また、一度Googleディスクにアーカイブをダウンロードし、GoogleClubにコピーすることも可能です。インターネット接続がうまくいかない場合ジッパーを一度に開けることができます。https://stackoverflow.com/questions/18885175/read-a-zipped-file-as-a-pandas-dataframe。 そして、https://www.google.ru/amp/s/cmdlinetips.com/2020/05/how-to-save-pandas-dataframe-as-gzip-zip-file/amp/ を保存します。
 
Maxim Dmitrievsky:
https://stackoverflow.com/questions/3451111/unzipping-files-in-python 携帯電話からです。明日、間に合わなかったらまた、アーカイブを一度googleディスクにダウンロードし、google colabにコピーすることも可能です。インターネット接続がうまくいかない場合ジッパーを一度に開くことができます。https://stackoverflow.com/questions/18885175/read-a-zipped-file-as-a-pandas-dataframe。 そして、https://www.google.ru/amp/s/cmdlinetips.com/2020/05/how-to-save-pandas-dataframe-as-gzip-zip-file/amp/ を保存します。

今のところ何の効果もありません。明日もう一度試してみます。

 
Aleksey Vyazmikin:

今のところうまくいっていません。明日、もう一度試してみます。

読書

data = pd.read_csv('exam.zip', sep=';')

書く

to_save.to_csv('oversamled_exam.zip', sep =';',

compression=dict(method='zip', archive_name='exam.csv'))


ノートパソコンをアップグレード

 
マキシム・ドミトリエフスキー

読む

data = pd.read_csv('exam.zip', sep=';')

書く

to_save.to_csv('oversamled_exam.zip', sep =';',

compression=dict(method='zip', archive_name='exam.csv'))


アップデートされたノートパソコン

ありがとうございました。すべてうまくいった。

私はそれが正しいと思う - テストでちょうどコントロールに行くので、訓練変換のみ - だから私はやったが、結果は非常に奇妙です - テストサンプルでエラーloglossが1を超え、成長 - どのようにそれはあり得る - 私はショックを受けています。

 

マキシム、これどうやってセットアップするんだ?

from imblearn.under_sampling import TomekLinks

tl = TomekLinks(return_indices=True, ratio='majority')
X_tl, y_tl, id_tl = tl.fit_sample(X, y)

id_tlとは?

理由: