트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2113

 
막심 드미트리예프스키 :


나는 Near-Miss를 선호한다 (사진에서)

사진은 아름답지만 시도해야 합니다.

 
알렉세이 비아즈미킨 :

엉뚱한 곳에서 교체했어도 - swears

거기에 무엇이 잘못되었는지 보십시오.

X, y가 아니라 data_X, data_y가 있습니다.

언더샘플링을 사용하는 경우(주요 클래스의 샘플 수 감소) 많은 데이터를 수집하는 것이 바람직합니다. 그렇지 않으면 출력이 작습니다(마이너 클래스의 크기에 따라).

 
막심 드미트리예프스키 :

X, y가 아니라 data_X, data_y가 있습니다.

cc = ClusterCentroids(random_state= 0 )
x_resampled, y_resampled = cc.fit_resample(data_X, data_y)
NameError                                 Traceback (most recent call last)
< ipython-input-7-29177f78bed3 > in < module > ()
      1 cc = ClusterCentroids(random_state=0)
----> 2 x_resampled, y_resampled = cc.fit_resample(data_X, data_y)

NameError: name 'data_X' is not defined
 
알렉세이 비아즈미킨 :

알렉세이... )))

데이터 세트를 다운로드하고 모든 단계를 랩톱에서 완료해야 합니다. 지금 거기에 인쇄되는 것은 저장된 정보입니다. 이 개체는 더 이상 존재하지 않습니다.

 
막심 드미트리예프스키 :

알렉세이... )))

데이터 세트를 다운로드하고 모든 단계를 랩톱에서 완료해야 합니다. 지금 거기에 인쇄되는 것은 저장된 정보입니다. 이 개체는 더 이상 존재하지 않습니다.

아카이브를 다운로드하고 압축을 풀 수 있습니까?

 
알렉세이 비아즈미킨 :

아카이브를 다운로드하고 압축을 풀 수 있습니까?

https://stackoverflow.com/questions/3451111/unzipping-files-in-python 전화에서 왔습니다. 안되면 내일 하겠습니다. 다른 아카이브를 Google 드라이브에 한 번 업로드한 다음 Google Collab에 복사할 수 있습니다. 인터넷이 나쁜 경우. 즉시 지퍼를 열 수 있습니다. https://stackoverflow.com/questions/18885175/read-a-zipped-file-as-a-pandas-dataframe . 그리고 저장 https://www.google.ru/amp/s/cmdlinetips.com/2020/05/how-to-save-pandas-dataframe-as-gzip-zip-file/amp/
 
막심 드미트리예프스키 :
https://stackoverflow.com/questions/3451111/unzipping-files-in-python 전화에서 왔습니다. 안되면 내일 하겠습니다. 다른 아카이브를 Google 드라이브에 한 번 업로드한 다음 Google Collab에 복사할 수 있습니다. 인터넷이 나쁜 경우. 즉시 지퍼를 열 수 있습니다. https://stackoverflow.com/questions/18885175/read-a-zipped-file-as-a-pandas-dataframe . 그리고 저장 https://www.google.ru/amp/s/cmdlinetips.com/2020/05/how-to-save-pandas-dataframe-as-gzip-zip-file/amp/

지금까지 아무 것도 작동하지 않았습니다. 내일 다시 시도하겠습니다.

 
알렉세이 비아즈미킨 :

지금까지 아무 것도 작동하지 않았습니다. 내일 다시 시도하겠습니다.

독서

데이터 = pd.read_csv( 'exam.zip' , sep= ';' )

기입

to_save.to_csv( 'oversamled_exam.zip' , sep = ';' ,

압축=dict(방법= 'zip' , archive_name= 'exam.csv' ))


업데이트된 노트북

 
막심 드미트리예프스키 :

독서

데이터 = pd.read_csv( 'exam.zip' , sep= ';' )

기입

to_save.to_csv( 'oversamled_exam.zip' , sep = ';' ,

압축=dict(방법= 'zip' , archive_name= 'exam.csv' ))


업데이트된 노트북

고맙습니다! 모든 것이 해결되었습니다.

내 생각에 옳다고 생각합니다. 제어 장치가 테스트로 이동하기 때문에 기차를 변환하십시오. 하지만 결과가 매우 이상합니다. 테스트 샘플에서 로그 손실 오류가 1을 초과하고 커집니다. 어떻게 이것이 가능합니까? 충격.

 

Maxim, 하지만 이것을 설정하는 방법은 무엇입니까?

from imblearn.under_sampling import TomekLinks

tl = TomekLinks(return_indices=True, ratio='majority')
X_tl, y_tl, id_tl = tl.fit_sample(X, y)

id_tl은 무엇입니까?