트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩

Aleksey Vyazmikin 2020.11.12 14:42 #21121

막심 드미트리예프스키 :

나는 Near-Miss를 선호한다 (사진에서)

사진은 아름답지만 시도해야 합니다.

Maxim Dmitrievsky 2020.11.12 14:48 #21122

알렉세이 비아즈미킨 :

엉뚱한 곳에서 교체했어도 - swears

거기에 무엇이 잘못되었는지 보십시오.

X, y가 아니라 data_X, data_y가 있습니다.

언더샘플링을 사용하는 경우(주요 클래스의 샘플 수 감소) 많은 데이터를 수집하는 것이 바람직합니다. 그렇지 않으면 출력이 작습니다(마이너 클래스의 크기에 따라).

Aleksey Vyazmikin 2020.11.12 17:44 #21123

막심 드미트리예프스키 :

X, y가 아니라 data_X, data_y가 있습니다.

cc = ClusterCentroids(random_state= 0 )
x_resampled, y_resampled = cc.fit_resample(data_X, data_y)

NameError                                 Traceback (most recent call last)
< ipython-input-7-29177f78bed3 > in < module > ()
      1 cc = ClusterCentroids(random_state=0)
----> 2 x_resampled, y_resampled = cc.fit_resample(data_X, data_y)

NameError: name 'data_X' is not defined

Maxim Dmitrievsky 2020.11.12 17:55 #21124

알렉세이 비아즈미킨 :

알렉세이... )))

데이터 세트를 다운로드하고 모든 단계를 랩톱에서 완료해야 합니다. 지금 거기에 인쇄되는 것은 저장된 정보입니다. 이 개체는 더 이상 존재하지 않습니다.

Aleksey Vyazmikin 2020.11.12 18:19 #21125

막심 드미트리예프스키 :

알렉세이... )))

데이터 세트를 다운로드하고 모든 단계를 랩톱에서 완료해야 합니다. 지금 거기에 인쇄되는 것은 저장된 정보입니다. 이 개체는 더 이상 존재하지 않습니다.

아카이브를 다운로드하고 압축을 풀 수 있습니까?

Maxim Dmitrievsky 2020.11.12 18:37 #21126

알렉세이 비아즈미킨 :

아카이브를 다운로드하고 압축을 풀 수 있습니까?

https://stackoverflow.com/questions/3451111/unzipping-files-in-python 전화에서 왔습니다. 안되면 내일 하겠습니다. 다른 아카이브를 Google 드라이브에 한 번 업로드한 다음 Google Collab에 복사할 수 있습니다. 인터넷이 나쁜 경우. 즉시 지퍼를 열 수 있습니다. https://stackoverflow.com/questions/18885175/read-a-zipped-file-as-a-pandas-dataframe . 그리고 저장 https://www.google.ru/amp/s/cmdlinetips.com/2020/05/how-to-save-pandas-dataframe-as-gzip-zip-file/amp/

Aleksey Vyazmikin 2020.11.12 23:33 #21127

막심 드미트리예프스키 :
https://stackoverflow.com/questions/3451111/unzipping-files-in-python 전화에서 왔습니다. 안되면 내일 하겠습니다. 다른 아카이브를 Google 드라이브에 한 번 업로드한 다음 Google Collab에 복사할 수 있습니다. 인터넷이 나쁜 경우. 즉시 지퍼를 열 수 있습니다. https://stackoverflow.com/questions/18885175/read-a-zipped-file-as-a-pandas-dataframe . 그리고 저장 https://www.google.ru/amp/s/cmdlinetips.com/2020/05/how-to-save-pandas-dataframe-as-gzip-zip-file/amp/

지금까지 아무 것도 작동하지 않았습니다. 내일 다시 시도하겠습니다.

Maxim Dmitrievsky 2020.11.13 08:06 #21128

알렉세이 비아즈미킨 :

지금까지 아무 것도 작동하지 않았습니다. 내일 다시 시도하겠습니다.

독서

데이터 = pd.read_csv( 'exam.zip' , sep= ';' )

기입

to_save.to_csv( 'oversamled_exam.zip' , sep = ';' ,

압축=dict(방법= 'zip' , archive_name= 'exam.csv' ))

업데이트된 노트북

Aleksey Vyazmikin 2020.11.13 15:08 #21129

막심 드미트리예프스키 :

독서

데이터 = pd.read_csv( 'exam.zip' , sep= ';' )

기입

to_save.to_csv( 'oversamled_exam.zip' , sep = ';' ,

압축=dict(방법= 'zip' , archive_name= 'exam.csv' ))

업데이트된 노트북

고맙습니다! 모든 것이 해결되었습니다.

내 생각에 옳다고 생각합니다. 제어 장치가 테스트로 이동하기 때문에 기차를 변환하십시오. 하지만 결과가 매우 이상합니다. 테스트 샘플에서 로그 손실 오류가 1을 초과하고 커집니다. 어떻게 이것이 가능합니까? 충격.

Aleksey Vyazmikin 2020.11.13 15:20 #21130

Maxim, 하지만 이것을 설정하는 방법은 무엇입니까?

from imblearn.under_sampling import TomekLinks

tl = TomekLinks(return_indices=True, ratio='majority')
X_tl, y_tl, id_tl = tl.fit_sample(X, y)

id_tl은 무엇입니까?

트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2113