트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3178

 
Forester #:
열을 대상 열과 혼합하는 것만으로 충분하지 않을까요?
꼬리 및 시리즈의 다른 매개 변수는 동일하게 유지됩니다. 그게 장점이라고 생각합니다.

그것도 나쁘지 않습니다. 두 가지 방법을 모두 시도해 보는 것이 좋습니다. 특성에 이상값이 많은 경우(무거운 꼬리) 결과가 달라질 수 있으므로 추가 정보를 제공할 수 있습니다.

 
Aleksey Vyazmikin #:

종파주의자들의 문제는 자신의 종교적 교리를 시험받는 것에 대한 두려움입니다.

항상 많은 패턴이 있으며 올바른 패턴을 선택하는 것이 문제입니다.

적어도 저는 시도해 보았습니다.

 
Aleksey Vyazmikin #:

자세히 설명해 주실 수 있나요?

레이블을 무작위로 혼합하거나 클래스 빈도와 동일한 확률로 무작위로 생성하여 의미 없는 과제를 얻을 수 있습니다.

의도적으로 무의미한 수많은 문제의 결과에서 대규모 샘플을 얻어 실제 문제의 결과와 비교한다는 아이디어는 여전히 동일합니다. 실제 결과가 이 샘플의 꼬리에 있지 않다면 이 방법은 다소 좋지 않습니다.

 
Maxim Dmitrievsky #:

적어도 저는 노력했습니다.

CatBoost에서 예측 지표의 다양한 정량화 방법을 사용할 가능성이 있다는 것을 이해하십니까?

단순히 프로그래머가 작동 메모리가 충분하지 않은 사람들에게 그러한 가능성을 남겼다고 생각하십니까?

아니면 개발자는 훈련의 결과가이 테이블에 직접적으로 의존한다는 것을 알고 있습니까?

그리고 결국 - 자신을 가져 가서 테이블 설정을 재정렬하고 결과의 가변성을 살펴보십시오.

그러면 왜 이런 일이 발생하는지 생각하고 아마도 나를 더 잘 이해하기 시작할 것입니다.


그리고 설교자 / 선지자 / 주술사 스타일의 진술은 유익하지 않습니다. 저는 저를 과시하려는 욕망으로 해석합니다.

 
Aleksey Nikolayev #:

레이블을 무작위로 섞거나 클래스의 빈도와 같은 확률로 무작위로 생성하는 것만으로도 의미 없는 작업을 얻을 수 있습니다.

명백히 무의미한 수많은 작업의 결과 샘플을 대량으로 확보하여 실제 작업의 결과와 비교한다는 아이디어는 동일합니다. 실제 결과가 이 샘플의 꼬리에 있지 않다면 이 방법은 다소 잘못된 것입니다.

0과 1의 비율을 유지하기 위해 "혼합"하는 것이 더 나을 수도 있습니다.

 
Aleksey Vyazmikin #:

캣부스트가 예측 점수를 정량화하는 다양한 방법을 사용할 수 있는 이유를 이해하셨나요?

단순히 프로그래머가 연산 메모리가 부족한 사람들에게 그런 가능성을 남겨둔 것이라고 생각하시나요?

아니면 개발자가 훈련의 결과가 이 표에 직접적으로 의존한다는 것을 알고 있을까요?

그리고 결국 - 자신을 가져 가서 테이블 설정을 재정렬하고 결과의 가변성을 살펴보십시오.

그러면 왜 이런 일이 발생하는지 생각하게 될 것이고 아마도 저를 더 잘 이해하기 시작할 것입니다.


그리고 설교자 / 선지자 / 주술사 스타일의 진술은 유익하지 않습니다. 그들은 저에게 자신의 사람을 과시하려는 욕망으로 해석됩니다.

나는 그들이 무엇을하는지 모르기 때문에 장바구니에있는 개발자에게 물어 보는 것이 좋습니다.
 
Maxim Dmitrievsky #:
장바구니의 개발자에게 문의하는 것이 좋습니다.

Don't. 개발자가 잘못 대답하는 경우)

 
Aleksey Nikolayev #:

하지 마세요. 오답인 경우)

😁😁
 
Maxim Dmitrievsky #:
개발자가 무엇을 하고 있는지 모르겠으니 장바구니의 개발자에게 물어보는 것이 좋습니다.

이해가 안 되니 물어보세요.

또한 일부 부스터는 각 분할 후 예측자의 정량화를 수행하여 나머지를 정량화합니다.

저만 사용하는 것이 아니라 참가자들도 가끔 이런 방향으로 작업을 언급하기도 합니다.

어쨌든, 더 이상 강요하지 않겠습니다.

 
Aleksey Vyazmikin #:

이해가 안 되면 물어보세요.

또한 일부 부스터는 각 분할 후 예측자를 정량화하여 나머지를 정량화합니다.

저뿐만 아니라 콘테스트 참가자들도 가끔 이런 방향으로 작업을 언급하기도 합니다.

어쨌든 더 이상 강요하지 않겠습니다.

그리고 플릿에서 인트로로의 전환이 주로 매우 큰 데이터에 대한 가속화를 위해 필요한지 물어봐야하는 이유는 무엇입니까?

보너스는 운이 좋으면 좋든 나쁘 든 모델의 작은 보정 일 수 있습니다.

그들은 당신에게 같은 대답을 줄 것이므로 수년간의 모든 노력을 평가 절하 할 것이기 때문에 물어 보는 것이 두렵습니다 :)

알고리즘의 속옷을 뒤지고 있습니다.
사유: