트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3179

 
Maxim Dmitrievsky #:
보라, 오리지널 시리즈의 패턴이 주어지지 않으면 힐베르트의 길은 당신의 소중한 목표에 도달하지 못할 것입니다. 당신의 노력은 악마로 변할 것이며 낙원 대신 불명예스러운 학살을 발견하게 될 것입니다.

😁😁

 

저는 부스트 개발자에게 다중 선형성 및 기능 선택(전처리)을 어떻게 해야 하는지 물어봤습니다.

분명한 대답을 들었습니다: 그냥 잊어버려요 :)

 
Maxim Dmitrievsky #:

그리고 플롯에서 인트로로의 변환이 주로 대용량 데이터의 가속을 위해 필요한지 묻는 이유는 무엇입니까?

보너스는 운이 좋으면 좋든 나쁘든 모델의 작은 보정일 수 있습니다.

그들은 당신에게 같은 대답을 줄 것이므로 수년간의 모든 노력을 평가 절하 할 것이기 때문에 물어 보는 것이 두렵습니다 :)

질문의 결과로 판단하면 제 노력이 어떻게 평가절하될 수 있나요?

예, 결과는 지표 성장 측면에서 최고는 아니지만 다른 표현을 포함하여 거기에 있습니다.

예를 들어, 제 방법을 사용한 사전 처리 없이는 새로운 데이터에서 수익성 있는 모델을 전혀 얻을 수 없는 샘플이 있습니다.

 
Maxim Dmitrievsky #:

저는 부스트 개발자에게 다중 선형성 및 기능 선택(전처리)에 대해 어떻게 해야 하는지 물어보았습니다.

분명한 대답을 들었습니다: 그냥 잊어버리세요 :)

특성이 수십억 개가 있다면 그냥 잊어버려야 할까요? 아니면 여전히 상관관계가 없는 특성을 선택해야 할까요?
 
mytarmailS #:
수십억 개의 특성이 있다면 그냥 잊어버리면 될까요? 아니면 여전히 상관관계가 없는 특성을 선택해야 할까요?
마음대로 하세요.
 
Maxim Dmitrievsky #:
마음대로
오히려 필요에 의해 필터링되어야 하며, 선택 사항이 아닙니다.
 
Maxim Dmitrievsky #:

저는 부스트 개발자에게 다중 선형성 및 기능 선택(전처리)에 대해 어떻게 해야 하는지 물어보았습니다.

분명한 대답을 들었습니다: 그냥 잊어버려요 :)

실제 적용 사례에 대한 정보로 판단할 때 거의 논의하지 않는 기능이 있습니다.

예를 들어 예측자를 그룹화하고 가중치를 부여하는 기능입니다. 또한 모델을 개선 할 수있는 잠재력을 보았지만 여기서는 실험 할 수 없으며 많은 검색이 필요합니다.

그리고 원래 전체 프로젝트를 머릿속에 보관 한 사람이 여전히 작업하고 있다는 것은 사실이 아니며 실행 속도 측면에서 알고리즘 자체를 개선하고 버그를 수정하는 동료와 다른 사람들이있을 가능성이 큽니다. 우물과 작은 칩이 때때로 나타납니다.

 
mytarmailS #:
오히려 필요에 따라 필터링해야 하며, 옵션은 없습니다.
애초에 수십억 개의 기능을 만들지 않는 것이 더 쉬울 수 있습니다.
 
Aleksey Vyazmikin #:

실제 적용 사례에 대한 정보로 판단할 때 거의 논의하지 않는 기능이 있습니다.

예를 들어 예측 변수를 그룹화하고 가중치를 부여하는 기능이 있습니다. 또한 모델을 개선할 수 있는 가능성도 보이지만 여기서는 실험할 수 없으며 많은 검색이 필요합니다.

그리고 원래 전체 프로젝트를 머릿속에 보관 한 사람이 여전히 작업하고 있다는 것은 사실이 아니며 실행 속도 측면에서 알고리즘 자체를 개선하고 버그를 수정하는 동료와 다른 사람들이있을 가능성이 큽니다. 우물과 작은 칩이 때때로 나타납니다.

이것은 모두 선택 사항입니다.
 
Maxim Dmitrievsky #:
애초에 수십억 개의 표지판을 만들지 않는 것이 더 쉬울 수도 있습니다.
기능이 나쁘다는 것을 깨닫기 위해서는 확인해야 하고, 확인하려면 기능이 있어야 하고, 기능을 가지려면 기능이 있어야 합니다....
사유: