트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1038

 
로프필드 :
그리고 랜덤 포레스트에 대한 "임계값"은 어디에 있습니까?

임계값이 무엇인지 기억나지 않습니다. 귀하의 임계값을 의미했습니다. 아마도 거래를 입력하기 위한 것 또는 다른 것 0.75 또는 거기에 얼마인지(유형 확률)

 
로프필드 :
그리고 랜덤 포레스트에 대한 "임계값"은 어디에 있습니까?

로짓 회귀의 경우 특정 클래스에 할당될 확률이 얼마나 되는지 상상할 수 있습니다. 포리스트의 경우 - 아아. 따라서 이것은 의사 확률일 가능성이 높으며 이것이 작동하는 방식이 아닙니다. 예를 들어 임계값 0.75에서 클래스에 할당될 확률이 0.6보다 높다는 의미는 아닙니다.

적어도 그것에 대한 정보는 읽지 않았습니다.
 

그리고 저는 "확률"을 랜덤 포레스트 알고리즘의 중요한 부분으로 받아들입니다. 모든 트리에서 결과를 계산하는 공식이 이를 기반으로 하기 때문입니다.

이 "확률"을 고려하여 트리 수까지 설정했습니다.

 
로프필드 :

그리고 저는 "확률"을 랜덤 포레스트 알고리즘의 중요한 부분으로 받아들입니다. 모든 트리에서 결과를 계산하는 공식이 이를 기반으로 하기 때문입니다.

이 "확률"을 고려하여 트리 수까지 설정했습니다.

표본 영역이 차지하는 잎의 수를 고려합니까? 그러한 나무의 각 잎사귀의 높은 능력 가능성을 고려하여 현재 상황에 대해 실제로 투표하는 위원회의 규모는?

 
알렉세이 비아즈미킨 :

표본 영역이 차지하는 잎의 수를 고려합니까? 그러한 나무의 각 잎사귀의 높은 능력 가능성을 고려하여 현재 상황에 대해 실제로 투표하는 위원회의 규모는?

최종 분기는 훈련 샘플의 최소 25개 변형을 담당합니다. Spark 옵션에서 설정합니다. AlgLib에는 그러한 매개변수가 없습니다.
 
로프필드 :
최종 분기는 훈련 샘플의 최소 25개 변형을 담당합니다. Spark 옵션에서 설정합니다. AlgLib에는 그러한 매개변수가 없습니다.

내가 그렇게 표현하지 않았는지도 모르겠다.

100개의 나무가 있고 동시에 나무의 각 잎(간단한 옵션 2개 선택 포함)이 분류를 생성한다고 가정해 보겠습니다. 따라서 매우 큰 오류가 있는 나무도 투표에 참여할 수 있습니다(예: 49/51). , 평균 예측을 크게 왜곡합니다. 아마도 그러한 잎의 투표 참여를 완전히 제거 할 가치가 있습니까? 예측 능력의 부족은 특정 데이터로 작업할 때 오히려 나쁜 나무 잎 모델에 대해 이야기하기 때문입니다.

 
Python 및 R을 포함한 프로그래밍 언어의 새로운 순위
 
산산이치 포멘코 :
Python 및 R을 포함한 프로그래밍 언어의 새로운 순위
좋은 자료입니다. 그러나 R과 Python에 대한 자신의 결론은 과격합니다. 그들은 일반적으로 귀하의 기준에 따라 비교할 수 없습니다. 바닥은 부드럽고 따뜻합니다.
 
유리 아사울렌코 :
좋은 자료입니다. 그러나 R과 Python에 대한 자신의 결론은 과격합니다. 그들은 일반적으로 귀하의 기준에 따라 비교할 수 없습니다. 바닥은 부드럽고 따뜻합니다.

그리고 더 구체적으로?

나는 언어의 기준 장치를 비교한다.

그리고 그것은 어떻게 필요합니까?

 
산산이치 포멘코 :

그리고 더 구체적으로?

나는 언어의 기준 장치를 비교한다.

그리고 그것은 어떻게 필요합니까?

양적으로는 트랙터보다 자동차가 더 많지만 서로 비교하는 것은 말도 안 된다.
참고 문헌에 따르면 - 거기에도 있고 거기에도 광범위합니다. 모듈별 - 부분적으로 겹칩니다.
Python은 R에 포트가 있고 R은 Python에 대한 포트가 있는 것 같습니다.
어려운 작업이 있는 경우 어떤 환경에서든 절대적으로 어떤 언어로든 작업하면 어떤 식으로든 외부에서 무언가를 이식해야 합니다. 원하신다면, 트럭, 트랙터, 굴착기가 있어야 시동이 걸립니다. 일반적으로 적용 가능성 면에서 30위입니다.
사유: