혼돈에 패턴이 있을까요? 찾아보겠습니다! 특정 샘플의 예에 대한 머신 러닝.

Aleksey Vyazmikin 2022.12.06 08:44 #151

Maxim Dmitrievsky #:

정상적인 상황에서 시드는 거의 영향을 미치지 않으며 중요한 것은 알고리즘입니다. 시드에 신경을 써야 한다면 데이터는 이미 쓰레기입니다.

새 데이터를 확인하면 1000개가 아니라 10개의 징후만 있으면 어느 정도 확신할 수 있습니다.

기본 깊이는 6이며 중요한 값을 제외하고는 큰 영향을 미치지 않는다고 생각합니다.

학습 깊이는 과거 변동성에 따라 다르게 영향을 미칩니다.

네, 4개의 시드 예측자에서는 큰 영향을 미치지 않을 수도 있습니다. 하지만 이는 오해입니다. 모델에서 사용되는 예측자의 수를 본질적으로 결정하는 것은 시드입니다.

모든 매개 변수가 영향을 받습니다. 다만 예시보다 훨씬 더 많은 조합이 있을 수 있다는 점을 말씀드리고 싶었습니다. 4개의 예측자를 사용하면 0.3-0.5의 학습률로 1~3개의 CB 트리로 구성된 모델에서 의미가 있으며, 그렇지 않으면 이미 적합하다고 볼 수 있습니다.

Renat Akhtyamov 2022.12.06 08:47 #152

Aleksey Vyazmikin #:

새로운 데이터에 대한 학습을 계속하기 위해 다양한 샘플을 공급할 수 있습니다. CatBoost도 이 작업을 수행할 수 있는 것 같습니다. 모델을 병합하는 방법도 알고 있지만 자세히 살펴보지는 않았습니다.

그라데이션 부스팅입니다...

즉, 이전 모델의 오류를 통해 학습하고

하나의 모델에 대해서만 여러 번 훈련하면 됩니다.

모델 간의 유일한 차이점은 샘플이 시간에 따라 이동한다는 것입니다.

Aleksey Vyazmikin 2022.12.06 08:52 #153

Renat Akhtyamov #:

그라데이션 부스팅.....

즉, 이전의 실수로부터 배우는 것입니다.

하나의 모델에 대해서만 여러 번 훈련하면 됩니다.

모델 간의 유일한 차이점은 샘플이 시간에 따라 이동한다는 것입니다.

제 뇌는 여러분이 작성한 내용을 처리할 수 없습니다.

Maxim Dmitrievsky 2022.12.06 09:27 #154

Aleksey Vyazmikin #:

네, 4개의 예측자 시드에는 큰 효과가 없을 수도 있습니다. 이는 오해입니다. 실제로 시드는 모델에서 사용할 예측자 수를 결정합니다.

모든 매개 변수가 영향을 받습니다. 다만 예시보다 훨씬 더 많은 조합이 있을 수 있다는 점을 말씀드리고 싶었습니다. 4개의 예측자를 사용하면 0.3-0.5의 학습률로 1~3개의 CB 트리로 구성된 모델에서 의미가 있으며, 그렇지 않으면 이미 적합하다고 볼 수 있습니다.

시드는 정상적인 최적값이 있는 곳에는 영향을 미치지 않습니다.

+- 단락이 있어도 상관없습니다.

약간 조정할 수 있지만 더 이상 중요하지 않습니다.

Aleksey Vyazmikin 2022.12.06 09:38 #155

Maxim Dmitrievsky #:

시드는 일반적인 최적값이 있는 곳에서는 효과가 없습니다.

+- 단락이 있으면 역할을하지 않습니다.

약간 조정할 수는 있지만 중요하지는 않습니다.

어디에 있나요?

Maxim Dmitrievsky 2022.12.06 09:39 #156

Aleksey Vyazmikin #:

어디에 있나요?

시드 테마의 변형이 결과에 큰 영향을 미치지 않는 곳입니다.)

Aleksey Vyazmikin 2022.12.06 10:25 #157

Maxim Dmitrievsky #:

시드 테마의 변형이 결과에 큰 영향을 미치지 않는 것으로 보입니다.)

우리의 경우는 분명히 아닙니다...

Maxim Dmitrievsky 2022.12.06 10:41 #158

Aleksey Vyazmikin #:

저희의 경우는 그렇지 않습니다.

기대해 볼 만한 일이죠.

Aleksey Vyazmikin 2022.12.06 10:47 #159

Maxim Dmitrievsky #:
기대할 만한 것이 있습니다.

있습니다. 그러나 이것은 이상적인 세계에 대해 이야기하고 있으며 때로는 기존 세계에 적응하는 것이 더 낫습니다.

Valeriy Yastremskiy 2022.12.06 12:16 #160

Maxim Dmitrievsky #:
무작위로 검색하는 것이 더 나은지, 아니면 선험적으로 신뢰할 수 있는 정보를 고수하는 것이 더 나은지는 다음과 같은 문제입니다.

시작 시간과 종료 시간(세션, 달력) 외에는 아무것도 떠오르지 않습니다. 무슨 뜻인가요?

혼돈에 패턴이 있을까요? 찾아보겠습니다! 특정 샘플의 예에 대한 머신 러닝. - 페이지 16