트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3317

 
Andrey Dik #:

그 자리에 그대로 계세요. 당신만 빼고 모두 멍청하니 질문에 답은 당신이 하세요.

저게 뭐야? 저기 빨간 홍당무는 뭐야? 저기 동그랗고 빨간 거요.


이런 그래프는 처음 봐요.

소설가, 당신은 존재하지도 않는 것을 만들어내서 억지로 토론하고 있어요.

몇 년 동안 여기서 떠들지 말고 어떤 모델에서 그런 그래프를 얻는 것이 정상입니다.

 
따라서 차트의 글로벌 저점에서는 샤프트 커브가 최대한 위로 올라가기 때문에 엄청난 오버트레이닝이 발생합니다.
 
Andrey Dik #:

학습을 일부 구성원이 없는 함수의 답을 찾는 것으로 생각한다는 것을 올바르게 이해했나요?

예를 들어, 관측값 A+B+C=Y, A와 B가 예측변수이고 C는 알 수 없는 경우, 최적화를 통해 표본의 답(마크업)을 파악한 다음, NS의 경우 계수 곱하기 등 조작을 통해 표현하거나 상호 규칙을 통해 C 값의 보정을 선택합니다. 즉, 누락된 변수를 대체하고 정답에 접근하기 위해 함수에 대한 적극적인 조사가 이루어집니다. 샘플의 함수 계산 결과는 충분히 대표성이 있어 새로운 데이터에 사용할 수 있다고 가정합니다.

그러나 테스터에서 최적화를 수행하는 경우, 변수를 모른다고 가정하고 변수 값을 변경하거나(본질적으로 함수로 표현), Y 값에 근사한 규칙의 형태로 보상 함수에 더 많은 가중치를 부여할 변수를 알 수 있습니다.

 

우리는 이미 교사가 무엇인지 알고 있으므로 이제 다시 한 번 앤드류를 위해 사진을 찍습니다.

https://ru.wikipedia.org/wiki/%D0%94%D0%B8%D0%BB%D0%B5%D0%BC%D0%BC%D0%B0_%D1%81%D0%BC%D0%B5%D1%89%D0%B5%D0%BD%D0%B8%D1%8F%E2%80%93%D0%B4%D0%B8%D1%81%D0%BF%D0%B5%D1%80%D1%81%D0%B8%D0%B8

 

채팅GPT에서 추가 질문.


Max, [2023년 10월 26일, 18:59:31]:

변위-분산 딜레마는 글로벌 최소값을 찾는 것과 어떤 관련이 있나요?


ChatGPT 및 미드저니 | AI 봇, [2023년 10월 26일, 18:59:38]:

편향-분산 딜레마는 머신러닝의 모델 선택 문제를 말합니다. 새로운 기능을 추가하거나 매개변수 수를 늘리는 등 모델의 복잡성이 증가하면 모델 예측의 분산(확산)은 증가하지만, 더 단순한 모델에 대한 편향(오류)이 발생할 수 있다는 것을 나타냅니다.


반면에 글로벌 최소값을 찾는 것은 모델의 파라미터를 최적화하는 것을 의미합니다. 목표는 오차 함수의 최소값에 도달하는 매개변수 값을 선택하는 것입니다. 그러나 매개변수의 수가 많고 모델이 복잡하면 전역 최소값을 찾는 것이 어렵거나 불가능할 수도 있습니다.


따라서 머신러닝 문제에 대해 너무 복잡한 모델을 선택하면 과훈련 문제(높은 분산)가 발생할 수 있고, 너무 단순한 모델을 사용하면 언더트레이닝 문제(높은 편향)가 발생할 수 있다는 점에서 편향-분산 딜레마와 전역 최소값 찾기는 서로 연관되어 있습니다. 이로 인해 글로벌 최소값을 찾기가 어려워지고 차선의 결과가 나올 수 있습니다. 따라서 최적의 결과를 얻기 위해서는 모델의 복잡성과 데이터를 일반화할 수 있는 능력 사이의 균형을 찾는 것이 중요합니다.

 

최대, [2023년 10월 26일 19:03:50]:

이 경우 최적 모델은 글로벌 최소값과 일치해야합니까?


ChatGPT 및 미드저니 | AI 봇, [26 Oct 2023, 19:03:54]:

아니요, 최적의 모델이 반드시 글로벌 최소값과 일치하는 것은 아닙니다. 경우에 따라, 특히 데이터에 노이즈가 있는 경우 모델을 재학습하여 글로벌 최소값을 달성할 수 있습니다. 이러한 모델은 학습 데이터에 대해서는 높은 정확도를 보일 수 있지만 새로운 예제에 대한 일반화는 제대로 이루어지지 않을 수 있습니다.


대신 최적의 모델은 전역 최소값에 가깝지만 분산과 편향이 낮은 모델이어야 합니다. 이러한 모델은 새로운 데이터에 대해 안정적이고 정확한 예측을 생성합니다. 따라서 최적의 모델을 선택할 때는 학습 데이터에 대한 모델의 정확도뿐만 아니라 새로운 예제에 대한 일반화 능력도 고려하는 것이 중요합니다.

 
Aleksey Vyazmikin #:

학습을 일부 멤버가 없는 함수의 답을 찾는 것으로 표현한 것을 올바르게 이해했나요?

예를 들어, 관측값 A+B+C=Y, A와 B가 예측변수이고 C는 알 수 없는 경우, 최적화를 통해 표본의 답변(마크업)을 파악한 다음, NS의 경우 계수 곱하기 등 조작을 통해 표현하거나 상호 규칙을 통해 C 값의 보정을 선택합니다. 즉, 누락된 변수를 대체하고 정답에 접근하기 위해 함수에 대한 적극적인 조사가 이루어집니다. 또한 샘플의 함수 계산 결과가 충분히 대표성이 있다고 가정하여 새로운 데이터에 결과를 사용할 수 있습니다.

그러나 테스터에서 최적화를 수행하는 경우, 변수 값을 모른다고 가정하고 변수 값(본질적으로 함수로 표현)을 변경하거나 Y 값에 근사한 규칙의 형태로 보상 함수에 더 많은 가중치를 부여할 변수를 알 수 있습니다.

질문이 잘 이해가 되지 않습니다. 명확하게 설명해 주세요.

 
Maxim Dmitrievsky 채팅GPT에 물어보겠습니다.


Max, [2023년 10월 26일 18:59:31]:

변위-분산 딜레마는 글로벌 최소값을 찾는 것과 어떤 관련이 있나요?


ChatGPT & 미드저니 | AI 봇, [Oct 26, 2023, 18:59:38]:

편향-분산 딜레마는 머신러닝의 모델 선택 문제를 말합니다. 모델 복잡성이 증가함에 따라(예: 새로운 기능 추가 또는 매개 변수 수 증가) 모델 예측의 분산(확산)이 증가하지만 더 단순한 모델에 대한 편향(오류)이 있을 수 있음을 나타냅니다.

회귀가 아닌 분류에서 오차의 분산(확산)을 고려하는 것은 어떻게 제안되나요?

 
Maxim Dmitrievsky #:

최대, [2023년 10월 26일, 19:03:50]:

이 경우 최적 모델은 글로벌 최소값과 일치해야합니까?


ChatGPT & 미드저니 | AI 봇, [26 Oct 2023, 19:03:54]:

아니요, 최적 모델이 반드시 글로벌 최소값과 일치하는 것은 아닙니다. 경우에 따라, 특히 데이터에 노이즈가 있는 경우 모델을 재학습하여 글로벌 최소값을 달성할 수 있습니다. 이러한 모델은 학습 데이터에 대해서는 높은 정확도를 보일 수 있지만 새로운 예제에 대한 일반화는 제대로 이루어지지 않을 수 있습니다.


대신 최적의 모델은 전역 최소값에 가깝지만 분산과 편향이 낮은 모델이어야 합니다. 이러한 모델은 새로운 데이터에 대해 안정적이고 정확한 예측을 생성합니다. 따라서 최적의 모델을 선택할 때는 학습 데이터에 대한 모델의 정확도뿐만 아니라 새로운 예제에 대한 일반화 능력도 고려하는 것이 중요합니다.

GPT에 언제 훈련을 중단해야 하나요? 아직 이 질문에 직접 답하지 않으셨군요.

 
Andrey Dik #:

질문이 잘 이해가 되지 않습니다. 명확하게 설명해 주세요.

제 계산이 정확하지 않고 정답은 "아니오"인데 프로세스에 대해 다른 생각을 가지고 계신 것 같습니다.