트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1957

 
도서관 :

사실이야 일련의 작업을 즉시 설명하는 것이 좋을 것입니다 ...
다시 한 번 귀하의 설명에 대해 생각하고 다음 순서를 가정합니다.

1. 기차에 있는 모든 예측 변수의 상관 관계를 계산합니다.
2. 나무 만들기
3. 마지막 스플릿에서 예를 들어 마지막 100개의 베스트 스플릿을 기억하십시오. 최대 100개까지 선택 가능합니다.
4. 이 100개 중에서 가장 좋은 분할의 예측 변수와 상관 관계가 없고 서로 상관 관계가 없는 5개를 선택합니다.

또한 이 5가지 분할 중 어느 것을 선택해야 하는지 명확하지 않습니까?
무작위인 경우 각 트리에 무작위 예측자를 제공하고 그에 따라 트리를 구축하는 무작위 숲의 유사체가 있습니다.
평균이라면 다시 그 경우와 유사합니다. Forest는 무작위 트리에서 산술 평균을 찾습니다.

이제 제대로 이해했습니다!

랜덤 포레스트는 쓰레기가 많기 때문에 랜덤이고, 설명된 조건이 반드시 준수되는 것은 아니지만 유사한 상황이 있을 수 있으며 유사한 교란으로 성공적인 모델이 얻어질 가능성이 있습니다. 또한 보다 통제된 프로세스가 있을 것입니다.

물론 시트에서 각 분할의 가중치를 측정하거나 동일한 계수를 제공할 수 있으며 동일한 기록에서 계수를 선택할 수 있습니다. 이제 나뭇잎에서 모델을 수집할 때 일반적으로 이 작업을 수행합니다.

 
발레리 야스트렘스키 :

아니요, 아날로그 작업은 합계, 빼기, 곱하기, 나누기 및 아마도 더 복잡한 로그 종속성, 지수 함수입니다. 그리고 이것은 계산이 아니라 각 셀의 아날로그 장치입니다. 그리고 DAC와 ADC는 입력 출력으로 계산에 참여하지 않고 수치를 제공합니다.

Neumann 아키텍처에서 프로시저와 데이터는 모두 메모리에 저장되며 프로시저와 데이터에 대한 병렬 액세스, 데이터에 대한 액세스, 프로시저에 대한 액세스 및 다시 데이터에 대한 액세스가 없으므로 데이터 처리에 제한이 있습니다. 그리고 여기에서 절차는 작은 장치로 각 셀에 연결되며 데이터에 액세스하여 즉시 절차에 액세스할 수 있습니다.

데이터에 대해 이해가 가지 않습니다. 조건부로 말하면 각 명령어가 파이프라인 없이 메모리 및 계산 결과에 직접 액세스할 수 있습니까?

 
알렉세이 비아즈미킨 :

이제 제대로 이해했습니다!

랜덤 포레스트는 쓰레기가 많기 때문에 랜덤이고, 설명된 조건이 반드시 준수되는 것은 아니지만 유사한 상황이 있을 수 있으며 유사한 교란으로 성공적인 모델이 얻어질 가능성이 있습니다. 또한 더 통제된 프로세스가 있을 것입니다.

물론 시트에서 각 분할의 가중치를 측정하거나 동일한 계수를 제공할 수 있으며 동일한 기록에서 계수를 선택할 수 있습니다. 이제 나뭇잎에서 모델을 수집할 때 일반적으로 이 작업을 수행합니다.

마지막 단계를 이해하지 못했습니다. 5개의 분할 중 무엇을 선택해야 합니까?
 
도서관 :
마지막 단계를 이해하지 못했습니다. 5개의 분할 중 무엇을 선택해야 합니까?

5개 분할 모두의 판독값을 고려해야 하므로 이로 인해 안정성이 증가합니다.

가장 좋은 분할에 가중치 0.6 을 부여하고 나머지 4개에 각각 0.1을 부여하고 합계가 0.8 또는 샘플에 의해 결정된 다른 지표를 제공하면 시트의 답이 true "1" 또는 다음을 충족하는 다른 클래스라고 간주합니다. 시트로 예상됩니다.

Recall 에 대한 검사도 필요합니다. 이 하위 샘플에 분할이 있는 리뷰 수입니다.
 
알렉세이 비아즈미킨 :

데이터에 대해 이해하지 못합니다. 조건부로 말하면 각 명령어가 파이프라인 없이 메모리 및 계산 결과에 직접 액세스할 수 있습니까?

'데이터'는 없고 전자 장치만 있으며 그 전류는 트랜지스터 등에 의해 제어됩니다. NS 아키텍처 자체는 디지털 방식이 아닌 보드에 인쇄됩니다. 오랫동안 이러한 아날로그 신경망은 예를 들어 iPhone과 같은 보조 프로세서 형태로 만들어졌습니다.

기사에 새로운 것은 없습니다.
 
막심 드미트리예프스키 :

'데이터'는 없고 전자 장치만 있으며 그 전류는 트랜지스터 등에 의해 제어됩니다. NS 아키텍처 자체는 디지털 방식이 아닌 보드에 인쇄됩니다. 오랫동안 이러한 아날로그 신경망은 예를 들어 iPhone과 같은 보조 프로세서 형태로 만들어졌습니다.

기사에 새로운 것은 없습니다.

그리고 나는 우리가 정적인 것이 아니라 미리 정해진 동적 계산에 대해 이야기하고 있다는 것을 이해했습니다.

 
알렉세이 비아즈미킨 :

그리고 나는 우리가 정적인 것이 아니라 미리 정해진 동적 계산에 대해 이야기하고 있다는 것을 이해했습니다.

예를 들어 iPhone 카메라 매트릭스의 신호는 디지털화를 우회하여 아날로그 NS에 직접 공급됩니다. NS는 화질 개선을 위해 이미지 전처리(노이즈 필터링 등)를 수행합니다.

그런 다음 디지털 사진으로 변환됩니다.

 
알렉세이 비아즈미킨 :

그리고 나는 우리가 정적인 것이 아니라 미리 정해진 동적 계산에 대해 이야기하고 있다는 것을 이해했습니다.

전자 밸브와 압축기 밸브에 대한 대략적인 비유. 물론 셀의 장치는 정적이지만 많은 장치가 있고 액세스가 병렬입니다.) 계산은 동적 일 수 있습니다. 입력 신호를 변경하면 출력에서 동적 표시기를 얻습니다.

 
알렉세이 비아즈미킨 :

5개 분할 모두의 판독값을 고려해야 하므로 이로 인해 안정성이 증가합니다.

가장 좋은 분할에 가중치 0.6 을 부여하고 나머지 4개에 각각 0.1을 부여하고 합계가 0.8 또는 샘플에 의해 결정된 다른 지표를 제공하면 시트의 답이 true "1" 또는 다음을 충족하는 다른 클래스라고 간주합니다. 시트로 예상됩니다.

Recall 에 대한 검사도 필요합니다. 이 하위 샘플에 분할이 있는 리뷰 수입니다.
가장 깨끗한 스플릿은 덜 깨끗한 스플릿과 혼합됩니다. 저것들. 기차에서 결과를 악화시키는 것은 원칙적으로 우리에게 중요하지 않습니다. 그러나 이것이 테스트 결과를 향상시킬 것이라는 사실은 아닙니다. 일반화 능력. 누군가는 시도해야합니다 ... 개인적으로 일반화가 더 나은 경우라고 생각하지 않습니다. 숲.

트리의 깊이를 제한하고 마지막 분할을 수행하지 않고 이전 분할에서 멈추는 것이 훨씬 쉽습니다. 결과적으로 추가 분할을 수행할 때보다 덜 깨끗한 시트를 얻습니다. 당신의 선택은 우리가 분할할지 여부 사이에 무언가를 줄 것입니다. 저것들. 예를 들어 자신의 방식으로 7번째 깊이 수준에서 시트의 평균을 구합니다. 6단계 깊이의 시트보다 약간 더 깨끗합니다. 일반화는 이것에서 크게 달라지지 않을 것이라고 생각하지만, 아이디어를 테스트하기 위해 많은 작업이 있습니다. 깊이가 6과 7인 여러 나무의 평균을 구할 수도 있습니다. 방법에 따라 발생하는 것과 거의 같습니다.
 
알렉세이 비아즈미킨 :

사실 파도와 함께 어떤 행동? 들어오는 데이터가 다항식으로 변환된 다음 다항식이 파동으로 변환되고 파동이 어떻게든 "푸시/병합"됩니까?

글쎄요.

아날로그 컴퓨터를 구축하려는 시도는 이전에도 있었지만 매우 느리거나 에너지 집약적이었습니다.