트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 302

 
안드레이 :

흥미로운 스레드. 홍수가 많이 나지만 현명한 생각도 있다. 고맙습니다.


+
 
알렉산더 이바노프 :
))) 주요 커뮤니케이션 및 프로세스. 몇몇 사람들은 이미 신경봇을 만들고 있는 것 같습니다. 시도 할 것입니다.

불행히도 주제 입력의 문턱은 매우 높습니다. ML 자체의 분야는 이미 꽤 오래되었고 다른 분기와 방법의 수만 이미 무한대로 경향이 있습니다.

그리고 이전에 하지 않았다면 일반적으로 이 정보의 바다에서 익사할 수 있습니다.) 그러나 조각으로 잡고 싶지는 않지만 발사체에 대한 일종의 체계적인 접근이 필요합니다. .

그러나 나는 아직까지 어떤 종류의 정리된 체계화 정보도 찾지 못했다.

 
산산이치 포멘코 :


나에게 예측 오류는 주요 문제가 아닙니다. 저에게 가장 큰 문제는 모델을 과적합하는 것입니다. 모델이 과대적합되지 않았거나 모델이 전혀 필요하지 않다는 약한 증거가 있지만 둘 중 하나입니다.

나는 이 스레드(그리고 다른 스레드에서도)에서 오버트레이닝 진단 및 오버트레이닝과 싸우기 위한 도구에 대해 여러 번 썼습니다. 요컨대, 이것은 노이즈로부터 입력 예측자를 제거하는 것이며 모델 자체는 이차적으로 중요합니다.

다른 모든 것은 재교육을 고려하지 않은 결과이기 때문에 관심이 없습니다. 방금 일어난 일입니다. 지금, 아마도 내일, 그리고 내일 이후에는 저장소가 고갈됩니다.

음, 과적합은 lern과 테스트의 점수가 다를 때입니다. 테스트(훈련 샘플 외부)에서 좋은 점수를 받으면 모든 것이 정상입니다. 어떤 의미에서 과적합은 전혀 피할 수 없습니다.   허용 가능한 수준으로 줄일 수 있습니다.


추신: uv. Mihail Marchukajtes 는 Reshetov 분류기의 급경사를 증명하도록 요청받았습니다. 시도해 볼 수도 있습니다. 이 데이터에서 65% 이상의 정확도를 짜낼 수 있는 사람이 있는지 궁금합니다.)))

 
독성 :

음, 과적합은 lern과 테스트의 점수가 다를 때입니다. 테스트(훈련 샘플 외부)에서 좋은 점수를 받으면 모든 것이 정상입니다. 어떤 의미에서 과적합은 전혀 피할 수 없습니다.   허용 가능한 수준으로 줄일 수 있습니다.


추신: uv. Mihail Marchukajtes 는 Reshetov 분류기의 급경사를 증명하도록 요청받았습니다. 시도해 볼 수도 있습니다. 이 데이터에서 65% 이상의 정확도를 짜낼 수 있는 사람이 있는지 궁금합니다.)))


테스터는 일부 마무리 작업입니다. 그리고 TS의 효율성을 위한 신뢰 구간이 필요합니다.
유리 아사울렌코 :

불행히도 주제 입력의 문턱은 매우 높습니다. ML 자체의 분야는 이미 꽤 오래되었고 다양한 분기와 방법의 수만 이미 무한대로 경향이 있습니다.

그리고 이전에 해보지 않았다면 일반적으로 이 정보의 바다에서 익사할 수 있습니다.) 그러나 조각을 낚아채고 싶지 않다면 발사체에 대한 일종의 체계적인 접근이 필요합니다.

그러나 나는 아직까지 어떤 종류의 정리된 체계화 정보도 찾지 못했다.


이것은 사실이 아닙니다.

일관성은 항상 초기 데이터 준비, 모델 피팅 및 이 모델 평가를 사용하는 것입니다.

첫 번째 근사치에서 이 모든 것이 덜거덕거립니다. 보고 놀 수 있습니다. 내 기사 를 가져 가면 지침뿐만 아니라 운동 데이터도 포함되어 있기 때문에 인건비가 최소화됩니다 (모든 것에 몇 시간).

 
유리 아사울렌코 :

불행히도 주제 입력의 문턱은 매우 높습니다. ML 자체의 분야는 이미 꽤 오래되었고 다양한 분기와 방법의 수만 이미 무한대로 경향이 있습니다.

그리고 이전에 해보지 않았다면 일반적으로 이 정보의 바다에서 익사할 수 있습니다.) 그러나 조각을 낚아채고 싶지 않다면 발사체에 대한 일종의 체계적인 접근이 필요합니다.

그러나 나는 아직까지 어떤 종류의 정리된 체계화 정보도 찾지 못했다.

우리의 세계는 주제의 수익성이 주제에 대한 진입 임계값의 높이의 단조로운 함수인 방식으로 배열됩니다. 진입 임계값이 높을수록(반드시 개념적 복잡성이 아니라 거품 임계값, 사회적 연결, 지리적 위치 등) 비즈니스의 잠재적인 수익성이 더 높아집니다.


많은 사람들이 수행하기 쉬운 것은 일반적으로 비용이 거의 들지 않으며 초과분은 말할 것도 없고 성인을 먹일 수조차 없습니다.

 
독성 :

우리의 세계는 주제의 수익성이 주제에 대한 진입 임계값의 높이의 단조로운 함수인 방식으로 배열됩니다. 진입 임계값이 높을수록(반드시 개념적 복잡성이 아니라 거품 임계값, 사회적 연결, 지리적 위치 등) 비즈니스의 잠재적인 수익성이 더 높아집니다.

많은 사람들이 수행하기 쉬운 것은 일반적으로 비용이 거의 들지 않으며 초과분은 말할 것도 없고 성인을 먹일 수조차 없습니다.

확실히 그렇습니다. 그러나 높은 진입 문턱은 또한 다양한 위험을 증가시킵니다. 반드시 재정적인 것은 아닙니다.
 
독성 :

많은 사람들이 수행하기 쉬운 것은 일반적으로 비용이 거의 들지 않으며 성인을 먹일 수도 없습니다....

++

또는 오히려 일반적으로 유망하지 않습니다.

 
이것이 내가 지점을보고 더 이상 거기에 없다는 것을 이해하는 방법입니다 ...
 
mytarmailS :
이것이 내가 지점을보고 더 이상 거기에 없다는 것을 이해하는 방법입니다 ...

그 존재 자체가 놀랍습니다)))

주제는 모든 세부 사항에서 큰 소리로 말하는 것이 해롭다는 것이므로 ...

 
산산이치 포멘코 :

이것은 사실이 아닙니다.

일관성은 항상 초기 데이터 준비, 모델 피팅 및 이 모델 평가를 사용하는 것입니다.

첫 번째 근사치에서 이 모든 것이 덜거덕거립니다. 보고 놀 수 있습니다. 내 기사 를 가져 가면 지침뿐만 아니라 운동 데이터도 포함되어 있기 때문에 인건비가 최소화됩니다 (모든 것에 몇 시간).

체계적인 접근 방식으로 나는 결국 당신이하고있는 일에 대한 이해와 그에 따른 행동의 결과를 계획하고 예측하는 능력을 이해합니다.

기사 주셔서 감사합니다. 왜냐하면 나는 특정 소프트웨어에 익숙하지 않지만 초보자에게는 가장 간단하고 이해하기 쉽습니다. 어떤 방법이 사용되는지, 회귀 또는 분류가 이해되지 않았습니까?
당연히 그는 즉시 자신의 시스템을 시험해 보기 시작했습니다. 어떤 질문이 그것을 어렵게 만든다면, 신은 그를 축복할 것이고, 그것은 플레이 과정에서 분명해질 것입니다.

1. 나는 진입과 퇴장을 위해 양초를 사용하지 않습니다 - 시세의 흐름만, 양초는 이전 양초부터 시작하는 히스토리에만 있습니다. 훈련을 하는 것은 괜찮습니다. 양초로 배우게 하세요. 하지만 Rattle이 현재 양초 안에 있는 인용 부호의 흐름을 삼키게 하는 방법은 여전히 미스터리입니다. 동시에 양초의 흐름은 여전히 어떻게든 분석해야 합니다.

2. 조정 가능한 예측 변수로 무엇을 해야 합니까? 예를 들어 회귀선과 시그마가 있습니다. 그것들을 역사(학습용)로 대체할 수도 없습니다. 즉석에서 계산하고 역사에서 이전 구성의 흔적을 제거하는 함수가 필요합니다.

3. 유사하게 - 항상 존재하지 않고 시리즈의 특정 지점에서 구축되고 일반적으로 플레이 과정에서 다시 구축될 수 있는 깜박거리는 예측자.

4 항목 2 및 3에 따른 예측 변수의 정규화 문제 - 근본적으로 불가능합니다.

그리고 예측 변수의 이력은 훈련과 작업 과정에서 모두 계산되어야 합니다.

지금까지 완전한 혼란.

사유: