트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 387

 
박사 상인 :

그리고 이 돈을 인출할 수 있습니까?
 
박사 상인 :

돈을 버는 방법보다.

돈을 벌고 싶다면 numerai가 자체 암호화폐를 출시한 것 같습니다. 소유자는 투자에 간접적으로 참여할 수 있는 기회가 있는 것으로 보입니다.

자세히 말은 안 하고 다 파악하고 싶은데 손이 안 닿는다.

 
박사 상인 :

흥미롭게도 유효성 검사 데이터에서 0.690 - 0.691의 로그 손실로 거의 모든 사람들이 새 데이터에서 좋은 결과를 보였습니다. 이것이 무엇과 관련이 있는지 상상조차 할 수 없습니다.

아마도 그들은 욕심이 없었고 모델을 지나치게 복잡하게 만들지 않았으므로 과적합하지 않았을 것입니다. 비록 그가 라이브 중이었던 일부 투어에서 ~ 0.65의 삼촌 같았지만 ~ 0.68+

그들의 데이터에서 나는 샘플의 혼란에 더 혼란스러워합니다. 이해할 수없는 id를 가진 "시대"는 과거 여행의 계산에서 재현 될 수 없습니다. 즉, 지옥은 훈련 세트에서 무엇을 알고 있으며 이전 라이브 투어에서 실제 로그 손실이 계산된 샘플이 배치되고 이 테스트 데이터 세트에 대한 모델을 훈련할 수 있다면 나쁘지 않을 것입니다. 적어도 그것이 갈라지는 이유를 이해하십시오. IMHO, 그들은 오랫동안 포인트를 축적한 것 같습니다. 그리고 기차로, 그들은 임의의 하위 집합을 제공하고 id-shniks는 데이터 집합 누적의 연대기를 반영하지 않으며, 그 다음에는 필요한 라이브 포인트를 반영합니다. bevanged는 모델을 수정하기 위해 별도로 제공되지 않으며 아마도 "하늘을 향한 손가락"으로 밝혀졌습니다.

그들이 그것을 해결하기를 바랍니다 :)

 
무작위 포리스트 가 이진 분류에 더 낫다는 것을 누군가 확인할 수 있습니까? 일반적인 경우 또는 특정 경우에 신경망을 선택할 수 있습니까? 그러면 약간 더 작은 오류가 발생합니까?


 
팬츄럴 :
그리고 이 돈을 인출할 수 있습니까?

예, 현재 비율로 비트코인으로 즉시 출금할 수 있습니다.


결합기 :

돈을 벌고 싶다면 numerai가 자체 암호화폐를 출시한 것 같습니다. 소유자는 투자에 간접적으로 참여할 수 있는 기회가 있는 것으로 보입니다.

자세히 말은 안 하고 알아내고 싶은데 손이 닿지 않는다.

예, 이제 그들은 달러와 함께 승자에게 암호를 제공합니다. 예를 들어, 나는 300 NMR(Numeraire)을 축적했지만 지금은 철회할 수 없거나 아무 것도 할 수 없습니다. 일반적으로 그들은 아직 이 지하실을 실제로 유통시키지 않았으며 지금까지는 배포만 하고 있습니다.

NMR 자체는 이더리움 암호화 토큰( https://github.com/ethereum/EIPs/issues/20 )이며 그들이 제공하는 투자 역시 이더의 기능을 기반으로 합니다. 더 정확히 말하면, 이것은 투자도 아니고, 당신의 예측에 돈을 투자할 기회입니다. 예측을 업로드하고 NMR에 내기를 걸면 이더리움의 알고리즘이 잠시 후 승자를 결정하고 상금을 분배합니다( https://numer.ai/whitepaper.pdf ). 카지노, krch 말하기.


막심 드미트리예프스키 :
무작위 포리스트가 이진 분류에 더 낫다는 것을 누군가 확인할 수 있습니까? 일반적인 경우 또는 특정 경우에 신경망을 선택할 수 있습니까? 그러면 약간 더 작은 오류가 발생합니까?
여기에 게시된 기사에서 나는 분류의 세계가 예를 들어 R 패키지 gbm에서 그래디언트 부스팅(특수한 유형의 포리스트)에 의해 지배된다는 것을 읽었습니다.
 
박사 상인 :

예, 현재 비율로 비트코인을 즉시 인출할 수 있습니다.

흠 이상하다.

왜 미국 헤지 펀드가 르네상스 시대의 삼촌의 후원으로 200-300,000 달러의 급여와 6 자리 보너스와 함께 지구상에서 가장 멋진 퀀트와 같은 ML 애호가의 예측이 발생합니다. 세계 (러시아, 인도, 중국 ...), sn. 전체 군중을 위한 한 명의 평균 모스크바 프로그래머(> 300명)????

마치 그들이 이것을 위한 자신의 퀀트가 없는 것처럼? 아니면 하버드 출신의 퀀트들이 이런 일에 질려 투자자들과의 소통을 위한 것이며, 모델들은 아웃소싱을 하게 됩니다....

흠 ... 그런 선견지명 부족에 대해 어떻게 대가를 치르겠습니까 ...

 
박사 상인 :


여기에 게시된 기사에서 나는 분류의 세계가 예를 들어 R 패키지 gbm에서 그래디언트 부스팅(특수한 유형의 포리스트)에 의해 지배된다는 것을 읽었습니다.

과적합 하기도 하고.. 더 읽어봐야겠습니다.. 어쨌든 MLP가 더 좋습니다. 그건 그렇고, 부스트된 결정 트리는 스튜디오의 단순 결정 트리보다 약간 더 나쁜 오류를 제공합니다.
 
막심 드미트리예프스키 :

과적합 하기도 하고.. 더 읽어봐야겠습니다.. 어쨌든 MLP가 더 좋습니다. 그건 그렇고, 부스트된 결정 트리는 스튜디오의 단순 결정 트리보다 약간 더 나쁜 오류를 제공합니다.


ada는 randomforest보다 약간 낫습니다. 그러나 캐럿에 ada에 몇 가지 문제가 있으므로(어느 것이 기억나지 않음) 이 게임은 양초의 가치가 없습니다.

가장 유망한 것은 예측 변수를 선택하는 것입니다. 우리 모두 중에서.

많은 수의 예측 변수가 이 분기에 사용되었지만 모든 파생 상품은 하나의 통화 쌍입니다.

왜 한 켤레가 아니라 여러 켤레입니까?

예측 변수로 인덱스가 아닌 통화 쌍이 필요한 이유는 무엇입니까?

거시 경제 데이터는 어디로 갔습니까?


오늘 새 파일에 30% 미만의 오류가 있습니다. 20 %는 어떤 트릭으로도 달성 할 수 없으며 모델을 교체해도 아무 것도 얻지 못합니다.

그러나 위의 질문에 답을 시도하고 답할 힘이 없습니다.

 
산산이치 포멘코 :


ada는 randomforest보다 약간 낫습니다. 그러나 캐럿의 ada에는 몇 가지 문제가 있으므로(어느 것이 기억나지 않음) 이 게임은 양초의 가치가 없습니다.

가장 유망한 것은 예측 변수를 선택하는 것입니다. 우리 모두 중에서.

이 분기에서 많은 수의 예측 변수가 사용되었지만 모든 파생 상품은 하나의 통화 쌍에서 나왔습니다.

왜 한 켤레가 아니라 여러 켤레입니까?

예측 변수로 인덱스가 아닌 통화 쌍이 필요한 이유는 무엇입니까?

거시 경제 데이터는 어디로 갔습니까?


오늘 새 파일에 30% 미만의 오류가 있습니다. 20 %는 어떤 트릭으로도 달성 할 수 없으며 모델을 교체해도 아무 것도 얻지 못합니다.

그러나 위의 질문에 답할 힘이 없습니다.


이상하게도 이미 예측 변수가 있습니다. 실생활에 있는 기성 봇이 있으며, 한 달도 채 안 되어 작성됩니다. 가장 중요한 것은 예측 변수입니다. 이것은 논의되지 않습니다. 그렇습니다. 글쎄, 누가 무엇에 대한 경험이 있는지.. 예를 들어, 내 불타오르는 상상력으로 한 번에 예측 변수를 선택하고 5 년 동안 분석가로 일했습니다 :) 예측 변수 선택은 NN 아키텍처를 공부하는 것만큼 어려운 작업이 아니라고 봅니다. , 가장 중요한 것은 앉아서 픽업하고 2-3 주를 보내는 것입니다 :)

특히 최근에 유행하고 있는 LSTM은 컴퓨팅 성능이 매우 까다롭지만 놀라운 결과를 제공합니다. 이제 비디오 카드의 계산을 위해 최소한 NVidia Tesla와 같은 강력한 게임용 컴퓨터를 구입하는 것에 대해 생각하고 있습니다.

소규모 ns로 작업한 경험에서 - 그들은 기계에서 재교육을 받거나 재교육을 받아야 하며 이는 필수 프로세스입니다. NN에 대한 동일한 예측자의 매개변수를 선택하기 위해 GA를 사용하는 것도 필수 조건입니다. 이 모든 작업에는 전원이 필요하지만 그만한 가치가 있습니다. 이 3가지 구성 요소를 고려하면 이미 일종의 AI로 밝혀졌습니다. 재훈련 + 유전학 + 힘

 

산산이치 포멘코 :

오늘 새 파일에 30% 미만의 오류가 있습니다. 20 %는 어떤 트릭으로도 달성 할 수 없으며 모델을 교체해도 아무 것도 얻지 못합니다.

HFT의 경우에도 매우 높은 결과입니다. 그러한 결과를 얻은 데이터 세트를 csv로 공유할 수 있는지, 이것이 과적합이 아닌지 확인하고 싶습니다.

위성 처리 기능을 포함하여 수천 가지의 상상할 수 없는 기능에 대해 훈련을 받은 르네상스 시대조차도 65-70% 이하의 정확도로 미세한 예측을 한다는 사실에 대해 높은 곳과 먼 곳에서 때때로 메아리가 들렸습니다. 전 세계 메가시티의 도시 기반 시설 활동에 대한 이미지와 데이터, 지구상의 자연과 군중이 하는 모든 것은 데이터입니다.

사유: