트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3082

 
Maxim Dmitrievsky #:
직업이 치료사이기도 하나요? 아니요, 저는 풀타임 치료사입니다.

네, 고객을 찾고 있는데 등록하시겠어요?

사실, 당신은 비판을 받아들이지 않아요. 당신은 샘플에서 불편한 부분을 걸러내어 당신의 접근 방식에 과학성을 부여한 것과 비슷한 것을 보았고 지금은 그것을 옹호하고 있습니다. 방어하는 방법 중 하나는 상대를 비하하고 모욕함으로써 공격하는 것입니다. 나는이 문제에 진전이 있음을 인정합니다 - 당신은 더 절제 해졌습니다 - 그리고 나는 이것에서 당신을 칭찬 할 수도 있습니다.

동시에 공동 활동에 대한 저의 제안, 즉 연구중인 주제에 대한 지식을 풍부하게하기위한 건설적인 제안-당신은 그것을 주제에서 산만하다고 부릅니다.

이 스레드의 주제는 무엇입니까-개별 참가자의 마음의 아름다움과 독창성을 보여주기 위해? 다시 말해, 진실을 찾기보다는 수다를 떠는 것이라고 생각하시나요?

 
Maxim Dmitrievsky #:
저는 제가 쓰는 글에 대해 명확히 알고 있습니다. 그렇지 않다면 글을 쓰지 않을 것입니다. 그렇지 않아요. 허둥대지 마, 짜증 나잖아.
.
자료를 공부한 다음 토론을 하죠. 못해도 화내지 않을게요. 씹어서 입에 넣는 것은 다른 사람들을위한 것입니다.

맥심, 아까 제가 구한 번역본을 던졌어요. 솔직히 말해서 나는 SanSanych Fomenko 와 비슷한 결론에 도달했습니다. 나는 그것이 왜곡 된 번역이라는 것을 인정합니다. 많은 것들이 이상하게 들리기 때문에 샘플링 처리 한 다음 지표를 맞추고 ....

그렇기 때문에 아무도 이해하지 못한 것을 적어도이 단어로 자신의 말로 설명하는 것이 좋습니다. 어쩌면 그 후에 나는 서면 정보를 다르게 인식 할 것입니다.

다음은 번역에서 발췌 한 것입니다. 모든 것이 명확합니까?


 
СанСаныч Фоменко #:

기사에 없는 내용입니다.

교차 검증을 포함하여 원래 예측자의 다른 분할을 사용한 일반적인 피팅이 설명되어 있습니다. 단어로 위장된 루틴입니다.

머신러닝 전문가에게 질문이 있습니다. 한 캐릭터의 데이터를 훈련에 사용하고, 다른 캐릭터의 데이터를 검증에 사용하고, 세 번째 캐릭터의 데이터를 테스트에 사용하는 경우 이것이 좋은 방법인가요?

또한 테스트 데이터에서 녹색 셀은 매우 좋음, 노란색 셀은 좋음, 빨간색 셀은 평균이라는 결과를 얻고 있습니다.


또한 모델 학습을 위한 데이터 수정에 관한 질문도 있습니다. 제 경우에는 60 이상의 값과 40 미만의 값을 찾는 데 어려움을 겪고 있습니다.
그래서 훈련 데이터에서 60 이상의 값과 40 미만의 값을 찾아서 모델에 공급하기 전에 훈련 데이터에 다시 추가하므로 극값에 대한 정보가 포함된 훈련 데이터를 늘려서 모델의 정확도를 향상시킬 수 있는지 궁금합니다.

inputs_unique, indices = np.unique(inputs, axis=0, return_index=True)
outputs_unique = outputs[indices]

#  Find indices where outputs_unique values are greater than 60
indices_greater_than_60 = np.where(outputs_unique > 0.6)

#  Get the corresponding inputs_unique and outputs_unique values
filtered_inputs_greater = inputs_unique[indices_greater_than_60]
filtered_outputs_greater = outputs_unique[indices_greater_than_60]

#  Add filtered_inputs values to inputs_unique
inputs_unique = np.concatenate((inputs_unique, filtered_inputs_greater), axis=0)
#  Add filtered_outputs values to outputs_unique
outputs_unique = np.concatenate((outputs_unique, filtered_outputs_greater), axis=0)

#  Find indices where outputs_unique values are smaller than 40
indices_smaller_than_40 = np.where(outputs_unique < 0.4)

#  Get the corresponding inputs_unique and outputs_unique values
filtered_inputs_smaller = inputs_unique[indices_smaller_than_40]
filtered_outputs_smaller = outputs_unique[indices_smaller_than_40]

#  Add filtered_inputs values to inputs_unique
inputs_unique = np.concatenate((inputs_unique, filtered_inputs_smaller), axis=0)
#  Add filtered_outputs values to outputs_unique
outputs_unique = np.concatenate((outputs_unique, filtered_outputs_smaller), axis=0)
 
Chapter 1 Introduction | An R Companion for Introduction to Data Mining
  • Michael Hahsler
  • mhahsler.github.io
1.1 Used Software This companion book assumes that you have R and RStudio Desktop installed and that you are familiar with the basics of R, how to run R code and install packages. If you are new...
 

 
Lilita Bogachkova #:

머신 러닝 전문가에게 질문이 있습니다. 한 캐릭터의 데이터를 학습에, 다른 캐릭터의 데이터를 검증에, 세 번째 캐릭터의 데이터를 테스트에 사용하는 경우 이것이 좋은 방법 인가요?

간단히 말해서 아니요.

수박을 인식하도록 모델을 훈련시키고, 사과를 대상으로 테스트하고, 유효성을 검사하고...

 
Lilita Bogachkova #:

머신 러닝 전문가에게 질문이 있습니다. 한 캐릭터의 데이터를 학습에, 다른 캐릭터의 데이터를 검증에, 세 번째 캐릭터의 데이터를 테스트에 사용하는 것이 좋은 방법인가요?

동일한 기호에 노이즈를 추가하여 사용해 보세요.

 
Rorschach #:

동일한 캐릭터에 노이즈를 추가하여 사용해 보세요.

틱이 아니라면 시간을 이동하는 것이 더 낫다고 생각합니다,

노이즈는 데이터를 왜곡하고 노이즈에는 매개 변수가 있으며 어떤 것을 선택할지 명확하지 않으며 일반적으로 최근에했던 것처럼 노이즈에서 따옴표를 만드는 것은 어떨까요?

 
Maxim Dmitrievsky #:

귀찮은 매개변수를 함수로 바꾸려면 문서에서와 같이 RF의 출력 값 또는 기본 알고리즘을 사용할 수 있습니다. 전혀 모르는 분들을 위해: 선택한 파라미터의 값을 함수 값으로 바꾸세요. 그런 다음 선형 회귀 (또는 다른 알고리즘)가 트리트먼트 효과를 평가하는 메타 러너가됩니다. 이 모든 것이 작동하는 이유와 방법 - 수학을 배워보세요.

그것을 이해하려면 머리로 생각하기 시작할만큼 충분합니다. 그러나 Sanych는 생각없이 무언가를 말하고 싶기 때문에 다시 넌센스를 만들기 시작할 것입니다. Sanych, 당신의 이해 부족이 너무 커서 RF 매개 변수를 일종의 증거로 인용하는 것은 절대적으로 믿을 수 없습니다. 나는 당신에게 3 번 썼습니다-RF는 잊어 버리세요. 마지막으로 : 주제를 공부 한 다음 폭언하십시오. 그렇지 않으면 같은 배우지 않은 사람들이 당신을 맹목적으로 믿습니다.

그리고 내 게시물에 대해 아는 사람처럼 (성가신) 내 게시물에 응답하지 마십시오. 왜냐하면 당신은 아무것도 모르고 프 투슈 닉의 격찬처럼 보이기 때문입니다.

출처에 대한 모든 참조는 글에 명시되어 있습니다. 눈먼 새끼 고양이처럼 모든 단어를 찔러야 하나요? 아니면 여러분도 결국 어른인가요?

당신은 다른 것을 인용하는 사람입니다....

우리는 모델을 잘 훈련시키고, 자발적인 예측 변수를 가져와서 모델이 예측한 값으로 대체한 다음 모델을 다시 훈련시킵니다. 회귀 모델/데이터에 대한 RMSE를 통해 결과를 비교합니다. 결과가 개선되었다면 대체된 예측자가 훈련 기간 동안 속성을 변경한 것일까요, 아니면 다른 이유가 있을까요?

 
Lilita Bogachkova #:

머신 러닝 전문가에게 질문이 있습니다. 한 캐릭터의 데이터를 학습에, 다른 캐릭터의 데이터를 검증에, 세 번째 캐릭터의 데이터를 테스트에 사용하는 경우 이것이 좋은 방법 인가요?

또한 테스트 데이터에서 녹색 셀은 매우 우수, 노란색 셀은 양호, 빨간색 셀은 평균이라는 결과를 얻습니다.

저는 전문가는 아니지만 제 생각을 공유하겠습니다.

다양한 캐릭터에서 성공적으로 실행되는 모델을 얻는 사람은 거의 없습니다. 따라서 실제로 그런 경우라면 좋은 성과로 간주할 수 있습니다. 저는 모델이 확률적으로 똑같이 실현되는 패턴을 본다고 가정합니다.

릴리타 보가코바 #:

모델 학습을 위한 데이터 수정에 관한 질문도 있습니다. 제 경우에는 모델이 60 이상의 값과 40 미만의 값을 찾는 데 어려움을 겪고 있습니다.
그래서 훈련 데이터에서 60 이상과 40 미만의 값을 찾아서 모델에 공급하기 전에 훈련 데이터에 추가로 추가하므로 극값에 대한 정보가 포함 된 훈련 데이터를 늘려 모델의 정확도를 향상시킬 수 있는지 질문합니다.

샘플을 더 추가하면 모델은 사용 된 예측자의 프리즘에있는 경우 모델에서 통합 패턴을 찾을 수 있습니다.