그리고 당신의 의견으로는 테스트에서 어느 시점에 맞춰야합니까? "테스트" 샘플은 교육을 중지하는 데 사용됩니다. 하나는 제외하고는 프로젝트 에서 전혀 존재하지 않으며 최종 교육에서 사용했습니다. /300/500/800 모든 샘플에 대한 결과를 보면 결과가 훨씬 더 나빠질 것이라고 생각하십니까?
그리고 당신의 의견으로는 테스트에서 어느 시점에 맞춰야합니까? "테스트" 샘플은 교육을 중지하는 데 사용됩니다. 하나는 제외하고는 프로젝트 에서 전혀 존재하지 않으며 최종 교육에서 사용했습니다. /300/500/800 모든 샘플에 대한 결과를 보면 결과가 훨씬 더 나빠질 것이라고 생각하십니까?
예 - 훈련을 중단하는 것도 테스트에 적합합니다. 나는 당신의 시스템에 대한 다른 세부 사항을 알지 못합니다. 더 이상 말할 수 없습니다. 교차 검증에서 모든 데이터는 테스트이고 모든 데이터는 기차입니다. 차례를 지키세요. 기차 면적을 40% 늘리고 싶었습니다.
이제 첫 번째 질문에 대한 답변
고맙습니다!
알아내려고 노력하겠지만 당장은 어렵습니다. 그럼에도 불구하고 코드의 구문은 C ++와 크게 다릅니다.
테스트에서 가장 성공적인 버전으로 모델을 조정했다고 생각하지 않습니까?
그리고 당신의 의견으로는 테스트에서 어느 시점에 맞춰야합니까? "테스트" 샘플은 교육을 중지하는 데 사용됩니다. 하나는 제외하고는 프로젝트 에서 전혀 존재하지 않으며 최종 교육에서 사용했습니다. /300/500/800 모든 샘플에 대한 결과를 보면 결과가 훨씬 더 나빠질 것이라고 생각하십니까?
고맙습니다!
알아내려고 노력하겠지만 당장은 어렵습니다. 그럼에도 불구하고 코드의 구문은 C ++와 크게 다릅니다.
그리고 당신의 의견으로는 테스트에서 어느 시점에 맞춰야합니까? "테스트" 샘플은 교육을 중지하는 데 사용됩니다. 하나는 제외하고는 프로젝트 에서 전혀 존재하지 않으며 최종 교육에서 사용했습니다. /300/500/800 모든 샘플에 대한 결과를 보면 결과가 훨씬 더 나빠질 것이라고 생각하십니까?
교차 검증에서 모든 데이터는 테스트이고 모든 데이터는 기차입니다. 차례를 지키세요. 기차 면적을 40% 늘리고 싶었습니다.
언어 수준이 높기 때문에 생소한 기능이 많습니다.
내 모든 변태가 R에서 쉽게 구현될 수 있다고 생각하지 않습니다. :)
예 - 훈련을 중단하는 것도 테스트에 적합합니다. 나는 당신의 시스템에 대한 다른 세부 사항을 알지 못합니다. 더 이상 말할 수 없습니다.
이론상 이렇게 하면 테스트 샘플의 결과가 증가한다는 데 동의하지만 테스트 샘플에서 결과를 평가합니다!
글쎄, 나는 모든 세부 사항을 설명한 것 같았습니다. 질문이 있으면 질문하십시오.
교차 검증에서 모든 데이터는 테스트이고 모든 데이터는 기차입니다. 차례를 지키세요. 기차 면적을 40% 늘리고 싶었습니다.
자, 교차 검증을 사용하는 목적은 무엇입니까? 현재로서는 모델 하이퍼파라미터를 검색할 때 그 의미를 알고 있습니다. 평균적으로 임의의 영역에서 어떤 설정이 가장 좋은지 보여주기 때문입니다.
내 모든 변태가 R에서 쉽게 구현될 수 있다고 생각하지 않습니다. :)
아 아 아))))
내가 내 변태를 깨달을 수 있다면, 당신의 긴장을 푸는 방법)
자, 교차 검증을 사용하는 목적은 무엇입니까? 지금 은 모델 하이퍼파라미터 검색 에서 그 의미를 알고 있습니다. 평균적으로 임의의 섹션에서 어떤 설정이 가장 좋은지 보여주기 때문입니다.
이를 위한 것입니다. 다른게 필요하신가요? 그리고 특정 기능 세트. 기능이 다르면 하이퍼파라미터가 다를 가능성이 큽니다. 다음은 최고의 하이퍼파라미터로 선택하고 실행해야 하는 것들입니다.
글쎄, 나는 모든 세부 사항을 설명한 것 같았습니다. 질문이 있으면 질문하십시오.
깊이 들어가는 것은 너무 게으르다.
아 아 아))))
내가 내 변태를 깨달을 수 있다면, 당신의 긴장을 푸는 방법)
자, 여기 있습니다. 데이터 준비를 위한 스크립트를 만들고 있기 때문에 다음을 포함하는 제외된 열을 나열하는 파일도 만들어야 합니다.
1. 상관된 예측 변수가 있는 열(그런데 버릴 열이 어떻게 선택되는지, 상관 관계가 있는 예측 변수가 5개라고 가정해 봅시다.).
2. 대상의 열을 제외하고 첫 번째 파일 테이블에서 삭제된 열.
또한 파일에 대상 레이블이 있는 열을 작성해야 하므로 열 이름으로 검색하는 것이 좋습니다.
파일 구조는 이렇습니다
이를 위한 것입니다. 다른 것이 필요하십니까? 그리고 특정 기능 세트. 기능이 다르면 하이퍼파라미터가 다를 가능성이 큽니다. 다음은 최고의 하이퍼파라미터로 선택하고 실행해야 하는 것들입니다.
깊이 들어가는 것은 너무 게으르다.
더 짧은 시간에 원하는 예측 변수를 선택해야 합니다. 예측자를 더 많이 거치면 처리 시간이 수백 배 증가합니다. 내 방법은 모든 샘플링 간격에서 모델에 좋은 예측 변수(특정 학습 방법에 적합한 예측 변수 포함)가 필요하다는 논리를 기반으로 합니다.