신경망 및 입력 - 페이지 38

 

안녕하세요.

뿐만 아니라. 저는 ada, randomForest(다양한 변형), C50 등을 사용합니다. 하지만 물론 CORElearn의 "ada"와 rfNear()가 최상의 결과를 제공합니다. 많이 자랑하는 svm은 어떤 이점도 보여주지 않았습니다(배우는 데 매우 오랜 시간이 걸린다는 점만 제외하면). 그 소중함을 얕잡아보지 않고는 제대로 요리할 수 없겠죠?

작업 순서는 이렇습니다. 입력 데이터 의 유의성을 확인하고 각 모델에 대한 최적의 매개변수를 결정합니다. 캘리브레이션이 있는 3가지 다른 모델에 의한 계산, 간단한 투표에 의한 결정. 1000개 막대의 초기 샘플을 사용하여 모델은 재훈련 없이 일관되게 250개 막대를 처리합니다. 정확성에 의한 모니터링 및 평가.

최근에는 주성분 방법의 입력 데이터를 평가하는 것 외에도 전처리 방법이 결과에 미치는 영향을 평가하고 가장 좋은 방법을 선택하는 패키지가 등장했습니다. 아직 완전히 숙달되지 않았고 시간이 없습니다. 그러나 나는 계속 공부할 것이다.

행운을 빕니다.

 
grell :

어떤 입력 신호가 유용한 정보를 전달한다고 생각하시나요? :)

첨부된 아카이브의 PDF 참조: p. 17 중요하지 않은 예측 변수 감소 ...


방법이 훈련 세트의 설명 변수가 아닌 입력에 대해서만 올바르게 축소한다는 것을 명확하게 보여주는 간단한 예가 있습니다.

 
흠.. 흥미롭게도 책에 있는 링크에서 프로젝트 를 다운받았는데 어떻게 실행해야 할지 모르겠습니다. 당신은 말할 수 있습니까???
 
그리고 Java를 통해 열 때. Jproject 클래스를 작성하지 않습니다 .... 이와 같은 것 ....
 

여기 창문이...

 
nikelodeon :
흠.. 흥미롭게도 책에 있는 링크에서 프로젝트를 다운받았는데 어떻게 실행해야 할지 모르겠습니다. 당신은 말할 수 있습니까???

컴퓨터의 Java 버전이 오래되었을 수 있습니까? 버전 1.8.0_25에서 프로젝트를 컴파일했습니다.

http://java.com/ru/ 웹사이트에서 최신 버전의 Java2SE(JRE 또는 JDK)를 다운로드할 수 있습니다.

 

좋아, 모든 것이 시작되었지만 데이터를 어떤 형식으로 제출해야 하는지 명확하지 않습니다.

예제와 함께 데이터 파일을 보낼 방법이 없다면....

 
nikelodeon :

좋아, 모든 것이 시작되었지만 데이터를 어떤 형식으로 제출해야 하는지 명확하지 않습니다.

예제와 함께 데이터 파일을 보낼 방법이 없다면....

파산 예측 참조

분류 예가 포함된 CSV 형식의 첨부 파일이 있습니다.

요컨대, 다음:

셀 구분 기호는 세미콜론입니다.

숫자의 분수 부분에서 정수의 구분 기호: 점 또는 쉼표(모든 쉼표는 자동으로 점으로 대체됨).

첫 번째 열 - 예제 식별자(텍스트 형식)

마지막 열은 종속 변수의 값입니다. 1 - 주어진 클래스에 속함, 0 - 지정되지 않은 클래스(주어진 클래스가 아닌 다른 클래스에 속함)

첫 번째 줄은 요인의 식별자입니다(텍스트 형식).

두 번째 줄 - 측정 단위(텍스트 형식)와 같은 요인 식별자에 대한 메모

첫 번째 열의 오른쪽과 마지막 열의 왼쪽에 있는 두 번째 행 아래의 나머지 데이터는 요인의 숫자 값입니다(숫자가 아닌 값은 처리되지 않음).

 
물론 내 공식은 단순해졌고 데이터도 많지 않았지만 어떻게 해석해야 할까??? 나는 그것을 이해하지 못한다 :-(
 

분명한. 첫 번째 변환은 입력 데이터의 정규화입니다.정규화 후 데이터를 공식에 대입하고 결과를 얻습니다. 즉, 정규화된 데이터를 공식에 대입합니다. 그리고 공식에 따라 표시 곡선을 얻습니다 ??? 그렇다면 기호 >0을 넣어야 하는 이유는 무엇입니까???

여기서 좀 헷갈리네요 :-(