Neuronales Netz und Eingaben - Seite 38

 

Guten Tag.

Und nicht nur das. Ich verwende ada, randomForest (in verschiedenen Varianten), C50 und andere. Aber die besten Ergebnisse liefern natürlich ada und rfNear() von CORElearn. Das hochgelobte svm hat keine Vorteile gezeigt (außer, dass es sehr lange braucht, um zu lernen). Ohne seine Bedeutung zu schmälern, vielleicht konnte ich es nicht richtig kochen?

Der Ablauf der Arbeiten ist wie folgt.Überprüfen Sie die Eingabedaten auf ihre Signifikanz und bestimmen Sie die optimalen Parameter für jedes Modell. Berechnung nach drei verschiedenen Modellen mit Kalibrierung, Entscheidung durch einfache Abstimmung. Bei einer anfänglichen Stichprobe von 1000 Takten funktioniert das Modell stabil mit 250 Takten ohne Nachschulung. Genauigkeitskontrolle und Schätzung.

Es gibt Pakete, die den Einfluss von Vorverarbeitungsmethoden auf das Ergebnis abschätzen und die beste Methode auswählen, zusätzlich zur Auswertung der Eingabedaten mit Hilfe von Hauptkomponentenmethoden. Ich habe sie noch nicht gemeistert, weil ich nicht genug Zeit habe. Aber ich werde sie weiter studieren.

Viel Glück!

 
grell:

Welche Eingangssignale enthalten Ihrer Meinung nach nützliche Informationen:)

Siehe PDF im angehängten Archiv: p. 17 Reduktion von unbedeutenden Prädiktoren ...


Es gibt ein einfaches Beispiel, das deutlich zeigt, dass die Methode nur die Eingaben korrekt auswählt, die keine erklärenden Variablen in der Trainingsstichprobe sind.

 
HMM... Interessant, ich habe das Projekt über den Link im Buch heruntergeladen, weiß aber nicht, wie man es ausführt. Können Sie mir einen Tipp geben?
 
Und beim Öffnen über Java. Es heißt, dass keine Jproject-Klasse.... So....
 

Hier ist ein Fenster wie dieses....

 
nikelodeon:
HMM... Interessant, habe das Projekt über den Link im Buch heruntergeladen, aber wie man es ausführt, weiß ich nicht. Können Sie mir das sagen?

Ist es möglich, dass die Java-Version auf Ihrem Computer nicht mehr aktuell ist? Ich habe das Projekt unter Version 1.8.0_25 kompiliert

Laden Sie die neueste Version von Java2SE (JRE oder JDK) herunter von: http: //java.com/ru/

 

Großartig, alles läuft, aber es ist nicht klar, in welcher Form die Daten eingereicht werden sollten.... Es ist klar, dass .csv Nun, wie sie angeordnet werden sollten, etc.

Wenn Sie mir eine Datei mit einem Beispiel schicken können....

 
nikelodeon:

Großartig, alles läuft, aber es ist nicht klar, in welcher Form die Daten sein sollen.... Es ist klar, dass .csv Nun, wie sollen sie angeordnet werden, etc.

Wenn Sie die Datendatei mit dem Beispiel an.... senden können

siehe. Vorhersage des Konkurses.

Im Anhang befindet sich eine CSV-Datei mit einem Beispiel für die Klassifizierung.

Kurz gesagt:

Das Zelltrennzeichen ist ein Semikolon.

Trennzeichen des ganzzahligen Teils vom gebrochenen Teil bei Zahlen: entweder Punkt oder Komma (alle Kommas werden automatisch durch Punkte ersetzt).

Die erste Spalte - Identifikatoren der Beispiele (in Textform)

Letzte Spalte - Werte der abhängigen Variablen: 1 - Zugehörigkeit zu einer bestimmten Klasse, 0 - Zugehörigkeit zu einer undefinierten Klasse (jede andere Klasse als die angegebene)

Erste Zeile - Faktorkennungen (in Textform)

Zweite Zeile - Anmerkungen zu den Faktorbezeichnungen, z. B. Maßeinheiten (als Text)

Die restlichen Daten unterhalb der zweiten Zeile, rechts von der ersten Spalte und links von der letzten Spalte sind numerische Werte von Faktoren (nicht numerische Werte werden nicht verarbeitet).

 
Natürlich war meine Formel einfacher, und ich hatte nicht viele Daten, aber wie soll ich sie interpretieren? Ich verstehe das nicht :-(.
 

Ich verstehe. Die erste Transformation ist die Normalisierung der Eingabedaten. Nach der Normalisierung setze ich die Daten in die Formel ein und erhalte das ERGEBNIS von WAS? Ich meine, ich gebe die normalisierten Daten in die Formel ein und erhalte die Kurve des Indikators entsprechend der Formel. Warum sollte ich ein Zeichen >0? setzen?

es ist ein bisschen unklar :-(