Diskussion zum Artikel "Neuronale Netze leicht gemacht (Teil 24): Verbesserung des Instruments für Transfer Learning"

 

Neuer Artikel Neuronale Netze leicht gemacht (Teil 24): Verbesserung des Instruments für Transfer Learning :

Im vorigen Artikel haben wir ein Tool zum Erstellen und Bearbeiten der Architektur neuronaler Netze entwickelt. Heute werden wir die Arbeit an diesem Instrument fortsetzen. Wir werden versuchen, sie nutzerfreundlicher zu gestalten. Dies mag ein Schritt weg von unserem Thema sein. Aber ist es nicht so, dass ein gut organisierter Arbeitsplatz eine wichtige Rolle bei der Erreichung dieses Ziels spielt?

Im vorigen Artikel dieser Reihe haben wir ein Tool entwickelt, das die Vorteile der Technologie des Transfer Learnings nutzt. Das Ergebnis dieser Arbeit ist ein Werkzeug, das die Bearbeitung von bereits trainierten Modellen ermöglicht. Mit diesem Tool können wir eine beliebige Anzahl von neuronalen Schichten aus einem vortrainierten Modell übernehmen. Natürlich gibt es einschränkende Bedingungen. Wir nehmen nur aufeinanderfolgende Schichten, beginnend mit der ersten Datenschicht. Der Grund für diesen Ansatz liegt in der Natur der neuronalen Netze. Sie funktionieren nur dann gut, wenn die Ausgangsdaten denen ähnlich sind, die beim Training des Modells verwendet wurden.

Darüber hinaus ermöglicht das erstellte Tool nicht nur die Bearbeitung trainierter Modelle. Es können auch völlig neue erstellt werden. Dadurch kann die Beschreibung der Modellarchitektur im Programmcode vermieden werden. Wir müssen nur ein Modell mit Hilfe des Tools beschreiben. Dann werden wir das Modell verfolgen und verwenden, indem wir das erstellte neuronale Netz aus einer Datei hochladen. So kann mit verschiedenen Architekturen experimentiert werden, ohne den Programmcode zu ändern. Dies erfordert nicht einmal die Neukompilierung des Programms. Sie müssen lediglich die Modelldatei ändern.

Eine solche vorteilhaftes Hilfsmittel sollte auch so nutzerfreundlich wie möglich sein. Daher werden wir in diesem Artikel versuchen, seine Nutzerfreundlichkeit zu verbessern.

Autor: Dmitriy Gizlyk