記事「ニューラルネットワークが簡単に(第24部):転移学習用ツールの改善」についてのディスカッション

 

新しい記事「ニューラルネットワークが簡単に(第24部):転移学習用ツールの改善」はパブリッシュされました:

前回の記事では、ニューラルネットワークのアーキテクチャを作成および編集するためのツールを作成しました。今日はこのツールでの作業を続けて、より使いやすくします。これは、私たちのトピックから一歩離れていると思われるかもしれませんが、うまく整理されたワークスペースは、結果を達成する上で重要な役割を果たすと思われないでしょうか。

当連載の前回の記事では、転移学習テクノロジーを利用するツールを作成しました。作業の結果、すでに訓練済みのモデルを編集できるツールを手に入れました。このツールを使用すると、事前訓練したモデルから任意の数のニューラル層を取得できます。もちろん、制限条件はあり、取得できるのは最初のデータ層から始まる連続した層のみです。このアプローチの理由は、モデルの訓練時に使用されるものと同様の初期データのみでうまく機能するというニューラルネットワークの性質にあります。

さらに、作成されたツールは訓練済みのモデルを編集できるだけではありません。完全に新しいものを作成することもできます。これにより、プログラムコードでモデルアーキテクチャを記述する必要がなくなり、ツールを使用してモデルを記述するだけで済みます。次に、作成したニューラルネットワークをファイルからアップロードすることで、モデルを追跡して使用します。これにより、プログラムコードを変更することなく、さまざまなアーキテクチャを試すことができます。プログラムの再コンパイルさえ必要ありません。モデルファイルを変更するだけです。

このような便利なツールは、できるだけ使いやすいべきです。したがって、この記事では、その使いやすさを改善しようとします。

作者: Dmitriy Gizlyk