記事「ニューラルネットワークが簡単に(第25部):転移学習の実践」についてのディスカッション

 

新しい記事「ニューラルネットワークが簡単に(第25部):転移学習の実践」はパブリッシュされました:

前々回、前回と、ニューラルネットワークのモデルを作成・編集するためのツールを開発しました。いよいよ転移学習技術の利用可能性を実例で評価することになります。

テスト結果は下のチャートのとおりです。ご覧の通り、事前に訓練させたモデルの方が、誤差が少ない状態で始まっていますが、すぐに2番目のモデルが追いつき、さらに両者の値はかなり接近しています。これは、エンコーダのアーキテクチャがモデル全体の性能に大きな影響を与えるという、先の結論を裏付けるものです。

回帰モデルの学習ダイナミクスの比較

学習率に注目します。事前訓練されたモデルは、1つのエポックを通過するのに必要な時間が6倍少なくなっています。もちろん、これはオートエンコーダの訓練を考慮しない純粋な時間です。

作者: Dmitriy Gizlyk