記事「ニューラルネットワークが簡単に(第82回):常微分方程式モデル(NeuralODE)」についてのディスカッション

 

新しい記事「ニューラルネットワークが簡単に(第82回):常微分方程式モデル(NeuralODE)」はパブリッシュされました:

この記事では、環境状態のダイナミクスを研究することを目的とした別のタイプのモデルについて説明します。

新しいモデルファミリー「常微分方程式」について学びましょう。隠れ層の離散的なシーケンスを指定する代わりに、ニューラルネットワークを使用して隠れ状態の導関数をパラメータ化します。このモデルの結果はブラックボックス、つまり微分方程式ソルバーを使用して計算されます。これらの連続深度モデルは、一定量のメモリを使用し、入力信号に応じて推定戦略を適応させます。このようなモデルは、論文「Ordinary Differential Equations」で初めて紹介されました。この論文では、著者は内部操作にアクセスせずに、任意の常微分方程式(ODE)ソルバーを使用してバックプロパゲーションをスケーリングできることを示しています。これにより、より大きなモデルの中でODEをエンドツーエンドで訓練することが可能になります。

作者: Dmitriy Gizlyk