記事「LSTMニューラルネットワークを用いた時系列予測の作成:価格の正規化と時間のトークン化」についてのディスカッション

 

新しい記事「LSTMニューラルネットワークを用いた時系列予測の作成:価格の正規化と時間のトークン化」はパブリッシュされました:

この記事では、日次レンジを使用して市場データを正規化し、市場予測を強化するためにニューラルネットワークを訓練する簡単な戦略を概説します。開発されたモデルは、既存のテクニカル分析の枠組みと組み合わせて、あるいは単独で、市場全体の方向性を予測するのに役立てることができます。この記事で概説した枠組みは、テクニカルアナリストであれば、手動と自動売買の両方の戦略に適したモデルを開発するために、さらに改良を加えることができます。

インターネットで検索を始めたとき、時系列予測でのLSTMの使用について説明するいくつかの記事を偶然見つけました。特に、Christopher Olah氏によるcolah's blogで、「Understanding LSTM Networks」を見つけました。Olah氏はそのブログで、LSTMの構造と機能を説明し、標準的なRNNと比較し、覗き穴結合(peephole connection)やGated Recurrent Unit (GRU)などのさまざまなLSTMの変種について論じています。Olah氏は最後に、LSTMがRNNのアプリケーションに与える影響の大きさを強調し、Attentionメカニズムのような将来の進歩を指し示しています。

要するに、従来のニューラルネットワークは、メモリがないため、過去の入力からの文脈を必要とするタスクに苦戦していたのです。RNNは情報を持続させるループを持つことでこの問題に対処していますが、それでも長期的な依存関係の難しさに直面しています。例えば、関連する文脈が何単語も後ろにある文の次の単語を予測することは、標準的なRNNでは難しいです。  長・短期記憶(Long Short Term Memory: LSTM)ネットワークは、回帰型ニューラルネットワーク(Recurrent Neural Network: RNN)の一種であり、RNNに欠けている長期的な依存関係をよりうまく扱えるように設計されています。

LSTMは、セル状態と情報の流れを制御する3種類のゲート(入力、忘却、出力)を含む、より複雑なアーキテクチャを使用することでこれを解決します。この設計により、LSTMは情報を長期間記憶することができ、言語モデリング、音声認識、画像キャプションなどのタスクに非常に有効です。私が興味を持ったのは、LSTMがより長い時間情報を記憶する能力を持つため、同じような値動きをした日の過去の値動きを基に、今日の値動きを予測できるかどうかということです。Adrian Tam氏による別の役に立つ記事に出会いました。その記事は「LSTM for Time Series Prediction in PyTorch」という巧妙なタイトルが付けられており、実用的な例を使って数学とプログラミングの側面をわかりやすく説明してくれました。どの通貨ペアでも将来の値動きを予測するために、それらを適用することに挑戦する十分な自信を持てました。

作者: Shashank Rai