LSTM

🏷️ 정보 딥러닝

LSTM

LSTM(Long Short-Term Memory, 장단기 기억 네트워크)은 망각 게이트(forget gate), 입력 게이트(input gate), 출력 게이트(output gate)를 추가하여 장거리 의존성 문제를 해결한 RNN의 개선 버전이다.

핵심

수식

\(f_t = \sigma(W_f[h_{t-1}, x_t] + b_f)\) (망각 게이트)

\(C_t = f_t \odot C_{t-1} + i_t \odot \tilde{C}_t\) (셀 상태 업데이트)