三种循环神经网络:

  1. RNN
  2. LSTM
  3. GRU

RNN

关于 RNN 计算的几幅图

  1. RNN 结构图,图上的循环其实是压缩了时间维度上的不同输入

  1. 前向传播计算图,当前时间 是由 和 上一时间 通过乘以矩阵 实现的,两部分分别是一个全连接神经网络。

所有的权重 都是共享的

正向传播的计算:

计算前三项:

反向传播的计算:

方法1:

展开

展开到

展开到

出现 导数连乘,其中 ,如果 导致梯度爆炸,如果 导致梯度消失

类似

方法2:

展开到

代入

得:

通式:

LSTM

正向传播的计算:

遗忘门(剔除无用信息):

输入门:

更新细胞状态:

输出门:

反向传播的计算:

需要计算

为例: