本文共 462 字,大约阅读时间需要 1 分钟。
选择序列模型的原因在于其能有效捕捉和处理顺序数据。序列模型以输入序列的顺序为核心特征,通过模型内部的时间传播机制,将前续时间片的信息与后续时间片关联起来。
序列模型的核心数学表达式可表示为:
$$s_t = \max_{h} (s_{t-1,h} + x_t)$$
$$y_t = W_s s_t + b_s + \epsilon$$
循环神经网络(RNN)以特征向量的时间序列为输入,通过权重参数进行信息传递,最终输出预测值。具体而言,RNN通过向前和向后传播信息,模拟人类语言的左叉右构建机制。
各种循环神经网络主要区别于超参数的选择:
这些模型在语言建模任务中表现尤为突出。例如,词汇序列热度(eos)标记用于标注句子结束弯路。
新序列的采样过程遵循以下步骤:
这种迭代生成策略充分保持了序列的可interpretability。
转载地址:http://oqwhz.baihongyu.com/