目录
一、 Transformer的出现背景
1.1 技术挑战与先前解决方案的局限性
RNN和LSTM
卷积神经网络(CNN)在序列处理中的尝试
1.2 自注意力机制的兴起
1.3 Transformer的革命性影响
二、自注意力机制
2.1 概念和工作原理
元素的权重计算
加权求和
自注意力与传统注意力的区别
计算效率
在Transformer中的应用
跨领域应用
未来趋势和挑战
2.2 计算过程
输入表示
相似度计算
权重分配
加权求和
多头自注意力
三、Transformer的结构
3.1 编码器(Encoder)
3.1.1 自注意力层
3.1......
暂无评论...