橦言无忌

一个不想改变世界的程序媛

A Survey of Transformers

前言

Transformer模型的发展综述~

论文百度云链接: https://pan.baidu.com/s/1fwGSq4SysfLSOzSPKRQzjg
提取码: r2ii
—来自百度网盘超级会员v6的分享

继续加油读文章

摘要

Transformers 在自然语言处理、计算机视觉、音频处理等许多人工智能领域取得了巨大的成功。 因此,自然会引起学术界和工业界研究人员的极大兴趣。 到目前为止,已经提出了各种各样的 Transformer 变体(又名 X-formers),但是,仍然缺乏对这些 Transformer 变体的系统和全面的文献综述。 在本次调查中,我们对各种 X-formers 进行了全面审查。 我们首先简要介绍 vanilla Transformer,然后提出一个新的 X-formers 分类法。 接下来,我们从架构修改、预训练、应用三个角度介绍各种X-former。 最后,我们概述了未来研究的一些潜在方向。

// 代码折叠