标签:Transformer 架构

彩云小梦V3.5上线!首个基于DCFormer架构通用大模型发布

云锦天章2017年,谷歌发布《Attention Is All You Need》论文,首次提出Transformer架构