标签:长上下文

非Transformer架构新模型爆火,从第一性原理出发,MIT CSAIL衍生团队打造

基于液态神经网络西风 发自 凹非寺量子位 | 公众号 QbitAI挑战Transformer