标签:可信测试集

将偏好学习引入模型训练,北大李戈团队新框架,可显著提升代码准确性与执行效率

生成效率也有提升北大李戈课题组 投稿量子位 | 公众号 QbitAI代码模型SFT对齐后,缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作