标签:JailTrackBench 框架

什么会影响大模型安全?NeurIPS’24新研究提出大模型越狱攻击新基准与评估体系

不仅专注于攻击,还深入探讨了越狱评估USAIL团队 投稿量子位 | 公众号 QbitAI全新大语言模型越狱攻击基准与评估体系来了。