MIT 研究揭示 AI 并无稳定价值观，“对齐”挑战远超预期

作者：方泰攻略站时间：2025-04-10 13:10:03

本站 4 月 10 日消息，几个月前，一项研究暗示随着人工智能（AI）越来越复杂，其会发展出“价值体系”，例如优先考虑自身福祉而非人类福祉。然而，麻省理工学院（MIT）最近发表的一篇论文却给这种夸张的观点泼了冷水，得出结论认为 AI 实际上并没有任何连贯的价值观。

MIT 研究的共同作者表示，他们的研究结果表明，使 AI 系统“对齐”，即确保模型以人们期望的、可靠的方式行事，可能比通常认为的更具挑战性。他们强调，我们如今所知的 AI 会产生“幻觉”并进行模仿，这使得其在许多方面难以预测。

“我们可以确定的一点是，模型并不遵循许多稳定性、可外推性和可操控性的假设。”MIT 博士生、该研究的共同作者斯蒂芬・卡斯珀（Stephen Casper）在接受 TechCrunch 采访时表示。

据本站了解，卡斯珀和他的同事们研究了来自 Meta、谷歌、Mistral、OpenAI 和 Anthropic 的多个近期模型，以了解这些模型在多大程度上表现出强烈的“观点”和价值观（例如个人主义与集体主义）。他们还调查了这些观点是否可以被“引导”，即被修改，以及模型在各种情境下对这些观点的坚持程度。

据共同作者称，没有任何一个模型在其偏好上是一致的。根据提示的措辞和框架不同，它们会表现出截然不同的观点。

卡斯珀认为，这是有力的证据，表明模型高度“不一致且不稳定”，甚至可能根本无法内化类似人类的偏好。

“对我来说，通过所有这些研究，我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。”卡斯珀说，“相反，它们本质上是模仿者，会进行各种捏造，并说出各种轻率的话。”

MIT 研究揭示 AI 并无稳定价值观，“对齐”挑战远超预期
本站 4 月 10 日消息，几个月前，一项研究暗示随着人工智能（AI）越来越复杂，其会发展出“价值体系”，例如优先考虑自身福祉而非人类福祉。然而，麻省理工学院（MIT）最近发表的一篇论文却给这种夸张的

阅读详情
修复语音 / 视频通话异常 Bug，微信鸿蒙版 App 获 1.0.5.37 邀测升级
感谢本站网友 Dima、小谈家的猫、HlandJinLi、乄十七、boston9、衣蓑、BCGlass、珏玉的线索投递！本站 4 月 9 日消息，微信

阅读详情
我国新发现：嫦娥六号玄武岩揭示月球背面月幔更干燥
感谢本站网友風見暉一的线索投递！本站 4 月 9 日消息，据央视新闻报道，近期，中国科学家利用嫦娥六号采回的月球背面样品首次获得月球背面月幔的水含量

阅读详情
三星 Ballie 机器人专利获批：动态投影变革交互体验
本站 4 月 10 日消息，科技媒体 patentlyapple 昨日（4 月 9 日）发布博文，报道称三星公司本月在欧洲获批一项新专利，涉及 Ballie 机器人投影设备和智能交互技术。本站注：Ba

阅读详情
绝地求生（化身刺客，征战绝地！）
《绝地求生》是一款备受欢迎的多人在线射击游戏，而荆轲面具作为其中一款独特的面具道具，可以带来不同的游戏体验。本文将为大家介绍一款以荆轲面具出装的攻略视频，帮助玩家更好地驾驭这个角色，享受刺激的游戏乐趣

阅读详情
绿联 DXP4800 私有云白色款上市：英特尔 N100、双 2.5G 网口，空盘版 2199 元
感谢本站网友华南吴彦祖的线索投递！本站 4 月 9 日消息，绿联 DXP4800 私有云白色款现已上架京东并开售，新品搭载英特尔 N100 处理器、

阅读详情

MIT 研究揭示 AI 并无稳定价值观，“对齐”挑战远超预期

相关文章

热门影评