MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期
作者:方泰攻略站时间:2025-04-10 13:14:52
本站 4 月 10 日消息,几个月前,一项研究暗示随着人工智能(AI)越来越复杂,其会发展出“价值体系”,例如优先考虑自身福祉而非人类福祉。然而,麻省理工学院(MIT)最近发表的一篇论文却给这种夸张的观点泼了冷水,得出结论认为 AI 实际上并没有任何连贯的价值观。
MIT 研究的共同作者表示,他们的研究结果表明,使 AI 系统“对齐”,即确保模型以人们期望的、可靠的方式行事,可能比通常认为的更具挑战性。他们强调,我们如今所知的 AI 会产生“幻觉”并进行模仿,这使得其在许多方面难以预测。
“我们可以确定的一点是,模型并不遵循许多稳定性、可外推性和可操控性的假设。”MIT 博士生、该研究的共同作者斯蒂芬・卡斯珀(Stephen Casper)在接受 TechCrunch 采访时表示。
据本站了解,卡斯珀和他的同事们研究了来自 Meta、谷歌、Mistral、OpenAI 和 Anthropic 的多个近期模型,以了解这些模型在多大程度上表现出强烈的“观点”和价值观(例如个人主义与集体主义)。他们还调查了这些观点是否可以被“引导”,即被修改,以及模型在各种情境下对这些观点的坚持程度。
据共同作者称,没有任何一个模型在其偏好上是一致的。根据提示的措辞和框架不同,它们会表现出截然不同的观点。
卡斯珀认为,这是有力的证据,表明模型高度“不一致且不稳定”,甚至可能根本无法内化类似人类的偏好。
“对我来说,通过所有这些研究,我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。”卡斯珀说,“相反,它们本质上是模仿者,会进行各种捏造,并说出各种轻率的话。”
相关文章
-
MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期
本站 4 月 10 日消息,几个月前,一项研究暗示随着人工智能(AI)越来越复杂,其会发展出“价值体系”,例如优先考虑自身福祉而非人类福祉。然而,麻省理工学院(MIT)最近发表的一篇论文却给这种夸张的
-
加州多个团体联名请愿,指控 OpenAI 营利性转型违背初衷
本站 4 月 10 日消息,据外媒 Engadget 今日报道,包括拉丁裔繁荣组织和加州卡车司机工会等多个组织,正在向加州总检察长罗布・邦塔请愿,要求阻止 OpenAI 转型为盈利公司。OpenAI
-
美国国会图书馆收录 Windows 95 开机音效:值得保存的声音遗产
本站 4 月 10 日消息,据外媒 Engadget 今日报道,美国国会图书馆日前宣布了 2025 年国家录音档案馆的入选名单,其中不乏令科技迷兴奋的声音 —— 微软 Windows 95 的启动提示
-
GoPro Hero 13 Black 运动相机“极域白”限量上市,国补后 2548.3 元起
本站 4 月 9 日消息,GoPro Hero 13 Black 运动相机“极域白”限量版正式上架京东,该配色运动相机在硬件配置上相比普通款并没有更新,主打记录运动、生活。根据 GoPro 官方所述,
-
零刻 NAS 型迷你主机 ME mini 预热:英特尔 N200、双 2.5G 网口、6 盘位、内置 45W 电源
本站 4 月 9 日消息,零刻已确认将推出全新 ME 系列存储设备,包括 ME mini、ME Pro 和 ME MAX 三款型号。零刻上个月曾承诺其首款产品 ME mini 会在3 月中旬发布,但至
-
任天堂:日语版 Switch 2 游戏机对海外实体卡带 “运行稳定性无法保证”
本站 4 月 9 日消息,任天堂于其日本官网上更新了一系列 Switch 2 游戏机常见问题解答,其中回答了部分 Switch 2 日语版与 Switch 2 多语言版之间差别的问题。根据任天堂日本官