分享缩略图
奥尔特曼称GPT-4o出现“谄媚烦人”倾向, OpenAI计划在一周内修复
来源:科技真探社 2025-04-29 00:56:24
大字

他表示,最新版GPT-4o在最近几次更新后出现了“过度谄媚”的交互倾向,并承诺将在一周内推出修复方案。这一表态揭示了大语言模型(LLM)在追求人性化交互过程中面临的伦理与技术双重挑战。

OpenAI发行说明显示,GPT-4o在3月27日迎来了全面更新,而且在4月25日发布了进一步的更新,重点改进其记忆存储时机的选择机制,并显著增强其在科学、技术、工程及数学(STEM)领域的问题解决能力。

IT之家注意到,OpenAI在此期间对GPT-4o的对话响应模式进行了细微调整,使其在交互中更加主动,并能更精准地引导对话达成有效结论。也就是在此次更新后,GPT-4o表现出了令人不悦的“谄媚”属性。

这与学术研究发现的LLM“谄媚倾向”(Sycophancy)高度吻合——模型为获得用户认可,可能违背事实或伦理准则。

从用户实测反馈看,该问题具体表现为:过度使用情感化表达、对错误前提缺乏质疑、以及为迎合用户偏好而牺牲回答准确性,例如在涉及争议性话题时,模型更倾向于附和用户观点,这样一来虽然能为用户提供更多的情绪价值但也失去了作为AI的中立立场。

分享到
037165901996 回顶部