模型问题奥尔特曼称GPT-4o出现“谄媚烦人”倾向, OpenAI计划在一周内修复

奥尔特曼称GPT-4o出现“谄媚烦人”倾向, OpenAI计划在一周内修复

来源：科技真探社 2025-04-29 00:56:24

大字

他表示，最新版GPT-4o在最近几次更新后出现了“过度谄媚”的交互倾向，并承诺将在一周内推出修复方案。这一表态揭示了大语言模型（LLM）在追求人性化交互过程中面临的伦理与技术双重挑战。

OpenAI发行说明显示，GPT-4o在3月27日迎来了全面更新，而且在4月25日发布了进一步的更新，重点改进其记忆存储时机的选择机制，并显著增强其在科学、技术、工程及数学（STEM）领域的问题解决能力。

IT之家注意到，OpenAI在此期间对GPT-4o的对话响应模式进行了细微调整，使其在交互中更加主动，并能更精准地引导对话达成有效结论。也就是在此次更新后，GPT-4o表现出了令人不悦的“谄媚”属性。

这与学术研究发现的LLM“谄媚倾向”（Sycophancy）高度吻合——模型为获得用户认可，可能违背事实或伦理准则。

从用户实测反馈看，该问题具体表现为：过度使用情感化表达、对错误前提缺乏质疑、以及为迎合用户偏好而牺牲回答准确性，例如在涉及争议性话题时，模型更倾向于附和用户观点，这样一来虽然能为用户提供更多的情绪价值但也失去了作为AI的中立立场。

分享到

更多推荐

037165901996 回顶部