大模型在回答“林黛玉倒拔垂杨柳”时,可能会信誓旦旦地描述鲁智深与林妹妹的跨界合作。这种一本正经的胡说八道,就是典型的模型幻觉

很多人寄希望于通过海量的标注数据来纠正它。毕竟,监督学习一直是人工智能训练的基石。我们喂给它正确答案,它就该学会正确输出,逻辑看似无懈可击。但现实往往更骨感。

监督学习的本质,是让模型在已知分布内寻找最优解。就像教学生做模拟题,题目都在考纲里,学生自然能拿高分。

可真实世界没有考纲。

当用户问出一个训练集中从未出现过的冷门问题,或者要求模型进行跨领域的复杂推理时,模型失去了“标准答案”的参照。为了维持对话的流畅性,它会基于概率拼凑出一个看似合理、实则虚构的回答。

这时候,再多的监督信号也无力回天。因为你无法为所有可能出现的错误预设标签。数据覆盖率永远追不上人类想象的边界。

换个角度看,幻觉其实是生成式AI创造力的副产品。

如果严格限制模型只输出训练数据中确切存在的内容,它就退化成了一个检索引擎,失去了“生成”的意义。我们在享受它写诗、编程、总结长文的便利时,必须接受它偶尔会“脑补”事实的风险。

监督学习能消除模型幻觉吗?在硅基生命崛起前,我们仍需直面这一隐患

目前的缓解手段,比如检索增强生成(RAG),本质上是在外挂一个知识库,强行给模型加上缰绳。但这依然无法根除底层概率预测带来的不确定性。

媒体常炒作硅基生命即将觉醒,仿佛明天AI就会拥有自我意识并接管世界。这种叙事忽略了当下的技术瓶颈。

现在的模型没有意图,没有真理观,只有next token prediction(下一个词预测)的数学冲动。它不知道自己在撒谎,因为它根本不懂什么是“真”。

在真正的通用人工智能(AGI)到来之前,我们必须建立一套新的交互伦理:

技术还在迭代,算法会更聪明,数据会更干净。但只要底层的概率生成机制不变,幻觉就不会消失。

我们需要的不是消灭幻觉的幻想,而是驾驭不确定性的能力。在人机协作的日常里,留一份怀疑,比盲目崇拜更安全。

声明:未经同意禁止任何个人或组织复制、盗用、采集、发布本站点内容到其他媒体平台。