上周,朋友圈里流传着一段某知名企业家在深夜直播卖货的视频。画质清晰,口型对得上,连标志性的停顿都惟妙惟肖。直到当事人发声明辟谣,大家才惊觉:这又是 AI 干的。
过去我们觉得 深度伪造 (Deepfake) 是电影里的黑科技,或者至少需要顶尖实验室算力支持。现在?只要你的显卡稍微能跑动几个 G 的显存,下载一个开源权重,配合简单的推理脚本,半小时就能生成以假乱真的换脸视频或语音。
这一变化的核心推手,是 开源模型 的泛滥式增长。
以前,Stable Diffusion 刚出来时,大家还在惊叹于它画出的二次元少女。如今,基于同样架构衍生出的微调模型,已经不仅能画图,更能“理解”人脸结构、光影逻辑甚至微表情。GitHub 上每天都有新的项目冒出来,宣称能更逼真地复刻特定人物的声线或动态。
这种技术民主化带来了一种诡异的割裂感:一边是创作者用 AI绘画 工具快速产出商业插画、概念设计,效率提升十倍;另一边,黑产团队利用同样的底层技术,批量制造虚假身份验证视频,绕过银行的人脸识别系统。
工具本身没有善恶,但获取工具的代价太低了。
最让人不安的不是技术有多强,而是检测手段远远落后于生成速度。
早期的 Deepfake 视频往往伴有眨眼频率异常、边缘模糊等瑕疵。现在的生成结果,皮肤纹理、毛孔细节甚至光线反射都符合物理规律。普通用户拿着手机刷短视频,根本不可能具备鉴别能力。

想象这样一个场景:你接到多年未联系的老友视频电话,对方神色焦急借钱。声音像,脸像,背景也是他熟悉的书房。你借了。第二天发现号被盗,那段视频是实时渲染合成的。
在这种环境下,信任成本被无限拉高。我们被迫进入一个“默认怀疑”的社会阶段。
法律滞后是另一个现实困境。目前的著作权法和肖像权保护,很难覆盖到由算法生成的“非真人”影像。如果一个人用开源模型生成了某个明星的虚假代言视频并获利,追责链条极其复杂:
平台方开始尝试添加数字水印,但去除水印的工具同样开源且易用。这是一场没有终点的猫鼠游戏。
对于普通用户而言,保持警惕不再是多余的建议,而是生存技能。下次看到震撼的视频证据,先别急着转发。问问自己:这真的是真的吗?还是只是另一组精心计算的像素排列?
技术狂欢还在继续,但冷静下来看清边界,或许比学会如何使用工具更重要。毕竟,当真实与虚构的界限消失,唯一能依靠的,只剩下我们那点摇摇欲坠的判断力。
