以前做设计提案,最耗时的往往不是“画出来”,而是“想方向”。客户说想要一种“赛博朋克但带点田园气息”的感觉,设计师得在脑海里拆解无数种组合,再花半天时间找参考图、拼 Moodboard。
现在,这个过程被压缩到了几分钟。输入提示词,调整参数,几十张草图瞬间生成。很多人因此焦虑:创意工作是不是要到头了?其实,焦虑的来源是误把工具当成了对手。
扩散模型 (Diffusion Model) 的真正价值,不在于它画得有多像照片,而在于它极大地降低了试错成本。
过去,修改一个背景光影可能需要重绘整个场景;现在,只需通过 Inpainting(局部重绘)功能,涂抹特定区域,重新生成即可。这种交互方式的改变,让设计师的角色发生了微妙转移:你不再是一个纯粹的执行者,而是一个拥有无限助手的艺术总监。
你的核心能力不再是笔触的细腻程度,而是审美判断力。你需要从 AI 生成的上百个版本中,挑出那个眼神最对、构图最稳的,然后告诉它:“这里再亮一点,那里的材质换成磨砂玻璃。”
在实际工作流中,人机协作 并不是简单的“人下令,机干活”,而是一种高频的乒乓式互动。
举个例子,为一个独立游戏制作角色概念图:
在这个过程中,人类负责逻辑、叙事和情感注入,AI 负责提供变体、填充细节和处理繁琐的渲染任务。双方各司其职,没有谁取代谁,只有效率的叠加。

当然,依赖扩散模型也有风险。由于训练数据大多来自互联网公开数据集,默认生成的图像往往带有某种“平庸的正确感”——光影完美,但缺乏个性;构图标准,但毫无惊喜。
如果直接沿用默认输出,作品很容易陷入同质化。打破这种局面的关键,在于人为引入“噪声”和“偏差”。
你可以故意使用矛盾的提示词,或者在后期处理中加入手绘的不规则线条,甚至混合不同风格的 LoRA 模型。这些非标准化的操作,才是区分普通美工与真正创作者的分水岭。
技术一直在变,但创意的本质没变:它始终源于人对世界的独特观察。扩散模型只是把那层厚厚的技术门槛削薄了,让更多人能直接触达表达的核心。至于能不能写出好故事,还得看你自己。
