被误读30年的多巴胺，根本不是“快乐信使”

刷短视频时的欲罢不能、喝到奶茶时的瞬间满足、打游戏获胜后的狂喜，甚至抽烟酗酒时的难以戒除——我们早已习惯将这些情绪起伏，归咎于大脑中一种叫多巴胺的神经递质。它被全网奉为“快乐化学物质”，仿佛我们所有的愉悦与成瘾，都由这微小的“信使”一手掌控。
但很少有人知道，这个流传数十年、甚至被写进多本权威科普书籍的结论，如今正遭遇神经科学界的全面围剿。今年5月，全球顶尖神经科学家将齐聚西班牙，在多巴胺学会年会上展开一场核心辩论：我们对多巴胺的经典认知，或许从根源上就错了。这场争论，正在重构人类对大脑奖励机制、学习行为乃至成瘾本质的理解。

统治学界30年：多巴胺的“奖赏预测”神话

要理解这场争论的意义，首先要回到30年前那个奠定经典理论的实验。大脑中，神经细胞之间的信号传递依赖神经递质，多巴胺就是其中最知名、研究最深入的一种，而支撑学界数十年认知的，是“奖赏预测误差（RPE）假说”。
这个假说的核心逻辑，并非“多巴胺管快乐”，而是“多巴胺管对奖赏的预期与预测”。简单来说，多巴胺就像大脑里的“奖惩记分员”，它不直接产生愉悦感，而是负责将外界线索与潜在奖赏绑定，教会大脑“做什么能获得好处”，进而驱动我们的行为。
这一切的起点，是1997年一项里程碑式的猴子实验。科学家给猴子喂果汁时意外发现：当猴子毫无预兆地喝到果汁，大脑中的多巴胺神经元会疯狂放电，释放大量多巴胺；反复几次后，科学家在喂果汁前先打开一盏灯，久而久之，多巴胺的释放节点竟从“喝到果汁”提前到了“灯亮”——因为灯光已经成了“马上有果汁”的信号；而如果灯亮了却没有果汁，多巴胺的释放会瞬间下降，大脑相当于收到了“预期落空”的负向警告。
这个发现完美契合巴甫洛夫经典条件反射，还被赋予了精准的数学模型，瞬间轰动整个神经科学界。我们用生活场景就能轻易理解：小孩第一次听到冰淇淋车的铃声，吃到冰淇淋时的意外快乐会让多巴胺飙升；反复几次后，只要听到铃声，多巴胺就会提前释放，催生强烈期待；若听到铃声却没买到冰淇淋，多巴胺骤降，失落与难受便会随之而来。
这个理论能统治学界数十年，核心在于它的“万能性”——它能从微观的神经元放电，无缝解释到我们的日常行为、成瘾行为乃至心理疾病：刷短视频停不下来，是因为不确定的下一个视频会持续刺激多巴胺释放；戒烟难，是因为抽烟的动作、场景早已成为“尼古丁奖赏”的线索，提前触发多巴胺带来的强烈渴望；就连多动症、精神分裂症的诸多症状，学界也习惯用多巴胺的奖赏预测误差模型解释，相关治疗药物也多围绕调节多巴胺分泌设计。
正如英国诺丁汉大学神经科学家马克·汉弗莱斯所言：多巴胺曾是神经科学领域，唯一一个能用计算模型说清“信号是什么、在计算什么”的研究方向。即便大家都知道这个模型有所简化，它依然是我们理解大脑学习、行为与成瘾的核心框架。

漏洞百出：经典理论撑不住了

转折发生在近十年。随着实验技术的迭代，科学家能更精准地监测大脑中多巴胺的释放轨迹，越来越多与经典理论相悖的现象浮出水面——多巴胺的作用，远比“奖赏预测”复杂得多，那些被忽略的细节，正在逐一击碎30年的认知神话。

漏洞一：多巴胺不只为“奖赏”买单，压力、威胁也能触发它

经典理论的核心前提，是多巴胺与“奖赏、好处”深度绑定，但最新实验却证明，负面刺激同样能让多巴胺大量释放。2021年，美国范德堡大学药理学家艾琳·卡利帕里做了一项极具争议的实验：给小鼠足部施加轻微电击，这种纯粹的压力与厌恶刺激，竟让小鼠大脑中的多巴胺出现了爆发式释放。
这个结果彻底推翻了“多巴胺=奖赏”的核心逻辑，也让她的论文遭遇了前所未有的审稿阻力——审稿人逼着她补做各种与奖赏相关的验证实验，有人甚至因这个结论大发雷霆。用卡利帕里的话说，那段审稿经历，简直是“地狱般的反驳”。
除此之外，更多研究发现，多巴胺会对全新的、从未见过的刺激产生反应，也会对危险的威胁信号做出响应，这些反应与“奖赏预测”毫无关联，说明多巴胺的触发机制，远比我们想象的更广泛。

漏洞二：不止奖赏，多巴胺还是大脑的“全能调度员”

在经典理论中，多巴胺的角色更像“专职快递员”，只负责传递奖赏相关的信号。但科学家在监测小鼠多巴胺神经元时发现，很多多巴胺神经元根本不关心“有没有奖赏”，反而会对小鼠的身体状态做出精准响应：比如小鼠在迷宫中的位置、移动的速度，甚至当前动作离目标的距离，都会引发多巴胺释放的变化。
后续研究进一步证实，多巴胺还与我们的注意力、工作记忆、社交行为紧密相关。这意味着，多巴胺根本不是只盯着奖赏的“专职人员”，更像是大脑中的“全能调度员”，广泛参与信息处理，调节整个神经系统的运行效率。
卡利帕里就此提出了一个颠覆性观点：追问多巴胺“负责哪一个单一功能”，本身就是一个错误。它的核心作用，是让大脑其他神经系统更高效地工作，帮助大脑强化与当前任务相关的活动，更快做出决策。换句话说，无论我们研究大脑的哪一项功能，都能找到多巴胺的身影。

漏洞三：最致命颠覆——多巴胺不是“提前预测”，而是“事后回溯”

如果说前两个发现只是给经典理论“打补丁”，那么美国加州大学旧金山分校神经科学家维贾伊·莫汉·南布迪里的研究，就是直接将经典理论“翻了个底朝天”。
经典的奖赏预测误差理论认为，大脑的学习过程是“先看到线索，再得到奖赏，进而将线索与奖赏绑定”——这是一种正向的、提前预测的学习模式。但南布迪里提出了完全相反的观点：大脑的学习逻辑，是“先得到奖赏，再回头回溯，寻找是什么线索带来了这份奖赏”——这是一种反向的、事后回溯的学习模式。
他用小鼠实验验证了这一理论：给完全未受过训练的小鼠，随机间隔喂糖水。按照经典理论，小鼠一开始会因意外得到糖水而出现高多巴胺反应，随着逐渐适应“糖水随机出现”，多巴胺反应会慢慢下降；但实验结果恰恰相反，小鼠的多巴胺释放，随着反复喝到糖水，变得越来越高。
南布迪里的解释是：多巴胺的释放，不是在“预测奖赏”，而是在“告诉大脑‘这件事有意义，快回头找找是什么导致了它’”。小鼠反复喝到糖水，多巴胺就会持续触发大脑的记忆搜索，让它去寻找与糖水相关的线索——这才是大脑学习的本质。
这个理论最厉害的地方，在于它完美解决了经典理论无法解释的“成瘾复吸”难题。按照经典理论，戒烟的人看到别人抽烟却忍住不抽，会产生“预期落空”的负向误差，久而久之，“看到别人抽烟=要抽烟”的联结会被削弱，复吸渴望也会逐渐消失。但现实中，所有戒过烟的人都知道，哪怕反复忍住不抽，只要看到别人抽烟，复吸的渴望依然强烈——这是经典理论无法自圆其说的漏洞。
而回溯理论恰好能说通这件事：多巴胺的作用，是让大脑在“抽烟获得尼古丁”这个有意义的事件发生后，回头寻找相关线索。而戒烟者早已牢牢记住，“看到别人抽烟”是“获得尼古丁”的前置线索，这种反向联结一旦形成，就很难被削弱。所以即便反复戒烟，只要看到相关线索，大脑依然会回溯到“抽烟”这个行为，催生强烈的渴望。

为何经典理论难以被推翻？

看到这里，很多人会疑惑：既然经典理论有这么多漏洞和反例，为什么它依然是学界的主流？核心原因在于，这30年来，经典理论一直在被不断修改、打补丁，从一个清晰的模型，分化成了无数个版本，最终变成了一个“难以被证伪的移动靶”。
最典型的例子，就是“多巴胺爬坡现象”。十几年前，科学家就发现，即便小鼠已经学会“灯亮=有糖水”，在它从听到铃声、走到糖水旁的过程中，多巴胺释放会一路稳步上升。但按照经典理论，多巴胺的释放应该完全转移到“灯亮”的那一刻，后续不该有任何上升——这与实验结果完全矛盾。
但很快，一大批论文陆续出炉，通过修改经典模型的前提，完美适配了这个现象：只要将“灯亮到喝糖水”这个单一步骤，拆解成一连串连续的小步骤，那么小鼠越靠近糖水，“获得奖赏的价值”就越高，多巴胺自然会呈现“爬坡”状态。
哈佛大学神经科学家塞缪尔·格什曼，就是参与修改模型的学者之一。他坦言，这些修改并非“凑数据”的临时调整，但不可否认的是，经典理论已经变得越来越“万能”——无论出现什么新发现，都能通过修改前提来适配，这也让它很难被彻底推翻。
如今，神经科学界已经分成了鲜明的两派：一派认为，经典理论虽有漏洞，但核心逻辑依然可用，我们只需继续完善它，不必“把孩子和洗澡水一起倒掉”；另一派则认为，这个理论早已千疮百孔，与其不断打补丁，不如彻底抛弃旧框架，建立一套全新的底层逻辑，重新解读多巴胺的真正作用。
今年5月的西班牙年会，或许会成为这场争论的转折点。而这场关于多巴胺的认知革命，最终也会影响我们对快乐、成瘾、学习的理解——毕竟，当我们终于读懂大脑中这微小的神经递质，或许才能真正读懂自己的行为与情绪。

解读文献：

https://doi.org/10.1038/d41586-026-00836-x