刷短视频时的欲罢不能、喝到奶茶时的瞬间满足、打游戏获胜后的狂喜,甚至抽烟酗酒时的难以戒除——我们早已习惯将这些情绪起伏,归咎于大脑中一种叫多巴胺的神经递质。它被全网奉为“快乐化学物质”,仿佛我们所有的愉悦与成瘾,都由这微小的“信使”一手掌控。
但很少有人知道,这个流传数十年、甚至被写进多本权威科普书籍的结论,如今正遭遇神经科学界的全面围剿。今年5月,全球顶尖神经科学家将齐聚西班牙,在多巴胺学会年会上展开一场核心辩论:我们对多巴胺的经典认知,或许从根源上就错了。这场争论,正在重构人类对大脑奖励机制、学习行为乃至成瘾本质的理解。
统治学界30年:多巴胺的“奖赏预测”神话
要理解这场争论的意义,首先要回到30年前那个奠定经典理论的实验。大脑中,神经细胞之间的信号传递依赖神经递质,多巴胺就是其中最知名、研究最深入的一种,而支撑学界数十年认知的,是“奖赏预测误差(RPE)假说”。这个假说的核心逻辑,并非“多巴胺管快乐”,而是“多巴胺管对奖赏的预期与预测”。简单来说,多巴胺就像大脑里的“奖惩记分员”,它不直接产生愉悦感,而是负责将外界线索与潜在奖赏绑定,教会大脑“做什么能获得好处”,进而驱动我们的行为。
这一切的起点,是1997年一项里程碑式的猴子实验。科学家给猴子喂果汁时意外发现:当猴子毫无预兆地喝到果汁,大脑中的多巴胺神经元会疯狂放电,释放大量多巴胺;反复几次后,科学家在喂果汁前先打开一盏灯,久而久之,多巴胺的释放节点竟从“喝到果汁”提前到了“灯亮”——因为灯光已经成了“马上有果汁”的信号;而如果灯亮了却没有果汁,多巴胺的释放会瞬间下降,大脑相当于收到了“预期落空”的负向警告。
这个发现完美契合巴甫洛夫经典条件反射,还被赋予了精准的数学模型,瞬间轰动整个神经科学界。我们用生活场景就能轻易理解:小孩第一次听到冰淇淋车的铃声,吃到冰淇淋时的意外快乐会让多巴胺飙升;反复几次后,只要听到铃声,多巴胺就会提前释放,催生强烈期待;若听到铃声却没买到冰淇淋,多巴胺骤降,失落与难受便会随之而来。
这个理论能统治学界数十年,核心在于它的“万能性”——它能从微观的神经元放电,无缝解释到我们的日常行为、成瘾行为乃至心理疾病:刷短视频停不下来,是因为不确定的下一个视频会持续刺激多巴胺释放;戒烟难,是因为抽烟的动作、场景早已成为“尼古丁奖赏”的线索,提前触发多巴胺带来的强烈渴望;就连多动症、精神分裂症的诸多症状,学界也习惯用多巴胺的奖赏预测误差模型解释,相关治疗药物也多围绕调节多巴胺分泌设计。
正如英国诺丁汉大学神经科学家马克·汉弗莱斯所言:多巴胺曾是神经科学领域,唯一一个能用计算模型说清“信号是什么、在计算什么”的研究方向。即便大家都知道这个模型有所简化,它依然是我们理解大脑学习、行为与成瘾的核心框架。

漏洞百出:经典理论撑不住了
转折发生在近十年。随着实验技术的迭代,科学家能更精准地监测大脑中多巴胺的释放轨迹,越来越多与经典理论相悖的现象浮出水面——多巴胺的作用,远比“奖赏预测”复杂得多,那些被忽略的细节,正在逐一击碎30年的认知神话。
漏洞一:多巴胺不只为“奖赏”买单,压力、威胁也能触发它
经典理论的核心前提,是多巴胺与“奖赏、好处”深度绑定,但最新实验却证明,负面刺激同样能让多巴胺大量释放。2021年,美国范德堡大学药理学家艾琳·卡利帕里做了一项极具争议的实验:给小鼠足部施加轻微电击,这种纯粹的压力与厌恶刺激,竟让小鼠大脑中的多巴胺出现了爆发式释放。这个结果彻底推翻了“多巴胺=奖赏”的核心逻辑,也让她的论文遭遇了前所未有的审稿阻力——审稿人逼着她补做各种与奖赏相关的验证实验,有人甚至因这个结论大发雷霆。用卡利帕里的话说,那段审稿经历,简直是“地狱般的反驳”。
除此之外,更多研究发现,多巴胺会对全新的、从未见过的刺激产生反应,也会对危险的威胁信号做出响应,这些反应与“奖赏预测”毫无关联,说明多巴胺的触发机制,远比我们想象的更广泛。
漏洞二:不止奖赏,多巴胺还是大脑的“全能调度员”
在经典理论中,多巴胺的角色更像“专职快递员”,只负责传递奖赏相关的信号。但科学家在监测小鼠多巴胺神经元时发现,很多多巴胺神经元根本不关心“有没有奖赏”,反而会对小鼠的身体状态做出精准响应:比如小鼠在迷宫中的位置、移动的速度,甚至当前动作离目标的距离,都会引发多巴胺释放的变化。后续研究进一步证实,多巴胺还与我们的注意力、工作记忆、社交行为紧密相关。这意味着,多巴胺根本不是只盯着奖赏的“专职人员”,更像是大脑中的“全能调度员”,广泛参与信息处理,调节整个神经系统的运行效率。
卡利帕里就此提出了一个颠覆性观点:追问多巴胺“负责哪一个单一功能”,本身就是一个错误。它的核心作用,是让大脑其他神经系统更高效地工作,帮助大脑强化与当前任务相关的活动,更快做出决策。换句话说,无论我们研究大脑的哪一项功能,都能找到多巴胺的身影。
漏洞三:最致命颠覆——多巴胺不是“提前预测”,而是“事后回溯”
如果说前两个发现只是给经典理论“打补丁”,那么美国加州大学旧金山分校神经科学家维贾伊·莫汉·南布迪里的研究,就是直接将经典理论“翻了个底朝天”。经典的奖赏预测误差理论认为,大脑的学习过程是“先看到线索,再得到奖赏,进而将线索与奖赏绑定”——这是一种正向的、提前预测的学习模式。但南布迪里提出了完全相反的观点:大脑的学习逻辑,是“先得到奖赏,再回头回溯,寻找是什么线索带来了这份奖赏”——这是一种反向的、事后回溯的学习模式。
他用小鼠实验验证了这一理论:给完全未受过训练的小鼠,随机间隔喂糖水。按照经典理论,小鼠一开始会因意外得到糖水而出现高多巴胺反应,随着逐渐适应“糖水随机出现”,多巴胺反应会慢慢下降;但实验结果恰恰相反,小鼠的多巴胺释放,随着反复喝到糖水,变得越来越高。
南布迪里的解释是:多巴胺的释放,不是在“预测奖赏”,而是在“告诉大脑‘这件事有意义,快回头找找是什么导致了它’”。小鼠反复喝到糖水,多巴胺就会持续触发大脑的记忆搜索,让它去寻找与糖水相关的线索——这才是大脑学习的本质。
这个理论最厉害的地方,在于它完美解决了经典理论无法解释的“成瘾复吸”难题。按照经典理论,戒烟的人看到别人抽烟却忍住不抽,会产生“预期落空”的负向误差,久而久之,“看到别人抽烟=要抽烟”的联结会被削弱,复吸渴望也会逐渐消失。但现实中,所有戒过烟的人都知道,哪怕反复忍住不抽,只要看到别人抽烟,复吸的渴望依然强烈——这是经典理论无法自圆其说的漏洞。
而回溯理论恰好能说通这件事:多巴胺的作用,是让大脑在“抽烟获得尼古丁”这个有意义的事件发生后,回头寻找相关线索。而戒烟者早已牢牢记住,“看到别人抽烟”是“获得尼古丁”的前置线索,这种反向联结一旦形成,就很难被削弱。所以即便反复戒烟,只要看到相关线索,大脑依然会回溯到“抽烟”这个行为,催生强烈的渴望。
为何经典理论难以被推翻?
看到这里,很多人会疑惑:既然经典理论有这么多漏洞和反例,为什么它依然是学界的主流?核心原因在于,这30年来,经典理论一直在被不断修改、打补丁,从一个清晰的模型,分化成了无数个版本,最终变成了一个“难以被证伪的移动靶”。
最典型的例子,就是“多巴胺爬坡现象”。十几年前,科学家就发现,即便小鼠已经学会“灯亮=有糖水”,在它从听到铃声、走到糖水旁的过程中,多巴胺释放会一路稳步上升。但按照经典理论,多巴胺的释放应该完全转移到“灯亮”的那一刻,后续不该有任何上升——这与实验结果完全矛盾。
但很快,一大批论文陆续出炉,通过修改经典模型的前提,完美适配了这个现象:只要将“灯亮到喝糖水”这个单一步骤,拆解成一连串连续的小步骤,那么小鼠越靠近糖水,“获得奖赏的价值”就越高,多巴胺自然会呈现“爬坡”状态。
哈佛大学神经科学家塞缪尔·格什曼,就是参与修改模型的学者之一。他坦言,这些修改并非“凑数据”的临时调整,但不可否认的是,经典理论已经变得越来越“万能”——无论出现什么新发现,都能通过修改前提来适配,这也让它很难被彻底推翻。
如今,神经科学界已经分成了鲜明的两派:一派认为,经典理论虽有漏洞,但核心逻辑依然可用,我们只需继续完善它,不必“把孩子和洗澡水一起倒掉”;另一派则认为,这个理论早已千疮百孔,与其不断打补丁,不如彻底抛弃旧框架,建立一套全新的底层逻辑,重新解读多巴胺的真正作用。
今年5月的西班牙年会,或许会成为这场争论的转折点。而这场关于多巴胺的认知革命,最终也会影响我们对快乐、成瘾、学习的理解——毕竟,当我们终于读懂大脑中这微小的神经递质,或许才能真正读懂自己的行为与情绪。
解读文献:
-
https://doi.org/10.1038/d41586-026-00836-x
本文来自微信公众号: 生态学时空 ,作者:复旦赵斌
