在动态多价值选项中进行高效决策的神经机制

发布时间:2021-06-07

  202167日,《Nature Communications》期刊在线发表了题为《在基于价值的决策中灵长类上丘核团将绝对价值信息转化为分类选择》的研究论文,该研究由中国科学院脑科学与智能技术卓越创新中心(神经科学研究所)、中科院灵长类神经生物学重点实验室的决策研究组完成。该研究开发了一个根据奖赏价值进行通过眼动在多个选项中进行选择的任务,并在中脑的上丘区域进行了单细胞电生理记录和电刺激操纵。研究发现上丘神经元不仅编码了单个选项自身的绝对价值,还表征了随着各选项总价值而灵活变化的决策阈值。研究者进一步用微电流对上丘神经元的活性进行操纵,揭示了上丘将选项的绝对价值转化为决策的神经机制。这一工作有助于我们理解现实生活中大脑是如何进行高效的决策。    

  日常生活中往往需要进行各种各样的价值决策。尽管关于价值是如何在不同脑区表征的问题已经有大量的研究,但是关于价值是如何转化为最终选择的过程还是缺少直接的证据。    

  本研究受最优觅食理论启发,在猕猴上开发了一种多选项的眼动觅食任务 (图A)。猕猴需要在有限的时间内在包含多个选项的视觉刺激阵列中进行一系列的扫视,依次通过注视各个选项来得到相应的奖励。任务中很多个目标可以有相同价值,它们的价值组合在觅食过程中发生动态的变化(图B),因此让我们能够在神经元水平分离价值信号和眼动决策信号,并研究价值表征是如何随选项的组合变化的。    

  本研究在大脑的上丘核团做出多个新颖有趣的发现(图C)。上丘是大脑中眼动控制的关键脑区之一。研究发现上丘神经元在眼动决策过程中首先表征了下一个被选择的目标的绝对价值,这种表征不受其它选项价值的影响。在最终作出完成决策的眼动之前,无论选择目标的价值大小,上丘神经元的发放都达到了一个决策阈值,而这一决策阈值为备选项的价值组合所调控。这个研究结果表明动态多选项的经济决策过程可以用一种简洁的机制来实现:大脑通过综合各选项的价值决定决策的阈值;当上丘中不同的神经元表征了不同选项的价值。它们之间相互竞争,当其中某一个神经元的发放到决策阈值的时候,其相应的选项就会被选中。精细的微电流刺激实验支持了这个猜想,当神经元的发放与决策阈值越近,越容易受到微电流刺激的影响而引发相应的决策。在这一决策机制下,不受其他选项影响的绝对价值表征保证了价值偏好的稳定性和神经元对价值表征的效率;而动态可调整的决策阈值则有助于大脑随情况发生变化进行灵活的决策。因此该研究为大脑如何实现高效灵活的经济决策提供了直接的神经生物学的证据。    

  该研究在灵长类模型动物上开发了一种新颖的经济决策机制的认知任务。这是人们第一次发现在关键的感觉-运动脑区可以表征决策选项的绝对价值。研究还发现了决策阈值依赖情景变化的的神经表征。最后,该研究为上丘中将价值转化为决策动作的神经机制提供了直接因果性的证据。这些发现对经济决策神经机制的理解产生深远的影响。

    

  (a)多选项眼动觅食实验的任务示例。这个4×4视觉刺激阵列是由3种颜色的目标组成的。每种颜色代表一定大小的价值。价值大小的定义是给果汁量除以获得该奖赏所需的注视时间。当猕猴将眼睛移动到某个目标并注视相应时间,目标颜色就会变成灰色,猕猴会获得相应的数量的果汁。在此例中,目标价值按照红色到绿色再到蓝色的顺序递减。在任务中,颜色和价值之间的关联保持不变,但在阵列中颜色点的位置是随机的。 (b) 在此示例任务中,随着猕猴的一系列选择,高价值的目标越来越少。由上至下,红色目标首先被选完,然后是绿色,最后只剩下低价值的蓝色目标。(c)上丘决策的机制示意图。每个峰代表一个神经元,峰的高度代表神经元的活性,颜色代表神经元所表征的目标的颜色。虚线则为决策阈值,实现代表动作阈值。神经元有稳定的价值表征,灵活的决策阈值和固定的动作阈值。某一颜色的价值表征大小不随其他选项变化,而决策阈值是由各选项总体的价值所决定。(左)任务开始时,由于红色目标价值较大,相应神经元的活性较高,更有可能达到决策阈值。(中)红色目标被选完后,决策阈值被调低,绿色的神经元胜出的可能变大。(右)只剩蓝色选项的时候,阈值更低。    

  该工作由中科院脑智卓越中心的博士生张倍祯和加拿大皇后大学神经科学研究中心生物医学和分子科学系博士生Janis Ying Ying Kan等研究人员在Mike Dorris研究员指导下完成。研究得到中科院脑智卓越中心的徐宁龙研究员,博士后段春雨, 杨天明研究员和博士生张哲伟的大力支持。本工作得到中科院的资助。

    

附件下载: