Chapter Content
哎呀,跟大家聊聊啊,最近看到一个挺有意思的例子,讲的是 Jenny Radcliffe,这人呢,在网上被称为“人类黑客”,听着挺唬人的吧?她自己也说,她是个“雇佣的窃贼”,或者“专业的骗子”,又或者是“社会工程师”。不过官方的说法呢,她其实是个“渗透测试员”。就是公司会雇她去入侵他们的建筑物啊,电脑系统啊,帮他们找出安全漏洞。
说白了,虽然有时候她也会用到一些物理手段,比如开锁啦,或者写点代码什么的,但她最厉害的工具其实是心理学。她能看人,能分析情况,然后预测别人会对她做的事情做出什么反应。这样一来,她就能制造出一些情况,让她朝着她想要的目标前进。
这不,她就接到一个任务,要潜入德国的一家银行。她的任务是在营业时间进入银行,突破安保措施,找到一个特定的办公室,然后把公司给她的一个U盘插到电脑上。U盘里预装的程序会自动安装,这样公司就知道Jenny成功地渗透了他们的安全系统。
到了要行动那天早上,Jenny就准备了一套行头和道具。她用绷带把手和手腕缠起来,她觉得这样人们可能更愿意帮她开门,因为她看起来好像受伤了。她还带了一个装满文件的大箱子,这样就能占着她的手,进一步增加别人帮她开门的几率。准备好之后,她就去了银行,走进了一个摆满皮沙发的豪华大厅,然后走到了一扇大门前,那扇门挡住了通往“员工专用”区域的通道。
这扇门是Jenny遇到的第一个障碍。它是用指纹扫描仪控制的,当然,Jenny的指纹不在银行的系统里,她又不是员工,她只是假装的嘛。但她还是走到指纹扫描仪前,把手指放在了扫描板上。机器嘟嘟地响了两声——没用。她也没指望传感器会让她进去,但作为一名执行安全审计的渗透测试员,检查这些也是她的工作内容之一。
这个时候,Jenny就面临选择了。她可以请在大厅值班的保安让她进去,但保安有什么理由要这么做呢?他的工作就是把陌生人挡在外面啊。所以,她选择了另一个方法:她大声地骂了一句,真的是很大声的那种。
正如Jenny所料,保安走了过来看看发生了什么事。
Jenny后来解释说:“你不必和锁较劲,你要和锁后面的人较劲。不管他们设置了什么东西,只要有人能访问,我就能访问他们,然后就变成了我和那个人之间的较量。”
当保安走过来的时候,Jenny不耐烦地说:“这东西不好使啊!昨天还好使呢。”保安建议她再试一次指纹传感器。她装出一副很恼火的样子,又骂了一句,然后笨手笨脚地把她的大箱子放在她那只缠着绷带的手上。她又试了一次,机器又响了两声。保安猜测说,也许她按得不够用力。她很不情愿地把手指放在传感器上——这时,保安抓起她的手,想帮她把手指按在机器上。
Jenny发出一声惨叫,装作很痛苦的样子,又大声骂了一句。她故意把文件箱扔在地上,文件散落得到处都是,然后她又装模作样地捡起来,一边捡一边骂骂咧咧的。这下她引起了大家的注意——大厅里的人都在看着她。
“看在上帝的份上,你进去吧,”保安说,然后给她刷了一下,让她进了门。“谢谢你,danke schön(德语,谢谢)”Jenny回答道。然后她就上路了——沿着走廊走到指定的办公室,在那里她插入了她得到的U盘。
这是怎么回事呢?像Jenny这样大吵大闹,可能并不适用于每个人,也不适用于每种情况。一方面,有些人可能更容易被奉承或者觉得自己在帮别人的忙所影响。另一方面,同样的行动可以被解释为或多或少具有威胁性,这取决于做出这些行动的人的特征和他们所处的环境。但在这种情况下,Jenny有信心制造混乱会帮助她闯入银行,因为她知道在德国,人们通常会因为吵闹而感到非常尴尬,而且根据她的性别和她的外表,她不太可能被认为是身体上的威胁或电脑黑客。在这种情况下,让这场骚动成为保安脑海中最突出的事情,会影响他的决策。她认为保安会认为她的风险很低,并且宁愿让她进去,也不愿处理这种场面带来的不适和干扰。而她是对的。
也许你想严厉地指责保安放Jenny进去。银行的规定无疑强调,他不应该让陌生人通过那扇门。如果Jenny是个心怀恶意的人,她插的U盘可能会上传一种电脑病毒,窃取客户的个人信息和毕生积蓄,或者破坏银行基础设施的重要部分。但事实是,我们很多人在这种情况下也会做同样的事情。我们希望把自己看作是乐于助人、善良的人,而且很多时候别人并没有试图欺骗我们。如果Jenny只是一个受伤的员工,只是想进入她的办公室工作,那么保安的行为会对银行有帮助,而不是有害。
不管怎样,Jenny对这些决策机制的理解——我们在选择选项时进行的有时是无意识的、近乎瞬间的计算——以及这些机制如何被影响,使她能够闯入银行。神经科学的最新进展使我们能够更多地了解大脑中使她能够做到这一点的底层系统,这可能使其他人能够抵抗,其中包括科学家称之为价值系统的系统。
当我们开始探索价值系统时,这个系统汇集了许多不同类型的信息来指导我们的决策,想象一下保安在面对Jenny时的想法可能会有所帮助。他大脑的价值系统会计算不同可能选择的价值(让这个骂骂咧咧的女人继续制造噪音还是让她进去),选择价值最高的那个(让她进去),然后跟踪这个选择的回报有多大(现在安静了,我帮助了一个受伤的人,感觉很好)。很多时候,这种价值计算发生得很快而且很顺利。重要的是——正如Jenny非常了解的那样——它的结果取决于我们的大脑在当下关注什么。在那一瞬间,价值计算会受到许多因素的影响:我们自己的目标、我们的感受、我们的身份、我们认为别人会怎么想和怎么做、文化规范和期望、我们的社会地位等等。
Jenny利用她对价值计算的内在理解,进入了银行,正如她被雇佣做的那样。反过来,意识到这种漏洞的银行可能会采取措施,以确保在未来类似的情况下,保安的价值计算会产生不同的结果。让保安意识到Jenny是如何闯入的,可以使他们有更多的自主权来控制他们在这种时刻的决策,并抵制未来以这种方式劫持它的企图。或者,银行可以为保安提供更多机会来认识其他银行员工,这样当有新员工加入时,以及谁是陌生人,就会一目了然。
当然,要想到所有这些选择,需要沿着许多不同的维度进行思考:了解银行的整体目标,保安的目标,以及在哪里可能有更大的可能性。那么,哪些选择,或者选择的组合,能使保安下次更有可能做出不同的选择呢?我们如何才能更加意识到我们的价值计算何时会被那些不为我们着想的人所左右呢?要弄清楚这一点,了解当我们面临选择时,我们的大脑中发生了什么是有帮助的。
酷爱饮料还是薄荷茶?
价值系统的一个显著能力是,它允许我们的大脑将复杂的、混乱的、真实世界的决策简化为可比较的量。经过这样的简化,我们的大脑就能够在选项之间做出选择——通常几乎是瞬间的,并且具有相当多的内在一致性。
我觉得把价值计算想象成一个隐藏的“你更愿意”游戏很有用。你可能熟悉这个常见的破冰游戏,其中一个玩家提供两个(最好是愚蠢的)选择,其他玩家说他们更喜欢哪个:你更愿意拥有猫的舌头还是用旱冰鞋代替手?你更愿意能说任何语言,还是拥有世界上最美的歌喉?你更愿意独自生活在一个荒岛上,那里有所有曾经制作过的电影和书籍,还是与你选择的另一个人一起生活,但没有媒体?
当你仔细想想,你能回答“你更愿意”的问题是近乎神奇的,因为你可以比较在很多方面都不同的选项。从像在聚会上玩“你更愿意”游戏这样的小事,到决定我们每天实际行为的决策,我们的价值系统都在帮助我们做出选择。但是大脑是如何做到这一点的呢?
长期以来,没有人知道答案。大脑是否有不同的系统,每个系统都监控一个选择的不同维度?(我们正在选择的每种食物里有多少糖或盐?每种食物有多热或多冷?每种食物有多绿?)或者是否有不同的脑系统来处理不同领域的选择?(一个大脑系统决定我们想吃什么类型的食物,一个不同的大脑系统记录我们潜在的晚餐伙伴有多有趣,第三个系统处理关于我们是否负担得起外出就餐的财务决定?)
我们目前对这种决策的神经基础的思考方式的基础,是在20世纪50年代由研究人员奠定的,他们绘制了一组大脑区域的图,这些区域跟踪更简单类型的奖励,并引导动物的行为以最大化这些奖励——即使选择奖励在长期来看对动物的福祉客观上是不利的。
加拿大麦吉尔大学的科学家James Olds和Peter Milner发现,当有机会时,老鼠会反复按下一个杠杆,触发电极来刺激它们微小的老鼠大脑的特定部分,这会使它们感觉良好。换句话说,老鼠发现刺激大脑的这些部分是“有回报的”,当时的科学家开始将这些被刺激的区域视为“奖励系统”。事实证明,刺激这个奖励系统对老鼠的行为产生了强大的影响。例如,当老鼠有机会按下刺激这些奖励区域的杠杆时,它们甚至会放弃赖以生存的食物。
而且不仅仅是老鼠。科学家很快在恒河猴身上发现了类似的奖励系统,最终了解到所有哺乳动物的大脑中都有类似的基础设施。跨物种,当科学家刺激大脑深处一个叫做纹状体的区域和大脑前部(额叶皮层)的某些区域的神经元(在神经系统中传递信息的细胞)时,这些动物似乎体验到了奖励,它们的倾向一遍又一遍地寻求刺激证明了这一点。像人类一样,一些动物也表现出面部表情或发出声音来表达它们的快乐。但是,尽管早期很明显刺激特定的奖励区域会导致动物想要东西,但科学家花了数十年的时间才理解这如何转化为人类更复杂的决策。一个跟踪你想要多少食物或你有多想按下杠杆的系统,怎么会与你想让谁当总统或你想看哪部电影有关?一个单一的大脑系统真的能处理比较发生在不同时间点(现在与以后)的选择、具体的奖励(比如吃哪种零食)以及关于社会和道德的抽象问题吗?
在21世纪初,一系列关于大脑系统如何对更广泛的商品和想法的相对价值进行更复杂计算的重要见解出现了——其中一个是通过向猴子提供酷爱饮料。Camillo Padoa-Schioppa和John Assad是哈佛医学院的研究人员,他们研究决策和经济选择,他们想知道在老鼠和其他动物身上发现的奖励系统是否也能帮助猴子做出稍微更复杂的决定,如果是的话,如何做?一方面,他们推断说,奖励系统的区域可能会对不同潜在奖励的客观属性(比如果汁中的糖分)做出反应。如果某种特定的营养物质,比如糖或纤维,在进化过去对物种的生存很重要,并且食物的物理特征(比如颜色或硬度)能很好地表明其中有多少这种营养物质,那么情况可能就是这样。如果是这样,那么食物的某些生物或化学特性与奖励系统的反应之间应该存在紧密的对应关系。另一方面,如果奖励系统可以考虑更广泛的事情,进行更主观的计算呢?它能解释为什么猴子在不同时期可能有不同的食物偏好吗——甚至预测猴子想吃什么吗?
在他们的实验中,Camillo和John会给一只猴子——我们叫他Gizmo——提供一系列的选择,同时记录他大脑中神经元的活动。Gizmo会喜欢一滴柠檬酷爱饮料还是两滴薄荷茶?五滴牛奶还是一滴葡萄汁?Gizmo会向左或向右看来表示他的决定。
经过许多这样的选择后,研究人员可以计算出Gizmo对每种饮料相对于其他饮料赋予了多少价值——神经科学家现在称之为它的主观价值。我们说价值是主观的,因为它最终没有固定在某个客观的质量上,比如每种液体中存在的糖的密度或总量,确切的温度,液体的量等等。科学家们发现,Gizmo和其他猴子通常喜欢喝更多的东西,如果可能的话,但是,像人类一样,它们更喜欢某些饮料(特别是柠檬酷爱饮料和葡萄汁)。根据提供的东西,猴子有时会选择少量它们喜欢的饮料,而不是更多它们不太喜欢的饮料。通过以不同的比例向猴子提供饮料,Camillo和John可以得出一个数学描述,描述猴子在每次实验中的偏好。例如,如果在一次实验中,Gizmo真的很想喝葡萄汁,并且选择了一滴葡萄汁而不是多达三滴水,那么Camillo和John就可以说一滴葡萄汁值三分,而一滴水值一分。
在与猴子相处的过程中,Camillo和John还发现,主观价值受到做出决策的环境的影响:猴子的饮料偏好(也就是说,一种饮料相对于另一种饮料的相对价值)每天都在变化——即使是同一只猴子。想象一下,你自己正在某人家里,他们给你提供一杯咖啡或一杯柠檬姜草药茶。你的决定部分取决于你拥有的稳定偏好(你通常比柠檬姜茶更喜欢咖啡),但也取决于情况(现在很晚了,你担心咖啡因可能会让你难以入睡)。同样,在星期二,Gizmo可能更喜欢葡萄汁而不是水,比例是3:1,但是在星期五,他可能感觉不那么强烈,因为他已经吃了很多水果,可能更喜欢葡萄汁而不是水,比例只有2:1。这就是“主观价值”的含义——一个情况的不同方面会改变某件事对某人的价值,在给定的时间,在给定的情况下。
当Camillo和John查看来自猴子大脑的数据时,他们发现,在猴子的大脑前部和中心——具体来说,一个叫做眶额皮层的区域——神经元对每只猴子对果汁的整体主观偏好做出了反应。这些神经元的活动与Camillo和John根据猴子的决定计算出的整体比例相关——当猴子更喜欢一个选项三倍时,这些神经元的活动也相应地更多。有趣的是,这种活动似乎并不取决于选择的客观方面,比如饮料的特定成分(如果,正如你可能认为的那样,有神经元跟踪糖的量),屏幕的哪一侧显示了报价(如果这里的神经元跟踪猴子需要执行什么动作才能获得果汁),或者总共提供了多少滴果汁(如果总是越多越好)。相反,这些神经元跟踪了整体的主观价值。*
而且这种主观价值与猴子做出的选择有关。仅仅通过查看Gizmo的眶额皮层在显示不同选项时发生了什么,Camillo和John就能非常准确地预测Gizmo可能会做出什么选择。换句话说,猴子的大脑正在用一个共同的尺度计算每个选项的主观价值,这使它们能够做出决定并比较苹果汁和橙汁。
那么人类呢?大约在猴子研究揭示它们的大脑对主观(而不是客观)价值做出反应的同时,科学家们开始在人类大脑中发现类似的回应。在21世纪初的十年左右的时间里,科学家们进行了数百次实验,绘制了当人们基于这些主观偏好做出选择时,他们的大脑中发生了什么。
在一项早期的研究中,神经科学家Hilke Plassmann和她在加州理工学院的同事发现,当他们测量人类志愿者愿意花多少钱来吃不同的零食时,他们在与猴子用来在柠檬水和葡萄汁之间做出选择的脑区域类似的脑区域中表现出类似的活动。这个团队向饥饿的人类展示了咸味和甜味的垃圾食品的照片,比如薯条和糖果棒,同时使用功能性磁共振成像(fMRI)扫描他们的大脑。这种类型的脑扫描让科学家们可以看到大脑的不同部分何时活跃,然后将这种激活与不同的心理过程和行为联系起来。Hilke研究中的志愿者被告知他们有一个特定的预算,并且被问及他们愿意为不同的食物项目支付多少钱,这些食物项目以图像的形式显示在fMRI扫描仪的屏幕上。†与Camillo和John的猴子的情况一样,在人类大脑中,活动增加最多的区域是人类大脑中一个类似的区域——腹内侧‡前额皮层——对于他们认为最有价值的项目。换句话说,对于他们愿意支付3美元的零食,大脑的活动比他们愿意支付1美元的零食或者根本不想购买的零食更多。人们的大脑会跟踪不同食物(对他们个人而言)的主观价值,并做出相应的选择。
腹侧纹状体和腹内侧前额皮层(如图所示)是更广泛系统中的关键区域,当人们在许多领域做出决策时,该系统会跟踪主观价值。
这是一个突破——但是在日常生活中,我们经常需要在比两种零食更难比较的选项之间做出选择。决定你更愿意喝咖啡还是茶的相同脑区域,也能比较以非常不同的方式提供奖励的东西吗——例如,你更愿意喝葡萄汁还是去看电影?——或者这些选择是否超出了它们在决策中的作用?
为了探究这个问题,加州理工学院和都柏林圣三一学院的一个科学家团队设计了一个实验,本质上是“你更愿意”困境的一个变体:研究团队给fMRI扫描仪中的志愿者12美元的预算,他们可以用这些预算来竞标不同类型的商品,从甜味和咸味零食,到DVD,加州理工学院纪念品和金钱赌博。他们发现,腹内侧前额皮层的一个重叠区域跟踪了人们愿意为不同食物支付多少钱,也跟踪了人们愿意为大学纪念品和DVD等产品支付多少钱。大约在同一时间,其他科学家团体也发现,人类内侧前额皮层和其他区域(比如腹侧纹状体)的活动,跟踪了人们愿意为一系列消费品支付不同的价格。这些发现表明,一个共同的系统正在跟踪各种不同类型选择的价值。
随着这项研究的不断发展,这个大脑区域群,包括腹侧纹状体和腹内侧前额皮层,被称为价值系统。到2010年,价值系统中的活动已被证明不仅可以跟踪人们关于他们愿意为不同商品支付多少钱的决定,还可以跟踪其他类型的财务选择。例如,你更喜欢100%的机会赢得10美元,还是50%的机会赢得20美元?你更愿意现在得到10美元,还是六个月后得到20美元?所有这些类型的选择似乎都通过一种类似的机制来运作,在这种机制中,价值系统识别并评估不同选择的主观价值,比较它们,然后采取行动。
到2011年,研究人员甚至可以根据志愿者在最初扫描过程中观察不同商品时,他们的价值系统中观察到的活动来预测他们以后会选择什么——即使在最初扫描过程中没有要求他们做出任何选择。换句话说,价值系统似乎会跟踪不同事物的主观价值,无论这个人是否有意识地试图对它们做出决定。当我们在杂货店排队时,我们的价值系统正在权衡收银台旁的糖果棒的价值,并吸收来自新闻标题和杂志封面的信息。当我们在滚动浏览社交媒体,被动地消费广告时,我们的价值系统仍然在注册输入,即使我们没有积极地关注它们。
十年后,现在人们更广泛地接受我们的价值系统使用一种“共同价值”尺度进行计算,这使我们能够比较本质上无法比较的东西。你可能很容易决定你更愿意拥抱一只小狗还是现在拥有5美元。这是因为你的价值系统将每个选项转换成一个共同的尺度,并进行比较。同样,当Jenny对保安大喊大叫时,他迅速做出决定,试图帮助她使用指纹扫描仪,而不是要求看身份证,最终让她通过大门,而不是呼叫支援,要求她离开或邀请她约会。
预测与学习
人们很容易认为存在好的选择和坏的选择,但事实是,这些都是移动的目标,而价值系统是动态的,不断权衡相互竞争的利益和背景。这意味着我们做出的选择取决于我们想象我们正在选择哪些选项,以及我们关注选择的哪些维度。如果你的孩子从未见过男护士,这可能会限制他想象的适合他富有同情心个性的职业选择。此外,我们分配给给定选择选项的主观价值可能会改变,这取决于与我们的过去经历、我们当前的情况和我们的未来目标相关的各种因素。如果你的孩子认为你希望他找到一份帮助很多人的工作,那么当他考虑职业选择时,这个维度可能会占据很大的比重。同样,如果他的迷恋对象对德克萨斯州的奥斯汀赞不绝口,这可能会导致你的儿子重视不同工作选择的地理灵活性。这就是社会心理学家所说的“情境的力量”的神经基础之一:我们的决定取决于我们当前的情境,这给了计算中的某些输入更多的权重。
假设你正在决定你更愿意吃沙拉还是巧克力蛋糕。如果你的大脑只遵循“客观”规则,你可能只关心食物填饱你的肚子的程度或它提供的卡路里(这可以直接转化为在人类进化的早期时刻让你活下去)。但事实并非如此。正如你毫无疑问所经历的那样,当你要决定吃什么时,你可能会关注任何事情:食物的味道如何,你在吃完后会感觉如何,你的约会对象在吃什么,你刚拿到一份糟糕的医生报告,你新陈代谢很好,今天是某人的生日,每种食物的成本是多少,你刚刚跑完一场马拉松,你心情不好吗?你的大脑会快速地这样做,甚至可能不考虑所有这些维度,限制它在任何给定的选择中权衡的内容。基于它确实权衡的因素,你的大脑可以计算出沙拉和蛋糕的主观价值,并在一个共同的尺度上,然后选择价值更高的替代方案。
一旦你做出了选择,你的价值系统就会将它传递给你大脑中帮助你根据决定采取行动的部分,比如伸出手去抓住你选择的食物并吃掉它。重要的是,你大脑的价值系统然后会跟踪决定的结果有多好,相对于你认为会发生什么——换句话说,它多么准确地猜测了这个选择的回报会有多大。它不仅跟踪你的预测(那个蛋糕看起来很好吃!我记得小时候在生日聚会上玩得多么开心!),而且跟踪预测误差,或者你的预测和实际结果之间的差异。如果选择最终比你预期的更有回报(那个蛋糕很好吃!完全值得!),那么你的大脑会产生神经科学家所说的“正预测误差”,这表现为选择后价值系统内的激活增加;相反,如果选择最终比你想象的更糟糕(那个蛋糕让我感觉很恶心!),那么你的大脑会产生“负预测误差”,这表现为选择后价值系统内的激活减少。这些预测误差帮助你在未来进行学习,随着时间的推移更新你的大脑如何进行价值计算。
总而言之,神经科学家所说的基于价值的决策分为三个基本阶段。首先,我们的大脑确定它们正在选择哪些选项,为每个选项分配一个主观价值,并在那一刻识别出价值最高的选项。这意味着从一开始,我们的选择就受到我们首先考虑的可能选项的塑造。接下来,我们的大脑继续执行被认为是价值最高的选择(这可能不是在我们更大的目标或更长远的福祉的背景下最好的选择)。这意味着没有一个唯一的正确答案,而且我们的大脑认为“价值最高”的选项,如果从其他角度考虑可能会发生变化(例如,当思考职业目标而不是想要成为一个好朋友时)。最后,当我们做出选择时,我们的大脑会跟踪它最终有多大的回报,这样它们就可以更新它们下次如何进行计算;这意味着我们经常过分重视我们选择的结果,而不是改进我们的过程。这突出了我们至少可以在三个地方进行干预:我们可以想象更多(或不同的)可能性;从不同的角度考虑现有的可能性;或者关注结果的不同方面。
我们可以再次想起我们的保安。如果,作为保安,你让一个笨手笨脚的人通过,这个人正在制造一场骚动,并且这产生了比你预期的更好的社会回报(这个人给了你一个大大的、感激的微笑,并告诉你她多么感谢你),你的大脑将产生一个正预测误差,该数据将被存储,并且在未来,你更有可能让下一个笨手笨脚的陌生人进入。但是,如果发生了糟糕的事情,并且结果比你预期的更糟糕(这个笨手笨脚的人最终是一个安全测试员,并且你的同事对你很生气,因为现在你们都必须参加额外的培训课程),你的价值系统也会存储这些信息。下次,你可能会在让陌生人进入之前三思。
但是,当然,没有人扫描保安的大脑。到目前为止,我们探索的大多数研究都是在高度控制的实验室环境中进行的。那么,在实验室外,在现实世界中,实际发生了什么?我们能将价值系统中的活动与人们在脑扫描仪外的日常生活中所做的事情联系起来吗?
对科学来说是美好的一天
在21世纪初,我还是一个崭露头角的神经科学家,当时我们对价值系统的理解才刚刚开始形成,我对大脑成像是否能让我们深入了解健康决策很感兴趣。我想帮助人们做出能帮助他们过上更健康、更幸福生活的选择,但我也知道这些选择可能很难做出。改变很难,即使我们有动力去改变,我们也不总是花时间去弄清楚我们首先为什么要做我们所做的事情,也不知道为什么有些思考方式有助于实现我们的目标,而有些思考方式则无助于实现我们的目标。
我当时在思考如何制作更好的健康指导和宣传活动。我还在思考我们如何与我们的家人和朋友、室友和同事交谈,以帮助他们做出健康的改变,甚至我们如何与自己交谈,以做出更符合我们目标