别瞪着我,你这个长得人模狗样的家伙

图片:《阿丽塔:战斗天使》 别瞪着我,你这个长得人模狗样的家伙

解读恐怖谷效应

卡卡,Arts, Culture, Technology

说到拟人机器,特别是高仿真机器人,就无法避免要谈到恐怖谷效应 (Uncanny Valley)。[拟人机器]系列第五篇,我们就来说说什么是恐怖谷,恐怖谷的成因,以及一些恐怖谷效应的经典案例。

什么是“恐怖谷效应”?

恐怖谷效应,The Uncanny Valley, 指的是当一个事物与自然的、活生生的人或动物非常相似,但不完全相似的时候,它会在一些人中产生反感厌恶的情绪反应。恐怖谷效应常用于解释我们在仿真机器人和电脑特效 CGI 中常见的,非常像真人但又总觉得哪里不对劲、使人感到反感不适的现象。

陷入恐怖谷的女孩 - 网页动态模拟 - CUBOCC

“Uncanny”,翻译成“恐怖”,其实并不确切。“Uncanny“形容的是一种怪异、诡诞的感觉,当然包含恐怖、让人害怕的成分,但更有一重神秘的、无法言说的、离奇异常的含义。要更具象的理解“Uncanny”,想想《世界奇妙物语》和 David Lynch (大卫林奇)就够了。“Valley”,谷底,指的是在一个事物的“拟人”程度与它的接受度之间关系的曲线上的一个显著的落点,如下图。

恐怖谷效应最早是在 1970 年代被 Masahiro Mori 发现的。Mori 认为,当一个机器人的外表变得更像人时,观察者对于机器人的情感反应会变的更积极、更有同理心;但当外表相似到某个点时,观察者的情感反应会迅速向相反的方向转化,变为强烈的反感。当机器人的外表继续向像人的方向偏移,甚至与真人无法轻易区分的时候,观察者的反应又会正向回归,接近于真人对真人的情感反应。( 这里说的外表,不仅仅指静态的身体特征,还包括肢体动作、语言、表情等其他表征人类及其他动物的动态特征。)

受恐怖谷效应影响的例子有很多。1988 年 Pixar 的动画短片《Tin Toy (锡铁小兵)》中的婴儿让很多观众感到不适,也使人们开始重视恐怖谷效应。电影《Beowulf (贝奥武夫)》本来想用全 CG 做噱头,结果却深陷恐怖谷,还被人吐槽拿 CG 的裸体安吉丽娜朱莉去替换真人的朱莉估计是脑子进水了。

动画《Tin Toy》

电影《Beowulf》

仿真机器人中的例子就更多了。比如下图中的儿童机器人 CB2,绝对可以把小朋友吓哭。还有日本机器人学者 Hiroshi Ishiguro 制作的机器人替身。Hiroshi Ishiguro 可以把自己的声音和肢体语言传输到替身身上,利用替身来进行远程会议,不过我觉得这更像是远程吓人。

CB2

Ishiguro 和他的机器人替身

需要注意的是,虽然目前人们对于恐怖谷效应都有基本的认识,但恐怖谷的确切定义其实仍然十分模糊。这个“谷”,到底在什么位置出现呢?标志它的特征是什么?它跌落前的最高点,和反弹前的最低点又如何定义?这些问题无法轻易回答,这也许是因为作用于我们感觉和认知的从来不是单一元素,而是多种元素的交叉混合。空洞的眼神也许让某个仿真机器人看上去很“假”,但在另一个机器人身上,配合稍微卡通化的五官,恐怖谷的效应可能就此消失。这些左右我们认知的特征如此微妙,以至于去定义到底是什么特征引发了恐怖谷效应几乎不可能。但幸运的是,我们每个人都是一个灵敏的感知机器,当我们看到有点不对劲的”类人“时,我们本能地知道,这是恐怖谷效应在起作用了。

为什么会产生“恐怖谷效应”?

关于恐怖谷效应的成因,目前主要有两大类解释。第一类解释认为恐怖谷效应是通过进化获得的,是人类在漫长的生存中逐渐产生的生理防御机制,而第二类则认为恐怖谷效应来源于人类的认知模式。目前的科学研究结果对两种假说都有支持的证据,所以恐怖谷效应很可能是两种原因共同作用的结果。

为了证明恐怖谷效应是一种进化机制,科学家做了这样的实验:给猴子看三张图像,一张是高仿真的 3D 猴子图像,一张是低仿真的 3D 猴子图像,一张是真猴子的图像。猴子目不转睛地看每张图像的时间,标志了其对每张图像的喜好和厌恶程度。研究结果表明,猴子看高仿真的 3D 猴子图像的时间最短,表现出了本能的厌恶。这说明,我们人类在恐怖谷效应这个问题上并不是孤立的,就像猴子一样,我们生来已经具有了这样的倾向。

猴子恐怖谷实验:中间图像为高仿真 3D 猴子

这种进化而来的生理防御可能与交配和疾病预防两个方面有关。人类在进化过程中逐渐形成了对优秀配偶的辨识能力和对劣质配偶的规避能力。“像人又非人”的存在在外表上标志了低存活率,低生育率,也许因此引发了我们的厌恶。类似的,这样的外表也可能预示了恶疾、病菌、死亡,会使我们产生自然的规避行为。我们对于重病病人、尸体会产生本能的反感,也是同样的生存机制。另一方面,“像人又非人”的存在象征了异化的人类自身,也许会激起人对于自身生存状态和存在意义的担忧,是否自己也是徒具外表而毫无灵魂的机器呢?这也会导致我们产生抵触的情绪。

电影《异形》中的 Ash 最后发现是个生化人 (童年阴影啊)

在认知方式的解释中,研究者将恐怖谷效应定义为一种“认知不确定 (perceptual uncertainty)”。这种“认知不确定”源于类别界限的模糊,一个无法轻易放在“人”的类别,也无法轻易放在“机器”的类别的事物,就会让人产生认知焦虑。这种焦虑在其他一些“杂交”型事物上也有体现,比如转基因食物、变性人等等。还有的解释则认为,当一个机器人表现的大部分还是一个机器人的样子的时候,我们会默认它为一个机器人,并对其“非”机器人的部分、即像人的部分格外关注,因而容易建立情感联系和同理心。而相反的,如果一个机器人十分像人,我们会用“人”的要求去看待它,从而对于它“非人”的部分尤其关注,容易对它的异样特征产生反感。总而言之,这属于一种对事物的心理预期与事物的实际表现出现矛盾时所产生的不适和厌恶。

艺术家 Patrcia Piccinini 创作的杂交动物雕塑 - 直观上就觉得诡异

这里需要指出的是,虽然我们感知恐怖谷效应的能力是与生俱来的,但这并不是说它是一成不变的。社会文化对我们对恐怖谷效应的敏感度有非常重要的影响。《死寂 (Dead Silence)》,《人形师》等恐怖电影使得很多人“后天获得”了一种对于人偶、木偶等事物的恐惧症,大量五毛特效 CGI 则让我们对于差火候的 CG 人物见怪不怪,而伴随着 CGI、机器人这些事物成长起来的年轻一代,他们可能对于恐怖谷的敏感度要弱的多。如果恐怖谷效应真的与“人”和“机器”之间的类别认知混乱有关,那么随着科技的发展以及我们对于“人”和“机器”的定义的不断更新,这种认知焦虑可能也会逐渐消失 (或者被“人类”和“后人类”之间的差异所取代)。

电影《死寂》

恐怖谷效应案例 (一些经常被提起的,和一些未被提起过的)

  1. 动漫,二次元

动漫人物在拟人程度和接受度关系的曲线上,还远没有达到恐怖谷的位置。动漫人物虽然是拟人,但距离真人其实还很有距离。拿一张动漫人物的截图,你永远不会误认为是一个真人。所以说其实二次元动漫人物跟恐怖谷效应关系不大。

真相只有一个

不过当动画走 CGI 写实路线时,倒是很容易落入恐怖谷的区间。2001 年的《最终幻想:灵魂深处 (Final Fantasy: Sprits Within)》曾经使很多人为其在 CGI 上超出同时代其他作品的高水准所震撼,但也有人认为其中人物的情态动作怪异,是典型的恐怖谷效应。《最终幻想:灵魂深处》为了创造真实的人物效果,采用了真人动作捕捉技术,但是当时动作捕捉技术还未像如今一般成熟,所以只有人物的身体动作采用了真人捕捉,而面部表情、手部动作则是手工添加。这些人体微表情的不到位也许正是导致了恐怖谷效应的原因。

电影《最终幻想:灵魂深处》

规避 CGI 动画中恐怖谷效应的策略主要有两类。一类是将人物特征卡通化,使其不像真人从而保持在恐怖谷左侧的曲线上。Pixar 工作室的作品多采用这个策略,比如 2004 年的《超人总动员 (The Incredibles)》。

电影《超人总动员》

另一类策略则是从真人入手,通过动作表情捕捉反向生成动画角色,使角色极度像真人从而“跳过”恐怖谷到达右侧的曲线上。这一类策略的例子包括《指环王(Lord of the Rings)》中的咕噜 (Gollum),《阿凡达 (Avatar)》中潘多拉星球人种,《人猿星球 (Planet of the Apes)》中的猿人,还有《本杰明巴顿奇事 (The Curious Case of Benjamin Button)》中老年 Brad Pitt 的角色塑造。前几个例子由于塑造的角色在五官特征和比例上都与真人有差别,所以即使有略微的不真实也很难觉察到。但在《本杰明巴顿奇事》中,老年婴儿 Brad Pitt 是通过对 Brad Pitt 真人捕捉附加到 CG 版 Brad Pitt 上实现的,CG 直接刻画真人也达到了非常高的水平,可以说是电影 CG 特效的巅峰之作。

电影《阿凡达》

Brad Pitt as Benjamin Button,左边老年头部全 CG

2. 电影 vs. 游戏

上面其实已经提到了电影 CGI,不过这里主要把电影和游戏对比起来说说。

第一视角射击类游戏《荣誉勋章:战士 (Medal of Honor: Warfighter)》中的妻子和小孩角色因为其怪异丑陋被很多玩家诟病,甚至有人建议游戏应该改名为“恐怖妻子俱乐部 (Creepy Wives’ Club)”。从截图上来看,虽然人物的刻画的确有种 CGI 特有的假,但是其实我们在很多其他游戏中看到的也都大同小异,而我们也似乎并没有刻意去提及恐怖谷效应。

“恐怖妻子俱乐部”

为什么类似水准的 CGI,我们对于游戏的接受度要普遍高于电影呢?这也许是因为 CGI 本身就是游戏的一种媒介,对于游戏中的 CGI,我们是一种默认的接受,即使人物看上去怪怪的,我们也能理解这是技术所限。当 CGI 变得更真实时,我们首先关注的经常不是人看上去怪怪的 (反正 CG 人物一直都怪怪的),反而是技术进步了、画面华丽了。相反的,我们对于电影的默认印象是真人出演,真人才能有效的带动观众的情绪从而展开叙事,而不够真实的 CGI 在这种预设条件下,其缺陷会自然的凸显出来。

在游戏设计中,恐怖谷效应可以被放大利用,用来塑造一些反面人物。具体的例子暂时没有找到,以后有的话再不上来。

3. 人偶

对于人偶的恐惧很可能是一种后天的社会文化架构,而非恐怖谷效应,毕竟大多数人偶在外形上还远达不到与真人难以区分的程度。被主人抛弃的人偶回来复仇的恐怖片我们已经套路很熟了。再加上欧美系的恐怖片中各种被附身的巫毒娃娃和木偶,我们对于人偶产生恐惧感也是再正常不过的。类似的还有小丑恐惧症,但这种恐惧感严格来说跟恐怖谷效应并不是一回事。

再来说说蜡像。有人对于蜡像有比较强烈的反感,但是这种反感到底出自恐怖谷的本能反应,还是受到文化现象的影响 (譬如电影《恐怖蜡像馆》,我的童年阴影),也是因人而异。蜡像带有的其它文化符号也会影响到我们对它的接受程度。譬如,一个陌生人的蜡像也许让你觉得怪怪的,但 Brad Pitt 的蜡像,你恨不得上去亲一口。

Kim Kardashian 和蜡像

性爱娃娃也是一个因人而异的例子。对于很多用户来说,他们把性爱娃娃当作是性玩具,是一种物品而非伴侣,所以在功能上的需求超过了对于外貌仿真程度的吹毛求疵,这也是为什么那些画的像祭奠的纸人一样的充气娃娃照样卖的出去的原因。当然越仿真越容易“入戏”,而当性爱娃娃更加像真人时,用户的第一反应大概会是 “这个看上去更真实,用起来应该更爽一点”,而不是“这个看上去怎么有点怪怪的”。

不同仿真程度的性爱娃娃 (我都替左边的不好意思)

3. 真人芭比,蛇精男

这一类鲜被提起,但我认为有必要在一起讨论。我们说到恐怖谷效应,举的例子大多是机器人和动画 CGI,即一个不是真人的事物,非常像人的时候会给人诡异的感受。同理,一个本来是真人的人,因为某种原因搞得不像真人,也会给人诡异的感受。乌克兰真人芭比和我们本土的蛇精男都属于这样的例子。不得不说,我国 PS 技术为我国人民跨越恐怖谷作出了贡献 (每天看到的都是磨皮美肤照,已经不再觉得恐怖了)。

真人芭比和蛇精男

[拟人机器]系列文章:

(一) Alan Rath 的拟人机器 - 脑波 - 知乎专栏

(二) Animatronics 电子动画特效技术 - 脑波 - 知乎专栏

(三) Bill Vorn:暗黑机械物语 - 脑波 - 知乎专栏

(四) 存在的困境:Chris Eckert 的动态机械装置艺术