在介绍六型面孔和面部行为编码系统的章节中,我们对面部识别有了初步的认识,也知道了一些基本表情的识别方法,例如每种表情有哪些必备特征,这些对于表情识别而言都是不可缺少的。在本节的内容中,你可以了解得更具体甚至更专业,也更能应用于生活。
动物的面部表情识别
当你环顾四周的时候,你会发现有太多的东西多多少少可以与表情识别扯上联系,无论是大街小巷还是室内室外,因为只要有人在的地方你都会发现有表情,而有了表情自然而然地就想知道表情背后隐藏的情绪,这就有了表情的识别。当然这需要我们来排除一些特殊情况,比如说在一个漆黑的午夜你站在一条只能隐隐约约听到奇怪的声音却没有人烟的小巷子里。在这种情况下,你不妨掏出一面镜子,识别一下你自己的面部表情。我们猜测,这个表情多半情况下是害怕。
事实上,就算周围没有人我们也可以进行表情的识别,因为动物也是有表情的。动物是生物界的一大分支,全世界动物的种类加起来大约有130万种(虽然这个数字每年都在减少),而人类的种类相比较而言就少很多,虽然严格意义上讲人也是动物。
这表情和人类的表情似乎如出一辙,我们完全可以对其进行简单的识别:眼轮匝肌眶部收缩,造成眼角产生皱纹,嘴角向两侧的斜上方拉伸咧开,肌肉的运动导致脸颊上升,脸颊上升的同时将下眼睑往上挤兑,让眼眶看起来更像一个球。我们可以识别出这就是一个动物微笑的表情,没错,实在是和人太像了!
是一个长颈鹿忧伤的表情,虽然我们在日常生活中不一定能看到长颈鹿,但我们同样可以用之前章节里学到的知识来对这个表情进行识别:嘴角下垂,双唇闭合,眼睛略微闭合,目光呆滞,眉毛……长颈鹿好像没有眉毛,但是这并不影响到我们的识别,我们依旧可以说这大致是一个忧伤的表情,而且是一个平静的悲伤表情。
从生物学角度而言,由于面部结构和肌肉分布的不同,人类只是可以做出比其他动物更为复杂的面部表情而已。而一些较早分化出来的基本情绪,例如恐惧等,一般情况下动物都会有与之对应的面部表情。在现实生活中,动物的情绪与人相比是简单的,在动物身上不存在一些复杂的情绪体验,或许这也就是人和动物的不同之处吧。
美元中富兰克林的表情分析
动物虽然同人一样有着丰富的表情,但这毕竟不是我们主要的识别对象,我们需要把重心重新放回到人的身上。那么我们如何对人的表情进行识别呢?我们并不一定要从真人身上开始观察,因为真人的表情时刻都在变化,而且在某些情况下人的表情并不一定包含着情绪,这在前面章节也有所提及,所以我们不妨从一些可以获得定格的表情的媒介来开始我们的主题,比如照片。
哪里有头像,哪里就有表情的识别,这句话一点没错。货币上往往印着各国重要人物的头像,这是一张面值为一百美元的钞票。许多人都不知道上面印的肖像到底是谁,他的身份是什么。是美国总统?乔治·华盛顿还是托马斯·杰斐逊?好像都不是,印在一百美元上的这个人就是18世纪美国最伟大的科学家和发明家,著名的政治家、哲学家、文学家和航海家以及美国独立战争时期的伟大领袖,并参与起草美国《独立宣言》,部分读者可能猜到了,他就是本杰明·富兰克林。
接下来表情识别正式开始。在这个肖像上,富兰克林口唇紧闭,嘴角向两侧拉伸,上唇向下压紧,脸颊没有明显上升,提上唇鼻翼肌收缩,导致鼻部两侧形成皱纹;眼轮匝肌眶部收缩造成眼部鱼尾纹,闭眼动作不明显;降眉间肌收缩,右眉微降,左眉扭曲且外侧挑起,额头没有明显皱纹。总的看来,在百元美钞上的富兰克林显得不是那么高兴,也不知道美国人为什么不把自己每天都要接触的百元钞票上的肖像印得喜庆一些。
我可没有夸大这肖像的作用,很多人都不知道,在现实生活中人们或多或少都有模仿行为,语言的习得也是模仿的作用。当一个人看到自己所使用的钞票上的人物并不高兴的时候,会被这种情绪所感染,这个人也显得不那么高兴了,不开心的原因绝对不单单是花掉了钞票。相比较之下,中国的人民币就更为人性化。
那么富兰克林的表情应该被识别为哪一类呢?从鼻颊—口唇区来看,这个表情应该是属于厌恶,但是眼—睑区却没有闭眼动作,所以这个表情不是厌恶。那么是不是悲伤呢?因为悲伤和厌恶的表情从很大程度上来说比较相似。如果是悲伤的话,嘴角下降的幅度明显不够,而且悲伤表情的另一个重要特征是眉形,虽然这张百元大钞上富兰克林的眉形有些扭曲,但就算凭感觉来推测,这个表情也绝对不是悲伤,于此同时这个表情更不可能是快乐、愤怒、恐惧和惊讶。分析到这里,你应该了解到富兰克林的这个表情并没有我们想象得那么简单,并且不属于基本表情的类别,而是一种更加高级、更晚分化也更加复杂的情绪表情。这个表情究竟代表着什么呢?
什么是面部表情的三个维度
当面部表情展现在我们面前的时候,我们如何进行一个系统又准确的识别?我们需要提到一个陌生的人,这个人的名字叫施洛斯伯格(Schlosberg)。
施洛斯伯格提出面部表情可以分成三个维度:
愉快—不愉快
注意—拒绝
睡眠—紧张
利用这三个维度,我们可以完成一张三维模式图。面部表情的三维模式图是在之前圆形量表的基础上增加了一个新的维度,即睡眠—紧张维度。
紧张指神经兴奋的状态,与兴奋状态相对应,我们可以将睡眠理解成是一种神经的抑制状态。任何情绪的产生,都伴随着一定程度的紧张(神经兴奋的时候),当我们神经不兴奋(睡眠)时就没有表情。在日常生活中,我们有时会说“我现在好紧张。”于是我们可以将紧张理解成是情绪较为强烈的维度,而睡眠则是情绪激活水平较低的一种状态。按照施洛斯伯格的理论来说,利用这三个维度可以把所有的面部表情进行合理的区分。
我们首先可以利用这个三维模式图来对人类6种基本表情进行区分。
之前提及厌恶和悲伤的表情比较相似,我们可以从这三个维度对这两种表情进行区分。
在愉快—不愉快的维度上,厌恶和悲伤都属于不愉快维度。
注意—拒绝这个维度可能比较难理解,我们可以把这个维度看得更加具体一些。惊讶的时候,眼睛甚至嘴部都是张开的,好像准备好要接受外界的刺激,这是注意;相反,在厌恶的表情中眼睛、嘴部都有闭合的趋势,似乎是拒绝接受外界的刺激,这就是拒绝。在这个维度上,厌恶和悲伤都属于拒绝维度。
可以将厌恶、悲伤进行区分的是睡眠—紧张维度。厌恶处于紧张维度,而悲伤则属于睡眠维度。我们可以这样理解:当我们厌恶某样东西的时候,我们就想要远离,此时身体是主动地去反抗,这代表着神经处于兴奋状态,激活水平高(紧张水平);悲伤的时候遵循重力原则而表现出各种向下的趋势,神经偏向于抑制状态,激活水平较低(睡眠水平)。
其他相似的情绪我们几乎都可以运用这个三维模式图来进行有效的区分,例如惊讶和恐惧,恐惧属于不愉快维度,而惊讶属于愉快与不愉快之间的维度等等。
愉快—不愉快、注意—拒绝这两个维度构成了一个圆形量表,不同的表情分布在这个圆形量表的不同位置,通过一张表格,我们已经可以将主要的情绪进行一个笼统的区分。
但是,许多类似的表情将无法进行区分,例如忧郁、哀伤、悲痛,这仅仅是因为情绪的不同强度所引起的细微差异。我们可以利用三维模式来构成一个三维坐标系进行细分。在这个表格中包含6种基本表情,而且还加入了更多仅有细微差异的表情。
包含了愉快、不愉快、注意、拒绝和中间五个名词,需要我们注意的是在这一列中的“中间”含义并不是完全相同的。此列中包含两小列,第一小列的“中间”指的是既不愉快也不是不愉快;而第二小列的“中间”指的是既不拒绝也不注意的中间状态。
如果你觉得表格上各种情绪的关系不是很明显的话,这是普拉奇克的情绪三维模式图。
不知道读者是否还记得,在前面关于富兰克林的表情问题还没有结束讨论,现在我们可以用这三个维度对其进行区分。百元美钞上富兰克林头像的截图,放大一些可以让我们更加清晰地进行观察。
同前面的内容相似,我们可以通过三个问题来对富兰克林的表情进行区分:富兰克林是愉快还是不愉快?是注意还是拒绝?是紧张还是睡眠?我们可以在三个维度上得出结论:富兰克林处于不愉快的维度,处于注意和拒绝之间的维度,处于紧张的维度。这个位置与六型面孔中的厌恶位置相近,所以应该是由厌恶所延伸出来的副表情,根据其眉形我们可以判断,这个表情代表的情绪是怀疑。但挑眉就是怀疑吗?这部分内容在下一章会具体提及。
表情测量与情绪识别
许多读者可能对这个问题依旧不是很明白,情绪和表情到底有着怎样的关系,我们为何要研究表情?这个问题在前文中只做了简单的提及。
事实上,我们研究表情的目的是探知人的情绪,测谎也是一样的道理,内心情绪与外部行为所代表的情绪不相符合的时候,我们便说这个人是在掩饰或者是说谎。没有一种单一的行为可以充分而必要地指向一种特定的情绪。我们知道哭泣通常代表悲伤,但是人有时候愤怒的时候也会哭泣,例如恨铁不成钢就是既愤怒又悲伤,甚至在体验快乐情绪的时候也会哭泣,喜极而泣就是一个很好的例子。所以外部行为并不能说明具体的情绪,判断而确定情绪是需要通过具体情境的。
情绪与生理变化及外部行为变化之间的关系是极其复杂的,这一直都是情绪研究的一个难点。
追溯情绪研究的历史,传统方法大致有印象法和表现法两类。面部表情并没有按照传统的研究方法进行研究,但是利用面部表情来对情绪进行测量是有其依据的。心理学家孟昭兰将理论依据归纳成三点:一、面部表情是传递情绪的外显行为;二、面部表情具有全人类的共同性;三、新生婴儿具有不经学习就有所显露的基本情绪的面部表情模式。
面部表情的发生同样有其客观的物质基础:表情以面部不同部位的肌肉运动而模式化,面部反应模式携带着心理学的意义,那就是或快乐或悲伤等具体情绪。但是,对表情进行测量的原则是:所要测量的是面部各部位的肌肉运动本身,而不是面部给予观察者的情绪信息。因此,测量的最终目的是揭示表情显露的情绪信息,但测量本身必须是产生情绪信息的物质过程。
现代化的表情识别与测量方法介绍
在一定意义上讲,识别和测量是近义词,它们代表的含义类似,只是测量更注重的是数据的量化。
面部行为编码系统是艾克曼等人在总结过去对面部表情评定工作的基础上,制定出的一个尽最大可能区分面部运动的综合系统,它是迄今为止最为详尽、最为精细的面部运动测量技术,它能够测量和记录所有可观察到的面部行为。
除了面部行为编码系统外,艾克曼最初制定的面部情感计算技术(FAST)是一个关于与具体情绪对应的面部运动的照片参照。六型面孔可以从面部的三个部分(额—眉区、眼—睑区和鼻颊—口唇区)予以区分,观察者将表情与面部情感计算技术图册上的样式进行比较,得到相应的分数,最后的总分即表明表情所代表的情绪的种类。
从一定程度上来说,艾克曼的面部情感计算技术是一种较为特殊的表情测量方法。我们知道,维度越多并且单位越小,与之对应的表情就越多;相反,计算总分让测量回到了一个单一的维度上。什么是单一的维度呢?
当我们计算总分的时候,就和许多专业量表或者是生活中的心理小测试类似,我们回答完所有的题目,会计算出一个总分,得出的总分会对应出一个结果。但是当总分相同的时候,每一个问题的答案一定是完全相同的吗?答案是否定的。
以面部情感计算技术为例,两个人的总分相同,但是额—眉区、眼—睑区和鼻颊—口唇区三个部分的得分很有可能是不同的。面部表情是由肌肉运动组成的,如果有一块肌肉运动不同,就组成了不同的表情。在日常生活中,我们有时候会去做一些来自网络的心理学小测验,但很多测验的结果却不是很准确,这就是因为计算总分让测量回到了单一的维度上,得分之间没有足够的区分度。专业的心理学量表就会考虑到信度(即测验的稳定程度)与效度(即有效性)问题,测验结果一般较准确。艾克曼通过分数计算上的改进,让总分具有足够的区分度(不同分数代表不同的表情),在这一点上,他无疑是成功的。
截至今日,越多越多的人正在跨越情绪研究的瓶颈,表情识别的方法也是层出不穷,我们把它们可以大致分为如下几类:
基于模型的方法
基于几何特征提取的方法
基于频率域特征提取的方法
基于统计特征提取的方法
基于运动和形变特征提取的方法
在英国还有更为先进的表情测量技术。专家表示,他们已经开发出一种复杂的新型摄像系统,能够对人们在说话时的面部表情进行扫描,从而判断这个人是否在说谎。不过研究人员也坦承,系统的辨别正确率不可能达到100%,这是因为设备测的是情绪而非撒谎行为本身。
如今,人类面部表情的研究已经有半个世纪的历史,一些发达国家如美国、英国、日本等和一些发展中国家都已经设立了专门的研究小组进行这方面的研究。历史的脚步正在大步向前,面部表情的相关研究虽成果颇丰,但依旧处于研究阶段,更多测量方法、更加现代化是这个领域的发展前景,科学家们在不断地探索,不断地尝试;与之相应的是更加广阔的应用前景,以及更加现代化的生活。