书城计算机网络体感交互技术
17928800000007

第7章 情感计算方法与模型(2)

Risberg等人探讨了搜集数据的实验方法。然而,最好的获得真实数据的方法可能是在日常生活情景中来捕获人们表达的感情。可穿戴计算机和普适计算提供新的交互应用的可能。Picard和Healey等人已经建立了情感可穿戴计算机来感知穿戴者日常的感觉。部分可穿戴计算机可以控制使用者的设备,比如基于唤醒反应的保存视频的照相机。并且可穿戴的“DJ”不仅能根据人的情绪特征选择喜欢的音乐,并且设计制作了一个穿戴系统来测量专业指挥的情绪特征。

目前对人工情感的研究主要有两个相关领域,情感计算和感性工学。人工情感的研究内容、支撑学科技术和应用领域如所示。

情感计算的研究内容包括所有的计算工具,比如支持软件和更为自然方式的交互设备以及许多其他形式的计算装置,包括可穿戴计算机等,任何软件、硬件的系统,都可以被赋予情感能力。

现在大部分计算机本身都不具有情感识别的能力,今后的情感计算机可能要研究以下的课题:识别情感的计算机、表达情感的计算机、有情感的计算机等。

对于情感研究的早期理论认为情感是分离的状态,后来把情感看做是规范行为的处理和评估的功能,并不是启动或者断开的单一状态。如表3.8给出了情感理论研究的代表人物和观点,Castelfranchi认为情感是主观的体验状态,并且取决于人的背景,当前的经历,精神和身体状态,和其他个人因素,所以情感的反应完全不同。对球赛时快乐的表达与在商务会议期间的快乐表达完全不同。因此,以生理信号或者其他的身体等额外的信号来识别情感状态是特别困难的任务,特别是在移动场合下,不断改变的身体状况和社会情境。

因此,情感作为人们交流的一个部分,更容易被看做是人性的、丰富的、神秘的、复杂的、难以定义的体验。Davies认为这个体验不仅是人脑的理性和有意识的推理的唯一的一部分,相反,身体和思想在本质上是紧密联系密不可分的。

Ekman认为感情并不仅仅是一个精神的状态,而且还是一个生理的状态。情感能够通过人的想象和意念所引发出来,但是也能够通过身体的运动创造出来。比如,当本来并没有感到高兴,但是装作非常高兴的身体运动时,也可以体验到在心里渐渐增加和酝酿的一种高兴和温暖的感情。然而,另一方面,当一个人蹦蹦跳跳并且面带微笑的时候也并不一定意味着悲伤。

人类情感智能的规律可直接适用于计算机的人机交互,然而,人与计算机之间情感智能的最主要不同点是在于为达到情感共鸣所需要的情感体验。人类相互之间有比较相似的情感体验,因为人类彼此之间有着相似的头脑和躯体。人类的情感合成模拟是以人类为模板,用计算机的人工智能的算法进行情感合成的,并且在无限趋近于这个目标。

3.2情感计算的方法

3.2.1 情感的分类

目前,对于基本情感已经讨论了很多的定义方式,PaulEkman给出的定义最详细,他将基本情感,和对应有明显的通用表情特征的情感,以及其他8种属性联系起来。用这个标准,提出了6种基本情感:恐惧、愤怒、悲伤、高兴、厌恶和惊奇。有些人讨论基本情感是否存在,这也是情感理论中长期争论的话题。虽然目前还没有统一的情感分类标准,但是一般来说,人类的情感特征可以分为常见的几类。比如:激动、生气、惊恐、惊喜、骄傲、满意、悲伤和爱等,如图3.9所示基本情感的八种分类图。一些情感普遍的表现出来,某种程度上与特定的文化环境有关。计算机识别情感时,情感的普遍性并不是主要的。

情感被当成是人性的、丰富的、神秘的、复杂的、难以定义的体验。这个体验是人脑的理性和感性的一部分,并且很容易被自身的身体运动或外界环境所影响。

人的情感功能系统对情感需求的原始意志使人产生的对情感的主观需求欲望,称为人的情感欲望。人的情感功能系统,在功能上分为三种表现形态,如图3.10所示,人的情感功能系统示例。一是个体间的“情感亲和”愿望;二是个体间的“情感交流”愿望;三是自我的“情感表现”愿望。人在情感亲和、情感表现和情感交流的行为中,能够获得情感器官特有的快乐感觉。人的情感亲和愿望,表现为伙伴和爱抚欲望。人的情感表现愿望,表现为悲欢欲望。人的情感交流愿望,表现为倾诉欲望。

在情感的能力方面,情感能力包括具有更灵活理性的决策、确定突出特征的能力、推理能力,以及和其他多种多样的,与创造力、学习、注意力、记忆力和调节过程有意的相互作用。在赋予计算机这些类似人类的这些能力中,以及改善计算机与人类的交互方式中,计算机情感将起着一定的作用。

3.2.2情感计算的流程

从人类情感的交流过程角度来说,情感识别的流程可以分为四步,如图3.11所示。流程总结如下:

1.输入。接收各种输入信号,例如:语音、手势、身体姿势、呼吸、皮肤电反应、温度、心电图、血压、脉搏、肌电图。

2.信号的识别和分析。对这些信号进行特征提取和分类。例如:分析运动传感器的加速度数据的特点,把欢快和沉重的感觉分开。这时候就需要推理,基于有关情感产生和表达的知识来预测隐含的情感。从根本上讲,这种能力要求环境、情境、个人目标和偏爱、情感规则和其他情感产生及情感表达有关的知识进行构思和推理。

3.情感信息的学习和理解。这是非常重要的,当计算机“认识”某个人的时候,它知道了以上的因素中哪些对这个人最重要,从而能更快更好地识别他或她的情感状态和情感特征。

4.情感表达输出。计算机指出所识别的表情及可能存在的情感的名称,或是对它进行描述。

以上这些流程含有大量的技术上的需求,例如,“接收输入的信号”需要精确的技术来收集生理的、声音的和视觉的信号,并研究决定哪些信号对当前任务最重要。在模式识别中,需要识别信号的信息特征——结构的、非线性的等等,和对这些特征的重要性有影响的条件变量。

通过传感器直接或者间接与人接触,获得情感信息,通过建模对情感信息进行分析和识别,对分析结果进行推理达到感性的理解,将理解结果通过合理的方式表达出去也就完成了情感交互的全过程。

3.2.3情感信号的获取

当一台计算机需要表现情感及表达时,可以采用方便的抽象层次,从低层次的信号表示,像心率的波形或者肌肉运动序列到高层次的解释,像“他看起来很快乐”这样的表达目的,在这个过程中,计算机没必要使用和人类一样的机制,可以用完全不同的方式进行识别情感。

情感识别处理的基础模块的一种方式是根据它们的不同应用:输入和内部信号、识别信号的模式、合成情感、产生状态、分析情境、影响认知与感知等。在所有的这些应用中,表示的结果是相互交叠的,每种应用都可以用多种不同的方法。情感信号可以很好地表示内在的情感和情绪,以及在人类情感识别中收集的生理数据。在情感信号处理时,比较合理的方法是将线性系统理论和数字信号处理方法应用到情感信号与系统的建模上。

各种信号模式的组合可提供更可靠的识别,从传感器,以及视频提取的特征模式可以识别出情感状态。这种中层次的模式表示,可被用于判定存在着什么样的情感。然而你无法直接观测到潜在的情感状态。所有可被观测到的,都是以身体和行为方式表现出来的复杂模式。

表征着情感、情绪和生理变化,如神经传导素、神经系统活动等的水平,这些都可以被测量、进行量化和建立基于身体的模型。但是对一种情感何时开始,何时结束,或者有多强烈,现在还没有可靠的测量方法。尽管如此,还是能提出一种可以对情感和情绪进行计算的方法,从而至少能在性质上描述它们的行为特征。

大脑中有许多的通道,特别是边缘系统结构和大脑皮层之间的通道,都可以用于传递反馈。也有来自身体的情感表达,这些动作可以加强这种情感。或者用户需要显示出某种情感,可以相应地调整身体姿态和运动状态,也就可以实现这种情感状态。而且现有的研究表明,人类的情绪也会影响想法,坏情绪趋向于对应到负面的想法。反馈可以是生理上的或认知上的,可以增强或减弱情感状态的强度。

将可计算的信号表示应用于情绪和情感,对理论学家提出了很多特定的问题。这种情感信号表示法目前描述了情感的许多特性,但是并不是很完整的反映了人类所有的情感特性,以后还会有其他未被发现的特性。比如说,理论学家不清楚过分渲染的思想或其他分散注意力的事物能如何影响情感的强度;但如果加上噪声信号很重要,这种信号表示很容易加上附加噪声的信号。

用信号来描述情感的低层次行为,为情绪和情感提供了灵活的表示方法,能处理计入了性情和人格影响的身体和认知的输入。因此,这不仅试图为情感的低层次的行为建模的理论家们提供了一种工具,还为计算机对于情感信号的建模提供了一种可以运用的表示方法,特别是它可以作为情感产生及调节的子系统的一部分。

情感信号的表示,描述了情感系统行为的如下特征51-54:

1.响应消失:情感反应有相对短的持续时间,除非又被激活,否则将降到感觉不到的程度。重复冲击:情感的快速重复激活,造成其感觉到的情感强度增加。

2.性情和人格的影响:一个人的性情和人格影响情感的激活和反应。

3.非线性:人类的情感系统是非线性的,但是在某种输入、输出范围内,可以用一个线性系统来近似。

4.时不变性:人类的情感系统在一定的持续期内可建模为与时间无关的。在持续期很短时会出现习惯性的影响。但是在持续期时,需要考虑一些因素,如人的24小时生理节奏和荷尔蒙周期等。

5.激活:不是所有的输入都能激活一种情感,情感激活需要有足够的输入。这个强度不是固定的值,而是决定于情绪、性情和认知上的期望等因素。

6.饱和性:无论如何频繁地激活一种情感,在一定时间内,系统将达到饱和,这是人的反应不在增强。类似的人的反应也不会降低到低于“零”。

7.认知和身体上的反馈:系统的输入,可由内心的认知或身体所激起。例如,情感的身体表达可以提供反馈,并作为系统的另一个输入,从而产生另一种情感反应。

8.背景情绪:所有输入都对背景情绪有影响,不管它们是否低于情感的激活水平。最新的输入对当前的情绪有最大的影响。

此外,还可以有其他不同的模型或表示方法能满足一组特性。并不存在一个对所有应用都是最好的模型;而且由于对人类的情感还没有足够的理解,所以无法判别哪一个综合模型适合于计算机的实现所需要的层次。基于一个应用所要求的细节层次,不同的模型可能会更适合。低层次的信号适合用来处理情感的强度问题,可能对理论学家在情感产生建模上有用,同时也能用计算机以产生和控制内部情感信号。但是这种低层次信号表示,不能很好地适用于阐述包括触发情感在内的高层次认知推理中。

迄今为止,所提到的信号都不表示已知物理量的测量值。但是有很多与情感反应相关的信号,在物理上是可测量的,特别是通过摄像机和传感器来测量,传感器可能以一种舒服的,非侵入性的方式置于人的身体上,并与身体保持良好的接触。从传感器上收集到的信号,低层次信号的模式可以和高层次的信息结合起来,用于情感表达的识别,以及描述某种情感状态。

因为人与计算机已有身体上的接触,通过传感器的接触提供了一种新形式的交流,而用户无需付出太多的努力。

本节讨论了情感系统的表示问题,特别是对于从低层次处理跨越到高层次处理的混合表示的需要。一个可以识别、表达和“有”情感的系统,必将运用涉及到从高层次到低层次,又从低层次到高层次的变换,从符号到信号及从信号到符号的处理。

3.3情感计算的模型

情感主要包括了两个方面:外在身体行为和内在情感认知。计算机系统要具有情感的功能,必须要包含以下几个组成部分:

1.带有情感的运动行为;

2.快速的第一性情;

3.认知产生的情感;

4.情感经历:包括认知意识、生理感觉和主观感觉;

5.身与心的相互作用。

在进行人机交互中,有这5种组成部分中的部分组合就足够了,就可以拥有类似人的情感功能。此外,因为计算机与人具有本质的区别,最关键的差别是身体肌能构造上的。所以,以上所述的这五种组成部分对人和计算机有各自不同的意义。

迄今为止,情感已经被用在人工智能中了。目前情感的实现主要是通过行为认知产生的,是以上几种成分中的第3种,即认知产生的情感。但是,它们大多数还仅仅用于电子游戏的开发。人工情感智能体具有一些简单的行为认知能力,通常能表达简单的情感,但是还不具备识别人类情感的能力,没有情感交互体验或者对用户表示情感共鸣的能力。现在的智能体具有的情感能力还不是为了帮助应对信息过载问题,也不是为了调整行动的优先度,不是为了更灵敏机智的应对,还缺乏创造性,不能做出智能的选择。目前的人工情感智能体仅仅可以实现娱乐的功能。

当人类开始构建能合成情感的系统时,需要考虑情感的智能逻辑,教计算机如何自觉的控制系统的情感,在什么时候表达怎样的情感,如何做出准确,智能地认知和推理情感,以上所述的情感能力都非常至关重要。假如一个情感的计算机系统不能以智能的方式来处理和表达情感,那么就根本说不上是富有合成情感的能力。但是,如果没有第一个有情感的系统,那么情感智能体是很难发展的。

在以上所述的五种情感组成部分中,首先赋予计算机的认知产生的情感。其次,介绍基于情感产生机制组合的模型。然后,我们将描述计算机情感和其他过程相互作用的方式,开始介绍情感在人类决策、学习和行为等方面的一些有益的影响。

以下分别阐述了如何实现情感的合成。

3.3.1基于认知机制的情感合成模型