运动传感器,就是基于惯性的运动传感器,是利用惯性原理,对用户的身体运动行为进行探测的设备。在人机交互中,常用的运动传感器有两种:加速度传感器和惯性测量单元,为了更好地将它们应用在基于运动的交互设计与开发中,接下来分别对两者的概念、工作原理、功能以及具体产品进行介绍:
(1)加速度传感器
加速度传感器可以自测瞬间的加速度,可以用于震动、坠落、旋转以及倾斜等运动的探测6。加速度传感器的量程一般是从数g到数千g,维度从单轴、双轴到三轴等。在单轴的加速度传感器中只有一个线性加速度传感器组件,所以只能够探测到单个方向(x轴)的运动加速度,输出的是一组一维的数据;在双轴加速度传感器中有两个相互垂直的传感组件,因此可以测得两个方向(x轴和y轴)的加速度,输出二维的向量;然而,三轴加速度传感器包含了三个相互垂直的传感器组件,能够获取x、y、z三个轴向的加速度向量,因此,具有三个自由度(3-DoF)。
以前,加速度传感器因体积大、精度低、价格昂贵,很难用于市场化。近年来,MEMS技术的发展使越来越多的智能手机、手持游戏手柄等集成了加速度传感器,为体感计算提供了硬件的条件。随着加速度传感器的产品化,在人机交互领域中可以产生很多基于加速度传感器的体感计算地研究、开发和应用。
(2)惯性测量单元
除了加速度传感器,惯性测量单元也可以应用在基于运动的体感交互系统中。下面将会对惯性测量单元的基本概念、工作原理、功能以及相关的器件做简要的介绍。
在人机交互中,惯性测量单元可以作为一种很好的运动数据的获取方式,使用户能够以身体运动与计算机进行交互。消费电子产品自带的惯性测量单元是由于其测量运动精确的特点,也正在逐渐地引起运动捕获设备厂家的重视。
荷兰的Xsens公司重点是研发惯性测量单元,它研发的MVN运动捕获识别采用了17个惯性测量单元对人的全身运动进行精准适时地捕捉。由于MVN运动捕获识别设备能够不受到环境场地的限制,可以在任何一种环境中进行人体动作地捕获,因此也成了未来动作捕获的一个重要的趋势产品。
惯性测量单元是一种比加速度更复杂的运动传感器。早期的惯性测量单元主要出现在惯性导航系统(inertialnavigationsystem)中,广泛运用于交谈导航以及导航制导。近年来,体积小、能耗低、价格便宜的MEMS惯性测量单元已经开始大量进入消费电子产品。如图5.10中所示的意法制造的半导体的首款iNEMO模块(STEVAL-MKI062V1)106,集成六个不同的传感器和一个32位微控制器。在公司网站上,意法半导体为客户提供4.5x5cm的iNEMO模块评估板,以及固件库、一个PC图形用户界面和一套多用途应用软件。最新的iNEMO产品(v2)在微型化道路上向前迈进了一大步,运行一个复杂的传感器融合算法AHRS(姿态方向参考系统),提供动静态方向和惯性测量功能。iNEMOv2集成五个意法半导体传感器:双轴滚转俯仰陀螺仪、单轴偏航陀螺仪、6轴地磁测量模块、压力传感器和温度传感器。
惯性测量单元与加速度传感器比较,体积略大,价格也更贵,但是惯性测量单元能够输出更丰富的运动信息。前者适合只需要探测简单运动或倾斜角度的场合,例如在手机游戏、数码相机系统中等,一般只有三个自由度;然而后者更适合应用在需要精确感知人体运动的任务,比如精准控制或定位、体育类的应用等,拥有六个自由度6。
在惯性测量单元中,包含了一组三轴加速度传感器和三轴陀螺,有的惯性测量单元模块还会集成一些其他的传感器提供补偿数据,比如地磁传感器、温度计等。大多数的传统惯性测量单元是平台式的,就是说加速度传感器和陀螺仪被安装在一个朝向不变的平台上,随着平台一起运动;目前,用在消费电子产品中的MEMS惯性测量单元是捷联式的,即加速度传感器与陀螺仪是直接被固定在了目标物体上,这种类型的惯性测量单元不仅仅是体积小、能耗低,也具有非常高的可靠性。
惯性测量单元中的MEMS加速度传感器与传统陀螺仪的工作原理的主要差异是:惯性测量单元中的MEMS加速度传感器利用旋转物体在有径向运动时所受到的切向力原理工作,最终获得的是角速度数据;而后者基于角动量守恒原理,是一个不停转动的物体,而且转轴指向不随着支架的旋转而发生变化,最终测得的是角度数据。惯性测量单元中的MEMS加速度传感器输出的角速度经过一次积分就可以得到角度数据,是与线性加速度传感器类似的。惯性测量单元中的陀螺仪可以测量仰俯、偏转、滚动三个轴向的角度。由于加速度传感器也是三轴的,因此由两者合而为一的惯性测量单元有六个自由度。
惯性测量单元中包含加速度传感器,因此具有加速度传感器的所有功能,比如倾斜度探测、振动探测等。由于内置了陀螺仪,惯性测量单元能够比加速度传感器得到更精确的信息,比如朝向探测和绝对运动和定位探测。
在工作原理方面,运动跟踪技术包括了光学、电磁、惯性、声波、无线电波、机械等几种主要的类型。然而,运动传感器在体积、自包含性、便捷性以及价格等方面都有很强的优势。基于运动传感器的方法相对于基于视觉的方法而言,更适合应用在人机交互中,感知人体运动,但也存在一些缺点,如运动的识别率还不高的问题,这在未来将有待于继续提高。
在人机交互中常用的运动传感器主要有两种,第一种是基于加速度传感器,能够探测物体运动时的瞬间加速度,另一种是惯性测量单元,除了得到加速度以外还能得到角速度,从而计算出朝向、绝对位置等运动信息。
5.2.3运动数据的实时获取
运动传感的关键技术之一是实时获取运动传感器数据,数据获取包括了数据的采集和数据的处理两个部分,下面将分别做出介绍:
(1)运动传感器数据的采集:
身体的运动信号在基于运动的人机交互系统中,通常是通过运动传感器模块采集数据得到。运动传感器模块是由运动传感器和一些附件组成,除了能够实时采集运动数据外,还可以对数据进行预处理和传输等。
由于各类软硬件平台和交互应用需求的不同,运动传感器模块与系统核心的通讯方式是不一样的。在手机和数码相机等移动设备中的运动传感器通常与系统合为一体,是内置的,因此移动设备中的运动数据可以由设备本身进行采集和处理。在家用游戏机、桌面计算机系统等使用环境相对固定的交互应用中,运动传感器模块通常以外置的形式存在,通过有线或者无线的方式与主机进行通讯,采集到的运动数据需要传送至主机,然后再进行处理。为了提供良好的用户体验,外置运动传感器模块通常采用无线的方式与主机通讯。
本书实验部分的运动传感器是采用Wiiremote,作为水墨画临摹的交互试验的动作采集设备,如图5.11所示,数据采集过程由三个主要步骤组成:
1.获取运动数据。通过内置的加速度传感器得到运动信息后发送到微型控制器。
2.数据预处理和传输。微控制器通过简单的数据预处理后,经蓝牙通讯模块送出。
3.接收和解析数据。计算机通过蓝牙通讯模块,接收、解析得到的运动数据。
Wiiremote作为成熟的产品,内部的数据处理模块已经固化,只要研究加速度数据的接收和使用即可,其他的运动传感器也与其相似。
信号是携带信息或消息的任何可检测到的变化。在社交中,姿势、声音以及面部表情,都是可被人类自然感官直接检测到的信号,而血压、荷尔蒙水平以及神经传导素水平,则要求用特殊的测量设备才能检测出来。很多与情感反映相关的信号,可以在物理上测量得出的,特别是通过摄像机、麦克风和传感器来测量。
现在实现体感信号采集技术的具体方式很多,如基于视觉的、自然界语言的、笔式的、脑机的等等,它们是信号采集的基础。因此,将其划分为以下类别:
基于视觉的信号采集;
基于自然界语言的信号采集;
基于触觉的信号采集;
基于笔式界面的信号采集;
基于脑机界面的信号采集;
基于运动感知的信号采集;
在实际应用中,通常根据情感计算应用的需求来实现不同的信号采集方法。然而,当情感信号采集技术发展到一定阶段时,对于用户而言应该是完全以自由自然的方式来交互的。在未来,也可以实现多通道的情感信号采集,以提高信号采集的效率。
(1)基于视觉的信号采集
视觉是人们相互沟通过程中最重要的通道,因为视觉以最直观的方式看到彼此间的情感信息。人们喜欢面对面的交谈聊天看到的信息,这比听到或者读到的要多得多。基于视觉的信号采集设备可以使用摄像头,3G手机等。而基于视觉的信号采集通常需要处理几种基本问题,如下表5.2所示。
一般说来,基于视觉的信号采集有相同的处理步骤,然而它们的区别在于,有的是采用几何体去拟合人体的不同部分,比如在运动以及手势识别中用圆柱形来拟合头部、手指和躯干等,而有的方法则采用基于外表的特征提取法。
(2)基于运动感知的信号采集
除了计算机视觉外,运动传感器也是对人体运动进行感知的一种重要的媒介。本书讨论的基于运动感知的体感计算就是通过使用运动传感器对人体的体感信号进行采集、分析和识别的。
常用的运动传感器分为两种类型:加速度传感器和惯性测量单元,加速度传感器能得到加速度数据或不精确的运动信息,而惯性测量单元能够得到比较准确的运动信息,甚至近似的绝对位置。
目前的传感器在很多电子消费产品上都可以找到,比如智能手机,任天堂游戏机手柄和苹果笔记本电脑等。如图5.12所示的任天堂游戏手柄107。
如图5.13所示,AM-Fishing108是一个使用两轴加速度传感器的钓鱼游戏。这个游戏的核心功能能够连续地采集、分析玩家有意或者无意的身体运动信息,采用信号处理结合状态机的方法识别用户身体的运动,经过训练后的身体运动识别率能够达到90%以上。动传感器可以让用户以非侵入的方式进行自然和谐的人机交互,并且与身体保持舒适的接触。因为与传感器接触提供一种新形式的交流,用户无需太多努力。
(3)脑机交互信息的采集
脑机交互是在上世纪70年代开始的一门包括了信息技术、认知科学、神经科学和生物技术等领域交叉的多学科技术。这种完全智能的人机交互是不动手,只用自己的意念去想一下,计算机就能够帮助自己实现了。
脑机交互技术是未来人机交互的终极目标,可以使得计算机直接获取和解读在人类头脑中的想法,而不依赖于交互命令和显示信号。现在的脑机界面是通过采集在用户头皮上的电极来获取脑电波信号,然后去操纵相应功能。早期的脑机交互技术的研发目的是帮助残疾人获得控制和交流能力,并且能够实现个性化的智能人机交互。最近几年,这种技术已经在研究应用于人的日常生活。
脑机交互技术的控制原理是:以假肢为例,如图5.14所示脑机界面的控制闭合环路109,首先需要使用者有意识地产生控制意图,置入电脑的微电极阵列采集到相应的信号后传送到计算机,然后应用数学方法将其转化为三维的运动轨迹,最后再控制假肢根据预期的轨迹进行运动。
随着脑机交互技术的不断研发,目前已经在市场上可以看到部分脑机交互的产品,并且开始被市场化。比如ART、Shimadzu与本田汽车制造企业合作开发的一个通过脑机的交互方式来控制机器人运动行为的系统,如图5.15所示用意念控制机器人运动,除了可以用来采集脑电波信号外,这套系统还能够用在近红外光谱仪分析脑部血液流动的状况,再将他们整合为控制命令。
5.3运动数据与体感信号的配准
本小节主要讨论关于体感信号的配准技术问题,特别是怎样通过运动传感器捕获人体运动数据,分析运动的语意,建立具有识别、表达、“有”语意的体感计算系统。
对于体感计算,当我们在日常生活中觉察某人的身体语言时,首先通过感官接收到低层次的体感运动信号,比如目标对象的手势、身体姿势的改变,嘴巴和眼睛周围的运动,当然还有一些他们在整个运动过程中的节奏速度等语境线索。除了这些可以观测到的身体运动信号,此外还有体温、血压、荷尔蒙水平以及神经传导素水平等,这些则需要用特殊的测量装置,这样潜在的身体信号测量目前还无法普及应用,所以不是本书讨论的范围。其次,各种体感信号的识别模式组合能够提供更为多元可靠的识别和对应,比如攥紧手和跺脚的运动姿势等结合起来,可能是一种下决心的姿势。体感信号多数是以人的内在情感通过身体运动行为的方式表现出来的,自觉或不自觉的复杂而非精确的交互模式。
识别体感信号的过程,通常涉及从运动信号到运动符号,从低层次的生理现象到高层次的抽象概念语义的转换。但是,因为在实践中又存在着对情境逻辑的推理能够修正并做出观察,信息的流动过程可被看做不仅仅是从低层次输入到高层次,也可以是从高层次到低层次的一个循环反复过程。
体感计算与情感表达存在一种内在的联系,所以可以借鉴情感信号的表达方式。在情感信号表达时,假设一个人想表达出怀有一定情绪,他先酝酿一下感情,然后开始合成低层次的信号,如改变身体的姿势、身体的运动、面部表情等来反应这样的情感状态。总之,试图表达某种情感的过程,通常涉及从符号到信号,从高层次概念到低层次的表达和行为调整之间的变换。
但是系统的体感信号计算主要是识别体感状态,而不是单向表达情感状态。计算机系统应该区分这种差别,因为计算机只能建立这些能力的一个子集,要进行体感识别首先要能够感知人的运动信号,人类具有感知能力因为人类的体感产生倾向性,观察着自己的行为与情感规律,既影响他的低层次感性过程,又影响他的高层次认知过程。人类趋向于以自己的体感认知相符合的感觉语义来对待对象的身体运动行为的刺激。