书城教材教辅医学信息学
48552800000002

第2章 医学信息学概论(1)

本章将论述有关医学信息学的概念、理论、实现方法以及面临的挑战。读完这章后,你应该知道下面这些问题的答案:

医学信息学的定义是什么?

医学信息学的历史沿革是什么?

医学信息学的功能实现对人和机器的要求是什么?

医学信息学的应用和挑战有哪些?

1.1医学信息学的概念

随着个人电脑和因特网的普及,人类对信息的采集、储存、分析、重组、显示、利用也越来越广泛,人类进入了崭新的信息化时代。同时随着生活水平的提高,人类对健康的追求也越来越高,从而促进了健康产业的迅速发展。新兴的信息科学与古老的医学以及其他现代科学的相互渗透、相互结合,诞生了一门新的学科——医学信息学。医学信息学作为一个新兴的交叉性学科,将迅速地影响和改变着传统医学,并促进健康信息技术(HealthIT)产业的蓬勃发展。

近十年数据表明,我国在健康上的投入比例逐年增长,我国医疗卫生体制改革促使基本医疗保障制度全面覆盖城乡居民,基本医疗卫生可及性和服务水平明显提高,加快对医学信息学的研究和应用就成为了历史的必然。

医学信息学(Medical Informatics)最早起源于20世纪50年代,曾用名包括生物医学计算(Biomedical Computing),计算生物学(Computational Biology),生物信息学(Bio‐Informatics)等。随着科技的发展,医学信息学的定义也随着人类对医学信息学的不断研究而拓展。现阶段对医学信息学的定义是:探讨生物学的、医学的或者更广义的健康数据的采集、存储、交互和展现的过程的科学;探讨如何利用信息科技来优化这些过程的科学;以及探讨如何利用这些数据实现信息和知识层次的各种应用的科学。

医学信息学有三个重要概念:数据,信息,知识。数据是原始符号,信息是经过分析的可用的数据,而知识是信息组成的一系列法则和公式。比如说,37是数据,37度是信息,37度体温是知识。

1.2医学信息学的构成和知识框架

根据Shortliffe教授生物医学信息学的知识框架,左侧表示医学信息学研究对象的层次,可以从分子水平逐级上升到基因水平、蛋白质水平、亚细胞水平、细胞水平、组织水平、器官水平、个体水平,再上升到公共卫生水平;右侧表示该学科相关或采用的科学技术,包括计算机科学、临床医学、基础生物医学科学、认知学、生物工程学、管理学、流行病学及生物统计学等,两者的交叉从而衍生出生物医学信息学的若干亚学科,比如生物信息学、影像信息学、临床信息学、公共卫生信息学等,统称为生物医学信息学。考虑我国的传统和惯例,本书书名仍沿用“医学信息学”。

美国医药信息学会还有一个更为详细的对医学信息学进行分类的本体论系统。这个系统有三大独立的轴,分别是方法、目标和应用领域。这样,医学信息学所有的基础研究或应用研究项目都可以从本体论角度分析为:应用某一个(或几个)“方法”,针对某一个“目标”在某一个“应用领域”进行研究或应用。下面就是这个分类系统。

第Ⅰ轴:方法

Ⅰ.A.信息与知识的表达

Ⅰ.A.1.受控术语、语汇、系统分类、知识库

Ⅰ.A.2.数据模型与知识表示

Ⅰ.A.3.知识获取与知识管理

Ⅰ.A.4.过程建模与建立假设

Ⅰ.B.信息与知识处理

Ⅰ.B.1.信息的存储与检索(文字和图像)

Ⅰ.B.2.自然语言处理,信息提取、文字生成

Ⅰ.B.3.复杂系统的模似(各层次:从分子水平、工作小组到整个机构)

Ⅰ.B.4.人机交互,人本计算,可用工程

Ⅰ.B.5.不确定因素推理,时间推理,决策理论

Ⅰ.B.6.大型数据组的统计分析

Ⅰ.B.7.自动化学习、发现、数据挖掘方法

Ⅰ.B.8.软件工程:组织结构、代理、分布式系统

Ⅰ.B.9.密码系统、数据库安全、匿名技术

Ⅰ.B.10.图像表示、处理与分析

Ⅰ.B.11.高级算法,语言,计算方法

Ⅰ.B.12.数据与知识的可视化

Ⅰ.B.13.高性能与大规模计算

Ⅰ.B.14.高性能网络与高级电信(手持设备)

Ⅰ.B.15.机器人(包括感觉道)

Ⅰ.B.16.虚拟现实

Ⅰ.B.17.生物传感器

Ⅰ.B.18.语言识别

Ⅰ.B.19.智能辅导与个性化信息表示

Ⅰ.B.20.异源信息的整合

Ⅰ.B.21.协作技术

Ⅰ.C.经验性研究

Ⅰ.C.1.认识(包括各种实验,主要指口语分析/可用性)

Ⅰ.C.2.经典实验与准实验(实验室与现场研究)

Ⅰ.C.3.质量/人种学现场研究

Ⅰ.C.4.法律、政策、历史、伦理研究

Ⅰ.C.5.调查与需求分析

Ⅰ.C.6.社会/机构研究

第Ⅱ轴:目标

Ⅱ.1.建立卫生信息基础设施:电子健康记录数据标准和企业数据之间的交换Ⅱ.2.确立信息系统的安全性和个人隐私

Ⅱ.3.设计在生物医学企业中可以普遍使用的可用(有响应的)信息源和系统

Ⅱ.4.促进卫生相关企业的整合

Ⅱ.5.改进卫生保健的效果

Ⅱ.6.提高患者安全,降低医疗事故

Ⅱ.7.探查疾病爆发与生物战争

Ⅱ.8.用实例证明给IT 业投资的回报

Ⅱ.9.提供生物医学文献及其他卫生信息的易于操作的获取方法

Ⅱ.10.保证医务工作者的竞争力

Ⅱ.11.提高卫生相关机构的效率

Ⅱ.12.建立更完善的有关个人健康与公众健康的信息系统

Ⅱ.13.鉴别基因组结构与功能

Ⅱ.14.鉴别蛋白质结构与功能

Ⅱ.15.建立基因型与表型的关系

Ⅱ.16.监视人群健康状况

Ⅱ.17.提取并链接不同种类的原始信息源的生物医学数据与知识

Ⅱ.18.加强基础生物研究

Ⅱ.19.加强临床试验与临床研究

Ⅱ.20.建设数字化图书馆

Ⅱ.21.建立个人健康记录

Ⅱ.22.支持诊断和个体行医者的决策

Ⅱ.23.支持远程诊断

Ⅱ.24.表现与模型化生物结构

Ⅱ.25.实验室信息管理

Ⅱ.26.建立从分子变化到临床表征的疾病模型

Ⅱ.27.以整合的数据为基准制订卫生政策

Ⅱ.28.建设专项EHR 组件(处方、审阅结果、决策支持)

第Ⅲ轴:应用领域

Ⅲ.1.医疗保健(强调个人保健)

Ⅲ.2.公共卫生(强调人群健康)

Ⅲ.3.生物医学研究(基础研究和临床研究)

Ⅲ.4.卫生工作者及消费者的教育

Ⅲ.5.卫生机构管理/行政管理

Ⅲ.6.卫生图书馆与图书馆员

从这个广阔而精深的分类系统中,我们能体会到医学信息学正在成为科学中的一门独立的学科,它有自己明确的研究应用目标和对象,有自己特殊的研究方法,有自己独特的应用领域。医学信息学的典型基础研究包括编程以外的方法学上的创新,并把这些创新应用于医学信息的各个领域。另外,医学信息学为计算机专家和生物医学研究人员及其他工作人员提供合作机会与交流平台。总之,医学信息学是一门新兴的、快速发展的综合性、边缘性、交叉性学科。它的发展前途将是巨大的。

1.3医学信息学的研究范畴

医学信息学的研究范畴可以概括为四个结构层次:

(1)原始健康数据,比如影像、微阵列、生理数据等。

(2)从原始健康数据中分析出来的有组织的综合数据库,比如整合起来的基因分类(genotype)和其外在表现形态(phenotype)。

(3)从数据库中抽象出来的知识库,比如词表、术语学、本体库、语义网等。

(4)从知识库中验证出来的可直接应用的知识结晶和理论,比如协议,临床实用手册,概论等。

每个结构层次中,以及每两个结构层次之间都对应着一些医学信息学研究的课题。

在原始健康数据层次,最主要的课题是数据采集和集成。这包括实时的生理信号分析、语音识别、传感器采集、条形码扫描等等。

从原始健康数据层次到综合数据库层次,最主要的课题是数据整合,包括数据仓库、数据模型、语义网络、本体论等等。

在综合数据库层次,最主要的课题是数据处理,包括数据储存、数据提取、数据可视化、高级算法、计算模型、图像处理等等。

从综合数据库层次到知识库层次,最主要的课题是推理,包括自然语言处理、信息抽取、数据挖掘、文本产生、统计处理、自动学习等等。

在知识库层次,最主要的课题是知识管理,包括知识表达和知识模型等等。

从知识库层次到知识结晶和理论层次,最主要的课题是知识获取,包括机器学习、文本解释、知识工程、决策理论等等。

在知识结晶和理论层次,最主要的课题是知识应用,包括诊断、治疗、预防等等。

上文提及的这些课题,需要人类和机器的交互合作来完成。

人类在这些研究范畴中的分工可以概括为如图左侧所示:从感官的感觉和知觉,形成感官记忆;对感官记忆的选择性注意,从而形成工作记忆;对工作记忆的回想和揣摩、背诵和回忆,从而形成长期的记忆;对长期记忆的整理、学习从而形成了专业知识;而专业知识将指导最终的分析、决策和执行。

右侧为机器的分工。机器的分工则包括从生物的、医学的或广义的健康的现象中采集数据,把数据集成到数据库,从数据库中对数据优化和推理从而获得知识库,从知识库中对知识进一步获取和管理,从而获得专门的生物医学知识,然后衍生出相应的知识应用。

上述的分工衍生出了机器的任务,比如建立电子病历的标准和数据交互法则,信息安全和隐私权,优化信息系统,远程治疗,电子处方,个体化电子病历等;以及与之对应的人类的任务,比如理解和使用电子病历,总结知识和教学,学习决策过程和个人信息管理等。

如果机器实现了这些任务,我们将能够提高医疗的质量,减少医疗事故,实现流行病爆发的预警,流程优化,通过医疗数据的循证影响卫生政策等。

如果人类实现了这些任务,我们将高效工作,提高产出,提高团队的合作,获得更人性化的界面和数据支持,减少人为导致的错误(比如疲劳下的决策差错),更好地总结知识。

为了实现这样的结果,当前医学信息学的研究焦点包括:在机器研究方向上,研究人员致力于研究如何利用计算机支持临床试验,支持基因结构和功能的识别,支持蛋白功能的识别,把基因的内在序列和外在表达结合起来,通过建模来再现生物结构,把疾病的临床症状和其分子级别的模型联系起来等;而在人的研究方向上,研究人员则致力于研究知识建模,模式识别和优化可视化的方法学等。

1.4医学信息学的历史沿革

1.4.1世界医学信息学的发展阶段

基于数据、信息、知识这三个概念,在美国医学信息学史一书中,Bruce I.Blum教授把20世纪90年代之前的世界医学信息学的发展分为如下几个阶段。

在1950-1975年,医学信息学的发展主要聚焦在以数据为中心的操作上,如信号分析、影像处理以及以信息为中心的操作上。比如病人信息管理以及早期的以知识为中心的操作的探讨,比如人工智能在医学决策中的应用。1960年代末期的卓着贡献包括Weed 教授提出了病历的新书写形式和管理流程,从而提出了以问题为中心的电子信息系统(Problem‐Oriented Medical Information System,PROMIS),并在个人工作站上被采用。霍普金斯大学的第一台医用电脑在1976年被正式安装,花费25万美元,其功能还不如当今的一台PDA。

1976年也是医学信息学发展的分水岭,美国医药信息学会(AMIA)的早期原型(Symposium For Computer Applications in Medical Care)开始建立,虽然这并不是全世界最早的医学信息学会,但是很快成为潮流的主导。AMIA提供了一个国际性的平台,实现信息共享,对理论和实践的探讨,从而为后继的研究提供了基础。同年,Shortliffe教授的MYCIN系统正式被医学信息学书刊记载,从而颠覆了人类对于知识自动化运用的构想,把人工智能的医学专家系统引入了主流研究。更让人兴奋的是,1979年的诺贝尔奖被颁给了Allan教授和Godfrey教授,奖励他们发明了X 射线断层扫描成像,也就是CT机。Allan 教授为CT 机提供了数学模型,Godfrey教授提供了工程学上的实现。CT机的发明大大推进了影像诊断学的研究发展。

1.4.2我国医学信息学发展回顾

回顾我国医学信息学的发展历程,自20世纪70年代起,伴随着计算机科学的高速发展,可以分为三个阶段:①单机孤立运用阶段,如药品和临床实验数据的管理;②局域网内的部门级应用阶段,比如实验室信息系统(LIS),电子病历(EMR),医学影像存储和传输系统(PACS),护理信息系统,以及与之相应的系统集成医院信息系统(HIS);③基于广域网的应用阶段,比如网站门户(Web Portal)提供的网络服务,移动终端的即时消息服务,远程医疗,社区卫生信息服务等。