书城教材教辅医学信息学
48552800000012

第12章 医学信息学中的计算机技术(3)

该系统开发的原则是尊重隐私,信息准确及时,容易使用,高效存取,对发生率数据的计算和表示标准化。

该数据库对100种死亡原因按年龄、性别、种族、年份、地理进行分解。如果用户提出有另外的死亡原因要加到数据库中,可根据新的国际疾病分类法用SAS 程序脱机运行。

2)对心电图数据的获取和分析

心电图是临床使用最频繁的常规检查方法之一,但是心电图数据的获取、存储和分析使用的是不同的格式和软件平台。数据只有在开放式情况下共享和解释,其益处才能充分利用。这就需要研究跨平台的解决方案,以支持生物医学培训、决策和远程医学应用。

英国的Haiying Wang 等人研究了一种用于心电图数据获取和分析的标记语言(ecgML),取得了很好的结果。基于XML技术的优越性,ecgML 有能力提供一种独立于系统、应用和格式的解决方案,拟订一种开放透明的表示、交换和挖掘心电图数据的方法。

因此,ecgML 不仅可用于在心电图数据中进行知识发现的基本成分构成,同时它还遵循将内容和表示信息分开的原则。

ecgML 能够把心电图数据无缝整合到电子病历和临床实践指南中。该方案能够支持不同的心电图获取和可视化设备之间的数据交换,还可能使用不同软件平台和应用进行数据挖掘,它通常能帮助实施自动决策支持模型,如基于案例的推理。

3)计算机辅助诊断

计算机辅助诊断(computed aided diagnosis,CAD)作为一种帮助放射科医生进行图像诊断的基本工具,现在已转变为一种更为复杂的应用系统。图像处理功能和模式识别程序通常需有一套数据存储在一个数据库中,作为一套标准或数据仓库。在诊断过程中由医生进行的操作(提醒注意)要有一个友好的用户界面。要将图像处理、数据库结构和图形用户界面整合在一起,就要设计多层CAD 系统。

波兰的Ewa Pietka 等为对骨龄评估方法进行评价,设计构建了计算机辅助诊断系统信息学基础设施。该系统设计为三层:第一层为数据库管理系统,第二层为应用层,最后一层为表示层。数据库管理系统负责数据存档和分配。应用层包括管理应用服务器,www 服务器和一个CAD 工作站共三个部分。应用层的任务包括数据库访问,由图形用户界面授予的数据表示,以及由设计的动态网页所允许的对整个CAD 系统的远程访问。

表示层通过一个网页取景器允许对系统进行方便的远程访问。在用户端,网页取景器则作为访问整个系统的一个界面。

计算机辅助诊断在检测和诊断乳腺癌方面发挥了不可替代的作用。乳腺X线摄影是早期检测乳腺癌的最佳筛查方法。乳腺放射线获取技术能使乳腺癌早期体征在乳房X线照片上更明显。但乳腺X线检查的精确度取决于乳腺X线图像的质量和放射科医生对这些图像的解释能力。使用对某一图像的计算机化的分析输出,可以帮助放射科医生检测和诊断乳腺癌,并且可能改进对乳腺癌图像的解释和后续的卫生保健。

计算机医学诊断应用从三个不同方面改进了分析:首先,通过使用定量特征而不是直观插入提高了客观性。这些特征是自动而不是手工提取的,这样一方面提高了分析的速度,同时使测量不受外部条件(比如光线)、测量的不精确和错误(比如刻度错误)等的影响。第二,规定了一种透明算法,使决策过程在特征分析中标准化。这就再次提高了客观性并解决了可复制性问题。最后,这样可使一套图像和描述图像的特征能够被采集并被认可为一种医学标准。

4)生物芯片技术的应用

简单地说,生物芯片就是在一块指甲大小的玻片、硅片、尼龙膜等材料上放上生物样品,然后由一种仪器收集信号,用计算机分析数据结果。目前制备芯片的固相材料有玻片、硅片、金属片、尼龙膜等。

生物芯片是20世纪80年代末在生命科学领域中迅速发展起来的一项高新技术,它主要是指通过微加工技术和微电子技术在固格体芯片表面构建的微型生物化学分析系统,以实现对细胞、蛋白质、DNA 以及其他生物组分的准确、快速、大信息量的检测。常用的生物芯片分为三大类:即基因芯片、蛋白质芯片和芯片实验室。生物芯片的主要特点是高通量、微型化和自动化。芯片上集成的成千上万的密集排列的分子微阵列,能够在短时间内分析大量的生物分子,使人们快速准确地获取样品中的生物信息,效率是传统检测手段的成百上千倍。它将是继大规模集成电路之后的又一次具有深远意义的科学技术革命。

生物芯片技术可以将极其大量的探针同时固定于支持物上,因此可以实现一次对大量生物分子进行的检测分析,弥补了传统核酸印迹杂交(southern blotting和northern blotting)等技术复杂、自动化程度低、检测目的分子数量少、低通量等不足,很快成为“后基因组计划”时期基因功能研究以及现代医学科学、医学诊断学发展的强有力的工具,推动了新基因的发现、基因诊断、药物筛选、给药个性化等方面的重大进展,给整个生命科学带来广泛深刻的变革。

生物芯片技术从出现,经历逐步发展,到现在已进入成熟阶段,并已逐步成为生命科学研究的重要手段。之前一些无法实现的科研设想成为可能。

我国生物芯片技术也呈现了极其迅猛的发展态势,目前的生物芯片产品有500多种,10余种芯片或相关产品实现产业化生产。产品主要包括:人乳头瘤病毒分型基因芯片及阅读仪;结核杆菌耐药基因芯片及阅读仪;地中海贫血基因芯片及阅读仪;生物电芯片(商品名:乳福康);睡眠障碍康复芯片;HD 2001A生物芯片检测仪;LE 01B 生物芯片阅读系统;生物芯片影像读取仪;EcoScan 100微阵列芯片扫描仪等。适用范围涵盖了疾病病因筛查和诊断、早期预警、健康评估、药物应答预测与疾病诊治方式的关系等领域。

尽管生物芯片技术已经取得了长足发展,但仍然存在着许多难题。比如成本昂贵;探针的合成与固定复杂,尤其是制作高密度的探针阵列更是如此;在信号的获取与分析上,目前大多使用荧光法进行检测和分析,重复性较好,但灵敏度不高;另外,对如此大量的数据信息进行读取与分析也是一个艰巨的技术问题,要想广泛应用到临床疾病的诊断还需要一定的时间。但是我们相信,在不久的将来,随着生物芯片技术的不断完善,它一定会为医学事业作出更大的贡献。

3.2.3数据库安全

数据的安全性关系到整个系统能否正常的运行,最终关系到单位能否提供正常的服务。虽然,计算机技术的发展给人们的日常生活提供了很多便利,然而,人为的操作错误,系统软件或应用软件的缺陷,硬件的损毁,电脑病毒,黑客攻击,自然灾难等等诸多因素都有可能造成计算机中数据的丢失或错乱等,从而给医院造成无可估量的损失。

对于医疗信息数据库的常见安全威胁包括自然灾害,电力中断,软件故障,硬件故障,战争行为和病毒等。

虽然没有计算机系统和数据库系统是绝对安全的,但是主动采取一些措施可能保护相应系统免受危害。这些措施有权限控制、预防性对策、矫正过程和检测行为。

权限控制:降低了蓄意攻击的可能性。常见的权限控制包括多级验证和密码保护等安全特性。物理验证,如指纹验证,虹膜验证,脸部验证都属于物理验证,使对重要服务器的访问者有更严密的保安措施,只给很少的使用者提供访问权。

预防性对策:能屏蔽掉攻击,从而导致攻击不成功或减少它的影响。防火墙能够阻止未经授权的系统访问,这是预防性对策的一个实例。

矫正过程:能够降低威胁的影响。数据库备份。灾难恢复计划和硬件设备的备用都是矫正过程的例子。数据库的备份是最常用的减少损失的办法。单次备份又分为全备份和增量备份两种。按时间分有定时备份和人工不定时备份。按设备分有本机备份和异机备份。按地点分有本地备份和异地备份。比如每一天做一次数据库备份,这样即使发生数据库的破坏,我们可以用备份数据库来恢复绝大部分的信息,所丢失的只是上次备份以后更新的内容。异机备份是指将备份做到另一台机器上。这样即使这台机器发生故障,那台备份机器就可以顶上来提供信息数据。

检测行为:能够识别威胁的攻击行为并触发预防性对策和矫正过程。例如,杀毒软件能够检测到病毒进入系统并能够按配置来自动清除系统文件或隔离受感染的文件。很多用来跟踪用户、文件更新以及对重要系统的更改的监视软件也可以用来帮助检测标明入侵或威胁的异常。

存放数据库的设备(服务器)应该被安置在一个特殊场所,要有严密的防火、防爆、防震、防盗措施。不间断电源的使用可以减少突然事故引发停电受到的影响。

3.2.4数据库概念的扩充

随着传统的数据库技术日趋成熟、计算机网络技术的飞速发展和应用范围的扩大,以分布式为主要特征的数据库系统的研究与开发受到人们的注意。分布式数据库是数据库技术与网络技术相结合的产物,在数据库领域已形成一个分支。分布式数据库的研究始于20世纪70年代中期。世界上第一个分布式数据库系统SDD 1是由美国计算机公司(CCA)于1979年在DEC 计算机上实现的。20世纪90年代以来,分布式数据库系统进入商品化应用阶段,传统的关系数据库产品均发展成以计算机网络及多任务操作系统为核心的分布式数据库产品,同时分布式数据库逐步向客户机/服务器模式发展。

1)分布式数据库(distributed database system,DDBS)的分类(1)同构同质型DDBS:各个场地都采用同一类型的数据模型(譬如都是关系型),并且是同一型号的DBMS。

(2)同构异质型DDBS:各个场地采用同一类型的数据模型,但是DBMS 的型号不同,譬如DB2、ORACLE、SYBASE、SQL Server 等。

(3)异构型DDBS:各个场地的数据模型的型号不同,甚至类型也不同。随着计算机网络技术的发展,异种机联网问题已经得到较好的解决,此时依靠异构型DDBS就能存取全网中各种异构局部库中的数据。

2)DDBS的基本特点

(1)物理分布性:数据不是存储在一个场地,而是存储在计算机网络的多个场地。

(2)逻辑整体性:数据物理分布在各个场地,但逻辑上是一个整体,它们被所有用户(全局用户)共享,并由一个DDBMS 统一管理。

(3)场地自治性:各场地上的数据由本地的DBMS 管理,具有自治处理能力,完成本场地的应用(局部应用)。

(4)场地之间协作性:各场地虽然具有高度的自治性,但是又相互协作构成一个整体。

3)DDBS的其他特点

①数据独立性。②集中与自治相结合的控制机制。③适当增加数据冗余度。④事务管理的分布性。

4)DDBS的优点

①具有灵活的体系结构。②适应分布式的管理和控制机构。③经济性能优越。

④系统的可靠性高、可用性好。⑤局部应用的响应速度快。⑥可扩展性好,易于集成现有的系统。

5)DDBS的缺点

①系统开销较大,主要花在通信部分。②复杂的存取结构(如辅助索引、文件的链接技术),在集中式DBS 中是有效存取数据的重要技术,但在分布式系统中不一定有效。

③数据的安全性和保密性较难处理。

6)分布式数据库管理系统

(1)“分布计算”概念突破了集中式DBS 的框架,数据分布使系统走上分布式DB 的道路,功能分布使系统走上C/S 道路。这是DBS 的两个发展。

(2)C/S系统包括一个计算机网络,通常用一个局域网联结。几乎在所有情况下,客户机都是微机;服务器有时用小型机或大型机,但多数情况下也使用微机或高档微机。应用程序在客户机上处理,DBMS和OS的数据管理分放在服务器上。

(3)C/S结构经历了从两层、三层到多层的演变过程。总的趋势是使客户机越来越“瘦”,变成浏览器;而服务器的种类越来越多,容易实现系统的组装。

(4)C/S系统使应用与用户更加贴近,为用户提供较好的性能和更复杂的界面。

(5)分布式系统是在集中式系统的基础上发展而来的。DDB是数据库技术与网络技术结合的产物。随着计算机网络技术的飞速发展,DDBS日益成为数据库领域的主流方向。

(6)DDB具有数据分布性和逻辑整体性的特点。DDBS能够支持涉及多个场地的全局应用。DDB的数据存储有数据分片和数据分配两种策略。

(7)DDB的模式结构为理解DDBS提供了一种通用的概念结构。分布透明性是DD医BS追求的目标。DDBMS是负责管理分布环境下,逻辑集成数据的存取、一致性、有效性和完备性的软件系统。

(8)DDBS中数据分布在各个场地,系统中压倒一切的性能目标是尽量减少网络中传送信息的次数和传送的数据量。分布式查询中基于半联接的优化策略是常用的技术。