书城教材教辅医学信息学
48552800000075

第75章 医学信息资源的利用(1)

本章将论述有关医学信息资源及其利用的基础理论和技术方法,读完这章后,你应该知道下面这些问题的答案:

医学信息资源的含义是什么?它有哪些特点和类型?

信息检索的含义是什么?

何为信息检索语言?包含哪些类型?

信息检索技术包括哪些内容?

常用的中外文医学信息检索系统有哪些?如何利用?

搜索引擎的定义是什么?其工作原理是什么?如何利用搜索引擎获取所需医学信息资源?

17.1医学信息资源概述

17.1.1医学信息资源的含义

一般而言,资源是指自然界和人类社会生活中的一种可能用以创造物质财富和精神财富、具有一定量的积累的客观存在形态。信息资源是指经过人类采集、开发并组织的各种媒介信息的有机集合。信息资源按载体形式可分为三大类型:传统印刷型文献信息资源、电子信息资源和网络信息资源。文献信息资源是指以文字形式存在的信息资源,即传统的书刊等印刷型资料;电子信息资源是指以机读方式存在的载体,如声像、光盘、缩微资料等;网络信息资源即依托因特网存在的虚拟信息资源,是目前使用面最广、最重要的信息资源。

信息资源,其本身是一个集合的概念,它可按不同标准而分为多种类型。医学信息资源则是按专业(学科)划分出来的一个门类,它是与医学这一学科相关的各类信息资源的总称。医学信息资源是指经过人类组织、加工、并可以存取和能够满足人类需求的各种医学信息的集合。它首先是医学信息的集合,其次是经过人类组织的、有序的、可存取的医学信息的集合,然后它应是包括各种载体形式如印刷型、缩微型、视听型及网络信息的集合。

17.1.2医学信息资源的类型

按照不同的标准,医学信息资源可以分为不同的类型:

(1)按学科分类,医学信息资源涉及基础医学、临床医学、预防医学、卫生保健等相关学科门类。

(2)按载体形式分类,可分为印刷型文献、缩微型文献、视听型文献、电子型文献。其中印刷型和电子型是目前医学信息资源利用中的两大主体。

(3)按出版形式,可划分为图书、连续出版物(期刊、报纸、年鉴、指南等)、特种文献(科技报告、专利、标准、会议文献、学位论文、政府出版物、产品资料、图片、照片等)三大类型。

(4)按信息加工层次,可划分为零次信息资源、一次信息资源、二次信息资源、三次信息资源。其中,零次信息资源是未被记录下来或公开的最原始信息,或没有正式发表的文字材料如书信、手稿、笔记等,也包括科技人员的口头交流;一次信息资源,即作者根据自己的工作和研究成果而写成的,也可称原始论文,如期刊论文、学位论文、研究报告、专利说明书等;二次信息资源是对一次信息资源进行收集、分析、整理,按照其外部特征或内容特征并按照一定的规则加以编排而成的文献,是查找一次文献的线索,如目录、索引、文摘等;三次信息资源是针对某一专题检索二次信息资源,获得与之相关的大量一次信息资源,对一次信息资源进行阅读、筛选所需内容,最后归纳、整理、加工、提炼而成的,如综述是最常见的三次信息资源。

(5)按开发程度为依据,可分为潜在信息资源和现实信息资源。潜在信息资源是指个人在认知和创造过程中储存在大脑中的信息资源;现实信息资源是指潜在的信息资源经个人表述后能够为他人直接利用的信息资源。

17.1.3网络医学信息资源

1)网络医学信息资源的含义

网络信息资源(Network Information Resource)是指以电子数据的形式将文字、图像、声音、动画等多种形式的信息存放在光磁等非印刷质的载体中,并通过网络通信、计算机或终端等方式再现出来的信息资源,包括各种局域网、地域网和广域网上的信息资源。

网络医学信息资源,主要是指通过因特网获取的有用的生物医学信息资源。

2)网络医学信息资源的类型(1)数据库资源。与手工检索方式相比,计算机信息检索(包括光盘数据库、联机数据库)具有检索速度快、准确率高等优点,因此理所当然地成为广大信息用户获取所需信息资源的首选。常用的生物医学数据库主要有:①全文数据库,如中国期刊全文数据库、中文科技期刊全文数据库、ProQuest 健康与医学大全、OVID 全文期刊库、Elsevier Science(SDOS)、Springer LINK 等;②文摘数据库,如Medline、中国生物医学文献数据库(CBM)、馆藏西文生物医学期刊文献数据库(EMCC)等;③引文数据库,如中国生物医学期刊引文数据库(CMCI)、美国科学引文索引(Science Citation Index,SCI)等;④数值型或事实型数据库,主要包括基因库、核酸序列、蛋白质结构等分子生物学数据库,以及毒理学、药物方面的事实型数据库等;⑤多媒体数据库,包括各种医学图谱库、医学影像库(CT、MRI、X 片等)、病理切片库以及化学物质或药物结构数据库等等。

(2)电子期刊和电子图书。Internet 提供的电子出版物主要包括电子期刊、报纸、图书、手册、法规、指南、百科全书等。可以在如斯坦福大学的Highwire和Freemedicaljournals、free‐ebook 等网站检索到相关电子期刊和电子图书。电子报纸国外有Science Daily,Physiweekly,Internal Medicine WorldReport 等,国内有健康报、中国医学论坛报、中国中医药报等。

(3)新闻资源。医药卫生新闻主要包括医药卫生行业新闻、商业新闻、临床实验进展、疾病防治新技术、新进展,可通过搜索引擎、综合网站新闻服务或专业网站查找,也可通过专业型新闻刊物,如各种newletters,weekly 及学术组织网站查找,多数医学网站都提供医学新闻。还有一些专门的新闻组信息栏目,这些信息主要来自usenet、BBS 的围绕各种专题和兴趣讨论的信息。

(4)医学教育资源。这类资源主要包括医学继续教育和病人教育资源两方面内容。

医学继续教育与培训资源包括医学院校网站中的继续教育内容,以及分散在各类网站上的医学教育资源。国内目前医学继续教育信息主要为各医科大学网站中的医学教育内容,如复旦大学医学院、第四军医大学、37℃ 医学网等网站中均设有医学继续教育栏目,此外,中华医学会每年均有各类国家级继续医学教育项目。

病人教育资源有:许多国外生物医学网站提供的医学信息都专门设立为患者和家属服务的Patients 版(患者版)及为普通大众服务或用通俗语言表达的General 版,如美国癌症学会、美国内科医师学会、美国癌症研究所的PDQ 等都提供丰富可靠的病人教育资源,一些权威协会、杂志的网页中也提供病人教育资源。

(5)医药市场信息资源。如今网络医药产品信息、市场信息越来越多,许多网站建立了医药产品、市场信息等栏目,如中国医药市场网、中国金药网、全国医药技术市场网、中国医药网等都提供丰富的网上医药市场信息。此外,制药公司或医药经营企业网站内容较为丰富,提供本单位介绍、产品介绍及药品和物资供求信息,侧重于广告宣传和药品营销,实用性较强,是搜集同行信息的有效途径。

(6)循证医学资源。循证医学(Evidence Based Medicine,EBM)资源的主要类型为系统综述和临床实践指南。由Cochrane 协作网创建的Cochrane Library 是获取循证医学资源的重要数据库。循证医学网站的内容包括系统综述数据库、临床实践指南数据库、循证医学期刊、Meta 分析软件、循证医学教学资源和导航系统等。我国于1993年12月在华西医科大学建立了中国Cochrane 中心,开展循证医学概念及系统综述方法的研究和培训。

(7)虚拟图书馆。虚拟医学图书馆是网络环境下大规模电子化文献信息系统,它将现实馆藏中数字化资源与外部虚拟信息资源整合、连接,供用户检索和共享利用。一些面向医学专业人员和病人服务的也称虚拟医学中心或虚拟医院。如美国Lowa 大学创建的虚拟医院,中国高等教育文献保障系统(china academic library & information system,CALIS)医药文献信息中心的重点学科导航等。

(8)其他医学信息资源。其他医学信息资源主要包括:医学会议信息资源,特种文献如专利信息、标准、学位论文资源等;医院、医学院和医生信息资源;科研基金申请、求职信息等等。

17.2信息检索基础

17.2.1信息检索的基本概念

信息检索(information retrieval)是指信息的有序化识别和查找的过程,即人们根据特定的信息需求,采取科学的方法,应用专门的工具,从浩瀚的信息海洋中迅速、准确地获取所需信息的过程。

广义的信息检索包括信息的存储和信息的检索,往往又称为“信息存储与检索”(InformationStorage and Retrieval)。信息的存储主要是在一定专业范围内的信息选择基础上进行信息特征描述、加工并使其有序化,或建立数据库,以便在检索时借助一定的设备与工具,从中查找出所需的信息。存储是检索的基础,检索是存储的逆过程。在现代信息技术的条件下,信息检索从本质上讲,是指人们从任何信息系统中高效、准确地查找到自己所需的有用信息,而不管它以何种形式出现,或借助于什么样的媒体,此即狭义的信息检索。一般来说“信息检索”主要指的是后者。

早期的信息检索,人们主要根据文献的特征,以手工方式实现。以计算机为核心的信息技术,开辟了信息处理与信息检索的新纪元,计算机从处理数字信息发展到处理字符信息、静态和动态的图像信息乃至声频视频信息等,不仅拓展了信息检索的领域,丰富了信息检索的内容,而且极大地提高了信息检索的速度。近年来,互联网给信息检索工作带来了一个全新的发展空间,信息检索的对象已从过去相对封闭,由独立数据库集中管理的信息内容扩展到如今开放、动态、更新更快、分布广泛、管理松散的网络内容;网络信息检索从一开始的一般人难以学会的标准化检索发展到现在,已经成为简单的、大众化的行为方式了。信息检索已成为当今科学研究、经济活动和社会生活中的一个组成部分,并发挥着越来越大的作用。

17.2.2信息检索语言

简单地说,检索语言就是一种检索标志系统,是根据检索需要而创建的一种人工语言。它应用于各种手工和计算机信息检索系统,它的实质是表达一系列概括文献内容的概念以及概念之间相互关系的标志系统。我们在建立一个检索系统,对信息、文献进行存储时,需要按照一定的语言来描述信息、文献的外部特征和内部特征;同时,信息用户在使用检索系统时,也要按照一定的语言来表达他的信息文献需求,那么,这种把信息存储与检索联系起来、把检索系统的建立者与使用者联系起来以便取得共同理解的语言就叫检索语言,或叫做检索标志系统,又称为信息存储与检索语言、标引语言、索引语言等。

信息检索语言是决定检索系统中大量信息排检序列的关键。它可以是一系列概括信息内容的概念及其相互关系的标识系统,如分类号码;也可以是自然语言中选择出来并加以规范化的一套词汇,如主题词表。常用的有下列三种。

1)分类检索语言

分类检索语言是以学科分类为基础,结合信息内容特征的一种直接体现知识分类概念的检索语言。它采用概念逻辑分类的一般规则进行层层划分,构成具有上位类和下位类之间隶属关系、同位类之间并列关系的概念等级体系。体系分类语言也叫分类法或分类表。

分类检索语言的“语词”就是它的类目及相应的分类号,分类号主要用于明确各类目之间的先后顺序。

分类检索语言既可以用于期刊论文的分类,也可以用于图书等其他文献信息的分类。

国内外有多种广泛使用的着名分类检索语言,如美国《国会图书馆图书分类法》(Library of Congress Classification,LC)、《国际十进分类法》(Universal Decimal Classification,UDC)、《杜威十进分类法》(Dewey Decimal Classification and Relative Index,DC 或DDC)、《中国图书馆分类法》(中图法)等。《中国图书馆分类法》是我国使用最普遍的一种分类检索语言。

2)主题检索语言

主题检索语言是用表达文献主题内容的词语作为标识并且按字顺排检的信息检索语言。应用较多的是叙词法和关键词法。