书城医学儿童少年精神医学(第二版)
16700100000034

第34章 流行病学基础(6)

当调查涉及个人福利待遇如索赔、劳保等问题时,又可能夸大某些暴露因素的信息,在病例对照研究中病例组容易受后来发病的影响,使病例回忆时偏于多提供“暴露”的信息,如在一次群体癔病暴发调查询问某项可疑接触史时,常常病人较对照更易于提供详细的自认为有关事件但实际不真实的信息。(2)不依从所致偏倚:同样来源于被研究者,现场干预试验中研究对象随机分配之后不遵守试验规定。如试验组的受试对象不遵守规定的试验进程,则相当于退出试验组。若是对照组的对象私下接受试验组规程,则相当于加入试验组,此时从两个组提供的信息成为互换的相反信息,自然丧失了试验的真实性。(3)因果颠倒的偏倚:有时暴露事件的发生很难判断是在发病前或后,尤其是当某病的早期表现未被及时发现或不易被发现时,更易于将疾病引起的结果误认为是因。例如,当疾病早期未被确诊,病人感到不适而服用某些药物,在后来询问这个原因不明性疾病的暴露史时,很可能就把服用某些药物当做特殊的暴露史加以分析了。(4)测量偏倚:由于仪器不准,试剂不统一,实验条件不同造成测量结果不正确,可使调查结果偏离真值,比如使用了未经修订或标准化的心理测量量表,调查项目措辞不严谨,致使被调查者或调查人员误解,造成收集信息偏离真实。在多中心联合试验中,几个医院长期随访对象时,诊断标准有时不一致,以致得出错误的判断。这种偏倚也叫错分偏倚。

比较组间调查环境与条件不对等也可造成系统误差,如病例对照研究时病例在医院住院期间调查而对照在家中调查,病例与对照使用不同的调查表调查等。无论自己研制或是引用成熟的量表,测试项目的选定、结果的解释、项目分析、信度和效度评价等均是判定量表优劣的重要依据。(5)调查人员偏倚:如调查员有意识地对有某些特征的对象深入调查,如对病例组、暴露组、试验组调查较认真,对于对照组、非暴露组则不愿花费同等精力,轻描淡写地调查一番。特别是当调查者怀疑某病与某因素有关联时,有意追问暴露史,甚至诱导式提问。队列研究中在测量以取得结局的信息时,如果医生认为暴露会导致疾病,可能在暴露组诊断时会掌握诊断标准偏松,以致出现较多假阳性,或将较多的无病判断为有病。此外,如果不同调查员衡量标准不同,甚至同一人在不同情况下对某结果的理解不同也会造成系统误差,如果病人及对照分别由两人调查,其调查质量可能会出现差异。

3.混杂偏倚(confoundingbias)当研究暴露与疾病因果关系时,往往有许多其他因素与所产生的效应干扰着欲研究的那一个危险因子与其所产生的效应,该因素与暴露有关,同时与研究的疾病也有关,由于它的存在,将本来无关的两个事件联系起来了,或者夸大(缩小)了暴露与疾病之间的关联,这种现象称为混杂,这个外部因素就叫混杂因素,由混杂引起的偏倚称混杂偏倚。

混杂与暴露及与疾病之间可以是因果关系,也可能仅仅是相互关联。混杂因素与暴露因素之间应当相互独立,如果某因素是暴露与疾病之间的中间变量,或是病因链上的一个环节,该因素就不可能成为混杂因素,因为控制了这个因素,暴露与疾病之间的关系亦随之消失。比如在探索心瓣膜病与链球菌感染关系的研究中如果排除曾患风湿热病人,很可能发现不了二者之间的关联,因为风湿热是链球菌感染导致心瓣膜病的中间环节。另一方面,在病因网中的两个具有交互作用的危险因子可能会互相成为混杂因素,因为当一个因素存在时会影响另一个因素与疾病关联的强度。比如高血压和高血脂都是冠心病的危险因素,同时患有高血压和高血脂发生冠心病的危险是单独高血压或高血脂发生冠心病危险的3倍。如果研究者收集高血压与冠心病资料时没有控制高血脂,就会夸大高血压在冠心病发病中的地位和作用。当混杂因素存在时暴露与疾病关联强度增加,称为正混杂;相反,当混杂因素存在时暴露与疾病关联强度减少,称为负混杂。高血脂对高血压与冠心病关联的影响就是一种正混杂。由于医学事件的发生大多数是多因素作用的结果,因此混杂现象随时随地可以发生。

(三)偏倚的控制

消除或防止产生偏倚的有效办法是针对产生偏倚的原因采取措施,防止偏倚的关键是能够清醒地预见到或估计出本研究可能出现的偏倚。可以在研究工作的设计阶段、实施阶段和资料分析阶段分别予以控制。

1.设计阶段

(1)选择适宜的研究方案任何研究设计都会出现偏倚,但是不同类型研究偏倚影响程度不同,描述性研究偏倚的来源广泛,质量控制难度较大,受偏倚的影响也最大,结论泛推时应当十分慎重。病例对照研究、队列研究、实验研究偏倚的影响逐渐减小,目前临床试验以随机对照设计被认为是较好的设计类型。为避免信息偏倚,实验设计时要认真推敲以准备一个完善的调查表,特别注意暴露与疾病的规定要有明确的执行定义,文字表述、措词内容应反复预试,以避免调查人员或被调查者误解。

随机化原则为防止选择偏倚,一般的研究设计都遵循随机化原则。随机主要体现在两个方面,一是在抽取研究样本时保证样本人群中的每一个体都有同等机会从目标人群中得来,以使样本人群有比较好的代表性;二是在分配研究对象时保证研究对象有同等机会进入实验组和对照组,以使样本人群有比较好的可比性。病例对照研究尽量在多个医院选择对象,或在社区选择研究对象,以减少入院偏倚。队列研究特别是实验研究通过随机化可以保证研究人群中非研究因素的分布与一般人群中该因素的分布一致,达到控制混杂的目的。

限制严格按规定的标准选择研究对象,是控制混杂偏倚的有效方法。在病例来源广泛时,为排除年龄的混杂作用,可以仅选择某一年龄组进行研究。病例对照研究尽量选用新发病例,不选用死亡病例,为防止和减少失访和不依从者的出现,如研究许可,不选用流动性大的人群。实验研究期限不宜过长,尽量简化干预措施。

匹配为保证比较组间可能的混杂因子分布一致,设计时常采用匹配的方式,按照可疑混杂因子列出匹配条件,可以个体匹配(配对),也可以成组匹配。为防止某些意想不到的因素产生混杂作用,常选择多种对照的形式。队列研究和实验研究要保证暴露组(实验组)与非暴露组(对照组)非研究因素的一致。

2.实施阶段

严格遵守设计方案研究方案一经确立,就不能随意更改,实施过程中如遇与原方案相悖之实际情况,需要认真讨论寻取应对办法。在设计中明确规定为随机样本的,必须严格遵守随机化的原则。为防止选择偏倚,项目实施时要尽量设法提高抽中对象的受检率,最好是一个不漏地检查或调查。特别要弄清愿意加入和不愿加入到研究里面来的两组人有什么不同点,了解这些特点有助于全面解释研究的结果。

(2)培训调查人员一项研究不可能仅由一个人完成,特别是大型协作研究项目,项目实施前,应当精心挑选调查员,认真培训,使其充分了解调查的意义和工作中应具备的科学态度,训练观察、询问和填写调查表的要领和技巧。尽量减少使用调查人员的数目,必要时使用盲法,使收集信息者不知被调查人的属性与研究中的作用。项目实施中应随时对调查人员进行监督和质量控制,要求严格按调查员守则进行工作。

(3)注意各种类型的无应答一旦发生,应当分析原因以便补救,现况调查时可设法普查一部分无应答者并作分析,如果无应答者的特征与应答者无甚区别,则可仅根据应答者的资料进行分析。但在调查报告中必须交代清楚应答率、影响因素分析及对无应答者的处理方法等,各类研究无应答率一般应控制在5%以下。队列研究与实验研究要尽可能提高研究对象的依从性,对失访者和已随访者的特征做比较分析,从各种途径了解失访者最后的结局,并与已随访者的最后观察结果做比较。病例对照研究中尽量说服动员研究对象合作,争取最良好的配合;实验性研究应对受试者说明实验的意义、规程及预期结果,以取得他们的合作与支持。为防止失访,在随机分配之前,应将实验开始以后的失访者排除。在实验中若有失访者,尽量用电话、通讯或随访进行调查。

为避免信息偏倚,研究中尽量选用精良的仪器设备并事先做好校准。在整个调查中所用试剂力求一致,特别是应当选用信度和效度均高的量表进行心理和行为测量,以消除可能引起的测量偏倚。

3.资料分析阶段

核实数据,避免过失误差在资料分析前,首先审查未按照原设计完成的研究对象情况,或排除,或失访,或不依从等都应有明确交代,如果被排除的研究对象较多,结论的泛化将受到限制。一项研究的失访率控制在5%左右,否则应重新比较研究组间各相关指标间的差异,同时慎重考虑结果的解释和推论。

分层分析在资料分析阶段,采用分层分析手段是最基本的控制偏倚的方法,如果按可疑混杂因素分层后分析指标(如犗犚值)与分层前有较大差别,说明可能存在混杂作用,此时应对各层犗犚值进行齐性检验,如果齐性检验差异有显著统计学意义,则不宜合并,需单独进行评价分析。如果差异无显著统计学意义,可以采用Mantel一Haenszel提出的公式进行合并,计算总ORm一h值,若此ORm一h值与未分层的OR值相比差异有显著统计学意义,说明确实存在混杂,而此时的ORm一h值已消除了混杂的作用。

多因素分析如果欲控制的混杂因素较多,多级分层后可能会出现层内样本含量过少影响统计学检验效能的情况,此时采用多因素数学模型处理是一种较理想的手段。随着计算机普及使用,各种应用型统计软件层出不穷,研究者可以依据数据的特点、研究的类型选用不同的程序,诸如逐步回归分析,多元协方差分析,典型相关分析,Logistic回归分析,Cox回归分析等。无论采用哪一种模型,其基本思路是:当分析某一因素(自变量)与疾病(因变量)关系时,采用数理统计方法控制其他因素不显示其作用。

(曲成毅)