流行病学研究需采用各种指标进行量化,选用的指标按性质分主要包括:(1)计量资料(measurementdata):对每个观察单位用定量方法测定某项指标的大小,实验室化验结果大多为计量资料,心理和行为评定结果相当多数也采用计量指标,计量资料表述时要注意既要有集中趋势(如平均数),又要有离散程度(如标准差)。(2)计数资料(enumerationdata):将观察单位按某种属性或类别分组,所得各组的观察单位数。除用绝对值表示之外,使用最多的是相对数,如各种率和比。率是发生事件人数和有可能发生该事件人数之比,使用时应当和相同事物内部不同组成部分的构成比相区别。流行病学研究有时使用率比,表明暴露组的率(如发病率)与非暴露组的率相差的倍数;有时使用比值比,是病例组含有某因素的比例与非病例组含有该因素比例的比值,表明该因素与疾病关联的强度。(3)等级资料(rankeddata):将观察单位按某种属性的不同程度分组,所得各组的观察单位数。与计数资料不同的是,属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是,每个观察单位不是确切定量,只是一种半定量资料,定性研究数据常采用等级资料表述。不同类型的指标要采用不同的统计分析方法。以下是几个常用的流行病学研究指标:
(一)发病指标
1.发病率(incidencerate)发病率指一定时间内(一般指一年内)人群中某病新病例出现的频率。
由于观察期内(如一年之内)人口可能有所变动,分母中的人群可以用(年初人口数十年末人口数)+2计算,也可用观察期中(如7月1日0点)实有人数估计。依据比例基数的不同,可以有百分率、千分率、万分率或十万分率等等。
发病率常用以描述疾病分布,探讨发病原因,提出病因假设或评价防治措施的效果。发病率的高低受致病因素的强弱、人群易感性的高低的影响,所以常用以评价预防措施的效果,此外发病率还可以受诊断标准和诊断水平以及漏报、错报等因素的影响。由于发病率的时间间隔一般为一年,所以发病率主要用于病程较长的慢性疾病。
2.羅患率(attackrate)罹患率指观察期内暴露人群中新发病例所占比率,计算公式为:
罹串率—观察期内某病新发病例数x比例其数権患率一同腿露人口数x比例基数
罹患率可以百分率或千分率表示,罹患率所指观察期比较灵活,一般指一个较短的时期,几个月、几天甚至几个小时,适合于对那些一过性的暴发或流行疾病的描述。
3.患病率(prevalencerate)患病率指观察期内观察人群中某病例所占比率,计算公式为:
某一期间内某人群中现患病例数患病率—一同期观察人口数一x比例基数
患病率的分子包括新老病例的总和,常用于对慢性病的流行病学研究,用于某病流行的现况调查,因此又称现患率或流行率。由于患病率反映的是现患病人在观察人群中的比率,因此它可用以评价某地预防与治疗两方面的情况,患病率(所有病例)随着发病率(新病例)增高而增高,并随着疾病恢复的加速或死亡的加速而下降。患病率与发病率、病程的关系可用公式表述为:患病率=发病率X病程。
4.病(伤)残率(disabilityrate)病(伤)残率指观察期内因病(伤)致残人数在观察对象中所占比率,残疾指病(伤)后长时期失能状态,有时甚至持续终身。目前国内外对各类残疾均制定了相应的标准,但是针对儿童残疾的标准往往概念模糊,诊断时随意性较大。特别是儿童正处于生长发育期,过早给予“残疾”的诊断常常带来负面影响,因此不少学者建议使用发育残疾(developingdisability)这一术语。
(二)死亡指标
1.死亡率(mortalityrate)死亡率指1年之内死亡人数在当年平均人口数中所占比率,计算公式为:
死亡率一一年之内某人群总死亡人数x比例基数
死亡率年平均人口数比例其数
死亡率一般以年为单位,因此有人称年平均死亡率,分母中的年平均人口数可以用(年初人口数十年末人口数)+2计算,也可用观察期中(如7月1日0点)实有人数估计。死亡率可用千分率、万分率或十万分率表示。人群死亡原因有多种,不分原因的死亡率称全死因死亡率;按疾病的种类、人口特征等分类的死亡率称死亡专率。如:婴儿死亡率=年内周岁内婴儿死亡数/年内活产数;新生儿死亡率=出生四周内新生儿死亡数/年内活产数等。
死亡率与人群的年龄、性别、职业、种族、生活习俗等密切相关,由于各地人口构成不同,可能会导致死亡率不同,因此在地区间死亡率比较时往往需要实现进行标准化,又有标准化死亡率的概念。死亡率可用以衡量某一时期,一个地区人群死亡危险性大小,可以反映一个地区不同时期人群的健康状况和卫生保健工作的水平,为该地区卫生保健工作的需求和规划提供科学依据,可以探讨病因和评价防治措施。
2.病死率(fatalityrate)病死率指一定期间之内某病死亡人数在患该病人数中所占比率,计算公式为:
病死率一一定同期内因病病人亡人数x比例基数
病死率表示某确诊疾病的死亡概率,表明该疾病的严重程度,反映医疗水平和诊断能力,通常多用于急性传染病或其他严重突发公共卫生事件,较少用于慢性病。如果某病死亡专率和病死率处于比较稳定的状态,死亡率与病死率、患病率的关系可以表述为:某病死亡率=该病患病率X该病病死率。
3.生存率(survivalrate)生存率指一定期间之内某病存活人数在患该病人数中所占比率。
生存率又称存活率,它从积极的方面反映疾病的终末结局,存活可以是疾病自然的转归,但是更多的是临床救治或康复的效果,生存率是一个动态变化的指标,可以是1年生存率、3年生存率、年生存率或10年生存率。为了计算生存率通常需要一个纵向观察的数据,在长期随访中观察对象可因各种原因退出观察,为充分利用观察期不等数据的信息,通常采用寿命表分析或Cox回归分析。
(三)疾病负担指标
近年来研究者对疾病负担(burdenofdisease)高度重视,由于儿童及青少年精神疾病从第一次发现到完全康复需要较长时间,儿童较一般人群在社会生存时间更长,因此对家庭和社会的负担更重。描述疾病负担的指标主要有:
1.潜在减寿年数(potentialyearsoflifelost,PYLL)潜在减寿年数是某病某年龄组人群死亡者的期望寿命与实际年龄之差的总和。
意义为:当死亡发生于某年龄组时,至活到e岁时还剩余的年龄;犱为某年龄组死亡人数。用潜在减寿年数除以当地相同性别的人口总数即为减寿率,潜在减寿年数和减寿率将死亡和死亡年龄结合在一起分析,更能全面表示疾病或某一事件对人群伤害的严重性。比如儿童少年精神分裂症和成人精神分裂症人群死亡率虽然相同,采用减寿率分析会得出前者较后者对人群威胁更大。
2.质量调整寿命年(qualityadjustedlifeyears,QALY)质量调整寿命年是描述生存质量的指标,表明从发病(或发生某有损健康事件)到死亡(或康复)的健康寿命年,计算公式为:
质量调整寿命年=某措施能延长的寿命年X效用值效用值是依据生理或心理功能对每一种疾病或残疾状态进行量化的指标,完全健康为1,死亡为0,因此效用值是介于0—1之间无量纲的比值。质量调整寿命年考虑了病残对生命质量的影响,既能描述疾病或事件对社会、家庭带来的负担,又能全面评价实施某项措施后的效果。从残疾失能的角度调整生存年称为伤残调整寿命年(disabilityadjustedlifeyears,DALY),其计算更为精确,需要有发病(或不利事件)的年龄、失能持续的时间、年龄和失能的权重、贴现率等参数。
(四)因果关联指标
流行病学研究相当多数是进行因果关联的推断,表述因果关联强度的重要指标是危险度,主要包括:
1.相对危险度(relativerisk,RR)是反映暴露与发病(死亡)关联强度的指标,也叫危险比(riskratio)或率比(rateratio)。
它表明暴露组发病或死亡是非暴露组的多少倍为暴露组的率(发病或死亡);为暴露组发病或死亡人数,狀为暴露组总人数;犐=c/n。为非暴露组的率(发病或死亡)犮为非暴露组发病或死亡人数,狀为非暴露组总人数。
2.归因危险度(attributablerisk,AR)也叫特异危险度,或叫率差(ratedifference,RD),是表明暴露组与对照组发病危险相差的绝对值,即危险特异地归因于暴露因素的程度。
RR说明对于个体暴露能比未暴露情况下增加相应疾病的危险是多少倍,AR则是对于人群来讲,暴露比未暴露情况下增加超额疾病的数量,如果暴露因素消除,就可以减少这个疾病的数量。
3.需要处理(治疗)的人数(numberneededtotreat,NNT)计算公式为1/比较组间之率差。如果比较组为暴露组和非暴露组,表明暴露多少对象可能出现一例病人,如果比较组为试验组和对照组,表明用某种防治措施需处理多少病例可防止一次不利结局出现。例如有铅暴露史儿童行为障碍发病率15%,无铅暴露史儿童行为障碍发病率5%,铅暴露增加罹患行为障碍危险3倍(RR),因铅暴露实际增加儿童行为障碍发病率10%(AR)如果有效控制铅暴露,每控制10个人可避免出现1例儿童行为障碍病人(NNT)。
二、横断面研究
横断面研究(cross一sectionalstudy)又称现况调查,是流行病学描述性研究的重要手段,可以在短时期之内调查了解人群中疾病或健康状况,调查的方法包括普查、抽查和筛查。
(―)普查(census)
普查是在特定时间对一定范围内人群的全面调查。普查可以达到对疾病早期发现、早期治疗的目的,可以掌握疾病的分布及病人的需求,以便合理配置卫生资源,有时普查是为了建立生理、心理正常值标准。普查质量的一个重要指标是普查率:普查率=实查人数/应查人数。一般普查率应当达到95%左右,最低不低于90%,如果普查率太低,就失去了普查的意义。
(二)抽查(slingsurvey)
普查工作费时费力,由于工作量大而不易控制质量,有时由于条件限制,不可能实现。所以常常采用抽样调查代替普查,即在总体中抽取一个样本,依据样本调查的结果推论总体的特征。抽查的基本原则是:保证总体中的每一个成员都有同等机会进入样本。为此,抽样必须随机,抽样对象必须均匀,样本必须够大。抽样调查前,首先应当确定目标人群,即样本所代表的那个“总体”,具体抽样方法包括:
1.单纯随机抽样(simplerandomsling)随机化需要一定的技术来实现,利用随机数字抽取研究对象是最基本的方法。可以采用随机数字表或从程序计算器或计算机选取随机数,然后依据一定规律抽取样本(比如按随机数大小排序,抽取前若干名)。
2.系统抽样(systematicsling)依据原有的序号,按照一定顺序,机械地每隔一定数量的单位抽取一个单位。进行系统抽样时先要决定按什么样的比例抽样以及从哪个单位开始抽起。例如总体有2500个单位,决定抽取100个,则比例为每25个中抽1个。然后采用单纯随机抽样法从1—25号中随机抽出1个作为起点,以后每隔25号再抽一个。
3.分层抽样(stratifiedsling)抽样前按照某些人口学特征(如年龄、性别、住址、职业、教育程度等)将研究人群分为若干组、类型或层,然后从每层抽出一个随机样本,如此可保证每个层内对象的特征充分均匀。为了保证样本内各层的构成和总体一致,常常采用从每层中按总体中各层的比例随机抽取出相同比例的样本,称为按比例分层随机抽样。
4.整群抽样(clustersling)单纯随机抽样是理想的抽样方法,但对大样本人群调查时会遇到困难。比如对某市10万名儿童抽样调查,按照单纯随机抽样设计需跑遍全市进行调查,此时可采用从要调查的总体中抽出一些群体如某个学校、某个街区、某些住宅或某种特殊人群的抽样方法,这些群体必须是从相同类型的群体中随机抽出的,被抽到单位的所有成员都是研究对象。此法要求各群内变异和整个研究对象变异一样大(考虑到所抽到的群能充分代表总体),而各群间的变异越小越好。整群抽样的优点是,在实际工作中易为群众所接受,抽样和调查都比较方便,也可节约人力、物力,因而多用于大规模调查。其缺点是,抽样误差较大,分析工作量也较大。
5.多级抽样(multistagesling)一般米用先分层后整群抽样的方法称整群二级抽样,这是大型调查时常用的一种抽样方法。例如2004年北京市2—6岁儿童精神障碍抽样调查,首先按照北京市18个区(县)分为18个“层”,按照每个层的人口在全市人口中的构成比例在每个层内随机抽取1—5个街道(乡镇),对抽中街道(乡镇)的全部符合条件的儿童进行调查。此外还可以采用多级分层整群抽样。二级和多级抽样的优点是节省人力和物力,可以充分利用各种抽样方法的优势,克服各自的不足。缺点是在抽样前要掌握各级调查单位的人口资料及其特点,有时是十分困难的。
抽样调查样本大小主要取决于两个因素:(1)对调查结果精确度的要求,即容许误差的大小。(2)预期患病率或标准差的大小。
抽样调查和普查相比具有省时、省力、省材料和省经费的特点。由于调查样本相对较小,因而较易集中人力、物力和器材设备,调查结果也易做到细致、准确。缺点是抽样调查的设计、组织实施以及资料分析等方面比较复杂,重复和遗漏不易发现,也不适用于变异过大的人群。
(三)筛查(screening)