作为第一步,调查人员必须确定研究对象和研究目的。例如,某研究人员可能想了解上海市的所有6~~8岁儿童收看电视情况,统计他们每天收看的时间以及节目。他也可能想了解在这些儿童收看电视的时间长短与他们的学习成绩之间是否有某种关系。这样研究人员就可以提出,研究课题的目的是验证在研究对象的收看电视习惯和他们的学习成绩之间有无任何关系。任何一项调查都必须提出研究目的或假设,并就研究对象及其特征的选择提供理论性或(和)实用性的充足的理由。
(二)抽样
1.为什么要抽样
抽样这个概念的含义其实人们是很熟悉的。家里做汤,要尝尝味道,只需用汤匙取一小口,尝一下便知整锅汤的味道。在日常生活中,卖水果也要挑一两个看看,品尝一下,便可知这堆水果的好坏。我们都认为品尝的那一部分足以代表整体,不必全部都品尝。实地调查中的抽样与这些日常生活的例子的原理是一样的。研究人员只需研究对象总体的一个样本就行了。抽样的好处就是速度快,节省经费,也很准确。
2.抽样方法
抽样调查总的可分为两大类:一是概率抽样;一是非概率抽样。
1982年北京受众调查运用的是概率抽样法。它是根据数学原则进行客观抽样的,不允许有主观因素的影响。样本中的每个单位都有已知的、可计算的中选概率。这些已知概率使得研究人员得以计算出抽样误差、样本可信度并最终推断出调查的精确性。另一种抽样是非概率抽样,它不按照数学原则进行抽样,而以主观标准去找调查对象。这样有主观因素的存在,所以研究人员无法推断出样本概率,也无法计算出样本的准确性。
非概率抽样在20世纪30年代以前较早期的调查方法里常用。如今概率抽样成了公认的、最常用的方法。此方法最主要的特征就是随机抽样。它主要可再细分为简单随机抽样、系统抽样、分层抽样和群体抽样四种。
(1)简单随机抽样法
这是最基本的随机抽样法。采用此方法,总体中每个具体单位都有均等的被抽选机会。被选中与否完全取决于其数值规律及概率大小的演变,不受其他任何因素,如主观意志等影响。抛钱币决定正反面,掷骰子,从盒子里抽签等可算是较原始的简单随机抽样法,但这些方法很少直接运用于传播研究里的抽样调查中。抽样调查常用的是随机数字表或依靠电脑程序,随机数字表上的数字都是随机排列的,调查设计人员可从表上随意取一数字为起点,然后从这点的上下左右依次抽取所需数目的样本。在美国,调查人员在进行电话采访时,可用电脑自动随意抽取电话号码,并自动拨号以供采访人员采访(这种方法节省了大量人力和时间,但准确度不高。因为有时电脑选的号码是空的。所以需要比样本规模多两三倍的号码供选择)。
(2)系统抽样法
简单随机抽样较少在实际工作中单独使用,因为它不太实用。例如,如用手工的话,抽样相当费力。所以如果有总体名单的话,研究人员通常较喜欢采用系统抽样法。
系统抽样法,国内亦称等距抽样法,即从受调查总体的所有单位里,每间隔若干个单位,就抽取一个样本,直到取得足够的样本数目。间隔数可以从总体单位数除以样本单位数求得。如果某一总体包括1万个单位,研究人员需要从中等距抽取1000个单独的样本,他以公式10000 1000求得间隔数为10,这样他就可每隔10个单位抽一样本。1982年的北京受众调查的抽样的就采用了这个方法。调查组织者把受调查的工作机构的职工花名册作为总体表,将全部职工人数除以抽样调查人数,得出间距数。然后从职工名册第一名开始,到间距止,就是第一个被调查人员,其他人员依此类推。
有人称此法为“准随机抽样法”。因为定下间距后,进行抽样就不能保证总体名单上每一个人都具有相同的被抽取概率。所以有人采取随机抽取开头第一个单位,然后再等距抽取其他样本。这样可减少一些人为的可能偏见差误。
系统抽样法比简单随机抽样法要省时省力。但由于此法是依据已有的总体表,如电话号码簿、花名册等抽样的,所以样本的准确性就受到总体表的精确度限制。如当总体表里的单位是以周期循环方式排列的,而这周期和样本间隔数刚好一样的话,就可能会引起样本偏差。例如,某调查人员要从某一高层公寓里抽取住户样本,设每层有10套房间,各按数字排列为,10、102……;201、202……;301、302……,如他从公寓总体图里用间隔数:10抽取样本,就有可能抽出的样本都是第1号房间(101、201、301……),这就可能产生样本偏差。因为抽出的位房可能全是东头的,它们通常比较大,多阳台等,这又可能意味着该住户的地位较高,这样样本的代表性就降低了。所以使用此法时,首先要考虑能否得到一个详尽准确的总体表,如无此表则最好不使用这种方法。其次,研究人员在从总体表里等距抽样前,必须仔细分析此表的结构,看看会不会有出现上述偏差的可能性,如有的话,就必须采取措施加以纠正。如先求出间距数,但在每一间距里用简单随机抽样法,抽取一个样本单位。
(3)分层抽样法
我国亦称类型抽样法。它是将统计分组法与抽样法结合运用的方法,适用于偏差大、总体里类型悬殊条件下的调查项目。它不是直接从总体中抽样,而是先按调查要求,将总体分类分层,然后再从这些类层里,按各自比例随机抽取样本。通常是按职业、年龄、性别、收入水平、文化程度等特点进行分类。这样可避免随机抽样中可能的比例偏差。例如,一个城镇有1万名10岁以上居民。其中一半是男性,一半是女性。但如从这些居民中随机抽取10%组成的样本里却不可能正好得到这个比例(可能650名女性,350名男性等),从而造成抽样误差。为了避免这种误差,可采取分层法,先把总体分成男性组和女性组,然后分别对两组进行抽样。这样便可能保证样本里500名是男性,500名是女性。
又如某研究人员要调查读者对某报副刊的反映,一般说来对副刊的反映与读者文化程度关系密切。所以研究人员可根据教育程度把对象分层,在抽样前先把总体分为文盲,小学程度、中学程度、大学程度等层次,然后按各层人数在总体中的比例抽取各自样本。如总体中10%受到大学教育,样本中就必须有10%的单位对象达到这一标准。我国目前较大型的调查大都采用此法。
(4)群体抽样法
上述几种方法都要求有个详尽完整的总体表,而有时无法得到这种名单,或者当调查地区广,总体大时,按个人单位取样十分费力,这时可考虑采用群体抽样法。即每次抽取成组或成块的样本,而不是个别单位的样本。群体抽样法,一般需要多次抽样组成样本。如要分析《北京晚报》读者对该报的态度,可采用群体抽样法,先将北京市分为区,以区为单位,再抽取街道,接着再从抽中的街道里抽取居委会,最后再从居委会的“居民户口登记册”上抽取居民家庭,并从家庭中抽取家庭成员,组成调查所用样本。
群体抽样法因其高效率而备受推崇,但有时“效率”可能意味着降低准确性,因为群体抽样一般要经多次抽样,这样就可能引起多次抽样误差。如在一个双层次抽样里,可能会抽出一个文化程度特别高的居住区,然后又从这居住区里抽出文化程度高的住户来,解决的办法是利用样本分布逻辑原则,尽量扩大样本里的群体数,减少各群里的单位数。
在受众调查过程中,要注意根据不同的情况,科学地进行调查和数据的比对,才能得出准确的数据。对节目进行评价时,必须消除外界因素对节目收视率的影响,像对播出时段、所在频道、节目类型等因素的控制,这一点在不同节目的评价中尤为重要。按照实际收视率和播出时段、播出频道、节目类型三个权重可以对节目的收视率进行调整,使其具有可比性,得到“标准化收视率”。它的计算方法如下:
标准化收视率=时段权重×频道权重×节目类型权重×实际收视率例如,针对2003年10月16日到22日一周中,北京台在北京地区收视率排名前25位的节目进行评价(一个栏目如果两次进入收视排名,只记录收视率最高的一次)。
10月16日到22日北京台收视率排名前25位的节目中,北京卫视有12个节目进入排名,其中新闻类占了7个,电视剧和生活服务类各占2个,专题类1个;北京台二套有5个节目,2个电视剧,电影、综艺类和音乐类各占1个;北京台三套有2个,都是专题类节目;北京台四套有3个,2个电视剧和1个综艺类;北京台七套有2个,1个是新闻类,1个是生活服务类;北京台八套有1个电视剧;北京台五套和六套则没有节目进入排名。
如上所述,时段的权重来自开机率,我们可以用所有频道的收视率来等同开机率,由于时段的权重是各时段的平均开机率与每一段开机率之间的比值,所以哪个时段的开机率高,它的时段权重反而低。
时段权重=全天开机率/节目所在时段开机率在排名前25位的节目中,播出时间集中在晚间18:00~~23:00,时段权重在0.3~~0.6之间,还有两个节目是在中午12:00~~13:00,时段权重是0.7。
Pp频道权重来自频道的覆盖率,是所有频道入户率平均值与这个频道入户率的比值,频道的覆盖率越高频道权重则越低。
频道权重=北京台所有频道覆盖率/节目所在频道覆盖率北京台9个频道的平均覆盖率是87%,频道权重在0.9~~1.2之间,差距不大。
节目类型的权重来自各类节目收视率,是所有节目平均收视率与这类节目收视率的比值,本类节目的收视率越高,权重反而越低。
节目频道=所有节目平均收视率/此类节目的收视率北京台各类节目中以新闻类节目的收视率最高,所以它的权重最低,只有0.35,综艺类节目0.39,电视剧0.40,电影0.73,专题1.48,音乐1.60,生活服务2.20。
各节目的收视率经过时段权重、频道权重、节目类型处理后,得到标准化的收视率,这样不同时段、频道和节目类型的节目就具有可比性。
在对北京台收视率前25位节目收视率标准化后,其原有的排名次序发生了很大的变化,名列前三位的分别是《天气预报》、《法制进行时》、《午间气象服务》。中央电视台《正大综艺》1995~1996年收视率下降,引起了各种议论,为此对《正大综艺》的收视率进行了调查和分析。按收视统计,1992年、1993年《正大综艺》的收视率在15%~20%之间。 1995年、1996年收视率在3%左右。如果对这个数字不加以分析就很容易使人得出悲观的结论,但通过对调查数据的分析,可以准确找出原因:一是电视频道增多。1992年、1993年收视率在20%的时候,大部分城市只能接收1~5个频道的节目。而1995年、1996年,一般城市都能接收20个左右的电视频道,观众大量分流;二是观众生活水平提高,娱乐方式多元化,许多人不再围坐在电视机前,而是去锻炼身体、朋友聚会、大片观摩等。观众欣赏电视的水平提高了,对节目的要求也高了,一旦电视满足不了需要,观众很可能“移情别恋”;三是类似《正大综艺》的电视节目大量出现,几乎每个省台都有类似的益智类节目,优秀节目也不断出现,竞争增加;四是统计方式的改变有时不好类比。如中央电视台这么多年来,为了统计数字的准确,统计方式、标准不同,因此类比有时不科学。通过调查得出结论后,对问题就可有一个较为科学的评价。因此,准确的频道对比结果为《正大综艺》1992年、1993年收视率在中央电视台二套位居第一,比第二名高出一倍左右;1995年、1996年在二套位居第一,也比第二名高出一倍左右;1997年高出第二名近两倍。这样就有了一个客观和较为准确的评价。
(三)设计问卷
确立了调查课题,抽选好样本后,就可着手进行具体调查。
调查大多以问卷形式进行。所以问卷设计是组织好每次调查的重要环节,也是保证调查能否达到预期目的的关键。因为调查问卷是调查目的的具体体现。调查者为什么要进行这次调查,通过调查想要了解什么情况,研究什么问题,都要在问卷里弄明白,并在问卷提出的问题中准确无误地表现出来。问卷设计是否合理,直接影响到调查的准确性。所以要组织好受众调查,一定要花力气,下工夫设计好问卷。问卷设计根据形式与内容可分为两步,一是形式即问卷总体安排;一是具体内容,也就是问题的设计。
1.问卷问题的安排顺序
问卷的总体设计安排直接关系到答卷的准确性和回收率,要提高合格卷的比例,最重要的是要安排好问题的顺序。
问卷的顺序应力求符合被调查者的思维逻辑习惯,即从简到繁,从易到难,从广泛到具体。以简单较容易回答的问题开头,有如打球的“热身赛”,可让答卷者熟悉一下答卷步骤,产生对问卷的兴趣,进入较好的“答卷状态”。1982年,北京受众调查的问卷设计者当时考虑到听广播、看电视的人比较多,所以把调查广播电视的问题摆在前面。当时有人提出应把报纸放在前面,但试验结果表明效果不好。因为有的人不读报,你一上来就问他读报情况,便产生心理上的距离,而先问广播电视里他感兴趣的问题,就容易接受调查。