正文

第3节 调查执行与数据清理情况

中国大学生成长报告2014 作者:李路路 编


第3节 调查执行与数据清理情况

这一节主要介绍2011年和2012年追访调查的执行情况,包括具体的执行方式、执行过程,以及礼品激励的设置、访问员报酬的安排、垃圾信息治理政策变化对于联系通知的影响等等。

2011年和2012年本调查采用网络填答的方式完成。之所以采用这种调查方式,原因在于:第一,随着2006级本科生的毕业,要在世界范围内追访这些学生,成本陡然增加。实现全面的实地追访已经不可能。第二,随着互联网技术的发展,当前我国大学生的网络可及性非常高。2010年的调查显示,95%的受访者有自己的个人电脑。在2011年的调查中,如果受访者表示上网不方便,项目组可付其10元上网费,请其到附近上网点上网。最终只有1位本科生表示在老家上网不方便,项目组额外给付了10元上网费。第三,相对于项目组派人登门进行面对面的问卷填写,说服受访者到近便的上网点进行填答更为方便,而且只要不存在代答的情况,由于网络问卷自动化的逻辑检查与必选设置,数据质量甚至有更好的保障。因此保证被访者自己填写问卷,并且能够与以往收集的数据链接起来非常重要。在调查邀请中,我们通过短信或邮件告知受访者一个唯一的6位或7位字符串密码,凭借该密码登录网页并完成问卷,问卷一旦完成密码失效。当然,具体填答过程中,受访者会不会告诉他人密码代为填答很难控制,就像实地填答过程中,一一核对受访者身份的成本也是很高的。后期的数据检验发现,个别案例的回答确实存在前后两轮相差较大,可被怀疑存在代答的情况。但总体而言,数据的一致性还是非常高的。

具体而言,调查过程可以分为“邀访”和“劝访”两个阶段。第一个阶段是邀访,即通过电子邮件或手机短信等方式,一般性地集中通知和邀请被访者凭借对应密码上网填答问卷,被访者自愿填答。第二阶段,对邀访不成功的被访者,由访问员针对性地通过电话、短信、邮件联系,说服其上网填答,是为“劝访”。

以2011年2008级学生的访问情况为例:2011年5月27日—6月10日为集中邀访阶段。在被访者主动自愿的情况下,共完成应访案例的67%。经过前两次调查的培养,被访者对CEPS的认同度是比较高的。6月10日—7月18日为劝访阶段。项目组将尚未完成问卷的受访者名单分配给6位访问员,由他们分头与受访者联系,进行劝访,共完成应访案例的26%。整个调查从5月27日至7月30日,历时65天,共有2311人完整地填答问卷,另有31人部分地填答问卷。按填答完整者计算,当年针对在校本科生的追访完成2009年初访名单的93.4%;2010年追访成功的案例中有95.1%被再次追访成功,2010年追访未成功的案例中,重新找回59%(69个)。

2011年和2012年的调查中,受访者接到通知后,可以自己选择填答问卷的时间,时间的安排更为自由。因此,在访问时长上,这两轮调查更长。2011年一半学生用时短于30分钟,除去用时超过300分钟的案例,平均用时为38分钟左右。之所以出现10%的案例用时超过5个小时,是因为填答者可以随时中断填写,并在未来接着填写,系统将记录最开始填写的时间与提交问卷的时间。这些案例的实际填写时长并不是真这么长。2012年因为增加的问题相对较多,调查时长明显增加了,并且分多次完成问卷的学生更多了(从开始到提交历时5小时以上的案例达到了15%)(见图1—2)。

图1—2 四轮调查问卷填答用时分布情况

四轮调查中受访者提交问卷的日期如图1—3所示。各轮调查开始的时间有一定的差异。第一轮调查在5月底开始,7月份学校放暑假之前结束。第二轮调查同样在暑假开始前结束,依据第一轮调查经验,开始时间略早。第三轮调查,针对2008级学生的主要在当年的6月份完成,而2006级学生因为已经毕业,主要在8、9月份完成,10月份有个别收尾案例。2012年的调查同样分为两部分,针对在校生,为了避免因为毕业联系方式改变联系不上,主要在6、7月份完成,时间较第一轮和第二轮有所延长。而针对已经工作的学生,主要在10月底、12月完成。

图1—3 四轮调查问卷提交日期分布情况

受访者一天中提交问卷的时点如图1—4所示。在头两轮中,调查基本是在中午开始的,因为大学生受访者中午空闲时间相对较多。2011年和2012年,受访者主要在上午10点以后开始提交问卷,中午有一个小高峰,下午相对比较均匀,晚上8点以后到深夜提交问卷的人较多。这与相当一部分的通知选择在下午6点左右发出有关,在校生有熬夜的习惯则是更为重要的原因。

图1—4 四轮调查问卷提交时点分布情况

如果以提交日期为周几来考察的话,第一轮和第二轮调查的高峰点在周三到周五,周一到周二相对较少(见图1—5)。采用网络问卷之后,每周各天的完成量比较均匀,周五相对最少,而周六相对更多。这除了与通知发送时间相关外,可能与周五通常是学生和工作人交友活动的日子,空闲时间较少,周六准备休息放松的人较多有一定的关系。

图1—5 四轮调查中一周各天提交问卷人数占比

在数据收集过程中我们给受访者提供了必要的激励。第一、二轮的调查中我们在调查现场给予受访者20元的现金补贴。而在第三、四轮调查中我们通过空中充值方式给受访者的手机或其提供的亲友手机号码充值,充值金额为30元到100元不等,对于毕业参加工作的学生的补助更高,少数较晚仍未提交问卷的受访者我们给予了更高的激励。互联网的发展和支付方式的多样化为本项目的推进提供了极大的方便。在第三轮调查结束之后,2011年末项目组进行了一次样本维护,给愿意接受的学生邮寄了中心定制的实物纪念品。而2012年调查结束后,我们对参加调查的2008级被访者进行了抽奖,共有30位学生获得500元或1000元不等的现金奖励。相对于现金激励,实物激励的影响更为分化,一件礼物,有的人非常喜欢,而在另一些人那里则可能带来负面的影响。总体而言,纪念品的质量非常关键,一定要慎重选择。已经毕业学生对补贴的重视程度也更为分化,有部分学生主动放弃补助,并愿意将补助捐献给其他机构和组织。总体上看,随着物价水平的提高,大家对于补助水平的期望也有所提高。

数据收集的过程也是首都大学生成长追踪调查逐步发展和完善调查管理系统的过程。通过网络来收集信息,需要有问卷系统、通知系统、催访记录系统、报酬发放系统、进度控制系统等多个系统和平台的配套和合作。在Limesurvey(http://www.limesurvey.org)基础上,我们发展出催访过程记录系统,对访问员与受访者沟通联系的过程进行记录,从而更好地进行进度和质量的控制。此外,通知平台也与问卷调查系统日益整合。这些都需要信息及网络技术人才的支持。在互联网经济快速发展,市场薪资日渐高涨的情况下,高校如何加大投入,并进行科研体制调整,通过何种形式购买此类专业技术支持或引进相关人才并发挥其长处是值得研究的问题。社会科学研究数据收集的专业化和现代化是近年来中国高校社科发展的重要潮流。相关高校和研究院所都成立了专业的调查机构与数据中心。如何立足于实际情况,找准各自的定位和最优发展路径,并与兄弟单位协作多赢是需要多方共同努力的事情。调查技术的信息化就是合作的重要方面。

数据收集好之外,数据的清理工作可以极大地提高数据的可用性。在第一、二轮数据收集录入后,我们通过各种信息进行了案例的匹配。自动匹配不成功的案例通过查验扫描版问卷的方式进行确定。后两轮调查数据则通过事先生成的密码数据表进行自动匹配。数据的清理使用Stata软件进行,并做了详细的文档说明。目前已经形成了四轮调查的长数据(long data)格式(见表1—6):

表1—6 首都大学生成长追踪调查数据集形式

所有在多轮调查中收集的变量统一了变量名,并在变量标签中标示了出现的轮次。提供给研究者使用的数据中,我们删除了所有涉及个人隐私或可能定位个人的信息,如工作单位名称、海外大学名称、过高的家庭收入,当然更包括个人的联系方式、家庭住址、具体的学生干部职位等等。数据清理的具体规则和过程,我们会在适当的时候公布相关的文档。有关首都大学生成长追踪调查项目的更多信息,可以浏览http://www.chinaeps.org。


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号