统计资料(statistics),即被汇集起来并加以归类的数字形式的信息,是社会科学家在理解社会关系和社会过程时所需的一种信息类型。虽然统计资料不能让我们直接测量诸如好公民、快乐或幸福这样的基本社会价值,但它们在测量构成社会生活基础的其他因素时很有用,比如说一个国家的人口规模,或者是收入低于贫困线水平的家庭的数量。统计关系也能帮助我们洞悉社会问题。如果我们发现少年拘留中心里来自破碎家庭的男孩的比例,大大高于全国人口中来自破碎家庭的男孩的比例,那么这就意味着家庭破裂可能是造成青少年犯罪的重要原因。不过,我们必须小心谨慎地解释统计资料,因为人们很容易用统计资料去解释它们其实无法证明的结论。况且,人们有时候可能操纵统计资料,以便用它们去说明我们想让它们说明的东西。
统计除了能测量社会活动的结果、显示发展趋势之外,还有其他用途,那就是检验理论与揭示关系。例如,相关性是指两组数据之间的关系,两组数据之间高度相关说明,如果其中一组中的一个要素升高,它在另一组中的相应要素也可能升高,其他数据则决定了我们能在多大程度上确定这样一种关系。我们不打算在此讨论这些统计,因为一门介绍性的社会科学课程不是学习统计的地方,而是让你知晓存在这类用来检验关系的技术,知道此技术将来可能值得你去研究。
如果要采用统计方法,我们必须有数据。数据是指描述一个活动、事件或情况的原始数字。社会科学家的数据,是通过测量和计算某一具体事件中的全部事实而获得的,例如,我们可能发现“1991年有x起谋杀和y起自杀。”获得数据的一种方法是展开统计调查(survey),即通过问卷或访谈的手段从个人或机构那里收集数据。举例来说,我们可以开展一项统计调查,向挑选出的对象询问或打听他们的收入、对某些事件的看法、打算投票给哪一个政党候选人等。图1.2给出了这样一个统计调查的范例。统计可以告诉我们,如果想让统计结果反应整个群体的看法,我们必须调查多大比例的人口,像盖洛普或哈里斯民意测验这类统计调查就广泛使用了这种技术。
计算机已经极大地方便了、因而也极大扩展了统计的运用。电脑使我们有可能迅速而有条理地记录、排列和重新排列浩瀚的信息。今天,任何人都可以利用计算机或别的上网渠道获得海量数据和其他资源。
随着社会数据的膨胀和计算能力的大大增强,社会科学家越来越有可能单凭数据去寻找关系,而不是通过理论指导去寻找。有的社会科学家利用高度错综复杂的统计技术分析数据,寻找模式,当他们发现某种模式之后,再为这一模式配上一种理论。例如,社会科学家史蒂芬·列维特(Stephen Levitt)和约翰·多诺霍(John Donohue)通过数据的搜索,找到了美国堕胎合法化与后来犯罪率下降之间的关联。基于这一证据,他们主张,由于堕胎减少了父母生下不想要的孩子的现象,于是那些出生的孩子就能得到更多的教导,因此,20世纪 90年代美国犯罪率下降的最主要原因是堕胎合法化,而不是法律在实施上有任何变化或者罪犯入狱数量的减少。