如果说0.5%的概率连续抽中不太现实,那么如果是99%的概率,连续抽中60万次的可能性有多大呢?实际上,也只有0.24%,60万次的话就要在这个基础上除以1 000,这又是一个称得上是奇迹的概率。
为了使计算的过程更简单,我们经常能够见到以“调查对象全部准确”为例进行命题,但即便不是那样,对10万人进行调查的话,调查结果和真正的结果之间出现1%误差的概率,也是非常小的。
实际上在计算误差的时候,并不是像这样直接地进行概率计算,而是通过图2–2所示的公式来进行计算的。
比如之前提到过的那个例子,总人数即美国的所有人口数也就是1.2亿,真实比率则是“真实失业率”的值。当然这个值我们并不知道,我们只要填入通过抽样调查得到的失业率数值即可,基本上填上这个值是不会错的。
因为在真实比率达到50%的时候,“标准误差”值为最大,所以如果不放心的话可以用50%这个值进行计算,用“能够想到的最大标准误差”进行判断,这也是一种慎重的做法。
为什么真实比率达到50%的时候,标准误差最大呢?因为0.5×(1–0.5)所得到的结果比0.6×(1–0.6)和0.3×(1–0.3)所得到的结果都大,因此我们选择50%作为最大值的标准。
至于标准误差的使用方法,因为从抽样调查中得到的比率(比如说失业率)是用标准误差除以2得到的数值,因此只要将算出的标准误差结果乘以2就是真实比率的范围。这一数据的可信度高达95%。
比如说抽样调查的结果显示失业率为25%,假设其标准误差为0.5%,那么全面调查得到的真实失业率数值应该在24%~26%之间,这一事实早已在80多年以前就已经被统计学家们证明过了。