穿孔卡片上记录的数据可以非常简单地记录在只读光盘(CD–ROM)或者硬盘上,数据输入也可以看着画面非常简单地进行。获得的数据可以通过互联网非常方便地收集和传送,至于统计分析,不仅可以通过个人电脑来进行,甚至连现在的智能手机都能够胜任。
以前的统计学家们常用的研究方法有两种,或者省去计算的麻烦直接进行类似的准确度较高的推测,或者尽可能少地对数据进行计算并得出准确度较高的推测,但是这些研究方法现在基本上已经不会出现在实际分析当中。随着计算机技术的进步,不管是庞大的数据还是繁杂的计算,都已经不再是统计分析的瓶颈。
另外,以前的统计学教育只能依靠黑板和粉笔,或者纸和笔,主要以理解算式,对几十个数据进行手工计算和分析为主。但是,现在的统计分析只需要写一个简单的程序,或者使用现成的统计分析工具,对大规模的数据进行实际分析也成为可能。
虽然我们现在主要使用的统计学思考方法和分析方法,早在几十年前就已经基本完成,但是像现在这样让每个人都能够随时随地地简单使用,还是在20世纪末计算机技术发生革命性进步之后,才得以实现的。
以前的纸和笔的统计学与现代的计算机统计学之间存在着巨大的差距,现代的统计学家必须在精通数理知识的同时,还掌握计算机技术的应用。
如果本书的读者朋友们在大学时代对统计学课程留下了一种无聊的印象,那么可能是因为只接受过“纸和笔的统计学”教育,所以对于一直在时代最前沿给出最佳解答的计算机统计学的力量没有切身感受,这也是情有可原的。
“大数据”时代浓浓的统计学气息
统计学在近几年的变化,可以说受计算机的影响最为强烈。
计算机使商业模式发生了翻天覆地的变化。商品的采购、库存、销售等记录基本上全都已经数据化,成本和销量的把控与用纸笔进行管理的时代相比也变得更加简单。顾客资料与消费记录、工作人员的工作时间与评定、健康状态、支付的报酬与成本核算等信息,都可以存储在公司内部系统和Excel电子表格中。为了生产而进行的机械操作、到自己公司网站的链接,基本上所有的登录情况都会被记录下来,必要时可以综合统计作为经营的参考。就算说那些大型公司几乎所有的业务流程已经全部实现电子化,也不为过。