大知识
大数据能为人类带来大知识,即通过对海量数据进行分析,以一种前所未有的方式获得深刻洞见。例如,2009年甲型H1N1流感爆发时,与习惯性滞后的官方数据相比,谷歌成为一个更有效、更及时的指示标。他们通过分析5 000万条美国人最频繁检索的词条,例如“哪些是治疗咳嗽和发热的药物”,建立了4.5亿个数学模型,并与美国疾控中心在2003~2008年季节性流感传播时期的数据进行比较,提前两周预测出流感的爆发时间和传播路径。这种工作方式不需要分发口腔试纸和联系医院,它是建立在大数据的基础之上的。基于这样的技术理念和数据储备,下一次流感来袭时,世界将拥有一种更好的预测工具预防流感的传播。
人们通过大数据获得的知识更快速、更准确、更便捷,而这些在传统的数据利用思维和技术的基础上是难以完成的。例如,个人收入对于银行放贷、社会保障等机构而言是一项关键数据。然而,收入又是一个比较敏感的话题,要调查个人收入,不仅过程烦琐、成本较高,而且还存在瞒报的可能。著名征信机构益百利有一项服务,即通过分析信用卡历史记录和美国国税局的匿名税收数据,对个人的收入状况进行较为精准的预测,其预测结果售价不足1美元,而通过传统的办法证明一个人的收入状况要花费10美元左右。
大数据使得组织决策将越来越依赖于数据和分析,而非经验和直觉。迈克尔·刘易斯于2003年出版的《点球成金》中讲述了棒球统计学的一个真实案例。该书的主角比利·比恩是一家棒球队的总经理,他在一位统计学家的帮助下,尽可能地将球员能力数据化,并以此作为衡量球员能力的唯一标准,而非基于主观经验的判断。通过这套计算机程序和数学模型,比利以有限的预算寻找那些被价值低估的球员,实现了最高的“投入产出比”,创下了美国职业棒球大联盟百年历史上的连胜20场的空前纪录。与那位统计学家相比,专业棒球星探们在挑选球员方面的精准程度相形见绌。
大价值
我们的日常生活会因为无处不在的大数据应用更加智能便捷。搜索引擎可以为关联网站排序;智能输入法能为用户创建个性化词典;豆瓣网为我们推荐想要看的电影和图书;微信自动推送好友信息,帮助我们建立朋友圈;电子邮箱自动过滤含有某些关键词的垃圾邮件;相亲网站通过计算用户的性格、教育背景、职业等匹配程度,提高男女配对成功的概率。