第1章 大数据时代,要懂点统计学 1
1.1 真实的数据也会说谎 2
1.2 那些不会统计学的倒霉蛋 4
◎ 1.2.1 重新解读“小马过河” 4
◎ 1.2.2 名校毕业生的收入有这么高吗 5
◎ 1.2.3 男女比例会有不同吗 7
1.3 数据虽好,但分析更重要 9
◎ 1.3.1 不可忽视的数据清理工作 9
◎ 1.3.2 分析数据也要考虑具体情境 10
◎ 1.3.3 合适的图表——数据的可视化 11
1.4 统计学,就是在玩数据 14
1.5 大数据时代下,统计学该怎么玩 15
第2章 不讲道理的统计陷阱 19
2.1 用来忽悠人的平均数 20
◎2.1.1 老板给的“平均工资”靠谱吗 20
◎2.1.2 广告营销中的平均数 22
◎2.1.3 这些比平均数更值得看 24
2.2 让你产生错觉的百分比 27
◎2.2.1 商品的折扣等于实惠吗 27
◎2.2.2 测测你的概率思维 29
◎2.2.3 相对数和百分比 31
2.3 有失偏颇的样本 33
◎2.3.1 出人意料的总统特朗普 33
◎2.3.2 不爱运动者的借口 35
◎2.3.3 什么样本才合理 36
2.4 分不清的相关和因果 38
◎2.4.1 冰激凌和犯罪有关系吗 39
◎2.4.2 汽车竟然对香草味过敏 40
◎2.4.3 相关和因果有何不同 42
2.5 不公平的比较 43
◎2.5.1 飞机变成了危险的交通工具 43
◎2.5.2 参军竟然更加安全 44
◎2.5.3 如何客观公正地比较 45
第3章 参差不齐的统计数据 49
3.1 数据与二手数据 50
◎3.1.1 数据到底是什么 50
◎3.1.2 我们周围有哪些二手数据 52
3.2 你是教练,会选择谁参赛 53
◎3.2.1 教练的烦恼,选择谁更合适 54
◎3.2.2 运动水平,应该怎么来衡量 54
◎3.2.3 成绩稳定性,又该如何来衡量 56
3.3 智商测验真的靠谱吗 60
◎3.3.1 智商测验里的偏差 60
◎3.3.2 误差,在所难免 62
3.4 更加公平的评分机制 63
◎3.4.1 “掐头去尾”的评分机制 63
◎3.4.2 加权的评分机制 66
第4章 充满随机的概率世界 69
4.1 哪种赌博赢的概率更大 70
◎4.1.1 哪种规则对庄家更有利 70
◎4.1.2 简单的概率计算 71
◎4.1.3 用概率来解决这个问题 73
4.2 傻傻分不清的加法和乘法 75
◎4.2.1 抛硬币中的概率学问 75
◎4.2.2 抽奖10次就一定能够中奖吗 77
◎4.2.3 概率不能够简单相加 78
4.3 用概率帮你相亲 80
◎4.3.1 如何选到最满意的TA 80
◎4.3.2 用概率做出选择 81
4.4 玩游戏也能玩出概率 86
◎4.4.1 “抛阶砖”的游戏 86
◎4.4.2 为什么“抛阶砖”难中奖 87
◎4.4.3 把问题转化为几何概率 89
4.5 黑天鹅事件与小概率 91
◎4.5.1 什么是黑天鹅事件 91
◎4.5.2 “黑天鹅”给我们的启示 93
第5章 估计未来的数学期望 95
5.1 两个赌徒如何分赌金 96
◎5.1.1 赌徒给数学家下了战书 96
◎5.1.2 数学家用期望解决了问题 96
◎5.1.3 数学期望到底是什么 99
5.2 做一个精明的求职者 101
◎5.2.1 面试机会多了,应该怎么办 101
◎5.2.2 利用期望来作出最合理的安排 102
5.3 找到最佳的理财方式 106
◎5.3.1 哪一种理财方式收益最大 106
◎5.3.2 用期望来作理财决策 108
5.4 支付宝集五福,你分到了多少 110
◎5.4.1 支付宝的两次“集五福”活动 110
◎5.4.2 估算“集五福”的期望收益 113
5.5 “最强大脑”也做错的题目 114
◎5.5.1 有趣的美女搭讪问题 114
◎5.5.2 “最强大脑”玛丽莲的做法 115
◎5.5.3 这个游戏到底公平吗 117
第6章 令人信服的统计规律 121
6.1 彩票倍投法为何不靠谱 122
◎6.1.1 彩票倍投的基本策略 122
◎6.1.2 用期望来分析倍投是否可靠 123
6.2 赌场为什么总能赚钱 126
◎6.2.1 不可忽视的赌场规则 126
◎6.2.2 大数法则,帮助赌场赚钱 127
6.3 所谓的股票“专家” 130
◎6.3.1 股票“专家”的常用套路 130
◎6.3.2 数据够大,你也可以成为股票“专家” 131
6.4 下一次,硬币哪一面朝上呢 133
◎6.4.1 下一次一定是正面朝上吗 133
◎6.4.2 概率和频率的暧昧关系 134
6.5 做老板要懂的统计规律 136
◎6.5.1 工厂老板应该开几台机器 136
◎6.5.2 有没有更好的方案呢 138
第7章 一叶知秋样本数据 143
7.1 “捉放法”来测鱼塘的产量 144
◎7.1.1 “捉放法”估算鱼的总数 144
◎7.1.2 “捉放法”的统计学原理 145
7.2 二战中德军到底有多少坦克 147
◎7.2.1 如何估计德军坦克总数 147
◎7.2.2 这个案例的启示 149
7.3 另类计算法 150
◎7.3.1 一般的方法 150
◎7.3.2 蒙特卡洛方法 152
◎7.3.3 计算圆周率的大小 153
7.4 随机化应答技术 155
◎7.4.1 遇到尴尬的问题,你会如何调查 155
◎7.4.2 随机化应答技术,化解尴尬 156
第8章 分辨真假的统计实验 161
8.1 大爷卖的枣儿甜吗 162
◎8.1.1 你猜大爷的枣儿甜不甜 162
◎8.1.2 用假设检验的方法分析 163
8.2 巧用铜钱鼓舞士气 166
◎8.2.1 狄青用计鼓舞士气 166
◎8.2.2 用假设检验的方法分析 167
8.3 经典案例:女士品茶 169
◎8.3.1 女士真有这种鉴别能力吗 170
◎8.3.2 费歇尔教授的实验 171
第9章 有趣的统计悖论 175
9.1 难倒一片的蒙提霍尔悖论 176
◎9.1.1 何为蒙提霍尔悖论 176
◎9.1.2 正确的解决思路 177
◎9.1.3 有趣的争议 179
9.2 出乎意料的生日悖论 180
◎9.2.1 生日同一天的概率有多大 180
◎9.2.2 为何会出现生日悖论 183
9.3 违反直觉的选举悖论 184
◎9.3.1 什么是选举悖论 184
◎9.3.2 分析选举悖论 184
第10章 挖掘数据的统计分析 189
10.1 最佳搭档:啤酒和尿布 190
◎10.1.1 啤酒和尿布的化学反应 190
◎10.1.2 挖掘数据,发现不一般的关系 191
◎10.1.3 留给今天的启示 192
10.2 住高压电线附近有害吗 193
◎10.2.1 学术界的两种不同观点 194
◎10.2.2 数据分析要小心 195