目 录
译者序
第1章 引言 1
第2章 去标识 3
2.1 关联攻击 4
2.1.1 重标识出Karrie有多难 5
2.1.2 Karrie很特别吗 7
2.1.3 可以重标识出多少个个体 8
2.2 聚合 10
2.2.1 小分组问题 10
2.2.2 差分攻击 11
2.3 总结 12
第3章 k-匿名性 13
3.1 验证k-匿名性 14
3.2 泛化数据以满足k-匿名性 15
3.3 引入更多的数据可以减小泛化的影响吗 17
3.4 移除异常值 19
3.5 总结 20
第4章 差分隐私 21
4.1 拉普拉斯机制 22
4.2 需要多大的噪声 24
第5章 差分隐私的性质 25
5.1 串行组合性 25
5.2 并行组合性 29
5.2.1 直方图 30
5.2.2 列联表 31
5.3 后处理性 32
第6章 敏感度 35
6.1 距离 36
6.2 计算敏感度 37
6.2.1 计数问询 37
6.2.2 求和问询 38
6.2.3 均值问询 39
6.3 裁剪 40
第7章 近似差分隐私 45
7.1 近似差分隐私的性质 46
7.2 高斯机制 46
7.3 向量值函数及其敏感度 48
7.3.1 L1和L2范数 48
7.3.2 L1和L2敏感度 48
7.3.3 选择L1还是L2 49
7.4 灾难机制 49
7.5 高级组合性 50
7.6 近似差分隐私的高级组合性 53
第8章 局部敏感度 55
8.1 均值问询的局部敏感度 56
8.2 通过局部敏感度实现差分隐私 57
8.3 平滑敏感度 60
8.4 采样-聚合框架 62
第9章 差分隐私变体 67
9.1 最大散度和瑞丽散度 70
9.2 瑞丽差分隐私 71
9.3 零集中差分隐私 72
9.4 不同差分隐私变体的组合性 73
第10章 指数机制 77
10.1 有限集合的指数机制 78
10.2 报告噪声最大值 79
10.3 将指数机制作为差分隐私的基本机制 81
第11章 稀疏向量技术 83
11.1 高于阈值算法 83
11.2 应用稀疏向量技术 85
11.3 返回多个问询结果 89
11.4 应用:范围问询 91
第12章 算法设计练习 93
12.1 需要考虑的问题 93
12.2 更普适的采样-聚合算法 93
12.3 汇总统计 94
12.4 频繁项 95
12.5 分层查询 95
12.6 一系列范围问询 96
?12.6.1 第1部分 96
?12.6.2 第2部分 96
?12.6.3 第3部分 96
第13章 机器学习 97
13.1 使用scikit-learn实现逻辑回归 98
13.2 模型是什么 99
13.3 使用梯度下降训练模型 100
?13.3.1 单步梯度下降 102
?13.3.2 梯度下降算法 103
13.4 差分隐私梯度下降 104
?13.4.1 梯度裁剪 105
?13.4.2 梯度的敏感度 108
13.5 噪声对训练的影响 110
第14章 本地差分隐私 113
14.1 随机应答 114
14.2 一元编码 118
第15章 合成数据 125
15.1 合成表示:直方图 126
15.2 增加差分隐私 127
15.3 生成列表数据 129
15.4 生成更多数据列 131
15.5 总结 134
参考文献 135