前 言
第1章 互联网广告与营销1
1.1 营销、广告与流量1
1.1.1 营销、广告、流量的定义2
1.1.2 流量的价值3
1.1.3 流量商业化变现模式3
1.1.4 自然流量和广告流量6
1.1.5 流量质量和无效流量7
1.2 互联网广告营销基础知识9
1.2.1 互联网广告发展史10
1.2.2 主流广告形式11
1.2.3 广告营销参与方14
1.2.4 归因分析模型17
1.2.5 计费方式和作弊风险20
1.3 互联网广告营销形势23
1.3.1 营收发展形势24
1.3.2 新媒体创新形势25
1.3.3 监管合规形势26
1.4 本章小结27
第2章 广告与营销黑灰产业链28
2.1 营销的人、货、场28
2.1.1 人:用户需求29
2.1.2 货:精准获客30
2.1.3 场:流量为王30
2.2 广告与营销的利益链31
2.2.1 商家视角的利益和风险32
2.2.2 渠道视角的利益和风险43
2.2.3 用户视角的利益和风险48
2.2.4 平台视角的利益和风险51
2.3 黑灰产作弊上下游链路55
2.3.1 黑灰产上游55
2.3.2 黑灰产中游63
2.3.3 黑灰产下游65
2.4 本章小结66
第3章 广告与营销领域的立体风控思路67
3.1 广告与营销风控范畴67
3.1.1 流量反作弊67
3.1.2 内容风控68
3.2 风控业务生命周期70
3.2.1 事前阶段71
3.2.2 事中阶段73
3.2.3 事后阶段75
3.3 风控立体防御体系77
3.3.1 在线风控78
3.3.2 近线风控81
3.3.3 离线风控83
3.4 风控MLOps84
3.4.1 什么是风控MLOps85
3.4.2 风控MLOps流水线85
3.5 本章小结88
第4章 异常检测技术概述90
4.1 什么是异常检测90
4.1.1 有监督异常检测91
4.1.2 半监督异常检测91
4.1.3 无监督异常检测92
4.2 异常检测面临的问题和挑战92
4.2.1 异常的稀疏性92
4.2.2 异常的多样性93
4.2.3 异常的对抗性95
4.2.4 异常检测的鲁棒性96
4.2.5 异常检测的可解释性97
4.2.6 异常检测的可控制性99
4.3 基于规则的异常检测99
4.3.1 基于名单的规则99
4.3.2 基于窗口聚合的规则100
4.4 基于模型的异常检测101
4.5 本章小结102
第5章 基于概率统计的异常检测103
5.1 异常检测中的概率知识103
5.1.1 抛硬币问题103
5.1.2 独立同分布104
5.1.3 离散概率分布104
5.1.4 连续概率分布109
5.2 拟合优度114
5.2.1 卡方检验114
5.2.2 G检验116
5.2.3 K-S检验118
5.3 极值分析和尾概率约束119
5.3.1 马尔可夫不等式119
5.3.2 切比雪夫不等式121
5.3.3 切尔诺夫界123
5.3.4 中心极限定理124
5.4 多维随机变量异常检测125
5.4.1 COPOD126
5.4.2 ECOD134
5.5 集成决策方法135
5.5.1 Bagging135
5.5.2 Boosting136
5.5.3 Stacking137
5.6 本章小结138
第6章 基于近邻的异常检测139
6.1 LOF139
6.1.1 算法原理139
6.1.2 刷单骗补应用案例142
6.2 KNN144
6.2.1 K近邻分类144
6.2.2 K近邻距离度量145
6.3 ANN151
6.3.1 风险向量表示方法153
6.3.2 风险向量检索算法163
6.3.3 相似风险检索业务应用168
6.4 近邻聚类169
6.4.1 K-Means169
6.4.2 DBSCAN172
6.5 本章小结174
第7章 基于图的异常检测175
7.1 什么是图175
7.1.1 图的基本概念176
7.1.2 图的分类177
7.1.3 作弊图的构建分析178
7.2 作弊社区发现181
7.2.1 标签传播181
7.2.2 连通分量182
7.2.3 Louvain187
7.2.4 Fraudar190
7.3 图嵌入193
7.3.1 为什么需要图嵌入193
7.3.2 图嵌入方法194
7.3.3 风控应用场景202
7.4 本章小结207
第8章 基于时序的异常检测208
8.1 风控中的时序特征208
8.1.1 什么是时序特征208
8.1.2 时序特征工程210
8.2 基于时序的异常检测算法214
8.2.1 统计类算法215
8.2.2 深度学习类算法222
8.3 CEP技术226
8.4 本章小结228
第9章 内容风控技术229
9.1 文本风控230
9.1.1 关键词过滤230
9.1.2 文本分类237
9.1.3 相似文本检索242
9.2 图像风控246
9.2.1 图像分类247
9.2.2 图像检测251
9.2.3 图像检索253
9.2.4 OCR技术253
9.3 短视频和直播风控257
9.3.1 视频抽帧257
9.3.2 关键帧提取260
9.3.3 视频相似检索263
9.3.4 直播间风控264
9.4 本章小结268
第10章 广告与营销风控未来思考269
10.1 业务:理解业务,服务于业务269
10.2 数据:合规埋点和科学归因271
10.3 算法:经验驱动和数据驱动相结合274
10.4 系统:在线、近线、离线互补,可持续的架构277
10.5 AIGC:带来的新挑战279
10.6 本章小结281