注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络数据库客户留存数据分析与预测

客户留存数据分析与预测

客户留存数据分析与预测

定 价:¥128.00

作 者: [美]卡尔·戈尔德 (Carl Gold)著,殷海英 译
出版社: 清华大学出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787302630807 出版时间: 2023-06-01 包装: 平装-胶订
开本: 16开 页数: 字数:  

内容简介

  对于任何依赖经常性收入和重复销售的企业来说,让客户保持活跃并持续购买是必不可少的。客户流失(或“流失”),这种代价高昂且令人沮丧的事情是可以预防的。通过使用本书中介绍的技术,你可以识别客户流失的预警信号,并学会在客户离开之前识别并挽留他们。 《客户留存数据分析与预测》向开发人员和数据科学家传授经过实践证明的技术与方法,可以在客户流失发生之前阻止其发生。本书包含很多来自现实中的示例,介绍如何将原始数据转换为可衡量的行为指标、计算客户生命周期价值,并使用人口统计数据改进客户流失预测。通过遵循 Zuora 首席数据科学家 Carl Gold 的方法,你将获得高客户留存率带来的优势。 主要内容 ● 计算流失指标 ● 通过客户行为预测客户流失 ● 使用客户细分策略减少客户流失 ● 将客户流失分析技术应用于其他业务领域 ● 使用人工智能技术进行准确的客户流失预测

作者简介

  Carl Gold是Zuora,Inc.的首席数据科学家。Zuora是一个综合订阅管理平台和新上市的硅谷独角兽公司,在全球拥有1000多家客户。Zuora的客户来自众多行业,包括软件(软件即服务,SaaS)、媒体、旅游服务、消费包装商品、云服务、物联网(Internet of Things,IoT)和电信运营商。Zuora在订阅和经常性收入方面是公认的领导者。Carl于2015年加入Zuora,担任首席数据科学家,并为Zuora的客户分析产品Zuora Insights开发了预测分析系统。

图书目录

第Ⅰ部分  构建自己的“装备库”
第1章  客户流失 3
1.1  为什么阅读本书 4
1.1.1  典型的客户流失场景 5
1.1.2  本书主要内容 6
1.2  对抗客户流失 6
1.2.1  减少客户流失的干预措施 7
1.2.2  为什么客户流失难以对抗 8
1.2.3  有效的客户指标:防止客户
流失的利器 11
1.3  本书为何与众不同 13
1.3.1  实用且透彻 13
1.3.2  模拟案例研究 14
1.4  具有重复用户交互性的产品 15
1.4.1  支付消费品的费用 16
1.4.2  B2B服务 16
1.4.3  客户流失与媒体广告 17
1.4.4  消费者订阅 17
1.4.5  免费增值商业模式 18
1.4.6  App内购买模式 18
1.5  非订阅服务的客户流失场景 18
1.5.1  将“不活跃”看作“流失” 18
1.5.2  免费试用转换 19
1.5.3  upsell和down sell 19
1.5.4  其他“是/否”客户预测 19
1.5.5  用户行为预测 20
1.5.6  其他与客户流失不同的用例 20
1.6  消费者行为数据 20
1.6.1  常见客户事件 20
1.6.2  重要的事件 23
1.7  对抗客户流失的案例分享 24
1.7.1  Klipfolio 24
1.7.2  Broadly 25
1.7.3  Versature 26
1.7.4  社交网络模拟 27
1.8  使用客户指标进行
案例研究 27
1.8.1  利用率 28
1.8.2  成功率 30
1.8.3  单位成本 31
1.9  本章小结 34
第2章 测量流失率 35
2.1  定义流失率 38
2.1.1  计算流失率和留存率 39
2.1.2  流失率和留存率的关系 40
2.2  订阅数据库 40
2.3  基本的客户流失计算:
净留存率 42
2.3.1  净留存率计算 42
2.3.2  使用SQL计算净留存率 44
2.3.3  解释净留存率 47
2.4  标准流失率计算:基于客户
数量的流失 49
2.4.1  标准流失率定义 49
2.4.2  用于计算流失率的外连接 50
2.4.3  使用SQL计算标准流失率 51
2.4.4  何时使用标准流失率 53
2.5  基于事件的非订阅产品
流失率 53
2.5.1  通过事件确定活跃客户和
流失客户 54
2.5.2  使用SQL计算基于客户活跃度
的流失率 54
2.6  高阶流失率:MRR流失率 56
2.6.1  MRR流失率的定义和计算 57
2.6.2  使用SQL计算MRR流失率 58
2.6.3  MRR流失率、客户数流失率与
净流失率 60
2.7  流失率测量转换 61
2.7.1  幸存者分析(高级) 61
2.7.2  流失率转换 63
2.7.3  通过SQL对任意时间窗口内的
流失率进行转换 64
2.7.4  选择流失率测量窗口 65
2.7.5  季节性和流失率 66
2.8  本章小结 67
第3章 客户指标计量 69
3.1  从事件到指标 71
3.2  事件数据仓库模式 72
3.3  统计某个时间段内的事件 74
3.4  指标周期定义的详细信息 76
3.4.1  行为周期 76
3.4.2  用于指标测量的时间戳 77
3.5  在不同时间点测量 78
3.5.1  重叠测量窗口 78
3.5.2  时序指标测量 81
3.5.3  保存测量指标 81
3.5.4  保存模拟示例的指标 83
3.6  测量事件属性的总数和
平均值 84
3.7  指标质量保证 85
3.7.1  测量指标如何随时间变化 85
3.7.2  QA案例研究 88
3.7.3  检查指标覆盖率 90
3.8  事件QA 92
3.8.1  检查事件如何随时间变化 92
3.8.2  检查每个账户的事件 95
3.9  选择行为测量的测量周期 97
3.10  测量账户使用期 99
3.10.1  账户使用期定义 99
3.10.2  账户使用期的递归CTE 101
3.10.3  账户使用期SQL程序 103
3.11  测量MRR和其他订阅
指标 106
3.11.1  计算MRR并作为指标 106
3.11.2  特定数量的订阅 108
3.11.3  计算订阅单元数量并作为
指标 109
3.11.4  计算计费周期并作为
指标 110
3.12  本章小结 112
第4章 观察续订与流失 115
4.1  数据集介绍 116
4.2 如何观察客户 117
4.2.1  提前进行观察 117
4.2.2  观察续订和流失的顺序 119
4.2.3  创建订阅数据集 120
4.3  从订阅中识别活跃期 121
4.3.1  活跃期 121
4.3.2  用于存储活跃期的模式 122
4.3.3  寻找正在进行的活跃期 123
4.3.4  找到以客户流失为结束的
活跃期 124
4.4  识别非订阅产品的活跃期 128
4.4.1  活跃期定义 128
4.4.2  从事件生成数据集的过程 129
4.4.3  用于计算活跃周的SQL 130
4.5  选择观察日期 132
4.5.1  平衡流失和非流失观察 132
4.5.2  选择观察日期的算法 133
4.5.3  计算观察日期的SQL程序 134
4.6  探索客户流失数据集 137
4.7  导出当前客户进行细分 141
4.7.1  选择活跃账户和指标 141
4.7.2  通过指标来细分客户 143
4.8  本章小结 143
第Ⅱ部分 动手实践
第5章 通过指标理解客户流失和
客户行为 147
5.1  指标队列分析 149
5.1.1  队列分析背后的思想 150
5.1.2  使用Python进行队列分析 152
5.1.3  产品使用队列 155
5.1.4  账户使用期队列 157
5.1.5  计费周期的队列分析 159
5.1.6  小队列规模 160
5.1.7  显著和不显著的队列差异 161
5.1.8  具有大量零客户指标的指标
队列 162
5.1.9  因果关系:指标是否会导致
客户流失 163
5.2  总结客户行为 164
5.2.1  了解指标的分布 164
5.2.2  用Python计算数据集汇总统计
信息 166
5.2.3  筛选罕见指标 168
5.2.4  邀请业务人员共同保证数据
质量 168
5.3  指标分数 169
5.3.1  指标分数背后的想法 169
5.3.2  指标分数算法 170
5.3.3  使用Python计算指标分数 171
5.3.4  使用评分指标进行队列
分析 173
5.3.5  MRR的队列分析 175
5.4  删除无效的观察 176
5.4.1  从流失分析中删除非付费
客户 177
5.4.2  在Python中根据指标阈值
删除观察 178
5.4.3  从罕见指标分析中删除零
测量值 179
5.4.4  脱离行为:与流失率增加相关
的指标 180
5.5  使用队列分析细分客户 182
5.5.1  细分过程 182
5.5.2  选择细分标准 182
5.6  本章小结 183
第6章 客户行为之间的关系 185
6.1  行为之间的相关性 186
6.1.1  “指标对”之间的相关性 186
6.1.2  使用Python计算相关性 190
6.1.3  使用相关性矩阵了解指标集
之间的相关性 191
6.1.4  案例研究的相关性矩阵 193
6.1.5  在Python中计算相关性矩阵 194
6.2  对行为指标组计算平均值 196
6.2.1  为什么要计算相关性指标分数
的平均值 196
6.2.2  使用载荷矩阵(权重矩阵)
计算平均分数 197
6.2.3  载荷矩阵的案例研究 198
6.2.4  在Python中应用载荷矩阵 200
6.2.5  基于指标组平均分数的流失
队列分析 202
6.3  发现相关性指标组 204
6.3.1  通过聚类对指标进行相关性
分组 204
6.3.2  在Python中计算聚类相关性 206
6.3.3  将分数的平均值作为分数载荷
矩阵的权重 211
6.3.4  运行指标分组及分组队列分析
列表 212
6.3.5  为聚类选择相关性阈值 213
6.4  向业务人员解释相关性
指标组 215
6.5  本章小结 217
第7章 使用高级指标对客户
进行细分 219
7.1  比率指标 221
7.1.1  何时以及为什么使用比率
指标 221
7.1.2  如何计算比率指标 224
7.1.3  比率指标案例研究 229
7.1.4  模拟社交网络的其他比率指标 231
7.2  指标占比 232
7.2.1  计算指标占比 232
7.2.2  案例研究:带有两个指标的
总指标百分比 235
7.2.3  带有多个指标的总指标百分比
案例研究 237
7.3  衡量变化的指标 238
7.3.1  衡量活跃水平的变化 238
7.3.2  具有异常值(肥尾)的
指标分数 242
7.3.3  测量自上次活跃事件发生
以来的时间 246
7.4  缩放指标时间段 249
7.4.1  将较长周期的指标转换为
较短的引用周期指标 250
7.4.2  估算新账户的指标 253
7.5  用户指标 258
7.5.1  测量活跃用户 258
7.5.2  活跃用户指标 260
7.6  比率选择 262
7.6.1  为什么使用比率,还有什么
选择 262
7.6.2  使用哪些比率 263
7.7  本章小结 264
第Ⅲ部分 特殊技巧与方法
第8章 预测客户流失 269
8.1  通过模型预测流失 270
8.1.1  用模型进行概率预测 270
8.1.2  客户参与和留存率 271
8.1.3  参与度和客户行为 272
8.1.4  偏移量将观察到的流失率与
S曲线相匹配 274
8.1.5  逻辑回归概率计算 275
8.2  审查数据准备 276
8.3  拟合客户流失模型 279
8.3.1  逻辑回归的结果 279
8.3.2  逻辑回归代码 281
8.3.3  解释逻辑回归结果 284
8.3.4  逻辑回归案例分析 286
8.3.5  模型校准和历史流失概率 288
8.4  预测客户流失概率 289
8.4.1  准备当前客户数据集以
进行预测 289
8.4.2  准备当前客户数据用于
客户细分 294
8.4.3  使用保存的模型进行预测 294
8.4.4  案例学习:预测 297
8.4.5  预测校准和预测漂移 298
8.5  流失预测的陷阱 300
8.5.1  相关性指标 300
8.5.2  异常值 302
8.6  客户生命周期价值 306
8.6.1  CLV的含义 306
8.6.2  从客户流失到预期客户
生命周期 308
8.6.3  CLV公式 309
8.7  本章小结 310
第9章 预测准确性和机器学习 313
9.1  衡量客户流失预测的
准确性 314
9.1.1  为什么不使用标准准确度
测量来衡量流失率 314
9.1.2  使用AUC衡量客户流失预测
的准确性 317
9.1.3  使用提升测量客户流失预测
的准确性 319
9.2  历史准确性模拟:回测 323
9.2.1  什么是回测以及为什么
进行回测 324
9.2.2  回测代码 325
9.2.3  回测注意事项和陷阱 327
9.3  回归控制参数 328
9.3.1  控制回归权重的强度和数量 328
9.3.2  带有控制参数的回归 329
9.4  通过测试选择回归参数
(交叉验证) 331
9.4.1  交叉验证 331
9.4.2  交叉验证代码 332
9.4.3  回归交叉验证案例研究 336
9.5  使用机器学习预测客户
流失风险 336
9.5.1  XGBoost学习模型 337
9.5.2  XGBoost 交叉验证 338
9.5.3  比较XGBoost与回归的
准确度 341
9.5.4  高级指标和基本指标的比较 342
9.6  利用机器学习预测对客户
进行细分 344
9.7  本章小结 346
第10章 客户流失的人口统计特征
和企业统计特征 347
10.1  人口统计和企业统计
数据集 348
10.1.1  人口统计学和企业统计数据
的类型 348
10.1.2  社交网络模拟的账户数据
模型 349
10.1.3  人口统计数据集的SQL 350
10.2  具有人口统计和企业统计
类别的流失队列 353
10.2.1  人口统计类别的流失率
队列 353
10.2.2  流失率置信区间 354
10.2.3  将人口统计队列与置信区间
进行比较 355
10.3  对人口统计类别进行
分组 361
10.3.1  用映射字典表示分组 361
10.3.2  分组类别的队列分析 362
10.3.3  设计类别分组 364
10.4  基于日期和数字的人口统计
数据的流失分析 366
10.5  利用人口统计数据进行
流失率预测 367
10.5.1  将文本字段转换为虚拟
变量 367
10.5.2  仅用分类虚拟变量预测
流失率 370
10.5.3  将虚拟变量与数值数据
相结合 372
10.5.4  结合人口统计数据和指标以
预测客户流失 375
10.6  使用人口统计数据细分
当前客户 378
10.7  本章小结 383
第11章 对抗客户流失 385
11.1  计划你自己的对抗客户
流失策略 385
11.1.1  数据处理和分析代码清单 387
11.1.2  用于与业务人员沟通的
检查清单 389
11.2  使用你自己的数据运行
本书的代码清单 391
11.2.1  将数据加载到本书的数据
schema中 391
11.2.2  在你自己的数据上运行程序 392
11.3  将本书的程序移植到不同
的环境中 393
11.3.1  移植SQL程序 393
11.3.2  移植Python程序 393
11.4  了解更多并保持联络 394
11.4.1  作者的博客网站和社交
媒体 394
11.4.2  客户流失基准信息的
来源 394
11.4.3  有关客户流失的其他
信息来源 395
11.4.4  帮助减少客户流失的产品 395
11.5  本章小结 395
 
 

本目录推荐