注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络软件与程序设计智能风控:Python金融风险管理与评分卡建模

智能风控:Python金融风险管理与评分卡建模

智能风控:Python金融风险管理与评分卡建模

定 价:¥89.00

作 者: 梅子行,毛鑫宇 著
出版社: 机械工业出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787111653752 出版时间: 2020-06-01 包装: 平装
开本: 16开 页数: 字数:  

内容简介

  本书基于Python讲解了信用风险管理和评分卡建模,用漫画的风格,从风险业务、统计分析方法、机器学习模型3个维度展开,详细讲解了信用风险量化相关的数据分析与建模手段,并提供大量的应用实例。作者在多加知名金融公司从事算法研究多年,经验丰富,本书得到了学术界和企业界多位金融风险管理专家的高度评价。全书一共9章,首先介绍了信用风险量化的基础,然后依次讲解了信用评分模型开发过程中的数据处理、用户分群、变量处理、变量衍生、变量筛选、模型训练、拒绝推断、模型校准、决策应用、模型监控、模型重构与迭代、模型报告撰写等内容。 所有章节都由问题、算法、案例三部分组成,针对性和实战性都非常强。

作者简介

  梅子行 资深风控技术专家、AI技术专家和算法专家,历任多家知名金融科技公司的算法研究员、数据挖掘工程师。师承Experian、Discover等企业的资深风控专家,擅长深度学习、复杂网络、迁移学习、异常检测等非传统机器学习方法,热衷于数据挖掘以及算法的跨领域优化实践。 著有畅销书《智能风控:原理、算法与工程实践》,是本书的姊妹篇。 公众号与知乎专栏:“大数据风控与机器学习”。 毛鑫宇 资深品牌视觉设计师、插画设计师。曾任职国内知名文旅公司品牌设计师,设计打造知名文化旅游目的地及品牌设计案例,作为插画设计师完成《智能风控:原理、算法与工程实践》一书。擅长品牌视觉设计、IP形象设计、插画设计,致力于用设计创造价值,让设计在跨领域合作中碰撞出更多的可能性。站酷设计师主页为“白鸽巡游记”。

图书目录

推荐序

前言

第1章 信用管理基础 /1

1.1 信用与管理 /2

1.2 风控术语解读 /3

 1.2.1 信贷基础指标 /4

 1.2.2 信贷风险指标 /5

1.3 企业信贷风控架构 /7

1.4 本章小结 /10

第2章 评分卡 /11

2.1 评分卡概念 /12

 2.1.1 适用客群 /13

 2.1.2 用途 /14

2.2 建模流程 /15

2.3 模型设计 /16

 2.3.1 业务问题转化 /17

 2.3.2 账龄分析与时间窗口设计 /17

 2.3.3 数据集切分 /19

 2.3.4 样本选择 /20

 2.3.5 采样与加权 /21

2.4 数据与变量解读 /25

2.5 本章小结 /26

第3章 机器学习 /27

3.1 基本概念 /28

 3.1.1 空间表征 /29

 3.1.2 模型学习 /31

 3.1.3 模型评价 /32

3.2 广义线性模型 /33

 3.2.1 多元线性回归模型 /34

 3.2.2 经验风险与结构风险 /35

 3.2.3 极大似然估计 /38

3.3 逻辑回归 /39

 3.3.1 sigmoid函数 /40

 3.3.2 最大似然估计 /41

 3.3.3 多项逻辑回归学习 /41

 3.3.4 标准化 /42

3.4 性能度量 /44

 3.4.1 误差 /45

 3.4.2 混淆矩阵与衍生指标 /45

 3.4.3 不均衡模型评价 /48

 3.4.4 业务评价 /52

3.5 上线部署与监控 /55

 3.5.1 上线部署 /55

 3.5.2 前端监控 /57

 3.5.3 后端监控 /59

3.6 迭代与重构 /61

 3.6.1 模型迭代 /61

 3.6.2 模型重构 /62

3.7 辅助模型 /62

 3.7.1 XGBoost /63

 3.7.2 模型解释性 /74

 3.7.3 因子分解机 /81

3.8 模型合并 /82

3.9 本章小结 /86

第4章 用户分群 /87

4.1 辛普森悖论 /88

4.2 监督分群 /90

 4.2.1 决策树原理 /90

 4.2.2 决策树分群 /92

 4.2.3 生成拒绝规则 /95

4.3 无监督分群 /105

 4.3.1 GMM原理 /106

 4.3.2 GMM分群 /107

4.4 用户画像与聚类分析 /108

 4.4.1 数据分布可视化 /109

 4.4.2 K均值聚类 /110

 4.4.3 均值漂移聚类 /111

 4.4.4 层次聚类 /113

 4.4.5 tSNE聚类 /114

 4.4.6 DBSCAN聚类 /115

 4.4.7 方差分析 /117

4.5 本章小结 /119

第5章 数据探索与特征工程 /120

5.1 探索性数据分析 /121

 5.1.1 连续型变量 /122

 5.1.2 离散型变量 /123

 5.1.3 代码实现 /123

5.2 特征生成 /126

 5.2.1 特征聚合 /127

 5.2.2 特征组合 /145

5.3 特征变换 /147

 5.3.1 卡方分箱 /148

 5.3.2 聚类分箱 /150

 5.3.3 分箱对比 /151

 5.3.4 箱的调整 /154

 5.3.5 两种特殊的调整方法 /156

 5.3.6 WOE映射 /158

5.4 本章小结 /158

第6章 特征筛选与建模 /159

6.1 初步筛选 /160

 6.1.1 缺失率 /160

 6.1.2 信息量 /161

 6.1.3 相关性 /162

 6.1.4 代码实现 /163

6.2 逐步回归 /164

 6.2.1 F检验 /165

 6.2.2 常见逐步回归策略 /165

 6.2.3 检验标准 /166

 6.2.4 代码实现 /167

6.3 稳定性 /167

6.4 负样本分布图 /169

6.5 评分卡案例 /171

6.6 本章小结 /189

第7章 拒绝推断 /190

7.1 偏差产生的原因 /191

7.2 数据验证 /193

7.3 标签分裂 /193

7.4 数据推断 /195

 7.4.1 硬截断法 /195

 7.4.2 模糊展开法 /198

 7.4.3 重新加权法 /199

 7.4.4 外推法 /200

 7.4.5 迭代再分类法 /202

7.5 本章小结 /204

第8章 模型校准与决策 /205

8.1 模型校准的意义 /206

8.2 校准方法 /207

 8.2.1 通用校准 /208

 8.2.2 多模型校准 /210

 8.2.3 错误分配 /214

 8.2.4 权重还原 /215

8.3 决策与应用 /215

 8.3.1 最优评分切分 /216

 8.3.2 交换集分析 /216

 8.3.3 人工干预 /218

8.4 本章小结 /219

第9章 模型文档 /220

9.1 模型背景 /221

9.2 模型设计 /222

 9.2.1 模型样本 /222

 9.2.2 坏客户定义 /222

9.3 数据准备 /223

 9.3.1 数据提取 /223

 9.3.2 历史趋势聚合 /224

 9.3.3 缺失值与极值处理 /224

 9.3.4 WOE处理 /225

9.4 变量筛选 /225

 9.4.1 根据IV值进行初筛 /226

 9.4.2 逐步回归分析 /226

 9.4.3 模型调优 /226

9.5 最终模型 /227

 9.5.1 模型变量 /227

 9.5.2 模型表现 /228

 9.5.3 模型分制转换 /228

9.6 表现追踪 /228

9.7 附件 /229

9.8 本章小结 /231

本目录推荐