大数据征信及智能评估：征信大数据挖掘与智能分析技术

定　价：¥198.00

作　者：	孙圣力罗宁张福浩
出版社：	清华大学出版社
丛编项：
标　签：	暂缺

购买这本书可以去

ISBN：	9787302594666	出版时间：	2022-03-01	包装：	平装-胶订
开本：	16开	页数：		字数：

内容简介

　　本书聚焦于个人层面的信用违约技术研究、风险预警与监控系统的实现，但其中的技术也可以便捷地应用于企业征信。全书由浅入深、循序渐进地讲述了大数据时代下的征信技术。全书分为三个部分，部分是基础技术研究，介绍了征信业务中多源、多模态数据的融合方法，以及大数据征信模型的归因分析与解释性研究；第二部分是信用评估技术研究，包括大数据征信场景下时序数据的挖掘与分析，违约风险评估预警技术，以及不同区域的差异性对于信用情况的影响；第三部分聚焦于信用评估系统研发，从全局角度描述了一个信用评估与监控预警系统的实现。

作者简介

　　孙圣力，博士，北京大学副教授，南京博雅区块链研究院副院长，复旦大学计算机软件与理论专业博士；主要研究方向为大数据、数据科学、机器学习、智慧医疗、服务计算。罗宁，博士，高级工程师，现任职于中国科学院软件研究所；长期从事政府数据治理，金融信息安全及分布式计算方面的研究工作。张福浩，博士，中国测绘科学研究院地理空间大数据应用研究中心主任，自然资源部青年技术带头人；中国地理信息产业协会政务GIS委员会主任委员，发改委系统整合专家组成员。

图书目录

部分基础技术研究
第1章多源多模态征信大数据融合方法 2
1.1 多模态融合概述 3
1.1.1 研究背景与意义 3
1.1.2 研究现状 5
1.1.3 研究内容 10
1.2 多模态融合相关理论技术 12
1.2.1 众包标注 12
1.2.2 众包数据的消噪 13
1.2.3 图像分类 19
1.2.4 多模态数据融合 25
1.2.5 协同学习 29
1.3 基于协同学习技术的决策级融合方法 33
1.3.1 任务描述 33
1.3.2 多源同构数据融合方法：CT-MID 34
1.3.3 CT-MID模块说明 35
1.3.4 实验分析 41
1.3.5 方法分析 45
1.4 基于多模态适配器的特征级融合方法 50
1.4.1 任务描述 50
1.4.2 多源异构数据融合方法：MLP-Adapter 51
1.4.3 实验结果 55
1.5 基于协同学习的多源数据融合原型系统 59
1.5.1 系统组成单元 59
1.5.2 功能展示 61
第2章大数据征信归因分析及模型可解释性研究 66
2.1 大数据征信分析概述 67
2.1.1 研究背景与意义 67
2.1.2 研究现状 68
2.1.3 问题与挑战 72
2.1.4 研究内容 77
2.2 相关理论技术 78
2.2.1 特征选择方法 78
2.2.2 因果模型 81
2.2.3 模型的可解释方法 83
2.3 归因分析技术研究 87
2.3.1 归因分析总体流程设计 87
2.3.2 实验评估：归因分析 93
2.4 模型可解释性提升技术研究 101
2.4.1 可解释性提升方法设计 101
2.4.2 实验一：整体可解释性提升 107
2.4.3 实验二：个体可解释性提升 116
2.5 原型系统的设计与实现 124
2.5.1 系统业务流程设计 124
2.5.2 系统功能架构设计 126
2.5.3 效果展示 128
2.5.4 系统测试 135
第二部分信用评估技术研究
第3章基于时序行为分析的信用评估技术 140
3.1 时序行为信用评估概述 141
3.1.1 研究背景与意义 141
3.1.2 研究现状 142
3.1.3 研究内容 144
3.2 相关理论技术 144
3.2.1 基于神经网络的模型 144
3.2.2 图嵌入模型 149
3.3 数据准备与特征工程 152
3.3.1 数据准备 152
3.3.2 数据观察 154
3.3.3 数据清洗 156
3.3.4 特征工程 157
3.4 基于时序行为的征信评估模型设计 163
3.4.1 模型总体设计 163
3.4.2 基于Auto-Encoder LSTM模型的交易序列特征编码 164
3.4.3 基于Node2Vec模型的行为序列特征编码 168
3.4.4 基于特征融合的用户信用评估模型 173
3.5 模型验证与原型系统 176
3.5.1 模型验证 176
3.5.2 原型系统设计与实现 184
第4章征信大数据频繁模式与关联规则挖掘 192
4.1 征信大数据挖掘概述 193
4.1.1 研究现状 193
4.1.2 问题描述 197
4.1.3 研究内容 198
4.2 相关理论技术 198
4.2.1 数据融合的相关技术 198
4.2.2 动态关联规则挖掘的相关技术 203
4.3 多源征信大数据融合方法 207
4.3.1 数据融合 207
4.3.2 数据融合方法 209
4.3.3 多源异构数据的融合模型 212
4.3.4 实验结果与分析 217
4.4 结构化征信大数据动态关联规则挖掘算法 219
4.4.1 动态关联规则的形式化定义 219
4.4.2 与静态关联规则的比较 220
4.4.3 动态关联规则的评价 221
4.4.4 动态关联规则挖掘算法 221
4.4.5 实验结果与分析 224
4.5 流式半结构化征信大数据频繁项集挖掘算法 227
4.5.1 数据流与半结构化数据 227
4.5.2 树结构模型挖掘的相关定义 229
4.5.3 两个改进 230
4.5.4 改进的挖掘算法 235
4.6 实验结果与分析 238
4.6.1 实验数据 238
4.6.2 实验结果 238
第5章信用风险违约识别与预警技术 242
5.1 信用风险违约概述 243
5.1.1 研究背景与意义 243
5.1.2 研究现状 245
5.1.3 研究内容 250
5.2 相关理论技术 251
5.2.1 个人信用评估指标体系 251
5.2.2 个人信用评估模型技术 253
5.3 信用风险数据与数据预处理 263
5.3.1 数据来源 263
5.3.2 数据信息 265
5.3.3 缺失值分析 268
5.3.4 分类变量 270
5.3.5 连续变量的离散化 273
5.3.6 异常值处理 274
5.3.7 领域变量处理 276
5.4 个人信用风险违约识别与预警模型设计 276
5.4.1 模型设计分析 277
5.4.2 组合模型优化 279
5.4.3 D-S Stacking模型 282
5.5 模型验证与原型系统 288
5.5.1 系统业务流程 288
5.5.2 系统架构设计 290
5.5.3 原型系统效果评估 296
第6章信用环境的区域差异性影响因素 301
6.1 信用环境的区域差异概述 302
6.1.1 研究背景与意义 302
6.1.2 研究现状 302
6.1.3 研究内容 304
6.2 相关理论技术 305
6.2.1 数据准备 305
6.2.2 空间自相关分析方法 306
6.2.3 XGBoost算法 309
6.2.4 随机森林 311
6.2.5 TreeSHAP模型 312
6.3 基于两种机器学习算法的我国城市商业信用环境指数模型 313
6.3.1 我国城市商业信用环境指数特征共线性分析 313
6.3.2 基于XGBoost的我国城市商业信用环境指数模型 314
6.3.3 基于随机森林的我国城市商业信用环境指数模型 316
6.3.4 两种机器学习方法评估精度比较分析 317
6.4　基于TreeSHAP特征因子解释分析 319
6.4.1 基于XGBoost模型的特征因子解释分析 319
6.4.2 基于随机森林模型的特征因子解释分析 321
6.4.3 小结 323
第三部分信用评估系统研发
第７章信用评估监测预警技术及系统 326
7.1 系统建设目标与任务 327
7.1.1 建设目标 327
7.1.2 建设任务 327
7.1.3 总体设计方案 328
7.2 系统设计 328
7.2.1 需求调研 328
7.2.2 数据库设计 329
7.2.3 系统架构设计 330
7.2.4 功能设计 331
7.2.5 接口设计 356
7.2.6 系统部署 357
7.2.7 软件安装 357