部分 基础技术研究
第1章 多源多模态征信大数据融合方法 2
1.1 多模态融合概述 3
1.1.1 研究背景与意义 3
1.1.2 研究现状 5
1.1.3 研究内容 10
1.2 多模态融合相关理论技术 12
1.2.1 众包标注 12
1.2.2 众包数据的消噪 13
1.2.3 图像分类 19
1.2.4 多模态数据融合 25
1.2.5 协同学习 29
1.3 基于协同学习技术的决策级融合方法 33
1.3.1 任务描述 33
1.3.2 多源同构数据融合方法:CT-MID 34
1.3.3 CT-MID模块说明 35
1.3.4 实验分析 41
1.3.5 方法分析 45
1.4 基于多模态适配器的特征级融合方法 50
1.4.1 任务描述 50
1.4.2 多源异构数据融合方法:MLP-Adapter 51
1.4.3 实验结果 55
1.5 基于协同学习的多源数据融合原型系统 59
1.5.1 系统组成单元 59
1.5.2 功能展示 61
第2章 大数据征信归因分析及模型可解释性研究 66
2.1 大数据征信分析概述 67
2.1.1 研究背景与意义 67
2.1.2 研究现状 68
2.1.3 问题与挑战 72
2.1.4 研究内容 77
2.2 相关理论技术 78
2.2.1 特征选择方法 78
2.2.2 因果模型 81
2.2.3 模型的可解释方法 83
2.3 归因分析技术研究 87
2.3.1 归因分析总体流程设计 87
2.3.2 实验评估:归因分析 93
2.4 模型可解释性提升技术研究 101
2.4.1 可解释性提升方法设计 101
2.4.2 实验一:整体可解释性提升 107
2.4.3 实验二:个体可解释性提升 116
2.5 原型系统的设计与实现 124
2.5.1 系统业务流程设计 124
2.5.2 系统功能架构设计 126
2.5.3 效果展示 128
2.5.4 系统测试 135
第二部分 信用评估技术研究
第3章 基于时序行为分析的信用评估技术 140
3.1 时序行为信用评估概述 141
3.1.1 研究背景与意义 141
3.1.2 研究现状 142
3.1.3 研究内容 144
3.2 相关理论技术 144
3.2.1 基于神经网络的模型 144
3.2.2 图嵌入模型 149
3.3 数据准备与特征工程 152
3.3.1 数据准备 152
3.3.2 数据观察 154
3.3.3 数据清洗 156
3.3.4 特征工程 157
3.4 基于时序行为的征信评估模型设计 163
3.4.1 模型总体设计 163
3.4.2 基于Auto-Encoder LSTM模型的交易序列特征编码 164
3.4.3 基于Node2Vec模型的行为序列特征编码 168
3.4.4 基于特征融合的用户信用评估模型 173
3.5 模型验证与原型系统 176
3.5.1 模型验证 176
3.5.2 原型系统设计与实现 184
第4章 征信大数据频繁模式与关联规则挖掘 192
4.1 征信大数据挖掘概述 193
4.1.1 研究现状 193
4.1.2 问题描述 197
4.1.3 研究内容 198
4.2 相关理论技术 198
4.2.1 数据融合的相关技术 198
4.2.2 动态关联规则挖掘的相关技术 203
4.3 多源征信大数据融合方法 207
4.3.1 数据融合 207
4.3.2 数据融合方法 209
4.3.3 多源异构数据的融合模型 212
4.3.4 实验结果与分析 217
4.4 结构化征信大数据动态关联规则挖掘算法 219
4.4.1 动态关联规则的形式化定义 219
4.4.2 与静态关联规则的比较 220
4.4.3 动态关联规则的评价 221
4.4.4 动态关联规则挖掘算法 221
4.4.5 实验结果与分析 224
4.5 流式半结构化征信大数据频繁项集挖掘算法 227
4.5.1 数据流与半结构化数据 227
4.5.2 树结构模型挖掘的相关定义 229
4.5.3 两个改进 230
4.5.4 改进的挖掘算法 235
4.6 实验结果与分析 238
4.6.1 实验数据 238
4.6.2 实验结果 238
第5章 信用风险违约识别与预警技术 242
5.1 信用风险违约概述 243
5.1.1 研究背景与意义 243
5.1.2 研究现状 245
5.1.3 研究内容 250
5.2 相关理论技术 251
5.2.1 个人信用评估指标体系 251
5.2.2 个人信用评估模型技术 253
5.3 信用风险数据与数据预处理 263
5.3.1 数据来源 263
5.3.2 数据信息 265
5.3.3 缺失值分析 268
5.3.4 分类变量 270
5.3.5 连续变量的离散化 273
5.3.6 异常值处理 274
5.3.7 领域变量处理 276
5.4 个人信用风险违约识别与预警模型设计 276
5.4.1 模型设计分析 277
5.4.2 组合模型优化 279
5.4.3 D-S Stacking模型 282
5.5 模型验证与原型系统 288
5.5.1 系统业务流程 288
5.5.2 系统架构设计 290
5.5.3 原型系统效果评估 296
第6章 信用环境的区域差异性影响因素 301
6.1 信用环境的区域差异概述 302
6.1.1 研究背景与意义 302
6.1.2 研究现状 302
6.1.3 研究内容 304
6.2 相关理论技术 305
6.2.1 数据准备 305
6.2.2 空间自相关分析方法 306
6.2.3 XGBoost算法 309
6.2.4 随机森林 311
6.2.5 TreeSHAP模型 312
6.3 基于两种机器学习算法的我国城市商业信用环境指数模型 313
6.3.1 我国城市商业信用环境指数特征共线性分析 313
6.3.2 基于XGBoost的我国城市商业信用环境指数模型 314
6.3.3 基于随机森林的我国城市商业信用环境指数模型 316
6.3.4 两种机器学习方法评估精度比较分析 317
6.4 基于TreeSHAP特征因子解释分析 319
6.4.1 基于XGBoost模型的特征因子解释分析 319
6.4.2 基于随机森林模型的特征因子解释分析 321
6.4.3 小结 323
第三部分 信用评估系统研发
第7章 信用评估监测预警技术及系统 326
7.1 系统建设目标与任务 327
7.1.1 建设目标 327
7.1.2 建设任务 327
7.1.3 总体设计方案 328
7.2 系统设计 328
7.2.1 需求调研 328
7.2.2 数据库设计 329
7.2.3 系统架构设计 330
7.2.4 功能设计 331
7.2.5 接口设计 356
7.2.6 系统部署 357
7.2.7 软件安装 357