本书基于大数据时代背景,对健康保险的精算统计模型与风险监管进行了系统研究。研究发现:其一,针对健康大数据量大、异质及多源特点导致的数据融合难题,本书提出的分布式算法、**子抽样、基于密度比模型的经验似然算法、数据插补和模型平均算法等能有效解决上述难题;其二,基于随机森林分类模型、BP组合神经网络模型、朴素贝叶斯模型及马尔可夫模型等大数据分析方法,可结合商业医疗保险、长期护理保险及重疾险的推行实践,有针对性地推进健康保险定价模型由“少量影响因子对‘标准体’定价+核保调整价格”的传统模式向“事前定价+动态调整”模式转变;其三,大数据分析方法中的聚类方法、LightGBM方法、Logistic算法和决策树算法能够对医疗保险欺诈识别与智能核赔起到有效的风险预警作用;其四,健康大数据在开放过程中面临标准化和隐私保护难题。此外,在数据标准化方面,本书基于HL7-RIM模型构建的健康保险业务底层数据标准化模型可为健康保险的高效发展提供数据标准。在数据开放隐私保护方面,鉴于健康保险大数据在收集、存储、共享、分析的全周期各环节中均存在数据泄露可能性,本书简要地对如何进行大数据时代健康保险相关数据的隐私保护进行了探讨。本书的研究可为健康保险的精算技术变革及风险监管对策改进提供理论支撑,可为我国多层次医疗保障体系的完善提供决策参考。