本书介绍了常用的数据科学与工程算法。内容涉及数据分析处理全流程的算法及其数学基础,从概率统计、线性 代数和组合优化角度介绍了经典的数据科学与工程算法,主要包括:抽样算法;尾概率不等式及其应用;典型的哈希 技术,如布隆过滤器和局部敏感哈希;数据流模型,以及典型 Misra-Gries 算法、Count-Sketch 算法;随机游走及其应 用;EM 算法;特征值计算,以及奇异值分解和主成分分析;矩阵分解;整数规划;子模及其应用;模块度及社区发现 等。有大量翔实的应用实例可供参考,有相当数量的习题可供练习。本书可作为统计学、计算机科学、软件工程或数据科学与大数据技术专业本科生、研究生数据科学算法课程教材或参考书,也可作为科技人员使用数据科学算法的参考。