本书介绍并行程序设计方法及相关编程工具与实践,分5篇共14章。 篇“并行程序设计基础”含两章,包括并行计算机系统与结构模型、并行程序设计简介;第二篇“SIMD指令级并行编程”含两章,包括SIMD基本概念和x86处理器上的并行指令编程方法和示例、ARM结构上的NEON向量指令编程与示例;第三篇“多核并行计算”含4章,包括Pthread多线程编程、OpenMP编程、GPU上的CUDA编程、寒武纪MLU编程基础;第四篇“多机并行计算”含4章,包括MPI并行计算及示例、Hadoop编程方法及示例、Spark编程和示例、TensorFlow多机异构计算的编程方法和示例;第五篇给出了并行算法实现示例。本书涉及范围广,覆盖了单核、多核和多机环境下的并行编程方法,读者可根据自己的计算问题和计算平台特性,选择合适的并行编程方法和工具,结合各章给出的性能调优思路有效地实现并行编程。本书可作为高等学校计算机及相关专业本科高年级学生和研究生的教材,也可供从事并行程序设计及其实现的科技人员参考阅读。