第1章概述
1.1算与计算工具
1.2处理器
1.2.1微处理器
1.2.2 协处理器
1.3异构计算简介
1.3.1 GPGPU 计算
1.3.2异构计算应用
本章小结
第2章异构计算系统结构
2.1 GPU体系结构
2.2CPU-GPU异构计算系统
2.2.1体系结构视角的CPU-GPU异构计算系统
2.2.2单结点单GPU异构计算系统
2.2.3单结点多GPU异构计算系统
2.3 GPU与AI计算
本章小结
第3章异构计算编程模型
3.1CUDA程序设计模型
3.1.1 CUDA线程模型
3.1.2 CUDA存储模型
3.1.3 CUDA编译流程
3.2 CUDA 相关软件库
3.3CUDA性能分析工具
本章小结
第4章线程池计算模型
4.1 模型设计
4.1.1 线程池模型
4.1.2 基本设计原理和优点
4.1.3模型结构设计·..
4.1.4支持单结点多GPU 的 CAGTP 模型
4.2模型运行机制
4.2.1 CAGTP模型构造
4.2.2 分配任务槽
4.2.3计算线程块级任务调度
4.2.4 启动任务复用 Kernel 函数
4.3 程序设计接口
4.4模型扩展变体
4.4.1无任务队列的CAGTP 模型
4.4.2 带有轮转双任务槽的 CAGTP 模型.
4.4.3支持流多处理器划分的CAGTP模型·
4.5模型性能测试与分析
4.5.1 模型讨论
4.5.2 性能分析
4.5.3微基准测试
本章小结
第5章线性代数算法实现
5.1 通用稠密矩阵乘
5.1.1 概述
5.1.2 GEMM 的 CAGTP 实现
5.1.3 GEMM在CAGTP 上的性能分析
5.2批量细度GEMM的CAGTP实现与性能分析
5.3 Cholesky分解
5.3.1 Cholesky 分解介绍
5.3.2 Cholesky分解的CAGTP 实现
5.3.3 Cholesky分解在CAGTP 上的性能分析
5.4混合任务计算
5.4.1 SPMV与Black Scholes 算法介绍
5.4.2混合任务计算的CAGTP 实现
5.4.3混合任务计算在CAGTP 上的性能分析
……
第6章机器学习算法实现
第7章高光谱图像分类算法实现
第8章FPGA异构计算
参考文献