目录
第1章 绪论 1
第2章 人工智能与神经网络 3
2.1 人工智能 3
2.2 神经网络 4
2.2.1 人工神经元 5
2.2.2 激活函数 7
2.2.3 人工神经网络 9
2.3 深度神经网络 10
参考文献 15
第3章 智能计算的挑战 17
3.1 基本网络层的数学模型 17
3.2 基本网络层的计算特点 19
3.3 智能计算的挑战现状分析 21
3.3.1 访存能力 21
3.3.2 功耗控制 21
3.3.3 架构通用性 22
3.3.4 稀疏性 23
3.3.5 混合精度计算 24
3.4 智能计算平台现状 24
参考文献 28
第4章 人工智能芯片架构设计 30
4.1 研究现状 30
4.1.1 时域计算架构 30
4.1.2 空域计算架构 33
4.2 现状分析 37
4.3 多粒度可重构计算架构 38
4.3.1 系统总体架构 38
4.3.2 计算数据流 45
4.3.3 基于融合数据模式的存储划分 48
4.3.4 按需动态阵列划分 51
4.3.5 实验评估 53
参考文献 54
第5章 人工智能芯片的数据复用 57
5.1 输入数据复用 57
5.2 输出数据复用 62
5.3 权重数据复用 64
5.4 混合数据复用 67
5.4.1 工作流程和调度框架 68
5.4.2 实验结果 70
参考文献 72
第6章 人工智能芯片的网络映射 74
6.1 单层网络映射方法 74
6.1.1 典型分块方法 74
6.1.2 屋顶线模型 75
6.1.3 单层网络映射的建模与求解 76
6.1.4 单层网络映射方法的延伸与扩展 78
6.1.5 单层网络映射方法的缺点 80
6.2 级联网络映射方法 81
6.3 复杂网络映射方法 83
6.3.1 层级时间映射方法带来的资源浪费 84
6.3.2 层聚类方法 85
6.3.3 多个层聚类并行映射方法 87
6.3.4 复杂网络其他特性的利用 89
6.3.5 复杂网络映射优化结果 90
参考文献 92
第7章 人工智能芯片的存储优化 95
7.1 高密度片外存储技术 96
7.1.1 三维集成存储器技术 96
7.1.2 3D DRAM的高温问题 98
7.1.3 高温问题的解决思路 99
7.1.4 计算架构优化 99
7.1.5 优化框架 105
7.2 高密度片上存储技术 110
7.2.1 实验分析平台和优化方向 112
7.2.2 训练层次优化:数据生存时间感知的训练方法 114
7.2.3 调度层次优化:神经网络分层的混合计算模式 115
7.2.4 架构层次优化:刷新优化的eDRAM控制器 117
7.2.5 实验结果 117
参考文献 120
第8章 人工智能芯片的软硬件协同设计 124
8.1 低位宽神经网络 124
8.1.1 线性量化 125
8.1.2 非线性量化 126
8.2 稀疏化神经网络及其架构设计 127
8.2.1 利用激活稀疏性 128
8.2.2 网络剪枝 129
8.2.3 压缩网络架构 131
8.3 二值神经网络 132
8.3.1 二值神经网络背景 132
8.3.2 面向二值/三值神经网络的计算架构优化 132
参考文献 137
第9章 总结与展望 141
9.1 本书内容总结 141
9.2 未来展望 141
彩图