第1章计算机体系结构的基本概念
1.1引言
1.2计算机体系结构的概念
1.2.1计算机系统中的层次概念
1.2.2计算机体系结构
1.2.3计算机组织和计算机实现技术
1.3计算机体系结构的发展
1.3.1存储程序计算机体系结构及其发展
1.3.2计算机的分代和分型
1.3.3应用需求的发展
1.3.4计算机实现技术的发展
1.3.5技术的挑战和体系结构的生命周期
1.4影响计算机体系结构的成本和价格因素
1.4.1计算机系统的成本和价格
1.4.2时间因素
1.4.3集成电路的成本
1.5定量分析技术基础
1.5.1计算机性能的评测
1.5.2测试程序
1.5.3性能设计和评测的基本原则
1.5.4CPU的性能
1.6计算机体系结构中并行性的发展
1.6.1并行性概念
1.6.2提高并行性的技术途径
1.6.3并行计算的应用需求
1.7小结
习题1
第2章计算机指令集结构设计
2.1指令集结构的分类
2.1.1指令集结构的分类
2.1.2通用寄存器型指令集结构分类
2.2寻址技术
2.3指令集结构的功能设计
2.3.1CISC指令集结构的功能设计
2.3.2RISC指令集结构的功能设计
2.3.3控制指令
2.4操作数的类型.表示和大小
2.5指令集格式的设计
2.5.1寻址方式的表示方法
2.5.2指令集格式的选择
2.6DLX指令集结构
2.6.1DLX指令集结构
2.6.2DLX指令集结构效能分析
2.7小结
习题2
第3章流水线技术
3.1流水线的基本概念
3.1.1流水线的基本概念
3.1.2流水线的分类
3.2DLX的基本流水线
3.2.1DLX的一种简单实现
3.2.2基本的DLX流水线
3.2.3流水线性能分析
3.3流水线中的相关
3.3.1流水线的结构相关
3.3.2流水线的数据相关
3.3.3流水线的控制相关
3.4MIPSR4000流水线计算机
简介
3.4.1MIPSR4000整型流水线
3.4.2MIPSR4000浮点流水线
3.5向量处理机
3.5.1向量处理方式和向量处理机
3.5.2提高向量处理机性能的主要技术
3.5.3向量处理机的性能评价
3.6小结
习题3
第4章指令级并行
4.1指令级并行的概念
4.1.1循环展开调度的基本方法
4.1.2相关性
4.2指令的动态调度
4.2.1动态调度的原理
4.2.2动态调度算法之一:记分牌
4.2.3动态调度算法之二:Tomasulo算法
4.3控制相关的动态解决技术
4.3.1分支预测缓冲
4.3.2分支目标缓冲
4.3.3基于硬件的前瞻执行
4.4多指令流出技术
4.4.1静态超标量技术
4.4.2动态多指令流出技术
4.4.3超长指令字技术
4.4.4多流出处理器受到的限制
4.5小结
习题4
第5章存储层次..
5.1存储器的层次结构
5.1.1从单级存储器到多级存储器
5.1.2存储层次的性能参数
5.1.3“Cachc—主存”和“主存—辅存”层次
5.1.4存储层次的4个问题
5.2Cache基本知识
5.2.1映象规则
5.2.2查找方法
5.2.3替换算法
5.2.4写策略
5.2.5Cache的结构
5.2.6Cachc性能分析
5.2.7改进Cache性能
5.3降低Cache失效率的方法
5.3.1增加Cache块大小
5.3.2提高相联度
5.3.3VictimC9che
5.3.4伪相联Cachc
5.3.5硬件预取技术
5.3.6由编译器控制的预取
5.3.7编译器优化
5.4减少Cache失效开销
5.4.1让读失效优先于写
5.4.2子块放置技术
5.4.3请求字处理技术
5.4.4非阻塞Cache技术
5.4.5采用两级Cache
5.5减少命中时间
5.5.1容量小.结构简单的Cache
5.5.2虚拟Cache
5.5.3写操作流水化
5.5.4Cache优化技术总结
5.6主存
5.7虚拟存储器
5.7.1虚拟存储器基本原理
5.7.2快表
5.8进程保护和虚存实例
5.8.1进程保护
5.8.2页式虚存举例:AlphaAXP的存储管理和21064的TLB
5.9A1phaAXP21064存储层次
5.10小结
习题5
第6章输入/输出系统
6.1引言
6.1.1I/O系统性能与CPU性能
6.1.2I/O系统的可靠性
6.2外部存储设备
6.2.1磁盘设备
6.2.2F1ash存储器
6.2.3磁带设备
6.2.4光盘设备
6.3可靠性.可用性和可信性
6.4廉价磁盘冗余阵列RAID
6.4.1RAID0
6.4.2RAID1
6.4.3RAID2
6.4.4RAID3
6.4.5RAID4
6.4.6RAID5
6.4.7RAID6
6.4.8RAID7
6.4.9RAID的实现与发展
6.5I/O设备与CPU和存储器的连接
6.5.1总线
6.5.2设备的连接
6.5.3通道
6,6I/O系统性能分析
6.6.1I/O性能与系统响应时间
6.6.2Little定律
6.6.3M/M/1排队系统
6.6.4M/M/m排队系统
6.7I/O与操作系统
6.7.1DMA和虚拟存储器
6.7.2I/O和Csche数据一致性
6.7.3异步I/O
6.7.4块服务器和文件服务器
6.8小结
习题6
第7章多处理机
7.1引言
7.1.1并行计算机体系结构的分类
7.1.2通信模型和存储器的结构模型
7.1.3并行处理面临的挑战
7.2对称式共享存储器体系结构
7.2.1多处理机Cache一致性
7.2.2实现一致性的基本方案
7.2.3监听协议及其实现
7.3分布式共享存储器体系结构
7.3.1基于目录的Cache一致性
7.3.2目录协议及其实现
7.4互连网络
7.4.1互连网络的性能参数
7.4.2静态连接网络
7.4.3动态连接网络
7.5同步
7.5.1基本硬件原语
7.5.2用一致性实现锁
7.5.3同步性能问题
7.5.4大规模机器的同步
7.6同时多线程
7.6.1将线程级并行转换为指令级并行
7.6.2同时多线程处理器的设计
7.6.3同时多线程的性能
7.7多处理机实例
7.8小结
习题7
主要参考文献...