第1章超级计算机的发展方向
1.1市场是决定性的因素
1.2微机集群的历史
1.3微机集群的现状
1.4微机集群的技术
1.5微机集群的可靠性
1.6微机集群的优势
1.7微机集群的局限
1.8微机集群的趋势
第2章并行计算概念及其所需的网络服务,
2.1并行计算的基本概念
2.1.1一维数值积分例子
2.1.2串行计算程序
2.1.3并行计算的基本概念
2.2消息传递界面并行计算
2.2.1消息传递模式的并行计算
2.2.2MPI并行计算的初始化
2.2.3MPI并行计算编程
2.3TCP/IP通信协议
2.3.1TCP/IP通信协议
2.3.2IP地址
2.3.3子网掩码(netmask)
2.3.4路由(router)
2.3.5域名(domain)
2.4微机集群所需的网络功能
2.4.1微机集群的网络结构
2.4.2网络信息服务(NIS)
2.4.3网络文件系统(NFS)
2.4.4远程Shell命令(rsh)
2.5微机集群的网络设计
2.5.1域名
2.5.2IP地址
2.5.3所需安装的软件
第3章微机集群的Linux安装和配置
3.1Linux系统安装
3.1.1进入安装
3.1.2硬盘分区
3.1.3选择软件
3.1.4启动预设置
3.1.5安装过
3.2YaST管理工具
3.2.1什么是YaST
3.2.2YaST管理功能
3.3微机集群服务器的网络功能设置
3.3.1基本网络设置
3.3.2NFS设置
3.3.3NIS设置
3.3.4启动网络服务
3.4微机集群节点机的网络功能设置
3.4.1基本网络设置
3.4.2NFS设置
3.4.3NIS设置
3.4.4启动网络服务
3.5内核的重新编译
3.5.1了解内核
3.5.2内核编译步骤
3.5.3LILO引导启动设置
3.5.4内核选项简介
3.6并行环境lammpi的安装
3.6.1lammpi软件及其获取
3.6.2lammpi软件安装步骤
3.6.3lammpi软件的简单测试
第4章微机集群的性能测试
4.1微机集群的连接
4.1.1网络的连接材料
4.1.2网线的接口标准
4.1.3网线的制作过程
4.1.4两台微机的直接连接
4.2集群所需网络功能的检测
4.2.1网络基本性能
4.2.2NIS
4.2.3NFS
4.2.4rsh
4.3启动lammpi并行平台常遇问题
4.3.1基本的网络问题
4.3.2节点机中lam的路径问题
4.3.3节点机中/tmp目录问题
4.4一维数值积分并行程序测试
4.4.1并行计算程序及编译
4.4.2执行lammpi并行计算的步骤
4.4.3串行计算程序
4.4.4串.并行计算速度比较
4.4.5并行计算中的负载平衡问题
4.5lamtests测试
4.5.1lamtests的测试内容和获取
4.5.2lamtests的编译和测试
4.6Linpack速度测试
4.6.1什么是Linpack速度测试
4.6.2Linpack测试程序包的获取和编译
4.6.3Linpack测试速度
4.6.4Linpack测试的可调参数
第5章微机集群的性能优化
5.1节点机的网络唤醒和停机
5.1.1网络唤醒的BIOS设置
5.1.2网络唤醒的驱动
5.1.3节点机的网络唤醒
5.1.4让指定的普通用户执行部分管理功能
5.1.5节点机的停机和重启
5.2用dhcp服务器进行网络配置
5.2.1dhcp协议及服务功能
5.2.2dhcp服务器的安装
5.2.3dhcp服务器的配置和启动
5.2.4dhcp客户机的配置
5.2.5dhcp服务器的配置文件
5.3如何复制节点机
5.3.1ghost软件
5.3.2硬盘对硬盘复制
5.4网络启动
5.4.1为何需要网络启动
5.4.2网络启动过程
5.4.3网络启动的硬件要求
5.4.4网络启动的节点机安装和配置
5.4.5网络启动的服务器配置
5.4.6网络启动的tftp设置
5.4.7网络启动的内核选择
5.4.8网络启动的有关问题
5.5网卡捆绑
5.5.1为何需要网卡捆绑
5.5.2网卡捆绑的原理
5.5.3网卡捆绑的实现
5.5.4网卡捆绑的内核选择
5.5.5网卡捆绑的网络结构
5.6节点机该启动哪些进程
5.6.1Linux的启动过程
5.6.2初始化控制表inittab
5.6.3启动进程文件boot
5.6.4运行级别runlevel
5.6.5启动服务文件rc
5.6.6启动服务目录rc.d
5.6.7启动节点机进程
第6章微机集群的任务管理
6.1OpenPBS概述
6.1.1任务管理的必要性
6.1.2OpenPBS的管理功能
6.2OpenPBS执行码
6.2.1OpenPBS执行码的获取
6.2.2OpenPBS执行码的安装
6.2.3OpeneBS执行码的局限
6.3OpenPBS源代码的编译安装
6.3.1解开源代码
6.3.2安装Tcl-devel工具
6.3.3编译设置
6.3.4编译
6.3.5安装
6.4OpenPBS的启动和停止
6.4.1pbs_server的第一次启动
6.4.2pbs_mom在节点机的启动
6.5OpenPBS的命令
6.5.1qmgr命令
6.5.2qmgr命令的常用功能
6.6OpenPBS的简单设置
6.6.1最简单的queue的设置
6.6.2最简单的server的设置
6.6.3最简单的node的设置
6.6.4调度(scheduling)设置
6.6.5PBS简单设置的实例
6.7OpenPBS的工作目录和主要文件
6.7.1PBS目录中的关键文件
6.7.2sched_priv目录
6.7.3server_priv目录
6.7.4mom_priv目录
6.8OpenPBS的用户命令
6.8.1用户脚本例子
6.8.2用户任务的递交
6.8.3用户任务的删除
6.8.4用户任务的查询
6.9OpenPBS两个重要的批处理文件
6.9.1prologue和epilogue文件
6.9.2命令行参数的意义
6.9.3环境变量的意义
附录ALinux系统基础
A.1基本Shell命令
A.1.1文件概念
A.1.2Linux基本指令
A.2vi编辑器
A.2.1vi的基本操作
A.2.2vi的命令模式
A.2.3全局搜索替换
A.3Shell脚本程序
A.3.1Shell脚本简介
A.3.2Shell变量及其运算
A.3.3流程控制
A.3.4bash介绍
A.4make工具
A.4.1程序的编译
A.4.2make的功能
A.4.3make工作流程
A.4.4makefile文件
A.5软件包管理器rpm
A.5.1主要选项
A.5.2安装
A.5.3卸载
A.5.4查询
附录B微机集群的硬件选择
B.1计算节点
B.1.1服务器还是微机
B.1.2CPU
B.1.3主流CPU比较
B.1.4双CPU的利弊
B.1.5内存
B.1.6主机板
B.2网络硬件
B.2.1以太网
B.2.2Myrinet
B.2.3网卡
B.2.4交换机
B.3其他
B.3.1散热
B.3.2机柜.机箱
B.3.3电源
后记