第1章 测序数据001
1.1 示例数据 001
1.1.1 分析目标 002
1.1.2 采样点概况 002
1.1.3 理化数据 003
1.1.4 扩增子高通量测序数据 004
1.2 文件类型 007
1.3 文件内容 008
1.3.1 FASTQ存储格式特点 009
1.3.2 碱基质量 010
1.4 质量评估 012
1.4.1 评估方法 012
1.4.2 分析结果 013
1.4.3 总体样本质量 023
第2章 扩增子高通量数据分析026
2.1 分析平台 026
2.1.1 平台介绍 027
2.1.2 平台搭建 029
2.1.3 Ubuntu系统 032
2.2 构建特征表 036
2.2.1 数据导入 036
2.2.2 去噪 041
2.2.3 导出特征表 052
2.2.4 BIOM文件 053
2.3 物种注释 055
2.3.1 参考数据库 055
2.3.2 训练分类器 056
2.3.3 物种组成 065
2.4 小结 069
第3章 微生物多样性分析070
3.1 PAST软件 070
3.2 Alpha多样性 071
3.2.1 数据导入 072
3.2.2 计算多样性指数 072
3.2.3 Alpha多样性指数 075
3.3 稀释曲线 077
3.4 Beta多样性 079
3.4.1 数据导入 079
3.4.2 距离矩阵 080
3.4.3 UPGMA聚类分析 081
3.4.4 群落差异检验 083
3.4.5 排序分析 087
第4章 微生物群落结构及差异分析099
4.1 群落结构 099
4.1.1 百分比堆积柱状图 100
4.1.2 热图 104
4.1.3 韦恩图 112
4.1.4 样本–物种丰度关联Circos弦装图 116
4.1.5 小结 119
4.2 差异分析 119
4.2.1 统计检验 119
4.2.2 LEfSe在线分析 124
第5章 基因功能预测131
5.1 PICRUSt2 131
5.1.1 配置环境 132
5.1.2 标准分步流程 133
5.1.3 KEGG通路层级汇总 145
5.2 Tax4Fun2 146
5.2.1 配置环境 147
5.2.2 运行分析 147
5.3 FAPROTAX 151
5.3.1 配置环境 152
5.3.2 数据准备 152
5.3.3 功能预测 153
5.4 代谢通路丰度柱状图 154
5.4.1 基于PICRUSt2输出数据绘图 154
5.4.2 基于Tax4Fun2输出数据绘图 156
5.4.3 基于FAPROTAX输出数据绘图 157
5.5 STAMP软件 159
5.5.1 导入数据 159
5.5.2 假设检验 161
5.5.3 分析可视化 165
5.5.4 注意事项 168
第6章 微生物与环境因子关联分析169
6.1 环境因子分析 169
6.2 冗余分析 170
6.2.1 分析原理 171
6.2.2 分析步骤 171
6.2.3 导出图形 182
6.3 网络分析 183
6.3.1 分析原理 184
6.3.2 Cytoscape 186
6.3.3 Gephi 192
6.4 随机森林模型分析 199
6.4.1 分析原理 199
6.4.2 分析内容 200
参考文献207