基因组学领域的数据正在剧增。在短短几年内,美国国家卫生研究院(National Institutes of Health,NIH)等组织托管的基因组数据已经超过了50PB(5000万GB),这些组织正在转向云基础架构,以便将数据提供给研究团体。你该如何调整分析工具和协议来访问和分析云端的海量数据?通过这本实用书籍,研究人员将学会如何使用基因组分析工具包(Genome Analysis Toolkit,GATK)、Docker、WDL、Terra等开源工具来处理基因组学算法。GATK用户社区的长期监理人Geraldine Van der Auwera和加州大学圣克鲁兹基因组学研究所的Brian O’Connor会指导你完成这一过程。你将通过使用真实数据和相关领域的基因组学算法展开学习。