随着以数据密集型科学研究为特点的科研“第四范式”快速发展,科学数据的汇聚、开放与应用受到国内外科研人员和数据从业人员的广泛关注。党的十九届四中全会第一次把“数据”纳入生产要素并参与分配,更加突显出数据的重要价值。 2020年 4月,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,明确提出“加快培育数据要素市场”,要求提升社会数据资源价值,加强数据资源整合和安全保护;同年 5月,《中华人民共和国数据安全法(草案)》公开征求意见,立法强化国家数据安全保障能力。 2019年年底,新型冠状病毒肺炎( COVID-19,简称“新冠肺炎”)疫情暴发并快速发展成为全球性流行病,人类面对近百年来影响范围最广的疾病挑战,强烈需要开展疫病防疫国际科学合作、分享科研成果与经验 ,集中全球力量争取在最短时间内解决公共卫生安全威胁。全球科学界积极应对,国际主要科技期刊向公众开放新冠病毒文献,我国国家科学数据中心及相关研究机构及时收集新冠肺炎科学数据并向全球公开共享,新冠肺炎疫情数据服务平台发挥积极作用,国家基因组科学数据中心、国家微生物科学数据中心等有关成果被国务院新闻办公室发布的《抗击新冠肺炎疫情的中国行动》白皮书收录。当前,开放科学运动蓬勃发展,得到科研机构、出版机构及科研人员的广泛关注和持续推动, 2019年 9月联合国教科文组织启动制定《开放科学建议书》,致力于拉近公民与科学的距离、促进全世界的科学交流与发展。科学数据开放共享需要满足“可发现、可访问、可互操作和可重用”的 FAIR基本原则已经得到了全球学界的广泛认同,国际数据委员会、研究数据联盟、世界数据系统等国际组织,欧洲开放科学云、全球开放科学云等国际计划均积极推进甚至联合布局 FAIR数据生态系统的研究和实践,以实现全球范围内更大时空粒度上的科学数据开放共享,为开放科学数据的“数据互联网”发展奠定基础。《科学数据管理办法》全面实施,截至 2020年年底,全国共有 15个省市、部委等发布实施细则类文件,科学数据政策体系进一步完善,地方或行业科学数据资源特色明显、实施路径科学清晰且执行性强。同期, 20个国家科学数据中心正式启动建设,面向世界科技前沿、经济主战场、国家重大需求、人民生命健康,重点布局科学数据资源体系,深入落实科技计划项目科学数据汇交,发展“通用专用”融合互促的科学数据管理和应用技术、软件、平台与共享服务体系。 2020年年底,国家科学数据中心整合科学数据总量超过 104 PB。国家科技基础条件平台中心启动建设了拥有自主知识产权的科技资源标识体系和标识系统,依托“中国科技资源共享网”建成新版国家科学数据网络管理平台。本报告基于 2019—2020年度国内外科学数据相关工作的开展现状,特别是首批国家科学数据中心正式组建以来,我国高质量科学数据资源汇聚和管理情况,以及科学数据在服务世界科技前沿、国家重大需求和人民生命健康方面所发挥的重要作用,在继承《国家科学数据资源发展报告 2019》科学数据资源发展状况的基础上,分析和探讨我国科学数据资源生产管理与整合、科技计划项目科学数据汇交、数据开放共享与应用服务等情况,梳理并总结了科学数据技术研发与分析挖掘平台建设进展、国家科学数据中心年度重要工作成效,提出持续推动我国科学数据管理与开放共享的对策建议。本报告共分为十一章,第一章“科学数据发展新特点、新趋势”,深入阐述了 2019—2020年度国际科学数据资源发展的新动态和新趋势,特别是在科学数据开放生态、数据影响力评价及数据服务新冠肺炎疫情防控方面的新进展。第二章“科学数据资源整合与应用服务体系初步形成”,全面介绍了首批国家科学数据中心在广泛汇聚领域科学数据、积极开展科学数据共享服务等方面取得的积极成效。第三章“科学数据服务新型冠状病毒肺炎疫情防控”,重点介绍了新型冠状病毒肺炎疫情相关科学数据及其服务平台全面支持病毒研究、疫苗研制和抗疫等情况。第四章至第十章系统阐述了我国科学数据的资源数量和质量、科技计划项目科学数据汇交进展、数据分析挖掘技术和平台建设情况、科技资源标识体系建设、国家科学数据网络管理平台建设、科学数据开放共享与服务应用及国际合作情况。第十一章“我国科学数据资源发展展望”,立足我国科学数据进展与现状,坚持构建一体化国家科学数据网络,推动数据要素市场化配置,加强开放共享与安全保护机制建设及深入发展符合我国国情的科学数据影响力评价指标。本书的出版完成,得到国家自然科学基金面上项目“基于动态与异构场景的科学数据中心评价方法研究”(项目编号: 72074017)的资助,在此表示感谢。