Python 因其拥有强大的第三方软件库,广泛应用在人工智能开发、科学计算和数据分析 中。而 pandas 就是一款基于 NumPy 的解决 Python 数据分析任务的软件库。在机器学习和数 据科学中,因为很少有数据可以直接使用,所以对数据进行预处理就成为必不可少的工作。 《Pandas 数据预处理详解》就利用数据处理必需的 pandas 库,从 pandas 基本操作、数据结构, 到 pandas 将执行的各种任务,如汇总统计信息、检查缺失值 / 异常值 / 重复数据以及合并和分 组数据等,通过简单易懂的示例,对预处理的基础知识和各种预处理方法进行了透彻讲解。学 完本书,读者将能够顺利执行各种机器学习和数据分析任务。特别适合作为机器学习工程师、 数据科学及科研工作者初学数据预处理的参考书,也适合作为案头手册,随时翻阅查看。