本书以Python自然语言处理的常用技术与真实案例相结合的方式,深入浅出地介绍Python自然语言处理的重要内容。全书共12章,内容包括绪论、语料库、正则表达式、中文分词技术、词性标注与命名实体识别、关键词提取、文本向量化、文本分类与文本聚类、文本情感分析、NLP中的深度学习技术、智能问答系统,以及基于TipDM大数据挖掘建模平台实现垃圾短信分类。本书包含实训和课后习题,帮助读者通过练习和操作实践,巩固所学内容。本书可作为“1+X”证书制度试点工作中“大数据应用开发(Python)”职业技能等级证书的教学和培训用书,也可以作为高校数据科学或人工智能相关专业的教材,还可作为机器学习爱好者的自学用书。