本书为国家职业教育大数据技术专业教学资源库配套教材,也是高等职业教育计算机类课程新形态一体化教材。本书选择Python 3作为编程环境,系统讲述编写爬虫所需要的各种技术。包括HTTP的原理、urllib和request网络请求库的使用、正则表达式、XPath等数据提取规则的使用和爬虫框架Scrapy的使用,并最后通过一个项目“招聘分析监控系统——数据采集系统”将以上技术综合运用起来。本书配套有微课视频、教学设计、授课用PPT等数字化教学资源。与本书配套的数字课程“数据采集与预处理”已在“智慧职教”平台(www.icve.com.cn)上线,学习者可以登录平台进行在线开放课程的学习,授课教师可以调用本课程构建符合自身教学特色的SPOC课程,详见“智慧职教”服务指南。读者可登录平台进行资源的学习及获取,也可发邮件至编辑邮箱1548103297@qq.com获取相关资源。本书紧跟信息社会发展动态,内容新颖、结构清晰,具有很强的趣味性和实用性。本书可作为高等职业院校大数据技术专业及其他相关专业的教材,也可作为大数据技术爱好者的自学用书。