本书为高等职业教育计算机类课程新形态一体化教材,同时是Python大数据技术系列教材中的一本。本书面向实践系统地介绍了Python网络爬虫技数据采集技术。本书采用项目式编排,主要分成5个项目。项目1以学生信息管理系统为依托,讲解Python的Web访问技术,它是网络爬虫的程序基础。项目2以爬取城市天气预报任务为依托,讲解网页数据的爬取方法,其中重点讲解了BeautifulSoup的数据分析与提取方法。项目3以爬取旅游网站的任务为依托,讲解爬取多个网页数据的方法,重点讲解了网页的深度优先与广度优先顺序爬取路径的构造方法与多线程分布式网页爬取技术。项目4以爬取网站的图书信息任务为依托,讲解目前功能强大的分布式爬取框架Scrapy的程序设计技术。项目5以爬取商品网站的数据项目为依托,讲解Selenium动态网页数据的爬取技术。每个项目都遵循由浅入深的学习规律,理论与实践相结合,提高学生的实践能力。 本书配套微课、授课用PPT、源代码、案例素材、习题等资源。与本书配套的数字课程在“智慧职教”平台(www.icve.com.cn)上线,读者可以登录平台进行在线开放课程的学习,授课教师可以调用本课程构建符合自身教学特色的SPOC课程,详见“智慧职教”服务指南。读者可登录网站进行资源的学习及获取,也可发邮件至编辑邮箱1548103297@qq.com 获取相关资源。 本书可以作为高等职业院校大数据技术、软件技术等专业相关课程的教材,还可以作为大数据技术领域从业人员的自学参考书。