本书从爬虫项目开发环境搭建开始,详细讲解从数据采集到内容可视化的全过程。本书从7个网站爬虫项目出发,根据项目需求选取不同的数据采集和处理技术,并有针对性地讲解几种Python网络爬虫。本书共8章,前3章是入门篇,第4、5、6章是进阶篇,第7、8章是 篇。涵盖的内容有Scrapy爬虫、Requests爬虫、Selenium模拟浏览器、XPath语言、CSS选择器、CSV存储、MySQL存储、JSON读取、Parsel解析、Flask框架、ECharts可视化等。本书参考企业项目开发的工作流程,图文并茂地讲解每个操作步骤,并提供运行结果让读者检验自己的代码,中间也穿插介绍相关知识点和疑难问题。本书适用于高职高专院校大数据技术专业开展项目化教学和毕业设计指导,也可作为网络爬虫爱好者的启蒙资料。