第1章 数据可视化和数据探索的重要性
1.1 简介
1.1.1 数据可视化简介
1.1.2 数据可视化的重要性
1.1.3 数据整理
1.1.4 可视化工具和库
1.2 统计学概述
1.2.1 集中趋势的度量
1.2.2 离散度测量
1.2.3 相关性
1.2.4 数据类型
1.2.5 摘要统计信息
1.3 NumPy
1.3.1 练习1:加载示例数据集并计算平均值
1.3.2 操作1:使用NumPy计算平均值、中位数、方差和标准偏差
1.3.3 基本的NumPy 操作
1.3.4 操作2:索引、切片、分割和迭代
1.3.5 高级NumPy 操作
1.3.6 操作3:过滤、排序、组合和重构
1.4 pandas
1.4.1 pandas的优点
1.4.2 pandas的缺点
1.4.3 练习2:加载示例数据集并计算平均值
1.4.4 操作4:使用pandas计算平均值、中位数和给定数字的方差
1.4.5 基本的pandas 操作
1.4.6 Series
1.4.7 操作5:基于pandas的索引、切片和迭代
1.4.8 pandas高级 操作
1.4.9 操作6:过滤、排序和重构
1.5 本章小结
第2章 绘图知识
2.1 简介
2.2 比较图
2.2.1 线形图
2.2.2 柱状图
2.2.3 雷达图
2.2.4 操作7:员工技能比较
2.3 关系图
2.3.1 散点图
2.3.2 气泡图
2.3.3 相关图
2.3.4 热图
2.3.5 操作8:20年内道路交通事故统计
2.4 合成图
2.4.1 饼图
2.4.2 堆叠式柱状图
2.4.3 堆叠式面积图
2.4.4 操作9:智能手机销售额
2.4.5 维恩图
2.5 分布图
2.5.1 直方图
2.5.2 密度图
2.5.3 箱形图
2.5.4 小提琴图
2.5.5 操作10:不同时间区间内列车的频率
2.6 地理图
2.6.1 点图
2.6.2 等值区域图
2.6.3 连接图
2.7 良好的设计规则
2.7.1 一般的设计实践
2.7.2 操作11:确定理想的可视化 操作
2.8 本章小结
第3章 Matplotlib
3.1 简介
3.2 Matplotlib中的图表
3.3 pyplot基本知识
3.3.1 创建Figure
3.3.2 关闭Figure
3.3.3 格式化字符串
3.3.4 绘制机制
3.3.5 利用pandas DataFrame绘制
3.3.6 显示Figure
3.3.7 保存Figure
3.3.8 创建简单的可视化内容
3.4 基本的文本和图例功能
3.4.1 标记
3.4.2 标题
3.4.3 文本
3.4.4 标注
3.4.5 图例
3.4.6 操作12:利用线形图可视化股票的走势
3.5 基本图表
3.5.1 柱状图
3.5.2 操作13:比较影片评分的柱状图
3.5.3 饼图
3.5.4 创建耗水量饼图
3.5.5 堆叠式柱状图
3.5.6 操作14:餐厅业绩的可视化结果
3.5.7 堆叠式面积图
3.5.8 操作15:利用堆叠式面积图比较智能手机的销售状态
3.5.9 直方图
3.5.1 0 箱形图
3.5.1 1操作16:智商的直方图和箱形图
3.5.1 2 散点图
3.5.1 3操作17:利用散点图可视化动物间的相关性
3.5.1 4 气泡图
3.6 布局
3.6.1 子图
3.6.2 紧凑型子图
3.6.3 雷达图
3.6.4 与雷达图协同工作
3.6.5 GridSpec
3.6.6 操作18:基于边缘直方图创建散点图
3.7 图像
3.7.1 基本的图像 操作
3.7.2 操作19:在网格中绘制多幅图像
3.8 编写数学表达式
3.9 本章小结
第4章 利用Seaborn简化可视化 操作
4.1 简介
4.2 控制Figure观感
4.2.1 图形样式
4.2.2 移除轴向
4.2.3 上下文
4.2.4 操作20:利用箱形图比较不同测试分组中的IQ值
4.3 调色板
4.3.1 分类调色板
4.3.2 连续调色板
4.3.3 离散调色板
4.3.4 操作21:利用热图发现航班数据中的模式
4.4 Seaborn中的图表
4.4.1 柱状图
4.4.2 操作22:电影评分比较
4.4.3 核密度估算
4.4.4 相互关系的可视化
4.4.5 小提琴图
4.4.6 操作23:利用小提琴图比较不同测试组中的IQ值
4.5 Seaborn中的多图表
4.5.1 FacetGrid
4.5.2 操作24:前30个YouTube频道
4.6 回归图
4.7 Squarify库
4.8 本章小结
第5章 绘制地理空间数据
5.1 简介
5.1.1 Geoplotlib的设计原理
5.1.2 地理空间可视化
5.1.3 简单地理空间数据的可视化
5.1.4 操作27:绘制地图上的地理空间数据
5.1.5 采用GeoJSON数据的等值线图
5.2 图块提供商
5.3 自定义层
5.4 本章小结
第6章 基于Bokeh的交互式 操作
6.1 简介
6.1.1 Bokeh的基本概念
6.1.2 Bokeh中的接口
6.1.3 输出
6.1.4 Bokeh服务器
6.1.5 演示
6.1.6 集成
6.1.7 利用Bokeh进行绘制
6.1.8 比较plotting和models接口
6.2 添加微件
6.2.1 基本的交互式微件
6.2.2 操作29:利用微件扩展图表
6.3 本章小结
第7章 知识整合
7.1 简介
7.1.1 操作30:实现Matplotlib和Seaborn 操作
7.1.2 操作31:利用Bokeh可视化股票价格
7.1.3 geoplotlib
7.1.4 操作32:利用geoplotlib分析Airbnb数据
7.2 本章小结
附录
第1章 数据可视化和数据探索的重要性
操作1:使用NumPy计算平均值、中位数、方差和标准偏差
操作2:索引、切片、分割和迭代
操作3:过滤、排序、组合和重构
操作4:使用pandas计算平均值、中位数和给定数字的方差
操作5:基于pandas的索引、切片和迭代
操作6:过滤、排序和重构
第2章 绘图知识
操作7:员工技能比较
操作8:20年内道路交通事故统计
操作9:智能手机销售额
操作10:不同时间区间内列车的频率
操作11:确定理想的可视化 操作
第3章 Matplotlib
操作12:利用线形图可视化股票的走势
操作13:比较影片评分的柱状图
操作14:餐厅业绩的可视化结果
操作15:利用堆叠式面积图比较智能手机的销售状态
操作16:智商的直方图和箱形图
操作17:利用散点图可视化动物间的相关性
操作18:基于边缘直方图创建散点图
操作19:在网格中绘制多幅图像
第4章 利用Seaborn简化可视化 操作
操作20:利用箱形图比较不同测试分组中的IQ值
操作21:利用热图发现航班数据中的模式
操作22:电影评分比较
操作23:利用小提琴图比较不同测试组中的IQ值
操作24:前30个YouTube频道
操作25:线性回归
操作26:耗水量
第5章 绘制地理空间数据
操作27:绘制地图上的地理空间数据
操作28:与自定义层协同工作
第6章 基于Bokeh的交互式 操作
操作29:利用微件扩展图表
第7章 知识整合
操作30:实现Matplotlib和Seaborn 操作
操作31:利用Bokeh可视化股票价格
操作32:利用geoplotlib分析Airbnb数据