前言 \n
第1章 机器视觉在行业中的应用1 \n
1.1 机器视觉的发展背景1 \n
1.1.1 人工智能1 \n
1.1.2 机器视觉2 \n
1.2 机器视觉的主要应用场景3 \n
1.2.1 人脸识别3 \n
1.2.2 视频监控分析4 \n
1.2.3 工业瑕疵检测5 \n
1.2.4 图片识别分析6 \n
1.2.5 自动驾驶/驾驶辅助7 \n
1.2.6 三维图像视觉8 \n
1.2.7 医疗影像诊断8 \n
1.2.8 文字识别9 \n
1.2.9 图像/视频的生成及设计9 \n
1.3 本章小结10 \n
第2章 图像识别前置技术11 \n
2.1 深度学习框架11 \n
2.1.1 Theano11 \n
2.1.2 Tensorflow12 \n
2.1.3 MXNet13 \n
2.1.4 Keras13 \n
2.1.5 PyTorch14 \n
2.1.6 Caffe14 \n
2.2 搭建图像识别开发环境15 \n
2.2.1 Anaconda15 \n
2.2.2 conda18 \n
2.2.3 Pytorch的下载与安装19 \n
2.3 Numpy使用详解20 \n
2.3.1 创建数组20 \n
2.3.2 创建Numpy数组22 \n
2.3.3 获取Numpy属性24 \n
2.3.4 Numpy数组索引25 \n
2.3.5 切片25 \n
2.3.6 Numpy中的矩阵运算26 \n
2.3.7 数据类型转换27 \n
2.3.8 Numpy的统计计算方法28 \n
2.3.9 Numpy中的arg运算29 \n
2.3.10 FancyIndexing29 \n
2.3.11 Numpy数组比较30 \n
2.4 本章小结31 \n
第3章 图像分类之KNN算法32 \n
3.1 KNN的理论基础与实现32 \n
3.1.1 理论知识32 \n
3.1.2 KNN的算法实现33 \n
3.2 图像分类识别预备知识35 \n
3.2.1 图像分类35 \n
3.2.2 图像预处理36 \n
3.3 KNN实战36 \n
3.3.1 KNN实现MNIST数据分类36 \n
3.3.2 KNN实现Cifar10数据分类41 \n
3.4 模型参数调优44 \n
3.5 本章小结48 \n
第4章 机器学习基础49 \n
4.1 线性回归模型49 \n
4.1.1 一元线性回归50 \n
4.1.2 多元线性回归56 \n
4.2 逻辑回归模型57 \n
4.2.1 Sigmoid函数58 \n
4.2.2 梯度下降法59 \n
4.2.3 学习率的分析61 \n
4.2.4 逻辑回归的损失函数63 \n
4.2.5 Python实现逻辑回归66 \n
4.3 本章小结68 \n
第5章 神经网络基础69 \n
5.1 神经网络69 \n
5.1.1 神经元70 \n
5.1.2 激活函数72 \n
5.1.3 前向传播76 \n
5.2 输出层80 \n
5.2.1 Softmax80 \n
5.2.2 one-hotencoding82 \n
5.2.3 输出层的神经元个数83 \n
5.2.4 MNIST数据集的前向传播83 \n
5.3 批处理85 \n
5.4 广播原则87 \n
5.5 损失函数88 \n
5.5.1 均方误差88 \n
5.5.2 交叉熵误差89 \n
5.5.3 Mini-batch90 \n
5.6 最优化91 \n
5.6.1 随机初始化91 \n
5.6.2 跟随梯度(数值微分)92 \n
5.7 基于数值微分的反向传播98 \n
5.8 基于测试集的评价101 \n
5.9 本章小结104 \n
第6章 误差反向传播105 \n
6.1 激活函数层的实现105 \n
6.1.1 ReLU反向传播实现106 \n
6.1.2 Sigmoid反向传播实现106 \n
6.2 Affine层的实现107 \n
6.3 Softmaxwithloss层的实现108 \n
6.4 基于数值微分和误差反向传播的比较109 \n
6.5 通过反向传播实现MNIST识别111 \n
6.6 正则化惩罚114 \n
6.7 本章小结115 \n
第7章 PyTorch实现神经网络图像分类116 \n
7.1 PyTorch的使用116 \n
7.1.1 Tensor116 \n
7.1.2 Variable117 \n
7.1.3 激活函数118 \n
7.1.4 损失函数120 \n
7.2 PyTorch实战122 \n
7.2.1 PyTorch实战之MNIST分类122 \n
7.2.2 PyTorch实战之Cifar10分类125 \n
7.3 本章小结128 \n
第8章 卷积神经网络129 \n
8.1 卷积神经网络基础129 \n
8.1.1 全连接层129 \n
8.1.2 卷积层130 \n
8.1.3 池化层134 \n
8.1.4 批规范化层135 \n
8.2 常见卷积神经网络结构135 \n
8.2.1 AlexNet136 \n
8.2.2 VGGNet138 \n
8.2.3 GoogLeNet140 \n
8.2.4 ResNet142 \n
8.2.5 其他网络结构144 \n
8.3 VGG16实现Cifar10分类145 \n
8.3.1 训练146 \n
8.3.2 预测及评估149 \n
8.4 本章小结152 \n
8.5 参考文献152 \n
第9章 目标检测153 \n
9.1 定位+分类153 \n
9.2 目标检测155 \n
9.2.1 R-CNN156 \n
9.2.2 Fast R-CNN160 \n
9.2.3 Faster R-CNN162 \n
9.2.4 YOLO165 \n
9.2.5 SSD166 \n
9.3 SSD实现VOC目标检测167 \n
9.3.1 PASCAL VOC数据集167 \n
9.3.2 数据准备170 \n
9.3.3 构建模型175 \n
9.3.4 定义Loss178 \n
9.3.5 SSD训练细节181 \n
9.3.6 训练186 \n
9.3.7 测试189 \n
9.4 本章小结190 \n
9.5 参考文献191 \n
第10章 分割192 \n
10.1 语义分割193 \n
10.1.1 FCN193 \n
10.1.2 UNet实现裂纹分割196 \n
10.1.3 SegNet209 \n
10.1.4 PSPNet210 \n
10.2 实例分割211 \n
10.2.1 层叠式212 \n
10.2.2 扁平式212 \n
10.3 本章小结213 \n
10.4 参考文献214 \n
第11章 产生式模型215 \n
11.1 自编码器215 \n
11.2 对抗生成网络215 \n
11.3 DCGAN及实战217 \n
11.3.1 数据集218 \n
11.3.2 网络设置220 \n
11.3.3 构建产生网络221 \n
11.3.4 构建判别网络223 \n
11.3.5 定义损失函数224 \n
11.3.6 训练过程224 \n
11.3.7 测试227 \n
11.4 其他GAN230 \n
11.5 本章小结235 \n
11.6 参考文献235 \n
第12章 神经网络可视化236 \n
12.1 卷积核236 \n
12.2 特征层237 \n
12.2.1 直接观测237 \n
12.2.2 通过重构观测239 \n
12.2.3 末端特征激活情况243 \n
12.2.4 特征层的作用244 \n
12.3 图片风格化245 \n
12.3.1 理论介绍245 \n
12.3.2 代码实现247 \n
12.4 本章小结255 \n
12.5 参考文献255 \n
第13章 图像识别算法的部署模式257 \n
13.1 图像算法部署模式介绍257 \n
13.2 实际应用场景和部署模式的匹配262 \n
13.3 案例介绍264 \n
13.4 本章小结265