注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络人工智能Python机器学习:基础、算法与实战

Python机器学习:基础、算法与实战

Python机器学习:基础、算法与实战

定 价:¥99.00

作 者: 孙玉林 编著
出版社: 化学工业出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787122435347 出版时间: 2023-10-01 包装:
开本: 页数: 字数:  

内容简介

  本书基于Python语言,结合实际的数据集,介绍了机器学习算法以及数据分析方法的应用。本书主要包含两部分内容,第一部分为Python机器学习入门知识:主要介绍了Python的基础内容、Numpy与Pandas库数据操作、Matplotlib与Seaborn库数据可视化、Sklearn库机器学习,以及与机器学习相关的基础知识;第二部分为Python机器学习算法应用:主要介绍了数据的回归预测分析、时间序列预测,数据无监督学习中的聚类、降维以及关联规则,数据分类模型的应用以及针对文本数据与网络图数据的机器学习算法应用。 本书适合对机器学习、数据分析感兴趣的初学者学习,也可作为Python机器学习、数据分析、数据可视化的入门及进阶的教材。

作者简介

  无

图书目录

第1章 Python机器学习快速入门 1 1.1 Python安装 1 1.1.1 安装Anaconda 1 1.1.2 安装Python库 5 1.2 Python常用数据类型 5 1.2.1 列表 5 1.2.2 元组 8 1.2.3 字典 9 1.2.4 集合 10 1.2.5 字符串 11 1.3 Python条件、循环与函数 13 1.3.1 条件判断语句 13 1.3.2 循环语句 14 1.3.3 函数 16 1.4 机器学习简介 17 1.4.1 无监督学习 18 1.4.2 有监督学习 20 1.4.3 半监督学习 21 1.4.4 常用机器学习算法 22 1.5 本章小结 22 第2章 Python中的常用库 23 2.1 Numpy库 23 2.1.1 Numpy数组生成 24 2.1.2 Numpy数组运算 27 2.1.3 Numpy数组操作 28 2.1.4 Numpy常用函数 33 2.2 Pandas库 36 2.2.1 Pandas数据生成和读取 37 2.2.2 Pandas数据操作 39 2.2.3 Pandas数据可视化 44 2.3 Matplotlib库 47 2.3.1 Matplotlib可视化基础 47 2.3.2 Matplotlib数据可视化实战 53 2.4 Seaborn库 60 2.4.1 Seaborn库功能简介 60 2.4.2 Seaborn库数据可视化实战 61 2.5 Sklearn库 65 2.5.1 Sklearn库功能简介 65 2.5.2 Sklearn库应用实战 66 2.6 本章小结 70 第3章 机器学习流程 71 3.1 数据预处理与探索 72 3.1.1 缺失值处理 73 3.1.2 数据可视化探索 74 3.1.3 数据标准化与变换 78 3.2 无监督问题应用 81 3.2.1 数据降维 81 3.2.2 数据聚类 84 3.3 有监督分类问题应用 87 3.4 有监督回归问题应用 91 3.5 半监督学习应用 94 3.6 本章小结 96 第4章 模型的选择与评估 98 4.1 模型的选择 98 4.1.1 模型拟合情况 98 4.1.2 避免欠拟合和过拟合的方式 100 4.1.3 模型的方差与偏差 101 4.2 模型训练技巧 101 4.2.1 相关方法 102 4.2.2 实战案例:K折交叉验证 103 4.2.3 实战案例:参数网格搜索 104 4.3 模型评价指标 106 4.3.1 分类效果评价 106 4.3.2 回归效果评价 106 4.3.3 聚类效果评价 107 4.4 本章小结 108 第5章 回归模型 109 5.1 一元线性回归 111 5.1.1 模型介绍 111 5.1.2 实战案例:一元线性回归建模 111 5.2 多元线性回归 116 5.2.1 模型简介 116 5.2.2 实战案例:房屋价格预测 116 5.3 正则化Lasso回归 127 5.3.1 模型简介 127 5.3.2 实战案例:Lasso回归预测房屋价格 128 5.4 时间序列ARIMA模型 133 5.4.1 模型简介 133 5.4.2 实战案例:ARIMA模型预测未来啤酒消耗量 134 5.5 时间序列SARIMA模型 145 5.5.1 模型简介 145 5.5.2 实战案例:SARIMA模型预测未来啤酒消耗量 146 5.6 本章小结 149 第6章 无监督模型 150 6.1 常用降维算法 151 6.1.1 主成分分析 151 6.1.2 因子分析 152 6.1.3 流形学习——等距映射 152 6.1.4 局部线性嵌入LLE 153 6.1.5 多维尺度变换MSD 153 6.1.6 t-SNE 153 6.2 数据降维案例实战 154 6.2.1 主成分分析数据降维 156 6.2.2 因子分析数据降维 159 6.2.3 流形学习——等距嵌入数据降维 160 6.2.4 局部线性嵌入数据降维 161 6.2.5 MDS数据降维 162 6.2.6 t-SNE数据降维 163 6.3 常用聚类算法 164 6.3.1 K均值聚类 165 6.3.2 密度聚类 165 6.3.3 系统聚类 166 6.3.4 模糊聚类 167 6.4 数据聚类案例实战 168 6.4.1 K均值聚类实战 169 6.4.2 密度聚类实战 173 6.4.3 系统聚类实战 175 6.4.4 模糊聚类实战 178 6.5 关联规则挖掘 179 6.5.1 模型简介 180 6.5.2 实战案例:购物篮分析 181 6.6 本章小结 188 第7章 分类模型 189 7.1 决策树算法 193 7.1.1 算法简介 193 7.1.2 实战案例:决策树算法实战 195 7.2 随机森林算法 203 7.2.1 算法介绍 203 7.2.2 实战案例:随机森林算法实战 203 7.3 Logistic回归算法 208 7.3.1 算法简介 208 7.3.2 实战案例:Logistic回归算法实战 209 7.4 支持向量机算法 211 7.4.1 算法简介 211 7.4.2 实战案例:支持向量机算法实战 213 7.5 人工神经网络算法 219 7.5.1 算法简介 219 7.5.2 人工神经网络算法实战 221 7.6 本章小结 225 第8章 高级数据回归算法 226 8.1 高级数据回归算法模型实战 227 8.1.1 数据探索与可视化 227 8.1.2 随机森林回归预测实战 232 8.1.3 GBDT回归预测实战 234 8.1.4 支持向量机回归预测实战 236 8.1.5 人工神经网络回归预测实战 237 8.2 复杂时间序列预测模型 239 8.2.1 Prophet时序回归 239 8.2.2 多元时序回归 240 8.3 时间序列回归模型实战 240 8.3.1 时序数据导入与可视化探索 240 8.3.2 Prophet算法预测用户数量 242 8.3.3 Prophet算法预测流量 245 8.3.4 VAR多变量时间序列的建模与预测 247 8.3.5 VARMA多变量时间序列的建模与预测 250 8.4 本章小结 253 第9章 非结构数据机器学习 254 9.1 非结构数据分析简介 255 9.1.1 文本数据分析简介 255 9.1.2 网络图数据分析简介 256 9.2 文本数据分析实战 257 9.2.1 文本数据预处理 257 9.2.2 文本获取TF-IDF特征 263 9.2.3 文本数据K均值聚类 265 9.2.4 文本数据LDA主题模型 266 9.2.5 文本数据朴素贝叶斯分类 267 9.3 网络图数据分析实战 272 9.3.1 网络图可视化 272 9.3.2 网络图聚类分割 277 9.4 本章小结 281 第10章 综合实战案例:中药材鉴别 282 10.1 无监督学习——鉴别药材种类 284 10.1.1 数据特征可视化探索 285 10.1.2 使用原始特征进行聚类分析 287 10.1.3 使用降维后的特征进行聚类 291 10.2 有监督学习——药材产地鉴别 295 10.2.1 数据特征可视化探索分析 296 10.2.2 利用选择的特征进行分类 297 10.3 半监督学习——药材类别鉴别 303 10.3.1 数据预处理和可视化探索 304 10.3.2 数据主成分分析降维 306 10.3.3 半监督学习分类——标签传播算法 308 10.4 本章小结 311 参考文献 312

本目录推荐