注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术工业技术建筑科学建筑设计Python高级数据分析:机器学习、深度学习和NLP实例

Python高级数据分析:机器学习、深度学习和NLP实例

Python高级数据分析:机器学习、深度学习和NLP实例

定 价:¥59.00

作 者: (印),萨扬·穆霍帕迪亚
出版社: 机械工业出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787111617020 出版时间: 2019-01-01 包装: 平装
开本: 16开 页数: 156 字数:  

内容简介

  本书介绍高级数据分析概念的广泛基础,以及*近的数据库革命,如Neo4j、弹性搜索和MongoDB。本书讨论了如何实现包括局部爬取在内的ETL技术,并应用于高频算法交易和目标导向的对话系统等领域。还有一些机器学习概念的例子,如半监督学习、深度学习和NLP。本书还涵盖了重要的传统数据分析技术,如时间序列和主成分分析等。

作者简介

暂缺《Python高级数据分析:机器学习、深度学习和NLP实例》作者简介

图书目录

译者序
作者简介
技术审核员简介
致谢
第1章 简介001
1.1 为何选择Python001
1.2 何时避免使用Python002
1.3 Python中的面向对象编程002
1.4 在Python中调用其他语言010
1.5 将Python模型作为微服务011
1.6 高性能API和并发编程014
第2章 Python结构化数据提取、转换和加载019
2.1 MySQL020
2.1.1 如何安装MySQLdb020
2.1.2 数据库连接020
2.1.3 INSERT操作020
2.1.4 READ操作021
2.1.5 DELETE操作022
2.1.6 UPDATE操作023
2.1.7 COMMIT操作023
2.1.8 ROLL-BACK操作024
2.2 Elasticsearch026
2.3 Neo4j Python驱动029
2.4 neo4j-rest-client029
2.5 内存数据库029
2.6 Python版本MongoDB030
2.6.1 将数据导入集合031
2.6.2 使用pymongo创建连接031
2.6.3 访问数据库对象032
2.6.4 插入数据032
2.6.5 更新数据032
2.6.6 删除数据032
2.7 Pandas033
2.8 Python非结构化数据提取、转换和加载034
2.8.1 电子邮件解析034
2.8.2 主题爬取036
第3章 基于Python的监督学习043
3.1 使用Python实现降维043
3.1.1 相关性分析044
3.1.2 主成分分析046
3.1.3 互信息048
3.2 使用Python进行分类049
3.3 半监督学习050
3.4 决策树050
3.4.1 哪个属性优先050
3.4.2 随机森林分类器052
3.5 朴素贝叶斯分类器052
3.6 支持向量机054
3.7 最近邻分类器055
3.8 情绪分析056
3.9 图像识别057
3.10 使用Python进行回归058
3.10.1 最小二乘估计059
3.10.2 逻辑回归060
3.11 分类和回归060
3.12 使模型高估或低估061
3.13 处理分类型数据062
第4章 无监督学习—聚类067
4.1 K均值聚类068
4.2 选择K—肘部法则071
4.3 距离或相似性度量071
4.3.1 属性072
4.3.2 一般及欧氏距离072
4.3.3 平方欧氏距离074
4.3.4 字符串之间的编辑距离074
4.4 文档上下文的相似性076
4.5 什么是层次聚类077
4.5.1 自下而上的方法078
4.5.2 聚类之间的距离079
4.5.3 自上而下的方法080
4.5.4 图论方法084
4.6 如何判断聚类结果是否良好085
第5章 深度学习和神经网络087
5.1 反向传播088
5.1.1 反向传播方法088
5.1.2 广义Delta规则088
5.1.3 输出层权重更新089
5.1.4 隐藏层权重更新090
5.1.5 反向传播网络小结091
5.2 反向传播算法092
5.3 其他算法094
5.4 TensorFlow094
5.5 递归神经网络099
第6章 时间序列107
6.1 变化的分类107
6.2 包含趋势的序列分析107
6.2.1 曲线拟合108
6.2.2 从时间序列中去除趋势109
6.3 包含周期性的序列数据分析110
6.4 从时间序列中去除周期性111
6.4.1 滤波111
6.4.2 差分112
6.5 转换112
6.5.1 稳定方差112
6.5.2 使周期效应累加113
6.5.3 使数据呈正态分布113
6.6 平稳时间序列114
6.6.1 平稳过程114
6.6.2 自相关和相关图114
6.6.3 自协方差和自相关函数的估计115
6.7 使用Python进行时间序列分析116
6.7.1 有用的方法116
6.7.2 自回归过程118
6.7.3 估计AR过程的参数119
6.8 混合ARMA模型122
6.9 集成ARMA模型123
6.10 傅里叶变换124
6.11 一个特殊的场景125
6.12 数据缺失127
第7章 大数据分析129
7.1 Hadoop129
7.1.1 MapReduce编程129
7.1.2 partitioning函数130
7.1.3 combiner函数131
7.1.4 HDFS文件系统140
7.1.5 MapReduce设计模式140
7.2 Spark146
7.3 云分析148
7.4 物联网156

本目录推荐