注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络计算机科学理论与基础知识数据科学实战

数据科学实战

数据科学实战

定 价:¥79.00

作 者: (美)舒特(Rachel Schutt),(美)奥尼尔(Cathy O''Neil)
出版社: 人民邮电出版社
丛编项:
标 签: 计算机/网络 数据仓库与数据挖掘 数据库

购买这本书可以去


ISBN: 9787115383495 出版时间: 2015-03-01 包装: 平装
开本: 16开 页数: 290页 字数:  

内容简介

  本书脱胎于哥伦比亚大学“数据科学导论”课程的教学讲义,它界定了数据科学的研究范畴,是一本注重人文精神,多角度、全方位、深入介绍数据科学的实用指南,堪称大数据时代的实战宝典。本书旨在让读者能够举一反三地解决重要问题,内容包括:数据科学及工作流程、统计模型与机器学习算法、信息提取与统计变量创建、数据可视化与社交网络、预测模型与因果分析、数据预处理与工程方法。另外,本书还将带领读者展望数据科学未来的发展。

作者简介

  Rachel Schutt,美国新闻集团旗下数据科学部门高级副总裁、哥伦比亚大学统计系兼职教授、约翰逊实验室高级研究科学家,同时也是哥伦比亚大学数据科学及工程研究所教育委员会的发起人之一。她曾在谷歌研究院工作数年,负责设计算法原型并通过建模理解用户行为。Cathy O'Neil,约翰逊实验室高级数据科学家、哈佛大学数学博士、麻省理工学院数学系博士后、巴纳德学院教授,曾发表过大量算术代数几何方面的论文。他曾在著名的全球投资管理公司D.E. Shaw担任对冲基金金融师,后加入专门评估银行和对冲基金风险的软件公司RiskMetrics,个人博客:mathbabe.org。

图书目录

作者介绍
关于封面图
前言
第1章简介:什么是数据科学
 1.1大数据和数据科学的喧嚣
 1.2冲出迷雾
 1.3为什么是现在
 1.4数据科学的现状和历史
 1.5数据科学的知识结构
 1.6思维实验:元定义
 1.7什么是数据科学家
  1.7.1学术界对数据科学家的定义
  1.7.2工业界对数据科学家的定义
第2章统计推断、探索性数据分析和数据科学工作流程
 2.1大数据时代的统计学思考
  2.1.1统计推断
  2.1.2总体和样本
  2.1.3大数据的总体和样本
  2.1.4大数据意味着大胆的假设
  2.1.5建模
 2.2探索性数据分析
  2.2.1探索性数据分析的哲学
  2.2.2练习:探索性数据分析
 2.3数据科学的工作流程
 2.4思维实验:如何模拟混沌
 2.5案例学习:RealDirect
  2.5.1RealDirect是如何赚钱的
  2.5.2练一练:RealDirect公司的数据策略
第3章算法
 3.1机器学习算法
 3.2三大基本算法
  3.2.1线性回归模型
  3.2.2足近邻模型(k-NN)
  3.2.3I(均值算法
 3.3练习:机器学习算法基础
 3.4总结
 3.5思维实验:关于统计学家的自动化
第4章垃圾邮件过滤器、朴素贝叶斯与数据清理
 4.1思维实验:从实例中学习
  4.1.1线性回归为何不适用
  4.1.2l(近邻效果如何
 4.2朴素贝叶斯模型
  4.2.1贝叶斯法则
  4.2.2个别单词的过滤器
  4.2.3直通朴素贝叶斯
 4.3拉普拉斯平滑法
 4.4对比朴素贝叶斯和k近邻
 4.5Bash代码示例”
 4.6网页抓取:APl和其他工具
 4.7Jake的练习题:文章分类问题中的朴素贝叶斯模型
第5章逻辑回归
 5.1思维实验
 5.2分类器
  5.2.1运行时间
  5.2.2你自己
  5.2.3模型的可解释性
  5.2.4可扩展性
 ……
第6章时间戳数据与金融建模
第7章从数据到结论
第8章构建面向大量用户的推荐引擎
第9章数据可视化与欺诈侦测
第10章社交网络与数据新闻学
第11章因果关系研究
第12章流行病学
第13章从竞赛中学到的:数据泄漏和模型评价
第14章数据工程:Mapreduce pregel、Hadoop
第15章听听学生学们怎么说
第16章下一代数据科学家、自大狂和职业道德

本目录推荐