第1讲 分析型企业的概念
大数据有大用
数据分析过程涉及的两个大数据环境
算法的概念
数据分析之信息概论
测量的哲学——自我学习之路
本书内容安排
第2讲 统计分布的数字特征
统计图
平均值
四分位距
标准差
偏度
峰度
分析大数据时需要注意的问题
商业模式的数字挑战
第3讲 时间序列
时间序列的概念
时间序列的特点
时间序列分析之低频分析
时间序列的分类分析
时间序列分析之日高频分析
分类分析
时间序列分析之日内高频分析
分析大数据时需要注意的问题
预测失灵
第4讲 期望值与信赖区间
期望的概念
简单的统计原理
R Commander项目实战
残差诊断
R语言程序实战
分析大数据时需要注意的问题
基于区块链的决策思考
第5讲 二元选择模型与Logstic模型
二元选择模型
R Commander项目实战
R语言程序实战
分析大数据时需要注意的问题
大数据的经济预测
第6讲 主成分分析
主成分分析的概念
R Commander项目实战
R语言程序实战
分析大数据时需要注意的问题
都是预测惹的祸
第7讲 聚类分析
聚类分析的基本概念
R Commander项目实战
R语言程序实战
分析大数据时需要注意的问题
平台经济的数据决策
第8讲 决策树
决策树的概念
决策树的分类原理
R Commander项目实战
R语言程序实战
分析大数据时需要注意的问题
当数据变成噪声
第9讲 随机森林
随机森林的概念
随机森林的特点
R Commander项目实战
R语言程序实战
分析大数据时需要注意的问题
都是随机惹的祸
第10讲 购物车分析
购物车分析的概念
关联分析的原理
R Cornmander项目实战
R语言程序实战
分析大数据时需要注意的问题
数据产品化——大数据决策的最后一段路
附录A 关于R语言的安装
R语言简介及安装
R Cornnmader简介
安装R Commander
附录B rattle包的安装
加载外部数据
加载R语言内置数据
附录C 数据文件的读取和MySQL数据库的使用
数据的读取
使用数据库读取数据
常用的数据处理函数
数据计算函数apply()家族