目录
前言
第1章 引言 1
1.1 统计学在天文学中的位置 1
1.2 天文研究中统计决策的流程 2
1.3 关于本书和主要参考书目 3
参考文献 4
第2章 概率论基础 6
2.1 观测科学的不确定性 6
2.2 随机事件与样本空间 6
2.3 事件之间的相互关系及运算 7
2.4 概率的一般定义与性质 8
2.5 条件概率及与之有关的三个公式 10
2.6 相互独立的事件 12
2.7 随机变量的分布函数 12
2.8 离散分布和连续分布 13
2.9 分位数函数 20
2.10 随机变量的数字特征 20
2.11 随机变量的函数的分布 23
2.12 多维随机变量及其分布 25
2.13 随机变量的独立性和条件分布 26
2.14 多维随机变量的数字特征 28
2.15 多维随机变量函数的分布 30
2.16 大数定理和中心极限定理 32
第3章 概率分布函数 35
3.1 多项分布族 35
3.2 泊松分布 36
3.2.1 泊松分布的天文背景 36
3.2.2 泊松分布的数学性质 38
3.2.3 泊松过程 39
3.3 正态分布和对数正态分布 44
3.3.1 一元正态分布 44
3.3.2 多元正态分布族 45
3.4 帕累托分布及其推广 47
3.4.1 帕累托分布 47
3.4.2 帕累托分布的推广 48
3.5 伽马分布族 49
3.6 贝塔分布族 51
3.7 Z 分布族 51
3.8 t分布族 52
3.8.1 一维连续型随机变量的分布密度图 54
3.8.2 一维连续型随机变量的累积分布图 56
3.8.3 二维连续型随机变量的分布图 58
参考文献 61
第4章 数理统计基础和描述统计 62
4.1 基本概念 62
4.1.1 总体和样本 62
4.1.2 统计量和样本的数字特征 63
4.1.3 样本数字特征的分布 64
4.2 抽样定理 67
4.3 描述统计 71
4.3.1 MATLAB中的数字特征函数 71
4.3.2 统计图 74
4.4 核密度估计 77
4.4.1 核密度函数 77
4.4.2 带宽的选取 79
4.4.3 多维核密度估计 80
4.4.4 核密度估计的MATLAB实现 81
参考文献 90
第5章 参数估计 91
5.1 统计推断的天文学背景 91
5.2 点估计原则 91
5.3 点估计技术 92
5.3.1 矩法 92
5.3.2 最小二乘法 93
5.3.3 最大似然法 94
5.3.4 计算最大似然估计的EM算法 97
5.3.5 估计量好坏标准 100
5.4 误差理论 102
5.4.1 线性函数的误差传播 103
5.4.2 误差传播公式 104
5.5 置信区间 105
5.5.1 置信区间和显著水平 105
5.5.2 正态总体的期望值和方差的置信区间 106
5.5.3 大样本单参数的置信区间估计 109
5.5.4 求置信区间的一般方法 110
5.5.5 多个参数的置信区间 112
5.6 用MATLAB求点估计和置信区间 114
参考文献 117
第6章 假设检验 118
6.1 假设检验的基本思想 118
6.2 双侧检验和单侧检验 119
6.3 两类风险 120
6.4 正态总体的参数检验 121
6.4.1 单正态总体检验 121
6.4.2 成数检验 121
6.4.3 两正态总体参数的检验 122
6.5 假设检验中的P值检验方法 123
6.6 拟合性检验 124
6.6.1 皮尔逊卡方检验 124
6.6.2 科尔莫戈罗夫-斯米尔诺夫检验 126
6.6.3 克拉默-冯 麦斯型统计量 127
6.6.4 斯米尔诺夫双样本检验 133
6.6.5 k样本安德森-达林检验 135
6.7 游程数R检验 136
6.8 符号检验 137
6.9 似然比检验 139
6.10 独立性检验 140
6.11 样本相关系数的检验 141
6.11.1 经典相关性检验 142
6.11.2 贝叶斯相关检验 145
6.11.3 等级相关系数 146
6.11.4 置换检验 149
6.12 假设检验的MATLAB实现 149
6.12.1 正态分布的假设检验 149
6.12.2 游程数检验 152
6.12.3 拟合优度检验 154
6.12.4 符号检验 156
6.12.5 列联表的独立性检验 157
参考文献 158
第7章 贝叶斯统计 160
7.1 先验分布与后验分布 160
7.1.1 三种信息 160
7.1.2 贝叶斯公式 160
7.2 先验分布的确定 163
7.2.1 基于经验的先验分布 163
7.2.2 利用边缘分布确定先验分布 164
7.2.3 共轭先验分布 165
7.2.4 无信息先验分布 166
7.2.5 最大熵方法确定先验分布 167
7.3 贝叶斯推断 168
7.3.1 贝叶斯点估计及其误差估计 168
7.3.2 可信区域 169
7.4 贝叶斯模型的选择 173
7.4.1 贝叶斯后验比 173
7.4.2 贝叶斯证据及其计算 173
7.4.3 贝叶斯因子 175
7.4.4 贝叶斯信息准则 175
7.5 P值检验和贝叶斯因子检验的比对 178
7.6 贝叶斯计算 179
参考文献 184
第8章 蒙特卡罗方法简介 185
8.1 随机数的产生 185
8.1.1 基于(0,1)均匀分布的随机数 185
8.1.2 基于极限定理产生的随机数 186
8.1.3 舍选法 187
8.1.4 较复杂的抽样 190
8.1.5 随机向量的抽样方法 192
8.2 减少方差的抽样技巧 193
8.2.1 一个积分的例子 193
8.2.2 MC方法的误差 196
8.2.3 重要抽样 196
8.2.4 控制变量法 198
8.2.5 分层抽样 199
8.3 重采样方法 199
8.3.1 自举法 200
8.3.2 刀切法 205
8.4 实验模拟的实例 209
8.4.1 李-马公式的检验 209
8.4.2 平滑处理对相关系数临界值的影响 212
8.4.3 拟合参数误差的MC估计 215
8.4.4 根据视向速度差的分布确定双星样本的比例 216
参考文献 220
第9章 回归分析 221
9.1 一元线性回归分析 221
9.1.1 基本问题 221
9.1.2 回归模型 222
9.1.3 参数估计 223
9.1.4 线性模型的显著性检验 226
9.2 多元线性回归 229
9.2.1 回归模型 230
9.2.2 参数估计 231
9.2.3 偏差平方和分解 232
9.2.4 回归方程和回归系数的假设检验 233
9.2.5 非嵌套模型的戴维森-麦金农J检验 234
9.2.6 回归诊断 236
9.3 回归分析的MATLAB函数 237
9.3.1 线性回归函数 237
9.3.2 多项式拟合交互式工具 239
9.3.3 非线性回归函数 241
9.3.4 逐步回归 244
参考文献 249
第10章 多元分析方法 250
10.1 聚类分析 250
10.1.1 问题的提出 250
10.1.2 距离和相似系数 251
10.1.3 数据的类型及其标准化 252
10.1.4 系统聚类法 254
10.1.5 动态聚类法 258
10.2 主成分分析 263
10.2.1 总体的主成分 264
10.2.2 主成分的性质 266
10.2.3 样本的主成分 268
10.2.4 样本主成分分析的MATLAB实现 272
10.3 判别分析 276
10.3.1 距离最小判别准则 276
10.3.2 贝叶斯判别 279
10.3.3 费希尔判别准则 282
10.3.4 判别效果的检验和判别准则的评价 284
10.3.5 判别分析的MATLAB实现 285
参考文献 289