目 录
第一部分 历史背景
第1章 拉普拉斯的学术成就 3
1.1 拉普拉斯的学术生涯 6
1.1.1 拉普拉斯在概率论上的贡献 8
1.1.2 拉普拉斯的两部概率论著作 12
1.2 拉普拉斯的因果哲学 13
1.2.1 充足理由律 14
1.2.2 探索不确定性中的规律 15
第2章 概率论简史 19
2.1 17 世纪中叶的概率论 20
2.2 18 世纪的概率论 21
2.3 19 世纪的概率论 21
2.4 20 世纪以来的概率论 23
2.5 概率论的意义 24
2.6 推荐的读物 28
第二部分 经典概率论基础
第3章 古典概率与概率论的公理化 33
3.1 古典概率模型 38
3.1.1 计数概率 42
3.1.2 几何概率 51
3.1.3 庞加莱论概率计算 58
3.1.4 随机模拟方法 60
3.1.5 对随机性的思考 63
3.2 概率论的公理化 70
3.2.1 样本空间 75
3.2.2 柯尔莫哥洛夫概率公理体系 79
3.2.3 三种不同类型的概率测度 88
3.2.4 概率的一些基本性质 92
3.3 条件概率与独立性 97
3.3.1 条件概率及其性质 100
3.3.2 全概率公式与贝叶斯公式 105
3.3.3 随机事件的独立性 113
3.3.4 条件独立性及其性质 122
第4章 随机变量及其数字特征 127
4.1 随机变量及其基本性质 131
4.1.1 随机变量的分布与分布函数 135
4.1.2 离散型与连续型随机变量 140
4.1.3 随机变量的函数 150
4.2 随机向量及其基本性质 152
4.2.1 边缘分布和条件分布 159
4.2.2 随机变量间的独立性 164
4.2.3 条件独立性 167
4.2.4 随机向量的函数 173
4.3 随机变量的数字特征 183
4.3.1 数学期望 187
4.3.2 条件期望与双期望定理 196
4.3.3 方差与条件方差 199
4.3.4 熵、互信息和 KL 散度 204
4.3.5 拉普拉斯变换与各种矩 210
4.3.6 概率不等式 215
4.4 随机变量之间的关系 226
4.4.1 协方差与相关系数 228
4.4.2 最小二乘法和回归 233
4.4.3 随机向量的主成分 238
第5章 示性函数 240
5.1 示性函数的基本性质 249
5.1.1 独立随机变量之和的示性函数 252
5.1.2 示性函数与矩 254
5.2 示性函数与分布函数的关系 256
5.2.1 莱维反演公式 261
5.2.2 莱维连续性定理 266
第6章 一些常见的分布 269
6.1 离散型随机变量的分布 276
6.1.1 单点分布和两点分布 278
6.1.2 二项分布 281
6.1.3 波利亚分布及其特例(超几何分布) 284
6.1.4 几何分布和负二项分布 286
6.1.5 泊松分布 290
6.2 连续型随机变量的分布 294
6.2.1 均匀分布 295
6.2.2 三角形分布 299
6.2.3 正态分布、对数正态分布和偏正态分布 299
6.2.4 拉普拉斯分布 304
6.2.5 柯西分布 308
6.2.6 伽马分布及其特例(卡方分布和指数分布) 309
6.2.7 贝塔分布 317
6.2.8 t 分布和 F 分布 320
6.2.9 帕累托分布 324
6.2.10 以物理学家命名的分布 326
6.3 随机向量的分布 330
6.3.1 高维均匀分布 332
6.3.2 多项分布 335
6.3.3 狄利克雷分布 338
6.3.4 多元正态分布与多元 t 分布 344
6.3.5 随机矩阵与威沙特分布 352
第7章 大数律与中心极限定理 355
7.1 大数律 360
7.1.1 弱大数律 364
7.1.2 强大数律与重对数律 369
7.2 中心极限定理 375
7.2.1 林德伯格-费勒中心极限定理 378
7.2.2 中心极限定理的应用 384
第8章 随机过程简介 388
8.1 离散时间马尔可夫链 398
8.1.1 状态的分类 403
8.1.2 马尔可夫链的遍历性与平稳分布 410
8.1.3 分支过程 414
8.2 连续时间过程 420
8.2.1 泊松过程与更新过程 423
8.2.2 生灭过程 429
8.2.3 布朗运动 434
8.3 随机分析简介 443
8.3.1 伊藤积分 444
8.3.2 随机微分方程 450
第三部分 贝叶斯决策与因果推断
第9章 贝叶斯分析与统计决策 457
9.1 参数的先验分布 465
9.1.1 非正常先验 467
9.1.2 杰弗里斯先验 469
9.1.3 共轭先验 470
9.1.4 有信息先验 472
9.2 后验 似然 先验 478
9.2.1 后验预测分布 481
9.2.2 后验期望的计算 485
9.2.3 层级贝叶斯模型 488
9.3 统计决策理论概要 494
9.3.1 贝叶斯学派的期望损失原则 497
9.3.2 频率派的决策方法 503
第10章 因果推断 507
10.1 干预 516
10.1.1 如何看待数据 523
10.1.2 因果关系之梯 527
10.1.3 中介分析 531
10.2 反事实推理 535
10.2.1 必要性概率 537
10.2.2 因果推断与人工智能 539
10.3 拉普拉斯的因果推断 548
10.3.1 拉普拉斯因果原则 551
10.3.2 拉普拉斯近似推断 552
第四部分 附录
附录A 拉普拉斯变换 559
附录B 母函数的计算 563
附录C 卷积的物理意义 567
附录D 正态分布的由来 572
附录E 矩阵计算的一些结果 574
E.1 本征值与本征向量 576
E.2 矩阵的分解 578
E.3 多元分析 586
附录F 费舍尔信息量与信息矩阵 594
附录G 凸性与詹森不等式 598
附录H 连分数 601
附录I 黎曼-斯蒂尔杰斯积分 605
附录J 测度论简介 609
J.1 外测度与卡拉西奥多里扩张 610
J.2 可测函数 611
J.3 勒贝格积分 614
J.4 勒贝格-斯蒂尔杰斯积分 616
附录K 参考文献 618
附录L 符号表 626
附录M 名词索引 628
M.1 术语索引 628
M.2 人名索引 640
