随机变量综述:概念到实践的全景指南
了解随机变量的定义、分布特性、统计数值以及在信息熵、频率直方图和百分位数等实际场景中的应用,帮助读者快速捕捉要点,并引导进一步阅读完整教程。
随机变量的概念
随机变量
随机变量是描述随机试验结果的函数,常用大写字母 X,Y,Z 或希腊字母 ξ,η,ζ 表示。它把样本空间 Ω 中的每个基本事件映射为实数值,从而将不确定的实验转化为可量化的数值。
分布函数
分布函数 F(x) 给出随机变量 X 小于等于某实数 x 的概率:
F(x)=P(X≤x) 它满足右连续、单调递增并在 −∞ 与 +∞ 处分别取 0 与 1。
示性函数
示性函数 IA 用于指示事件 A 是否发生:
IA(ω)={1,0,ω∈Aω∈/A 其期望恰好等于事件 A 的概率,即 E[IA]=P(A)。
离散型随机变量
离散型随机变量的取值集合是有限或可数无限的。例如掷骰子的点数 {1,2,3,4,5,6}。其概率分布可用概率分布列描述:
- P{X=xi}=pi,且 ∑ipi=1。
连续型随机变量
连续型随机变量的取值覆盖整个区间(或更广)。单点概率通常为 0,而应使用密度函数 f(x) 来刻画分布:
F(x)=∫−∞xf(t)dt,f(x)≥0,∫−∞∞f(x)dx=1 随机变量的独立性
若对任意实数 x 与 y 都满足
P(X≤x,Y≤y)=P(X≤x)P(Y≤y) 则称 X 与 Y 相互独立。独立性意味着它们的边缘分布互不影响。
随机变量的数字特征
期望
期望是随机变量的平均值。离散情形:
E[X]=i∑xipi 连续情形:
E[X]=∫−∞∞xf(x)dx 它具备线性特性 E[aX+bY+c]=aE[X]+bE[Y]+c。
方差
方差衡量离散程度:
Var(X)=E[(X−E[X])2]=E[X2]−(E[X])2 若对变量作线性变换 aX+b,则 Var(aX+b)=a2Var(X)。
协方差
协方差描述两个变量的线性相关程度:
Cov(X,Y)=E[(X−E[X])(Y−E[Y])] 它满足 Cov(X,X)=Var(X),以及 Cov(aX+bY,Z)=aCov(X,Z)+bCov(Y,Z)。
相关系数
相关系数 ρX,Y 将协方差标准化:
ρX,Y=σXσYCov(X,Y) 其中 σX=Var(X)。其取值范围为 −1≤ρX,Y≤1;若 ∣ρX,Y∣=1,则 X 与 Y 线性相关。
Markov 不等式
对非负随机变量 X,任意正数 a 满足
P(X≥a)≤aE[X] 该不等式仅依赖期望即可给出上界。
随机变量的应用
信息熵
信息熵衡量随机变量的不确定性:
H(X)=−x∑P(X=x)log2P(X=x) 若 X 均匀分布于 {1,2,…,n},则 H(X)=log2n,说明存储 n 个等概率符号至少需要 log2n 比特。
频率分布直方图
直方图以矩形面积表示频率,横轴为取值区间,纵轴为相对频率(频数除以总数)。等距分组常用于展示连续型数据的分布形态。
百分位数和四分位数
将有序数据 x1≤x2≤⋯≤xn 按累计比例划分,可得到第 k 百分位数 Pk。常见四分位数包括:
- Q1=P25(上四分位数)
- Q2=P50(中位数)
- Q3=P75(下四分位数)
四分位距 Q3−Q1 描述数据的离散程度。
想进一步掌握随机变量的理论细节与实际例题,请访问原文 随机变量专题(https://raineblog.dpdns.org/whk/science/probability/3/),深入阅读完整章节内容。