关于常见的随机变量相关知识整理 离散型随机变量是什么

编辑导语:“随机变量”是我们经常会听到的一个词 , 但它具体是什么 , 它有什么样的特点?这篇文章为我们仔细讲解了“随机变量”的相关知识 , 一起学习一下吧 。

关于常见的随机变量相关知识整理 离散型随机变量是什么

文章插图
很久没有分享一些基础的理论知识相关的文章了 。一方面这种文章大家阅读意愿低 , 比较难和实践结合 , 没那么多合适的案例分享;另一方面也是不好写 , 各种数学公式和符号 , 电脑编辑起来真的是异常艰难 。
所以写完了统计学相关的系列后 , 就迟迟没动笔写新的 。不过对于我们数据从业人员来讲 , 概率、代数、统计、算法等相关的知识 , 还是要尽可能扎实掌握的 。(统计学系列传送:《统计学基础》、《抽样分布》、《参数估计》、《区间估计》、《假设检验》)
今天和大家唠唠概率论中很重要的基础内容:随机变量的一些基础概念 , 主要是离散型和连续型的区别 , 以及各自的分布函数 。
一、随机变量的基础概念先聊聊一些基础的概念 。
1. 随机变量设随机试验的样本空间为S={e} , X=X(e)是定义在样本空间上的实值单值函数 , 则称X为随机变量 。一般以大写字母X , Y , Z等表示随机变量 。
关于定义 , 理解就好 。
说白了 , 我们就是把真实的随机事件抽象出来 , 用随机变量来表示 , 进行数字化、抽象化 , 便于分析 。
随机变量分为两类:离散型和非离散型 。
离散型:若随机变量X只能取到有限个或者可列个不同值 , 则称X为离散型随机变量 。比如抽一张纸牌 , 一共54张 , 把这个事件转化成随机变量 , 这个随机变量的取值最多54个 , 是有限的 。这就是离散型随机变量 。
非离散型:与离散型相对地 , 非离散型随机变量指随机变量有不可列个不同取值的随机变量 。比如人的身高 , 可以从0厘米到300厘米任取 , 是无限个取值 , 因此是非离散型的 。
非离散型随机变量中 , 有一类特殊的 , 也是我们主要关注的类型:连续型随机变量 。连续型和非离散型并不等同 , 这点需要注意 。
2. 概率分布列与密度函数对于离散型随机变量而言 , 我们用概率分布列描述概率分布;而对于连续型随机变量 , 我们用概率密度函数来描述 。
以下是离散型随机变量概率分布列的示意图:
关于常见的随机变量相关知识整理 离散型随机变量是什么

文章插图
可以看出来 , 随机变量X的有限可列个的 , 因此可以用上面的表格表示不同X取值时 , 具体的概率值 。
连续型随机变量密度函数示意图如下:
关于常见的随机变量相关知识整理 离散型随机变量是什么

文章插图
下面是常见的连续型函数的概率密度示意:
关于常见的随机变量相关知识整理 离散型随机变量是什么

文章插图
另外 , 关于连续型随机变量的概率密度函数还有个性质:
关于常见的随机变量相关知识整理 离散型随机变量是什么

文章插图
这告诉我们对连续型随机变量 , 其在任意单点处取值的概率为0 。这点很重要 。因此也可以得到推论:
即在端点上是否取到 , 不影响整体区间的概率 。
最后 , 无论是概率分布列还是密度函数 , 概率之和(或者面积)都等于1 。这是概率的基础定义 。
3. 分布函数X是随机变量 , 则函数F(x)=P(X<x)成为X的概率分布函数 , 简称分布函数 。
对于离散型随机变量 , 假设P(X=xk)=pk , 则分布函数为:
关于常见的随机变量相关知识整理 离散型随机变量是什么

文章插图
此时分布函数为阶梯函数且单调递增 。且函数值的跳跃发生在所有xk处 , 跳跃的幅度为pk 。举个例子 , 随机变量X的概率分布列:
关于常见的随机变量相关知识整理 离散型随机变量是什么

文章插图
根据定义 , 可以推导出分布函数为:
关于常见的随机变量相关知识整理 离散型随机变量是什么

文章插图
对于连续型随机变量 , 假设密度函数为f(x) , 则分布函数为不定积分: