关于常见的随机变量相关知识整理离散型随机变量是什么 _知识分享

编辑导语：“随机变量”是我们经常会听到的一个词，但它具体是什么，它有什么样的特点？这篇文章为我们仔细讲解了“随机变量”的相关知识，一起学习一下吧。

文章插图
很久没有分享一些基础的理论知识相关的文章了。一方面这种文章大家阅读意愿低，比较难和实践结合，没那么多合适的案例分享；另一方面也是不好写，各种数学公式和符号，电脑编辑起来真的是异常艰难。
所以写完了统计学相关的系列后，就迟迟没动笔写新的。不过对于我们数据从业人员来讲，概率、代数、统计、算法等相关的知识，还是要尽可能扎实掌握的。（统计学系列传送：《统计学基础》、《抽样分布》、《参数估计》、《区间估计》、《假设检验》）
今天和大家唠唠概率论中很重要的基础内容：随机变量的一些基础概念，主要是离散型和连续型的区别，以及各自的分布函数。
一、随机变量的基础概念先聊聊一些基础的概念。
1. 随机变量设随机试验的样本空间为S={e} ， X=X(e)是定义在样本空间上的实值单值函数，则称X为随机变量。一般以大写字母X ， Y ， Z等表示随机变量。
关于定义，理解就好。
说白了，我们就是把真实的随机事件抽象出来，用随机变量来表示，进行数字化、抽象化，便于分析。
随机变量分为两类：离散型和非离散型。
离散型：若随机变量X只能取到有限个或者可列个不同值，则称X为离散型随机变量。比如抽一张纸牌，一共54张，把这个事件转化成随机变量，这个随机变量的取值最多54个，是有限的。这就是离散型随机变量。
非离散型：与离散型相对地，非离散型随机变量指随机变量有不可列个不同取值的随机变量。比如人的身高，可以从0厘米到300厘米任取，是无限个取值，因此是非离散型的。
非离散型随机变量中，有一类特殊的，也是我们主要关注的类型：连续型随机变量。连续型和非离散型并不等同，这点需要注意。
2. 概率分布列与密度函数对于离散型随机变量而言，我们用概率分布列描述概率分布；而对于连续型随机变量，我们用概率密度函数来描述。
以下是离散型随机变量概率分布列的示意图：

文章插图
可以看出来，随机变量X的有限可列个的，因此可以用上面的表格表示不同X取值时，具体的概率值。
连续型随机变量密度函数示意图如下：

文章插图
下面是常见的连续型函数的概率密度示意：

文章插图
另外，关于连续型随机变量的概率密度函数还有个性质：

文章插图
这告诉我们对连续型随机变量，其在任意单点处取值的概率为0 。这点很重要。因此也可以得到推论：
即在端点上是否取到，不影响整体区间的概率。
最后，无论是概率分布列还是密度函数，概率之和（或者面积）都等于1 。这是概率的基础定义。
3. 分布函数X是随机变量，则函数F(x)=P(X<x)成为X的概率分布函数，简称分布函数。
对于离散型随机变量，假设P(X=xk)=pk ，则分布函数为：

文章插图
此时分布函数为阶梯函数且单调递增。且函数值的跳跃发生在所有xk处，跳跃的幅度为pk 。举个例子，随机变量X的概率分布列：

文章插图
根据定义，可以推导出分布函数为：

文章插图
对于连续型随机变量，假设密度函数为f(x) ，则分布函数为不定积分：

关于常见的随机变量相关知识整理 离散型随机变量是什么

关于常见的随机变量相关知识整理离散型随机变量是什么