深入浅出地阐述一个观点:期待即是均值的预估。
首先要清晰明白的是,期待值仅适用于随机变量。
那么,何为随机变量呢?简而言之,这是一个值会因不同情况而变化的变量,其具体数值我们无法预先知晓。面对这种充满未知的变量,我们自然希望能借助某些工具来理解它的性质,而期望、方差、偏度、峰度等统计量便是这样的工具。
期望的定义:
对于连续型和离散型随机变量,期望实际上都是一种“加权平均数”的计算。从数学角度讲,这表示期望就是随机变量各个可能取值,根据其出现概率进行的加权平均。如果我们掌握了变量的分布函数,便能通过特定的公式计算出其期望值。
实际情况往往没有这么理想。对于某个随机变量,如果我们经过多次观察仅获得了一组观察值,且对其分布并不了解,那么我们就需要寻找其他方法来“估算”其期望。期望的值与这个随机变量的平均值有何关联?我们对这个随机变量的“期待”又是什么?在统计学中,这些都构成了待解的问题。
以同样的逻辑思考,我们通常会选择计算样本均值来对随机变量的期望进行估计。在统计学中,当样本数量足够大时,这个样本均值对随机变量期望的估计是十分可靠的,甚至可以认为与期望值非常接近。
再以一个实例来说明。假设我们扔一枚均匀,正面记作+1分,反面记作-1分。从数学角度计算,我们预期的得分是0。
设扔的结果为一个随机变量,这是一个离散型随机变量,出现正面和反面的概率各为0.5。其实我们已经知道了这个变量的分布,可以直接求出其期望。但为了更好地解释何为期望,我们仍按照上述的估算方法来计算。
假设我们扔了许多次,得到了一系列的观察值。这些观察值中,有的是1,有的是-1,但肯定没有0。随着扔次数的增加,这些观察值的平均值会逐渐趋向于0。这就是我们所说的预期结果。即,当我们独立重复这个实验很多次时,平均值会非常接近0。如果平均值不趋向于0,那么我们就有理由相信这枚并不是均匀的。
再回顾一下开头的论述:当我们了解随机变量的分布时,期望就是按照公式计算的加权平均值。而当我们只有随机变量的一些观察样本而不知道其分布时,这个随机变量的期望与样本的均值应该相差不大。
— 终 —