三分钟学统计之:t分布的特点
2018/2/10 明姬心理工作室

    

     对于数据量庞大的总体,我们往往很难测量,但对于统计分析来说,估计总体参数情况并做出总体推断是我们的最终目标。因此,研究人员只能通过对样本统计量的深度挖掘,来达到估计总体参数的目的。

     如果总体的分布均为正态分布,且总体方差已知,我们很容易通过样本平均数的抽样分布规律来推断总体分布的参数区间。但在现实生活中,更多的情况是,虽然我们知道总体分布为正态分布,但是不知道总体方差的大小,此时,我们就需要引入t分布来帮助进行推断。

     t分布,又称Student 分布,统计学者高赛特在1908年以笔名student发表的一篇论文中推导出了t分布。

     详细的推导过程就不多说了,简单来说,从一个正态分布、总体方差未知的总体中,每次抽取容量为n的样本,计算平均值,这时样本平均数的抽样分布不是正态分布,对其进行标准化操作也不会生成标准正态分布(Z分布),而是t分布。

     t分布的图形和标准正态分布很像(见下图),都是以0为均值,左右两侧对称分布,左侧t为负值,右侧t为正值,t的取值在 -∞ ~ +∞之间。

    

     t分布的形状随自由度(样本容量n-1)的变化而变化。当样本容量趋于∞时,t分布就是标准正态分布(Z分布),方差为1;当自由度n-1>30时,t分布接近标准正态分布(Z分布),方差大于1,随自由度的增大而方差渐趋于1;当n-1<30时,t分布与标准正态分布(Z分布)相差较大,随自由度减少,离散程度(方差)越大,分布图的中间变低但尾部变高。

     简单来说,样本量越大,t分布的图形就越接近标准正态分布(Z分布),样本量较小的时候,t分布与标准正态分布(Z分布)差异明显。您可以把t分布理解为“山寨版”的标准正态分布(Z分布)。

     t分布十分有用,是总体均数的区间估计和假设检验的重要工具。由于现实条件所限,我们通常不容易达到标准正态分布(Z分布)的条件,所以t分布的应用十分常见,统计学家也对t分布做了深入的研究,生成了t分布表供人们查找,使用t分布变得很方便。

    

     ----------------------------

     本文由中国科学院心理研究所EMBA专业研修班学员温静、蒋小寸、李让、李媛媛、尚婷联合撰写,后经王明姬教授修改后发布。

     ----------------------------

    

     长按二维码一键关注

     您的支持是我们前进的动力!

    http://weixin.100md.com
返回 明姬心理工作室 返回首页 返回百拇医药