使用Excel绘制t分布概率密度函数-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读使用Excel绘制t分布概率密度函数

使用Excel绘制t分布概率密度函数

2016-08-04

使用Excel绘制t分布概率密度函数

关于t分布应用广泛，主要用于假设检验。关于使用Excel画出t分布的概率密度函数图表的问题，试答如下：

使用excel绘制t分布的概率密度函数，需要两列：1）自变量X，2）计算自变量X对应的t分布的概率密度函数。由于Excel中TDIST函数计算的是概率累积密度，不能计算概率密度值，所以借用伽马函数的自然对数。先从t分布的公式着手。

其中：ν 为自由度=n-1

Γ为伽马函数的的符号

t分布的平均数和标准正态分布一样均等于0

t分布的标准差=ν/(ν-2)

我们以随机变量t值为x轴（即视t为x），如何将自由度带入方程式求y值？因为t分布中涉及到GAMMALN()函数，而excel是提供GAMMALN()函数的，所以我们可以使用excel中的GAMMALN()函数来计算得到t分布的概率密度函数（参见【附录】）。经转换后其公式为：

t(X,df)=EXP(GAMMALN((df+1)/2))/（SQRT(PI()*df)*EXP(GAMMALN(df/2))）*(1+X^2/df)^(-1/2*(df+1))……………………………………公式（1）

由于对公式书写格式的顺序的理解不同，上述公式可能也会写成以下形式：

t(X,df)=EXP(GAMMALN((df+1)/2))*(1+X^2/df)^(-(df+1)/2)/SQRT(df*PI())/EXP(GAMMALN(df/2)) ……………………………………公式（2）

现以自由度（ν）=4为例，求t分布的图表，可由以下几步进行：

第1步确定自变量取值范围

自由度=4时，t分布的方差为ν/(ν-2)=2，标准差= SQRT (2)=1.414

t分布的平均数和标准正态分布一样均等于0,同样与正态分布一样，几乎99%的t值会落在平均数`x±3个标准差之内，即落在区间（`x-3σ，`x+3σ）之间，所以横轴的取值范围在-4.2~4.2之间。

第2步在Excel单元格中输入自变量

在A列中，在单元格A2中输入-4.2，在单元格A3中输入-4，递增0.2，选中单元格A2与A3，按住右下角的填充控制点一直拖到单元格A44是4.2为止，A列的这些数据就作为随机变量t的取值。如表-1所示：

表-1

第3步在单元格B2中输入计算t分布的概率密度函数的公式

对于公式（1），由于自由度（ν）=4 ，则由df=4代入；自变量X就是单元格A2的值，所以按Excel相对引用的规则，X由A2代入即可，于是单元格B2内容是

=EXP(GAMMALN((4+1)/2))/（SQRT(PI()*4)*EXP(GAMMALN(4/2))）*(1+A2^2/4)^(-1/2*(4+1))，如表-2所示：

表-2

上述公式如按公式（1）的理解顺序，单元格B2内容可以写成：

=EXP(GAMMALN((4+1)/2))*(1+A2^2/4)^(-(4+1)/2)/SQRT(4*PI())/EXP(GAMMALN(4/2))

结果是一样的。

第4步复制公式

按住单元格B2右下角的填充控制点，向下一直拖曳到B44，将B2的公式填充复制到B列的相应的单元格，如表-3所示：

表-3

第5步由于相对引用的规则，A列的自变量会自动被公式相对引用计算，结果如表-4所示：

表-4

上述表-3是为了说明公式的复制，而特意在“工具”-“选项”-“视图”中将“公式”勾选，从而使公示内容全部显示出来。实际操作中，如表-4一样，公式的表达式不会显露，只有计算的结果会出现。至此已完成自由度为4的t分布概率密度函数表。

第6步作t分布概率密度函数图

选择A1：B44，选“图表向导”-“标准类型’-“XY散点图”（平滑线），如图-1所示：

图-1

第7步输入标题，调整字号、线型等格式，完成t分布概率密度函数图，如图-2所示：

图-2

如将上图的图表类型换成二维面积图，则如图-3-1(2003版)和图-3-2（2010版）所示：

图-3-1

图-3-2

在Excel 2003版中面积图数据系列格式的图案的内部填充格式没有透明的设置，也不能使用柱形图那样用预先制作的透明图片填充，此类效果可以在2007版与2010版中轻易实现。如为了在2003版中突出视觉效果，可以尝试使用三维面积图。如将上图的图表类型换成三维面积图，则如图-4-1（2003版）和图-4-2（2010版）所示：

图-4-1

图-4-2

为了方便调整不同的自由度参数值观察图形变化，在Excel数据表中可在第一行的某几个单元格如E1、F1、G1输入不同参数，然后在公式引用这几个参数时使用不同的方式：列数据为相对引用，而行数据为绝对引用，如E$1、F$1、G$1。而A列自变量值则使用：列数据为绝对引用，而行数据为相对引用，如$A2、$A3、$A4等。

数据表输入截图如图-5：