
SAS、spss进行Durbin-Watson检验
1.首先要知道你用的哪一个SAS子程序。
2.如果是PROC NLIN,那么非常遗憾,它没有现成的DW统计量,但是你可以在OUTPUT选项中在输出数据集里面输出残差。
3.DW实际上是对残差做一阶自相关判断,因此你完全可以根据公式用SAS中的DATA步来完成代码开发,参考代码如下:
data nkwilling;
do i=1 to 100;
e=normal(0);
output;
end;
run;
data DW;
set nkwilling end=last;
e_lag=lag(e);
e_dif=sum(e,-e_lag);
t1=e_dif*e_dif;
t2=e*e;
if _n_=1 then do;dw1=t1;dw2=t2;end;
else do;dw1+t1;dw2+t2;end;
if last then dw=dw1/dw2;
run;
再参考DW有关自相关的范围,我记得好像是0-4,作出判断。
匆忙写的,你再参考有关书籍做一下修改。
sas 和spss都能做
检验图就是残差图
以预测值Y为横轴,以y与预测值Y之间的误差et为纵轴(或学生化残差与拟和值或一个自变量),绘制残差的散点图。如果散点呈现出明显的规律性,则认为存在自相关性或者非线性或者非常数方差的问题。
DW是0<D<4,统计学意义如下:
①当残差与自变量互为独立时,D=2 或 DW 越接近2,判断无自相关性把握越大。
②当相邻两点的残差为正相关时,D<2,DW 越接近于0,正自相关性越强。
③当相邻两点的残差为负相关时,D>2,DW 越接近于4,负自相关性越强。
判断。根据样本容量n 和解释变量的数目p 查DW 分布表,得下临界值L D 和上临界值U D ,
并依下列准则判断扰动项的自相关情形。
(1)如果0<DW< L D ,则拒绝零假设,扰动项存在一阶正自相关。DW 越接近于0,正自相关
性越强。
(2)如果L D <DW< U D ,则无法判断是否有自相关。
(3)如果U D <DW<4- U D ,则接受零假设,扰动项不存在一阶正自相关。DW 越接近2,判断
无自相关性把握越大。
(4)如果4- U D <DW<4- L D ,则无法判断是否有自相关。
(5) 如果4- L D <DW<4,则拒绝零假设,扰动项存在一阶负自相关。DW 越接近于4,负自
相关性越强。
检验不难,据不完全统计,PROC REG/AUTOREG/MODEL都有选项输出统计量和p-值。你要是非线性的,可以用PROC MODEL。其实Durbin-Watson检验的统计量也可以利用残差根据公式手工算。
但是检验图是个什么概念不才就一点也不懂了,一个模型不就只有一个Durbin-Watson值吗?
option nocenter;
dm ‘log;clear;output;clear’;
proc import datafile=”c:\example.xls” replace
out=one;
getnames=yes;
data one; set one;
proc nlin data=one;
parms b1=0.2 b2=-0.2 b3=-0.4 ;
AOld = a1;anew=a2;
hdold=hd1;temp = AOld / ANew;
do anew = (1+a1) to a2 by 1;
HdNew = exp(temp*log(hdold)+(1-temp)*(b1+b2/aold+b3*hdold)); AOld = ANew;
hdold=hdnew;
end;
model hd2 = HdNew;
output out=two predicted=hd2hat;
我应该如何在上面代码中添加Durbin-Watson检验呢?
用proc reg就好了,在option那里加一个“DW
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26