数据的无量纲化处理和标准化处理的区别是什么-CDA数据分析师官网

热线电话：13121318867

数据的无量纲化处理和标准化处理的区别是什么

2017-01-07

数据的无量纲化处理和标准化处理的区别是什么

请教：两者除了方法上有所不同外，在其他方面还有什么区别？

解答：

标准化处理方法是无量纲化处理的一种方法。除此之外，还有相对化处理方法（包括初值比处理）、函数化（功效系数）方法，等等。由于标准化处理方法可以与分布函数结合，所以应用比较广泛。如果指标有正、逆之分，功效系数方法也不错。初值比处理方法主要应用在灰色系统关联分析方面。

标准化并不能解决正向化问题，如果要将数据正向化，需要其他无量钢化的方法，例如我要将数据全部变成0到100之间的数，那么可以用compute计算公式：

（x-min(x)）/(max(x)-min(x))*100

数据的标准化处理

（1）数据的中心化处理

数据的中心化处理是指平移变换，即

该变换可以使样本的均值变为 0，而这样的变换既不改变样本点间的相互位置，也

不改变变量间的相关性。但变换后，却常常有许多技术上的便利。

（2）数据的无量纲化处理

在实际问题中，不同变量的测量单位往往是不一样的。为了消除变量的量纲效应，

使每个变量都具有同等的表现力，数据分析中常用的消量纲的方法，是对不同的变量进

行所谓的压缩处理，即使每个变量的方差均变成1，即

还可以有其它消量纲的方法，如

（3）标准化处理

所谓对数据的标准化处理，是指对数据同时进行中心化－压缩处理，即

方差分析

用在哪方面数理统计分析试验结果、鉴别各因素对结果影响程度的方法称为方差分析（Analysis Of Variance），记作ANOVA。

我们已经作过两个总体均值的假设检验，如两台机床生产的零件尺寸是否相等，病

人和正常人的某个生理指标是否一样。如果把这类问题推广一下，要检验两个以上总体

的均值彼此是否相等，仍然用以前介绍的方法是很难做到的。（均值法）

从用几种不同工艺制成的灯泡中，各抽取了若干个测量其寿命，要推断这几种工艺制成的灯泡寿命是否有显著差异；用几种化肥和几个小麦品种在若干块试验田里种植小麦，要推断不同的化肥和品种对产量有无显著影响。（方差分析）。

模型

方差分析一般用的显著性水平是：取α = 0.01，拒绝0 H ，称因素A 的影响各水平的差异显著，取α = 0.01，不拒绝0 H ，但取α = 0.05，拒绝0 H ，称因

素A的影响显著；取α = 0.05，不拒绝0 H ，称因素A 无显著影响。

例子例1 为考察5 名工人的劳动生产率是否相同，记录了每人4 天的产量，并算出其平均值，如表3。你能从这些数据推断出他们的生产率有无显著差别吗？

工人

天 1 A 2 A 3 A 4 A 5 A

1 256 254 250 248 236

2 242 330 277 280 252

3 280 290 230 305 220

4 298 295 302 289 252

平均产量269 292.25 264.75 280.5 240

解编写程序如下：

x=[256 254 250 248 236

242 330 277 280 252

280 290 230 305 220

298 295 302 289 252];

p=anova1(x)

求得p = 0.1109 >α = 0.05，故接受0 H ，即5 名工人的生产率没有显著差异。

曲线拟合（判断，估计，两者的关系）

线性最小二乘法已知一组（二维）数据，即平面上的n个点(xi , yi) ，

i = 1,2,L,n，… i x 互不相同，寻求一个函数（曲线） y = f (x)，使f (x)在某种准则下与所有数据点最为接近，即曲线拟合得最好。

模型

例5 某乡镇企业1990-1996 年的生产利润如表5。

表5

年份 1990 1991 1992 1993 1994 1995 1996

利润（万元） 70 122 144 152 174 196 202

试预测1997 年和1998 年的利润。

解作已知数据的的散点图，

x0=[1990 1991 1992 1993 1994 1995 1996];

y0=[70 122 144 152 174 196 202];

plot(x0,yo,’*’)

发现该乡镇企业的年生产利润几乎直线上升。因此，我们可以用1 0 y = a x + a 作为

拟合函数来预测该乡镇企业未来的年利润。编写程序如下：

x0=[1990 1991 1992 1993 1994 1995 1996];

y0=[70 122 144 152 174 196 202];

a=polyfit(x0,y0,1)

y97=polyval(a,1997)

y98=polyval(a,1998)

求得20 1 a = ， 4

0 a = −4.0705×10 ，1997 年的生产利润y97=233.4286，1998 年的生产利润为y98=253.9286 最小二乘优化（mtalab cftool）

回归分析

用途简单地说，回归分析就是对拟合问题作的统计分析。

前面我们讲过曲线拟合问题。曲线拟合问题的特点是，根据得到的若干有关变量的

一组数据，寻找因变量与（一个或几个）自变量之间的一个函数，使这个函数对那组数

据拟合得最好。通常，函数的形式可以由经验、先验知识或对数据的直观观察决定，要

作的工作是由数据

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

方差分析最小二乘统计分析假设检验散点图数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

数据的无量纲化处理和标准化处理的区别是什么

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：曾津谈互联网数据分析与业务赋能实 ...

【CDA干货】Pandas文本词频统计：查找关键词出现次 ...

从“数据存储”到“智能取数”：CDA数据分析师视角 ...

【CDA干货】CDA透视分析核心计算方法：求和、计数、 ...

【CDA干货】客户交易价值分析：核心逻辑、分析方法 ...

从“数据仓库”到“智能取数”：CDA数据分析师视角 ...

CDA持证人专访：黄冬谈数字化运营核心与数据中台建 ...

【CDA干货】市场调查、竞品分析、需求调研的核心区 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】MySQL分表如何查询数据在哪张表？实战方 ...

【CAD干货】业务模型与逻辑模型的概念辨析及实战案 ...

从“零件”到“引擎”：CDA数据分析师视角下的指标 ...

CDA持证人专访：宋利宝谈电销行业数据运营与数据分 ...

【CDA干货】ARIMA时间序列分析方法：核心原理、建模 ...

从“通用基石”到“场景利器”：CDA数据分析师视角 ...

【CDA干货】SQL Server 提示“实例已在使用”：常见 ...

【CDA干货】Excel数据透视表两列相乘：正确计算方法 ...

从“模糊需求”到“精确标尺”：CDA数据分析师视角 ...

CDA持证人专访：冯卓基谈大数据平台搭建与行业数字 ...

【CDA干货】基于月度数据的送货率提升专项数据分析 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载