京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SPSS-数据处理-数据变量
spss工具中”行“用【个案】表示,“列”用【变量】表示。变量其实也就是我们在数据库中称之为字段的概念。但是在统计学中,我们称之为变量。
接下来主要介绍两点有关变量的基础知识:一、变量的数据类型 二、变量的尺度
一、变量的数据类型
从所周知,变量分为不同的数据类型,分别是:a:数值型数据、b:字符型数据、c:日期型数据。
a:数值型数据:直接使用自然数或度量单位进行计量的数值数据。例如:收入、年龄、体重、身高这几个变量均为数值型数据。可以直接用算术运算方法进行汇总和分析,这是区分是否是数值型数据的重要特征。
b:字符型数据:也成为文本数据,由字符串组成,它是不能进行算术运算的文字数据类型。它包括中文字符、英文字符、数字字符(非数值型)等字符。例如姓名、性别、省份这几个变量均为字符型数据。字符型数据是一种分类数据,例如性别可以分为男、女两类。省份可以分为好多省,我们可以通过对这些分类数据进行分类研究,从而更全面的掌握事务特征。

c:日期型数据:用于表示日期或时间数据,它可以进行算术运算,所以它是一种特殊的数值型数据。主要应用在时间序列分析中。
二、变量的尺度
上面介绍的数据类型主要是数据库中的语言,有的时候仅用数据类型不能准确的说明变量的含义和属性。为了更好的说明变量的含义和属性,在统计学中就采用了变量尺度这个概念。举例:
职业变量,1代表白领、2代表蓝领、3代表金领,这时1、2、3只是个标记,属于并列关系,没有次序关系。
职级变量,1代表初级、2代表中级、3代表高级,这时1、2、3不只是个标记,还有次序关系。
年龄变量,1代表1岁、 2代表2岁、 3代表3岁, 这时1、2、3不只是个标记,还有次序、大小关系,可以做算术运算。
职业职级年龄三个变量的数据类型都是数值型,但数值的集体含义不同,适用的统计方法也不同,这时就必须给数据变量增加一个测量尺度属性。
尺度属性从低到高分为四个层级:a:定类尺度、b:定序尺度、c:定距尺度、d:定比尺度。
a:定类尺度:是对事物类别和属性的一种测度。 特点:其值只能代表事物的类别和属性,不能比较各类别之间的大小,例如性别、职业这两个变量。spss中用【名义(N)】表示。
b:定序尺度:是对事物之间等级或者顺序的一种测度。 特点:其计算结果只能排序, 不能进行算术运算, 例如学历、职级这两个变量。spss中用【序号(O)】表示。
c:定距尺度:是对事物次序之间间距的一种测度,只可以进行加减运算、不能进行乘除运算,不仅能对事物进行排序,还能准确计算次序之间的差距是多少,例如温度、时间这两个变量。spss中用【度量(S)】表示。
d:定比尺度:是测量两个测量值之间比值的一种测度。它能够进行加减乘除运算,例如收入、用户数这两个变量。它与定距尺度最大的区别在于它有一个固定的绝对“0”值,而定距尺度没有。在定距尺度中“0”不表示没有,它只是一个测量值;而在定比变量中“0”就表示没有。spss中用【度量(S)】表示。数据分析师培训
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31