京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SPSS问卷分析---编码录入及描述统计详解_数据分析师
一、编码录入
调查分析问卷回收,在经过核实和清理后就要用SPSS做数据分析,首先的第一步就是把问题编码录入。要根据问卷问题的不同定义变量。定义变量值得注意的两点:1、区分变量的度量,其中Scale是定量、Ordinal是定序、Nominal是指定类;2、注意定义不同的数据类型。
各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,现详细举例介绍如下:
1、单选题:答案只能有一个选项
例一、当前贵组织机构是否设有面向组织的职业生涯规划系统?
A有 B 正在开创 C没有 D曾经有过但已中断
编码:只定义一个变量,Value值1、2、3、4分别代表A、B、C、D 四个选项。
录入:录入选项对应值,如选C则录入3
2、多选题:答案可以有多个选项,其中又有项数不定多选和项数限定多选。
(1)方法一(二分法):
例二、贵处的职业生涯规划系统工作涵盖哪些组群?画钩时请把所有提示考虑在内。
A月薪员工 B日薪员工 C钟点工
编码:把每一个相应选项定义为一个变量,每一个变量Value值均如下定义:“0” 未选,“1” 选。
录入:被调查者选了的选项录入1、没选录入0,如选择被调查者选AC,则三个变量分别录入为1、0、1。
(2)方法二(多重分类法):
例三、你认为开展保持党员先进性教育活动的最重要的目标是那三项:
1( ) 2 () 3( )
A、提高党员素质 B、加强基层组织 C、坚持发扬民主
D、激发创业热情 E、服务人民群众 F、促进各项工作
编码:定义三个变量分别代表题目中的1、2、3三个括号,三个变量Value值均同样的以对应的选项定义,即录入的数值1、2、3、4、5、6分别代表选项ABCDEF,相应录入到每个括号对应的变量下。如被调查者三个括号分别选ACF,则在三个变量下分别录入1、3、6。
3、排序题: 对选项重要性进行排序
例四、您购买商品时在 ①品牌 ②流行 ③质量 ④实用 ⑤价格 中对它们的关注程度先后顺序是(请填代号重新排列)
第一位 第二位 第三位 第四位 第五位
编码:定义五个变量,分别可以代表第一位~第五位,每个变量的Value都做如下定义:“1” 品牌,“2” 流行,“3” 质量,“4” 实用,“5” 价格
录入:录入的数字1、2、3、4、5分别代表五个选项,如被调查者把质量排在第一位则在代表第一位的变量下输入“3“。
4、开放性数值题和量表题:这类题目要求被调查者自己填入数值,或者打分
例六 你的年龄(实岁):______
编码:一个变量,不定义Value值
录入:即录入被调查者实际填入的数值。
5、开放性文字题:
如果可能的话可以按照含义相似的答案进行编码,转换成为封闭式选项进行分析。如果答案内容较为丰富、不容易归类的,应对这类问题直接做定性分析。
二、问卷一般性分析
下面具体介绍SPSS中问卷的一般处理方法,操作以版本spss13.0为例 ,以下提到的菜单项均在Analyze主菜单下
1、频数分析:Frequencies过程可以做单变量的频数分布表;显示数据文件中由用户指定的变量的特定值发生的频数;获得某些描述统计量和描述数值范围的统计量。
适用范围:单选题(例一),排序题(例四),多选题的方法二(例三)
频数分析也是问卷分析中最常用的方法。
实现: Descriptive statistics……Frequencies
2、描述分析:Descriptives:过程可以计算单变量的描述统计量。这些述统计量有平均值、算术和、标准差,最大值、最小值、方差、范围和平均数标准误等。
适用范围:选择并排序题(例五)、开放性数值题(例六)。
实现: Descriptive statistics……Descriptives,需要的统计量点击按钮Statistics…中选择
3、多重反应下的频次分析:
适用范围:多选题的二分法(例二)
实现:第一步在Multiple Response……Define Sets把一道多选问题中定义了的所有变量集合在一起,给新的集合变量取名,在Dichotomies Counted value中输入1。第二步在Multiple Response……Frequencies中做频数分析。
4、交叉频数分析:解决对多变量的各水平组合的频数分析的问题
适用范围:适用于由两个或两个以上变量进行交叉分类形成的列联表,对变量之间的关联性进行分析。比如要知道不同工作性质的人上班使用交通工具的情况,可以通过交叉分析得到一个二维频数表则一目了然。
实现:第一步根据分析的目的来确定交叉分析的选项,确定控制变量和解释变量(如上例中不同工作性质的人是控制变量,使用交通工具是解释变量)。第二步选择Descriptive statistics……Crosstabs
三、简单图形描述介绍
在做上述频数分析、描述分析等分析时就可以直接做出图形,简单方便,同时也可以另外作图。SPSS的作图功能在菜单Graphs下,功能强大,图形清晰优美。现在把常用图简单介绍如下
1、饼图:又称圆图,是以圆的面积代表被研究对象的总体,按各构成部分占总体比重的大小把圆面积分割成若干扇形,用以表示现象的部分对总体的比例关系的统计图。频数分析的结果宜用饼图表示。
2、曲线图:是用线段的升降来说明数据变动情况的一种统计图。它主要表示现象在时间上的变化趋势、现象的分配情况和2个现象的依存关系等。
3、面积图:用线段下的阴影面积来强调现象变化的统计图。
4、条形图:利用相同宽度条形的长短或高低表现统计数据大小及变化的统计图。
四、问卷深入分析
除了以上简单的分析,spss强大的功能还可以对问卷进行深入分析,比如常用的有聚类分析、交叉分析、因子分析、均值比分析(参数检验)、相关分析、回归分析等。因为涉及到很专业的统计知识,下面只将个人觉得比较有用的方法的适用范围和分析目的简单做介绍:
1、聚类分析
样本聚类,可以将被调查者分类,并按照这些属性计算各类的比例,以便明确研究所关心的群体。比如按消费特征对被调查者的进行聚类。
2、相关分析
相关分析是针对两变量或者多变量之间是否存在相关关系的分析方法,要根据变量不同特征选择不同的相关性的度量方式。问卷分析中的多数用的变量都属于分类变量,要采用斯皮尔曼相关系数。
其中可以用卡方检验,其是对两变量之间是否具有显著性影响的分析方法。
3、均值的比较与检验
(1)Means过程:对指定变量综合描述分析,分组计算计算均值再比较。比如可以按性别变量分为男和女来研究二者收入是否存在差距。
(2)T 检验:
独立样本t检验用于不相关的样本是否开来自具有相同均值的总体的检验。比如,研究购买该产品的顾客和不购买的顾客的收入是否有明显差异。
如果样本不独立则要用配对t检验。比如研究参加职业培训后 工作效率是否提高。
4、回归分析
问卷分析中的回归分析常采用的是用离散回归模型,一般是逻辑斯蒂模型,解释一个变量对另一变量的影响具体有多大。比如,研究对某商品的消费受收入的影响程。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28