京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SPSS:质量信息管理的助手
目前,企业的各种质量数据量越来越大,对质量数据的处理工作量就异常巨大,软件研究人员把它们称作海量数据。海量数据有以下两个特点:首先,数据量庞大,由于企业规模扩张、产品品种急剧增加、产品产量的增大,其质量特征信息量也必然十分庞大。其次,海量数据集的隐性特征和特征数据的获得十分困难,数据的隐性特征是指数据的相关特性,特征数据包括样本的对称性、中心位置、分布特征等。
然而,企业间竞争的日益激烈,不仅使得企业对这些信息处理结果的精确度要求越来越高,而且对信息处理的时间也越来越短。由于处理海量数据的工作量太大,企业要进行科学的质量管理,客观上需要专业性的统计分析软件作为工具。
SPSS统计软件介绍
SPSS是现代统计软件的典型代表,其全称是:Statistical Pro?鄄gram for Social Sciences,即社会科学统计程序,该软件是公认的最优秀的统计分析软件包之一。如今SPSS已经由DOS版本发展为Windows版本,我国用户目前大多使用9.0~12.0版本。
作为统计分析工具,SPSS的功能包括数据统计管理、统计分析、趋势研究、制表绘图、文字处理等。SPSS对质量信息的管理,是指在生产、管理的所有阶段借助SPSS统计软件、运用统计方法对产品质量信息、数据所进行的处理和分析过程。其具体操作主要包括:数据的收集和简单处理、编制统计质量控制图、线外质量控制(又称试验设计)、抽样验收等。
本文主要介绍SPSS对质量信息的一般性管理,包括质量数据集的建立和简单处理、质量数据的统计描述等。
SPSS质量数据集
的建立与简单管理
数据集是统计数据的简单集合,一般具有大量性、差异性和同质性三个特征。数据集是统计软件研究的基本单元,是统计分析的起点。创建一个稳健、有效率的数据集对于正确的统计分析十分重要。质量信息数据集就是SPSS针对各类质量信息、数据所建立的数据集合,SPSS利用质量信息数据集对其进行统计分析。质量信息数据在这里是指生产、检验等过程中所得到的质量信息、数据,对于获得的不是数据性的信息,要进行数据化处理,转化为可以统计分析的数据,进而建立数据集。
1. 建立SPSS质量数据集
下面,以2004年山东省质量技术监督局名牌万里行活动所调查的关于山东各名牌产品知名度的部分数据、信息为例,建立SPSS质量数据集:
⑴信息数据化,确定变量值。
问卷对知名度调查的问题是:您听说过下列哪些名牌产品?所涉及的可供选择答案共有13种产品,将产品和被调查者的年龄、文化程度及从业岗位作为变量,各取变量名。针对每一产品有“听说过”和“没有听说过”两种回答,则分别用变量值“1”和“0”来表示;对于被调查者的各变量,用“1”、“2”分别表示“男”、“女”;用“1”、“2”、“3”、“4”、“5”分别表示“高中以下”、“高中或中专”、“大专”、“大学”、“大学以上”;用“1”、“2”、“3”、“4”、“5”分别表示“机关或事业单位”、“企业”、“军人”、“农民”、“其他”。
⑵变量、变量值的录入
启动SPSS后,将自动打开SPSS的数据编辑器,在其左下端有两个页标签,其中,“Data View”是数据窗口,“Variable View”是变量属性窗口,前者录入变量值,后者输入变量名并定义其各个属性。最后,SPSS用 “sav”类型保存其数据集。
值得一提的是,在确定变量属性时,单击“Values”列格中的阴影方框,可以定义该变量的标签。
2. SPSS数据集的简单管理
SPSS数据集内数据的简单管理包括数据、单元格的查找,观测量的分类排序,数据文件的分类汇总和数据的选择等。这些功能主要由“Data”下拉菜单中的各个命令来完成,这与excel并没有很大的区别,并且这些功能excel也能够较好地完成。
质量数据的统计描述
要对质量数据做好统计分析,首先要对这些数据进行描述性统计分析。SPSS统计软件对质量信息的描述统计分析功能主要集中在Descriptive Statistics菜单中,主要包括建立质量数据频率表,质量数据的一般性统计描述、探索性分析和交叉统计等。
1. 建立质量数据频率表
SPSS统计软件建立数据频率表由“Analyze”菜单中“Descriptive Statistics”的“Frequencies…”项来完成。具体操作如下:
打开“Analyze”菜单,选择“Descriptive Statistics”中的“Fre?鄄quencies…”项,弹出“Frequencies”对话框,将两个变量选入“Variable(s)”框内。单击“Statis?鄄tics”按钮。可以弹出“Frequencies:Statistics”对话框,其中,“Per?鄄centile Values”复选框组定义了需要输出的百分位数;“Central ten?鄄dency”复选框组主要用来定义描述集中趋势的一组指标:均值(Mean)、中位数(Median)、众数(Mode)、总合(Sum);“Disper?鄄sion”复选框组用于定义标准差(Std.deviation)、方差(Variance)、全距(Range)等描述离散趋势的一组指标;“Distribution”复选框组用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis)。点击“Statistics”对话框中的“Charts”按钮可以选择是否在输出结果中输出所要求的辅助图形,例如条形图、直方图等,本例选择饼图(Pie chart)。点击“Statis?鄄tics”对话框中的“Format”按钮可以定义输出频数表的格式。最后,点击“OK”,可以得到频率表和频率饼图,如文中图一、表一所示。
2. 质量数据的一般性统计描述
质量数据的一般性统计描述主要是指对连续性随机变量进行的一般描述统计。这个过程既可以对变量进行描述性统计分析,列出一系列相应的统计指标,还可以将原始数据转换成标准正态评分值并以变量的形式存入数据库以供分析。这一功能是由SPSS的“Analyze”菜单中“Descriptive Statistics”的“Descriptive…”项来完成。
例如,某一企业要统计每个车间(共两个)在一个月内所付出的质量成本,并统计预防成本、鉴定成本、内部损失成本和外部损失成本的差异,由所统计的数据建立SPSS数据文件。要求对这些数据进行一般性统计描述,得到各项所需指标,操作如下:
打开“Analyze”菜单选中“Descriptive Statistics”中的“Descriptions…”项,则会弹出“Descrip?鄄tives”对话框。将变量均选入“Variable(s):”框内,如果选中“Save standardized values as variables”复选框,则将变量的原始数据的标准正态评分存为新变量,列在后面(此例不选)。如果,点击“Descrip?鄄tives”对话框中的“Options…”按钮,则会弹出“Descriptions Op?鄄tions”对话框,在其中可以设置各项所需的统计指标。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28