京公网安备 11010802034615号
经营许可证编号:京B2-20210330
用excel完全可以代替SPSS软件
市场研究界习惯使用SPSS软件进行统计计算与分析,大家都说效果非常不错。当年刚刚创业时,我们也慕名准备使用该软件。到同行处去看了一下,不仅英文多,而且与Window不兼容(当时是这样),对于我们这些离不开微软程序的人来说,这样的学习成本太高了。后来,深入研究了一下excel程序,发现微软实在是优秀的软件公司,使用excel程序完全可以替代SPSS程序。

一、 excel中的统计函数
除了轻而易举的四则运算之外,在excel中有专门的统计函数栏目(点击插入-函数-统计),包括∶中位数(MEDIAN)、众数(MODE)、方差(DEVSQ)、标准差(STDEV)、频率(FREQUENCY)、置信区间(CONFIDENCE)、最大值(MAX)、最小值(MIN)等等,看一看帮助说明操作起来很容易。
如果一下找不到想要的函数,也不难,可以根据公式让excel计算。我不喜欢记公式,就去查一下书,然后把常用的一些统计公式做到excel某个文件中。比如,为计算应调查的样本数量,做出下表∶
1、重复抽样
概率度t
标准差σ
极限误差△
样本总数N
样本数n
B3
C3
=B3^2*C3^2/D3^2
2、不重复抽样
概率度t
标准差σ
极限误差△
样本总数N
样本数n
B5
C5
D5
E5
F5
=E5*B5^2*D5^2/(E5*D5^2+B5^2*D5^2)
等等。上表中B3、C3等符号是为了说明空格的位置才加上去了,在excel中看不到,在相应的位置输入实际的数据结果就会自动算出来。当然,用vb的frame控件来编个程序也可以,但好像太浪费大脑与电脑资源了,这样的函数已经足够解决我们的问题。其它很多统计计算用函数也可同样处理。
二、 统计数据分析
1、分析工具库加载宏
SPSS中的回归分析,在excel“工具”中也用(见本人的博客“利用excel提高工作效率”),用数组公式也可以,步骤如下∶
A. 选定数组公式输入区域
B. 输入公式
C. 按ctrl+shift+enter完成
2、聚类分析等
充分利用excel中的“筛选”、“排序”即可,在“数据”菜单中,具体操作方法请看“帮助”。在excel中做交叉分析时,可以使用“筛选”,数据的个数数字会显示在excel文件的下方。当然,如果要做大量的交叉分析,这样的办法还是很不方便的,不够自动化,很多数字要靠手工记录,这个时候,就要辛苦一些,用vb语言做一下程序了(不要怕,vb语言就是为非专业人士准备的程序语言,操作思路见本人的博客“利用excel提高工作效率”。
3、各种统计检验
在excel中,还有成对双样本均值分析、t检验:双样本等方差假设、F检验:双样本方差分析等,能够大大提高统计结论的科学性。
三、 用宏语言安排统计工作
在SPSS中,使用者没有什么自由度,完全受到人家事先编好程序的控制,遇到一些临时出现需要特别处理的问题十分被动,不妨尝试一下在Window中用vb语言编一些程序吧。我做交叉分析就用了vb语言,就是用循环句(for)而已,让统计结果自动汇总显示在数据库的某一处。当然,为了提高程序的运行速度,建议尽量利用Window本身已有的功能。比如,我会让程序先对数据库进行排序,然后利用Window已有的“筛选”功能提高计算的速度,这样,运行效率提高了很多。即使不懂这些所谓的技巧也没有关系,大不了让电脑累一些就是了,你自己可以放松一下,多一些伸懒腰的时间。
数据库的汇总统计用countif函数也可以,但太笨,如果你经常做统计工作,建议将工作“录制宏”,并进行一些改编,这样,一点击鼠标,数据的统计结果就自动出来了。这还不够,我还让excel根据统计结果自动作图,自动将统计数据库及图标拷贝到Word中(因为我们总是在Word中写分析报告)。
我们的问卷一般都录入在Word文件中,我们设置的excel数据统计程序显示的选项都是数字,没有把汉字选择项表示出来。一开始,我们都是从Word中一点一点把文字拷进excel表格中的相应位置,后来,我觉得如果已经在电脑中输入过一次,就不应该为此做第二次的手工工作,就编了一个小程序,Word中的汉字就可以直接自动拷贝到excel中来了,省了很多手工劳动。
四、 其它,象制图之类的工作,excel也相当出色,没有必要劳驾SPSS。
总之,Office实在是太强了,在电脑办公方面有绝对的垄断性,好好用它,就可以不理睬许多其它的电脑软件,大大提高我们的工作效率,降低自己的学习与时间成本。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26表格结构数据以“行存样本、列储属性”的规范形态,成为CDA数据分析师最核心的工作载体。从零售门店的销售明细表到电商平台的用 ...
2025-11-26在pandas数据处理工作流中,“列标签”(Column Labels)是连接数据与操作的核心桥梁——它不仅是DataFrame数据结构的“索引标识 ...
2025-11-25Anaconda作为数据科学领域的“瑞士军刀”,集成了Python解释器、conda包管理工具及海量科学计算库,是科研人员、开发者的必备工 ...
2025-11-25在CDA(Certified Data Analyst)数据分析师的日常工作中,表格结构数据是最常接触的“数据形态”——从CRM系统导出的用户信息表 ...
2025-11-25在大数据营销从“粗放投放”向“精准运营”转型的过程中,企业常面临“数据维度繁杂,核心影响因素模糊”的困境——动辄上百个用 ...
2025-11-24当流量红利逐渐消退,“精准触达、高效转化、长效留存”成为企业营销的核心命题。大数据技术的突破,让营销从“广撒网”的粗放模 ...
2025-11-24在商业数据分析的全链路中,报告呈现是CDA(Certified Data Analyst)数据分析师传递价值的“最后一公里”,也是最容易被忽视的 ...
2025-11-24在数据可视化实践中,数据系列与数据标签的混淆是导致图表失效的高频问题——将数据标签的样式调整等同于数据系列的维度优化,或 ...
2025-11-21在数据可视化领域,“静态报表无法展现数据的时间变化与维度关联”是长期痛点——当业务人员需要分析“不同年份的区域销售趋势” ...
2025-11-21在企业战略决策的场景中,“PESTEL分析”“波特五力模型”等经典方法常被提及,但很多时候却陷入“定性描述多、数据支撑少”的困 ...
2025-11-21在企业数字化转型过程中,“业务模型”与“数据模型”常被同时提及,却也频繁被混淆——业务团队口中的“用户增长模型”聚焦“如 ...
2025-11-20在游戏行业“高获客成本、低留存率”的痛点下,“提前预测用户流失并精准召回”成为运营核心命题。而用户流失并非突发行为——从 ...
2025-11-20