京公网安备 11010802034615号
经营许可证编号:京B2-20210330
Excel中使用SQL语句汇总表格
上一节我们学习了通过Excel数据透视表对多个工作表进行快速汇总,这仅仅是一种特殊的情况。我们在实际工作中经常遇到的情况是,要汇总的每个工作表中有多列文本。但是这些工作表的列数据结构完全相同,也就是列数相同,列数据项目的先后顺序也相同,但是行数可以不同,今天我们来学习下在Excel中使用SQL语句汇总表格。
使用导入数据+SQL数据查询的方法是目前这类问题最好的解决方法之一。这种方法的实质就是将各个Excel工作表当成数据库的表进行连接查询,得到一个查询数据集,这个数据集中保存有各个工作表的所有数据,然后将这个查询记录集的数据保存到工作表,或者以此为基础制作普通的数据透视表,从而得到需要的报表。
需要注意的是,为了能够利用导入数据+SQL数据查询的方法汇总多列文本情况下的多个工作表数据。每个工作表的第一行最好是数据区域的列标题。如果每个工作表的第一行不是数据区域的列标题。就需要先对数据区域定义名称,或者在SQL语句中进行特殊处理。
图1所示为3个城市的销售数据工作表“北京”、“上海”和“天津”,每个工作表保存有不同销售部门的各个产品的销售量和销售额数据。现在要把这3个工作表的数据合并到一张工作表上,或者直接制作数据透视表,以便于进行各种统计分析。
图1
下面是利用SQL数据查询的方法来汇总具有多列文本的多个工作表数据的具体方法和步骤。
1、在任何一个工作表中单击“数据”选项卡,在“获取外部数据一功能组中单击“现有连接”按钮,如图2所示,打开“现有连接”对话框。如图3所示。
图2
图3
2、单击对话框左下角的“浏览更多”按钮,打开“选取数据源”对话框,如图4所示。
图4
3、从保存该工作簿的文件夹中选择该文件,如图5所示。
图5
4、单击“打开”按钮,打开“选择表格”对话框,从表格列表中任选一个表格,并要选择“数据首行包含列标题”复选框,如图6所示。
图6
5、单击“确定”按钮,打开“导入数据”对话框,如图7所示。
图7
6、单击“属性”按钮,打开“连接属性”对话框,如图8所示。切换到“定义”选项卡,在“命令文本”文本框中输入以下SQL命令(如图9所示):
图8
图9
select '北京'as城市,*from[北京$]union all
select '上海'as城市,*from[上海$]union all
select '天津'as城市,*from[天津$]
7、单击“确定”按钮,返回到“导入数据”对话框。
根据需要,可以选择“表”单选按钮或者“数据透视表”单选按钮,并指定数据的保存位置,最后单击“确定”按钮,印可得到需要的汇总表。
图10所示是选择“表”单选按钮后得到的汇总数据清单。
图10
图11
关于SQL语句的小知识:
本节介绍了利用SQL语句对多个具有多列文本工作表数据进行查询汇总的基本方法,下面简要介绍SQL语句的基本知识。
在众多的SQL语句中,SELECT语句是使用最频繁的。SELECT语句主要用来对数据库进行查询并返回符合用户查询标准的结果数据。
SELECT语句有5个主要的子句,而FROM是唯一必需的子句。每一个子句有大量的选择项和参数。
SELECT语句的语法格式如下:
SELECT字段列表
FROM子句
[WHERE子句]
[GROUP BY子句]
[HAVING子句]
[ORDER BY子句]
SELECT语句的各项组成说明如下:
(1)字段列表
字段列表指定多个字段名称。各个字段之间用半角逗号“。”分隔。用星号“*”表示所有的字段。当包含有多个表的字段时。可用“数据表名。字段名”表示,即在字段名前标明该字段所在的数据表。
例如。“select日期,产品编号,销售量,销售额”就是选择数据表中的“日期”、“产品编号”、“销售量”和“销售额”这4个字段。还可以在字段列表中自定义宇段。例如SQL语句“select日期,产品编号,销售量,销售额。“北京'as城市from[北京$]”中,除了查询工作表“北京”中的宇段“日期”、“产品编号”、“销售量”和“销售额外”。还自定义了一个工作表中没有的字段“城市”。并将“北京”作为该宇段的数据。由于“北京”是一个文本。因此需要用单引号括起来。将某个数据保存在自定义字段的方法是利用AS属性词。即“'北京'as城市”。
(2)FROM子句
FROM子句是一个必需子句,指定要查询的数据表,各个数据表之间用半角逗号“。”分隔。
但要注意。如果是查询工作簿中的数据表,就必须用方括号将工作表名括起来,并且工作表名后要有美元符号($)。
例如。“select日期,产品编号,销售量,销售额from[北京$]".就是查询工作表“北京”中的字段“日期”、“产品编号”、“销售量”和“销售额”。
如果要查询的是Access数据库、SQL Server数据库等关系型数据库的数据表,在FROM后面直接写上数据表名即可。
(3)WHERE子句
WHERE子句是一个可选子句,指定查询的条件。可以使用SQL运算符组成各种条件运算表达式。
例如“WHERE部门=“销售部”就表示要查询的部门是“销售部”的数据。
如果条件值是数值,则直接写上数值,如“WHERE年龄>50";如果条件值是字符串。则必须用单引号“'”括起来。如“WHERE部门='销售部'”;如果条件值是日期,则必须用井号“#”或单引号“'”括起来。如“WHERE日期:=#2007-12-22#”。
(4)GROUP BY子句
GROUP BY子句是一个可选子句,指定分组项目,使具有同样内容的记录(如日期相同、部门相同、性别相同等)归类在一起。
例如,“GROUP BY性别”就表示将查询的数据按性别分组。
(5)HAVING子句
HAVING子句是—个可选子句,功能与WHERE子句类似,只是必须与GROUP BY子句一起使用。
例如,要想只显示平均工资大于5000元的记录并按部门进行分组,则可以使用子句“GROUPBY部门HAVING AVG(工资总额)>5000"。
(6)ORDERBY子句
ORDER BY子句是一个可选子句,指定查询结果以何种方式排序。排序方式有两种:升序(ASC)和降序(DESC)。如果省略ASC和DESC.则表示按升序排序。
例如。“ORDER BY姓名ASC"就表示查询结果按姓氏拼音升序排序;而“ORDER BY工资总额。年龄DESC”则表示查询结果按“工资总额”从小到大升序排序,“年龄”按从大到小降序排序。
此外,在实际工作中可能要查询工作簿中的多个工作表或者数据库中的多个数据表。这就是多表查询问题。
多表查询有很多种方法。例如。利用WHERE子句设置多表之间的连接条件。利用JOIN…ON子句连接多个表。利用UNION或者UNION ALL连接多个SELECT语句等。
Excel中使用SQL语句汇总表格时,如果我们要查询多个工作表或数据表的数据,并将这些表的数据生成一个记录集。那么可以利用UNION ALL将每个表的SELECT语句连接起来。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27