京公网安备 11010802034615号
经营许可证编号:京B2-20210330
来源:AirPython
作者:星安果
多表查询,也称为多表连接查询;作为关系型数据库最主要的查询方式,在日常工作中被广泛使用
常见的多表查询操作包含:子查询、内连接、左外连接、右外连接、完全连接、交叉连接
本篇文章将利用一个实例逐一介绍这些操作
以 Mysql 数据库为例,创建两张数据表:
student - 学生表
record - 选课记录表
其中,学生表 id 字段对应选课记录表中的 student_id 字段
Sql 如下:
# 学生表:student
create table student
(
id int not null
primary key,
name varchar(255) null,
age int null
)
comment '学生表';
# 选课记录表:record
create table record
(
id int not null
primary key,
name varchar(255) not null,
student_id int not null,
time datetime null
)
comment '选课记录';
然后,向 2 张表中插入一些数据
# 学生表数据
1,张三,18
2,李四,23
3,王五,30
4,马六,35
5,孙七,40
6,朱八,19
7,黄九,53
# 记录表数据
2021001,语文,1,2021-01-18 15:32:47
2021002,数学,2,2021-01-18 15:33:41
2021003,英语,3,2021-01-18 15:34:01
2021004,物理,4,2021-01-18 15:34:33
2021005,体育,5,2021-01-18 15:34:47
2021006,化学,8,2021-01-18 15:35:12
2021007,生物,9,2021-01-18 15:35:39
2021008,音乐,10,2021-01-18 15:36:00
子查询,又称之为内查询,是一种嵌套在其他 Sql 查询的 Where 子句中的查询
一般用于对查询结果的进一步限制,返回所需要的数据;子查询可以用在 SELECT、INSERT、UPDATE 和 DELETE 语句中
这里以 SELECT 语句为例,在两张表中使用子查询,筛选出满足条件的记录
# 子查询
select * from student where id in (select student_id from record where student_id<=3)
查询结果如下:
# 子查询的结果
1,张三,18
2,李四,23
需要注意的是,子查询必须包含在圆括号内,并且不能使用 ORDER BY 进行排序
内连接是通过关键字 inner join 连接两张表,只返回满足 on 条件的,两张表的交集数据
# 内连接
select * from student s inner join record r on s.id=r.student_id;
查询结果如下:
# 内连接查询结果
1,张三,18,2021001,语文,1,2021-01-18 15:32:47
2,李四,23,2021002,数学,2,2021-01-18 15:33:41
3,王五,30,2021003,英语,3,2021-01-18 15:34:01
4,马六,35,2021004,物理,4,2021-01-18 15:34:33
5,孙七,40,2021005,体育,5,2021-01-18 15:34:47
需要注意的是,如果内连接没有通过 on 关键字指定条件的话,查询结果和交叉连接查询结果一样,只是执行效率高于交叉连接
外连接包含:
左外连接
右外连接
其中,
左外连接:使用关键字 left join,以左表为准,返回左表的所有数据,右表满足 on 条件的数据会全部显示,否则用 null 值去填充
右外连接:和左外连接相反。使用关键 right join,以右表为准,返回右表的所有数据,左表满足 on 条件的数据会全部显示,否则用 null 值去填充
首先,我们来看左连接的实例
# 左外连接
select * from student s left join record r on s.id=r.student_id;
返回结果如下:
# 左外连接结果
1,张三,18,2021001,语文,1,2021-01-18 15:32:47
2,李四,23,2021002,数学,2,2021-01-18 15:33:41
3,王五,30,2021003,英语,3,2021-01-18 15:34:01
4,马六,35,2021004,物理,4,2021-01-18 15:34:33
5,孙七,40,2021005,体育,5,2021-01-18 15:34:47
6,朱八,19,NULL,NULL,NULL,NULL
7,黄九,53,NULL,NULL,NULL,NULL
然后,我们再来看看右连接
# 右外连接
select * from student s right join record r on s.id=r.student_id;
返回结果如下:
# 右外连接结果
1,张三,18,2021001,语文,1,2021-01-18 15:32:47
2,李四,23,2021002,数学,2,2021-01-18 15:33:41
3,王五,30,2021003,英语,3,2021-01-18 15:34:01
4,马六,35,2021004,物理,4,2021-01-18 15:34:33
5,孙七,40,2021005,体育,5,2021-01-18 15:34:47
NULL,NULL,NULL,2021006,化学,8,2021-01-18 15:35:12
NULL,NULL,NULL,2021007,生物,9,2021-01-18 15:35:39
NULL,NULL,NULL,2021008,音乐,10,2021-01-18 15:36:00
完全连接,是通过关键字 full join 连接两张表,返回左表和右表的所有数据,并使用 null 值填充缺失的数据
# 完全连接
select * from student s full join record r on s.id = r.student_id;
需要注意的是,Mysql 并不支持完全连接,我们可以使用左连接 + union + 右连接的方式去模拟完全连接
select * from student left join record on student.id = record.student_id
union
select * from student right join record on student.id = record.student_id;
查询结果如下:
# 完全连接结果
1,张三,18,2021001,语文,1,2021-01-18 15:32:47
2,李四,23,2021002,数学,2,2021-01-18 15:33:41
3,王五,30,2021003,英语,3,2021-01-18 15:34:01
4,马六,35,2021004,物理,4,2021-01-18 15:34:33
5,孙七,40,2021005,体育,5,2021-01-18 15:34:47
6,朱八,19,NULL,NULL,NULL,NULL
7,黄九,53,NULL,NULL,NULL,NULL
NULL,NULL,NULL,2021006,化学,8,2021-01-18 15:35:12
NULL,NULL,NULL,2021007,生物,9,2021-01-18 15:35:39
NULL,NULL,NULL,2021008,音乐,10,2021-01-18 15:36:00
交叉连接,又称之为笛卡尔积,使用关键字 cross join 连接两张表进行查询
如果不使用 where 加入限制条件,则返回两张表行数的乘积;如果加入限制条件,则返回满足条件表达式的数据并合成一行
以加入限制条件的交叉连接查询为例
# 交叉连接
select * from xag.student as s cross join xag.record as r where s.id=r.student_id;
查询结果如下:
# 交叉连接结果
1,张三,18,2021001,语文,1,2021-01-18 15:32:47
2,李四,23,2021002,数学,2,2021-01-18 15:33:41
3,王五,30,2021003,英语,3,2021-01-18 15:34:01
4,马六,35,2021004,物理,4,2021-01-18 15:34:33
5,孙七,40,2021005,体育,5,2021-01-18 15:34:47
需要注意的是,交叉连接查询如果带有限制条件,它会先生成两张表行数成绩生成查询结果集,然后再通过限制条件去过滤;因此,在数据量大的时候,查询速度会很慢
相比单表查询,多表查询可以覆盖更多业务场景,大大提升我们的工作效率!实际工作当中,可以根据需要选择性的去使用!
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14