
在pandas中实现SQL查询中的CASE-WHEN-THEN-END功能是一项非常有用的技能,可以帮助我们快速和高效地处理数据。我将向你介绍如何在Pandas中实现此功能,并提供一些示例,以便您更好地理解。
首先,让我们先回顾一下SQL中的CASE-WHEN-THEN-END语句是什么。它通常用于根据某些条件对数据进行分类或转换。例如,假设我们有一个“订单”表,其中包含客户的姓名、订单金额和订单日期。我们可以使用CASE-WHEN-THEN-END语句将订单金额按照以下规则进行分类:
在SQL中,可以通过以下方式实现:
SELECT
customer_name,
order_amount,
CASE
WHEN order_amount < 100 class="hljs-string">'Small Order'
WHEN order_amount BETWEEN 100 AND 1000 THEN 'Regular Order'
WHEN order_amount > 1000 THEN 'Large Order'
END AS order_type,
order_date
FROM
orders;
现在让我们看看如何在pandas中实现相同的结果。Pandas提供了类似的功能,称为“np.select”。它将一个布尔数组列表作为第一个参数,每个布尔数组都代表一个条件。第二个参数是一个列表,其中包含与每个条件对应的值。如果没有任何条件被满足,则返回第三个参数作为默认值。以下是如何在Pandas中实现上述示例的代码:
import pandas as pd
import numpy as np
orders = pd.read_csv('orders.csv')
conditions = [
orders['order_amount'] < 100 class="hljs-string">'order_amount'] >= 100) & (orders['order_amount'] <= 1000),
orders['order_amount'] > 1000
]
choices = ['Small Order', 'Regular Order', 'Large Order']
orders['order_type'] = np.select(conditions, choices, default='Unknown')
print(orders)
在这个例子中,我们首先将数据集加载到一个名为“orders”的DataFrame中。然后,我们定义了三个条件,因此我们有三个布尔数组分别代表小额订单、普通订单和大额订单。接下来,我们定义了三个值列表,其中包含与每个条件相对应的值,即“Small Order”、“Regular Order”和“Large Order”。最后,我们使用np.select函数将这些条件和值传递给订单数据集,并将结果存储在名为“order_type”的新列中。
需要注意的是,我们还提供了一个默认值参数,以便处理任何未被满足的条件。在这个例子中,我们将默认值设置为“Unknown”。
此外,在Pandas中,也可以使用“pd.cut”函数来执行类似的操作。它允许我们将连续变量分成离散的区间,并将它们标记为相应的类别。例如,在上面的订单数据集中,我们可以使用以下代码将订单金额划分为三个等距的区间:
orders['order_type'] = pd.cut(orders['order_amount'], 3, labels=['Small Order', 'Regular Order', 'Large Order'])
在这种情况下,我们将订单金额分成三个等距的区间,并将每个区间标记为“Small Order”、“Regular Order”或“Large Order”。
总结起来,Pandas提供了多种实现SQL查询中CASE-WHEN-THEN-END功能的方法,包括使用np.select和pd.cut函数。这些函数都非常有用,可以帮助我们快速、高效地处理数据,并使得数据转换和分类更容易。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-06-052025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27