秒懂！图解四个实用的pandas函数！-CDA数据分析师官网

热线电话：13121318867

首页大数据时代秒懂！图解四个实用的pandas函数！

秒懂！图解四个实用的pandas函数！

2020-10-28

作者：Baijayanta Roy

来源：towardsdatascience

编译&内容补充：早起Python

在用python进行机器学习或者日常的数据处理中，pandas是最常用的Python库之一，熟练掌握pandas是每一个数据科学家的必备技能，本文将用代码+图片详解Pandas中的四个实用函数！

shift()

假设我们有一组股票数据，需要对所有的行进行移动，或者获得前一天的股价，又或是计算最近三天的平均股价。

面对这样的需求我们可以选择自己写一个函数完成，但是使用pandas中的shift()可能是最好的选择，它可以将数据按照指定方式进行移动！

下面我们用代码进行演示，首先导入相关库并创建示例DataFrame

import pandas as pd
import numpy as np
df = pd.DataFrame({'DATE': [1, 2, 3, 4, 5],
                   'VOLUME': [100, 200, 300,400,500],
                   'PRICE': [214, 234, 253,272,291]})

现在，当我们执行df.shift(1,fill_value=0)即可将数据往下移动一行，并用0填充空值

现在，如果我们需要将前一天的股价作为新的列，则可以使用下面的代码

我们可以如下轻松地计算最近三天的平均股价，并创建一个新的列

向前移动数据也是很轻松的，使用-1即可

更多有关shift函数可以查阅官方文档，总之在涉及到数据移动时，你需要想到shift！

value_counts()

pandas中的value_counts()用于统计dataframe或series中不同数或字符串出现的次数，并可以通过降序或升序对结果对象进行排序，下图可以方便理解。

现在让我们用代码示例，首先是Index对象

下面是Series对象

同时可以对bin参数将结果划分为区间

更多的细节与参数设置，可以阅读pandas官方文档。

mask()

pandas中的mask方法比较冷门，和np.where比较类似，将对cond条件进行判断，如果cond为False，请保留原始值。如果为True，则用other中的相应值替换。

现在我们看下面的DataFrame，在这里我们要更改所有可以被二整除的元素的符号，就可以使用mask

下面是代码实现过程

nlargest()

在很多情况下，我们会遇到需要查找Series或DataFrame的前3名或后5名值的情况，例如，总得分最高的3名学生，或选举中获得的总票数的3名最低候选人

pandas中的nlargest()和nsmallest()是满足此类数据处理要求的最佳答案，下面就是从10个观测值中取最大的三个图解

下面是代码实现过程

但如果有相等的情况出现，那么可以使用first,last,all来进行保留

了解了nlargest()的使用方法后，nsmallest()就显得十分简单，本文就不再赘述，如果还有疑问可以查阅官方文档！

——热门课程推荐：

想从事业务型数据分析师，您可以点击>>>“数据分析师”了解课程详情；

想从事大数据分析师，您可以点击>>>“大数据就业”了解课程详情；

想成为人工智能工程师，您可以点击>>>“人工智能就业”了解课程详情；

想了解Python数据分析，您可以点击>>>“Python数据分析师”了解课程详情；

想咨询互联网运营，你可以点击>>>“互联网运营就业班”了解课程详情；

想了解更多优质课程，请点击>>>

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

pandas 数据分析 DataFrame 数据处理 Series 人工智能 numpy python

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇R语言绘图 | 折线图画法，如何画出你满意的图？

下一篇除了ABtest，数据分析测试方法还有这些！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

秒懂！图解四个实用的pandas函数！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

【CDA干货】MySQL固定时间间隔数据查询：语法原理、 ...

从“杂乱信号”到“有序资产”：CDA数据分析师视角 ...

CDA持证人专访：周婧博谈会计行业数据分析与经营诊 ...

【CDA干货】问卷调查卡方检验：原理、前提与实战应 ...

从“整体波动”到“因子归因”：CDA数据分析师视角 ...

【CDA干货】单因素方差分析：三组及以上独立样本的 ...

【CDA干货】次日付费留存计算方法、统计口径与业务 ...

从“点状静态”到“时序动态”：CDA数据分析师视角 ...

CDA持证人专访：王晓琳谈数据分析备考与秋招实战经 ...

【CDA干货】用户决策流程全解析：核心环节、影响因 ...

从“标签”到“人”：CDA数据分析师视角下的用户画 ...

【CDA干货】透视表跨表数据应用原理与实战方法 ...

【CDA干货】正态分布异常事件识别与处理方法：数据 ...

从“raw”到“ready”：CDA数据分析师视角下的标签 ...

CDA持证人专访：孙尚亮谈制造行业数据分析与生产采 ...

【CDA干货】DataFrame数据归一化：核心原理、常用方 ...

从“零散标识”到“结构资产”：CDA数据分析师视角 ...

【CDA干货】数据分析如何辅助商业谈判决策：从经验 ...

【CDA干货】T检验完整实操教程：核心原理、分类场景 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载