在 Pandas 中如何获取列与特定值匹配的行的索引？-CDA数据分析师官网

如何获取列与特定值匹配的行的索引？

在Pandas中，可以使用布尔索引来获取与特定值匹配的行。具体来说，在DataFrame中选取一列，然后使用比较运算符（如“==”、“>”、“<”等）和特定值进行比较，就可以得到一个布尔Series对象，其中值为True表示该行与特定值匹配，值为False表示不匹配。接下来，可以使用这个布尔Series对象作为索引，来获取符合条件的行的索引。

下面是一个示例代码：

import pandas as pd # 创建一个DataFrame data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eric'], 'age': [25, 30, 35, 40, 45], 'gender': ['F', 'M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 获取gender列值为'M'的行的索引 index = df[df['gender'] == 'M'].index print(index)

输出结果为：

Int64Index([1, 2, 3, 4], dtype='int64')

在这个例子中，我们首先创建了一个包含name、age和gender三列的DataFrame。然后，我们使用“df['gender'] == 'M'”来获取gender列值为'M'的行的布尔Series对象。最后，我们使用这个布尔Series对象作为索引，使用“.index”方法来获取符合条件的行的索引，并将其存储在变量index中。

需要注意的是，在使用布尔索引进行行选取时，布尔Series对象的长度必须与DataFrame的行数相同。如果对于每一行都有对应的布尔值，则可以直接使用布尔Series对象作为索引；否则，可以使用“loc”方法来选择符合条件的行，具体如下所示：

# 创建一个DataFrame data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eric'], 'age': [25, 30, 35, 40, 45], 'gender': ['F', 'M', 'M', None, 'M']} df = pd.DataFrame(data) # 使用loc方法获取gender列值为'M'并且不为NaN的行的索引 index = df.loc[(df['gender'] == 'M') & (df['gender'].notnull())].index print(index)

输出结果为：

Int64Index([1, 2, 4], dtype='int64')

在这个例子中，我们在gender列中使用了一个空值（即None），因此要使用“&”操作符来连接两个条件，并使用“notnull”方法来排除空值。最后，我们使用“loc”方法来选择符合条件的行。

总结

在Pandas中，使用布尔索引可以方便地获取列与特定值匹配的行的索引。具体来说，可以通过比较运算符和特定值来创建一个布尔Series对象，并将其作为索引来选择符合条件的行。需要注意的是，布尔Series对象的长度必须与DataFrame的行数相同。如果存在空值，则需要使用“notnull”方法来排除空值，并使用“loc”方法来选择符合条件的行。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；