对于这么大的数据量进行遍历操作,使用for循环的 效率是比较低的,可以尝试使用apply 或者map进行操作:
(1)apply:
· 既可以用在DataFrame,也可以用到单独的Series中
· 运用到DataFrame时,是用到了整行或者整列上,不是逐一运用到每个元素上
· 运用到Series时,作用到每个元素上
· 第一个参数只接收python原生函数或者numpy中的函数
(2)map
· 只能运用到Series的每个元素上
· 参数可以是函数也可以是字典,还可以是序列
(3)applymap
· 只能应用在DataFrame中,并且是作用在DataFrame的每个元素中
· 参数只接收可调用的函数
2022-09-30 17:20
(1)可以先读取数据,然后使用dataframe的转置功能df.T进行行列的互换
(2)也可以使用数据透视表pivot_table,pivot_table() 的特点就是默认显示指定索引列和所有数值列。索引显示的是唯一值,所以会把对应的数值处理成均值。其他str类型的列都会自动忽略。当然,使用pivot_table() 时,可以通过添加参数进行计数或求和
2022-09-30 17:20
原因是因为Python底层由C来写,调用底层C语言在编译时无法解析这个参数的名称,而目前Python的底层设计无法解决这个问题,所以直接传入参数即可,不要加入default=,这里语法没问题。
(1)错误写法:
d = {
'key': 2,
}
print(d.get("key", default=0))
(2)正确写法:
d = {
'key': 2,
}
print(d.get("key", 0))
2022-09-30 17:20