
来源:麦叔编程
作者:麦叔
今天分享13个Python代码技巧。
来,数一数你知道几个。最后大家比一比!
1,2,3,开始!
作为程序员,一定离不开两个字:性能。
工作中经常要去解决性能的问题:
用time模块可以计算代码执行时间:
import time startTime = time.time() # 要衡量的代码 for i in range(1000000): print('麦叔:大家早上好!') endTime = time.time() totalTime = endTime - startTime print("总时间= ", totalTime)
你会吗?如果会,给自己加1分!
假设有两个列表,你想获取列表中的不同元素。
可以使用set的symmetric_difference方法:
list1 = ['张三', '李四', '王五', '大美', '如花'] list2 = ['张三', '李四', '王五', '麦叔'] set1 = set(list1) set2 = set(list2) list3 = list(set1.symmetric_difference(set2)) print(list3) #打印:['大美', '如花', '麦叔']
你会吗?如果会,给自己加1分!
在程序的世界里,内存是绝对的稀缺资源。程序员绞尽脑汁的想办法提升内存使用效率,有的为此头发都秃了。
所以了解某些对象所使用的内存数量是常用操作。使用sys.getsizeof可以获得对象所占用的字节数:
import sys list1 = ['张三', '李四', '王五', '大美', '如花'] print("list1所用字节数 = ",sys.getsizeof(list1)) name = '麦叔' print("name的字节数 = ",sys.getsizeof(name))
注意:对于list等容器类对象,打印出的字节数只是容器本身占用的内存数,不包括它存放的内容所占用的内存。
了解Python的内存管理,请看我另一篇文章:
Python是如何管理内存的?
你会吗?如果会,给自己加1分!
第一个列表中存放了所有的迟到记录,里面有重复的名字。你上学迟到过吗?
我们要做的是去掉重复,获得一份没有重复的迟到人名单。
最简单的方法就是把list转成set,因为set是不允许重复的。
late_names = ['张三', '李四', '王五', '大美', '如花', '张三', '李四', '林志颖',
'大美'] print("迟到记录= ", late_names) unqiue_late_names = list(set(late_names)) print("迟到过的人= ", unqiue_late_names)
你会吗?如果会,给自己加1分!
可以判断第一个元素的个数是否和列表的长度相同:
list1 = [20, 20, 20, 20] print("list1中都相同吗?", list1.count(list1[0]) == len(list1)) list2 = [20, 20, 20, 50] print("list2中都相同吗?", list2.count(list2[0]) == len(list2))
你会吗?如果会,给自己加1分!
有两个列表,里面内容相同,但顺序不同。
我们想确定一下它们是否完全相同。
有两个办法:
from collections import Counter one = [33, 22, 11, 44, 55] two = [22, 11, 44, 55, 33]
print("相同吗?", Counter(one) == Counter(two)) print("相同吗?", sorted(one) == sorted(two))
你会吗?如果会,给自己加1分!
由于set不能重复的特性,经常在判断唯一或者去重的时候使用。
下面的isUnque方法,通过推导式生成一个由None或True组成的序列。如果里面有True就说明重复:
def isUnique(item): tempSet = set() return not any(i in tempSet or tempSet.add(i) for i in item) list1 = [123, 345, 456, 23, 567] print("list1都唯一吗? ", isUnique(list1)) list2 = [123, 345, 567, 23, 567] print("list2都唯一吗? ", isUnique(list2))
你会吗?如果会,给自己加1分!
有时候从网上接收到的数据是字节码,比如这样的:xe9xbaxa6xe5x8fx94
我们需要把字节码转成字符串,否则就是乱码。
在转码的过程中也要使用正确的编码规则,否则还是乱码。
byteVar = bytes("麦叔密码", 'utf-8') print(byteVar) #编码规则不对,乱码:楹﹀彅瀵嗙爜
str1 = str(byteVar.decode("gbk")) print("字符串是:" , str1 ) #编码规则正确,
不乱 str2 = str(byteVar.decode("utf-8")) print("字符串是:" , str2 )
你会吗?如果会,给自己加1分!
循环的时候经常要打印序号,使用enumerate::
listOne = [123, 345, 456, 23] for index, element in enumerate(listOne): print(index, element)
你会吗?如果会,给自己加1分!
使用**给字典先解包,再把它们合并起来。合并的过程中,如果后面的key和前面一样会覆盖前面的value。
names1 = {1: '张三', 2: "李四", 3:"王五"} names2 = {2: '麦叔', 4: "小强"} all_names = {**names1, **names2} print(all_names)
你会吗?如果会,给自己加1分!
使用zip先把两个列表合成由元组组成的列表,然后再转成字典:
ids = [1, 2, 3, 4, 5] names = ['张三', '李四', '王五', '大美', '如花'] name_dict = dict(zip(ids, names)) print(name_dict)
你会吗?如果会,给自己加1分!
浮点数的计算可能会产生很多位小数,假设我们要求只显示2位小数:
number= 88.234578965467 print('{0:.2f}'.format(number))
你会吗?如果会,给自己加1分!
Python函数可以返回多个值,用逗号隔开。
实际上是返回了一个元组,但Python会自动解包,所以调用者可以直接使用返回值:
def total_diff(num1, num2): total = num1 + num2 diff = num1 - num2 return total, diff total, diff = total_diff(99, 88) print("总和:", total, "差额:", diff)
这13个小技巧,你会几个呢?别的小伙伴会几个呢?投票查看:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14