京公网安备 11010802034615号
经营许可证编号:京B2-20210330
Python能用来做什么?以下是Python的三大主要用途
如果你想学Python,或者你刚开始学习Python,那么你可能会问:“我能用Python做什么?”
这个问题不好回答,因为Python有很多用途。
但是随着时间,我发现有Python主要有以下三大主要应用:
· Web开发
· 数据科学
· 脚本
让我们来依次介绍。
一、Web开发
Django和Flask等基于Python的Web框架最近在Web开发中非常流行。
这些Web框架可以帮助你用Python编写服务器端代码(后端代码)。这是在你的额服务器上运行的代码,而不是运行在用户设备和浏览器的代码(前端代码)。
为什么需要Web框架
因为用Web框架可以更容易地构建通用后端逻辑。这包括将不同的URL映射到Python代码块,处理数据库以及生成用户在浏览器中看到的HTML文件。
应该使用哪种Python Web框架
Django和Flask是最流行的两种Python Web框架。如果你刚刚入门,我建议使用其中一种。
Django和Flask有什么区别
Gareth Dwyer 关于这个问题有一篇出色的文章,在这里我引用几段:
主要区别
Flask:能够实现简单、灵活和细致的控制。并能让你自己决定实现方式。
Django:提供了全面的体验:你可以获得管理面板、数据库接口、ORM(对象关系映射)以及开箱即用的应用程序和项目的目录结构。
如何选择
Flask:如果你关注的是经验和学习的机会,或者你想更多地控制使用哪些组件,比如你想使用哪些数据库以及如何与其进行交互。
Django:如果你关注最终产品,或者你正在研究一个简单的应用,比如新闻网站、网店或博客,并且你希望有单一实现的方式。
换句话说,如果你是初学者,Flask可能是更好的选择,因为它要掌握的组件更少。此外,如果你想要更多的定制,那就选Flask。
根据我的数据工程师朋友Jonathan T Ho的说法,由于Flask 的灵活性,在创建REST API时,Flask 比Django 更适合。
另一方面,如果你想直接构建一些东西,Django可能会让你更快实现。
二、数据科学
机器学习是什么
假设你想开发一个能够自动检测图片内容的程序。给出图1,你希望程序识别这是一只狗。
图1
给出图2,希望程序能识别这是一张桌子。
图2
你可能会说,我可以写一些代码来做到这点。例如,如果图片中有很多浅棕色像素,那么可以识别是狗。
或者可以检测图片中的边缘,如果有很多直的边缘,那么就是桌子。
但这种方法很快就不好用了。如果图片中的狗不是棕色毛的怎么办?如果图片只显示桌子的圆形部分怎么办?
这里就需要用到机器学习了。
机器学习通过实现算法,该算法能够自动检测输入中的模式。
例如,你将1000张狗的图片和1000张桌子的图片输入给机器学习算法,让它掌握狗和桌子间的区别。那么当你给出新的图片让它识别是狗还是桌子时,它就能够进行判断。
这有点类似孩子学习新事物的方式。孩子是如何学习认知狗或桌子的呢?就是通过大量的例子。
你不会明确告诉孩子:“如果某个毛茸茸的东西有浅棕色的毛发,那么就可能是狗。”
你会说,“这是狗,这也是狗。而这是桌子,那个也是桌子。“
机器学习算法的方式大致相同。
我们可以将相同的想法应用于:
· 推荐系统
(比如YouTube,亚马逊和Netflix)
· 人脸识别
· 语音识别
以及其他应用。
你听过的热门机器学习算法包括:
· 神经网络
· 深度学习
· 支持向量机
· 随机森林
你可以使用上述任何算法来解决前面提到的图片标签问题。
将Python用于机器学习
有一些热门的机器学习库和Python框架。其中两个最热门的是scikit-learn和TensorFlow。
· scikit-learn带有一些内置的热门机器学习算法。
· TensorFlow是一个低级库,能让你创建自定义机器学习算法。
如果你刚开始进行机器学习项目,我会建议你先从scikit-learn开始。如果你开始遇到效率问题,那么可以使用TensorFlow。
数据分析和数据可视化
假设你在一家在线销售产品的公司工作。作为数据分析师,你会绘制这样的条形图。
条形图1 - 用Python生成
从这张图中可以看到在某个周日,男性用户购买了400多件产品,女性用户购买了350件产品。
作为数据分析师,对此你会提出一些可能的解释。明显的解释是,该产品在男性用户中更受欢迎。另一种是样本量太小,而这种差异是偶然的。还可能呢是由于某种原因,男性往往在周日才购买该产品。
为了理解哪种解释是正确的,你可以绘制另一个图。
折线图1 - 用Python生成
不止看周日的数据,还要看到一周的数据。从这张图表中可以看出,在不同的日子里这种差异比较一致。
从这个分析中你会得出结论:这种产品在男性中比在女性中更受欢迎。
但如果你看到像这样的图表呢?
折线图2 - 用Python生成
那么,怎么解释周日的差异呢?
你可能会说,也许出于某种原因男性只在周日才会更多地购买这款产品。或许这只是巧合。
我在谷歌和微软工作时所做的数据分析工作与这个例子非常相似,只是更复杂一些。在谷歌时我使用Python进行分析,而我在微软使用JavaScript。
在这两家公司我都使用SQL从数据库中提取数据。然后,我用Python和Matplotlib(在谷歌)或JavaScript和D3.js(在微软)来可视化和分析这些数据。
使用Python进行数据分析/可视化
进行数据可视化时,Matplotlib是非常热门的库。
Matplotlib很棒,因为:
· 容易上手
· seaborn等库是基于它的,学习Matplotlib可以帮助你以后学习其他库。
如何用Python学习数据分析/可视化
你首先应该了解数据分析和可视化的基础知识。在学习了数据分析和可视化的基础知识之后,学习统计学基础知识也将会很有帮助。
三、脚本
什么是脚本?
脚本通常是指编写能够自动执行简单任务的小程序。
我曾经在日本的一家小型创业公司工作,公司有邮件支持系统,这用来回复客户通过邮件发送给我们的问题。
在那儿工作时,我的任务是计算包含关键字的邮件数量,以便分析我们收到的电子邮件。这可以手动完成,但我写了一个简单的脚本来自动执行此任务。
当时我们使用了Ruby,但对于这类任务Python也是不错的选择。Python适合这类任务,因为它语法简单,易于编写,而且进行测试也很快。
其他用途
嵌入式应用
我不是这方面的专家,但我知道Python可以与Rasberry Pi一起用,在硬件爱好者中很流行。
游戏开发
你可以用PyGame来开发游戏,但这并不是最受欢迎的游戏引擎。你可以用它来开发业余爱好项目,但如果你对游戏开发很认真,建议不要选它。
我建议使用Unity的C#,这是最受欢迎的游戏引擎之一。它能让你为许多平台开发游戏,包括Mac、Windows、iOS和Android。
桌面应用
你可以用Python的Tkinter,但这并不是最热门的选择。Java,C#和C ++等语言似乎更受欢迎。
最近,一些公司也开始使用JavaScript来开发桌面应用程序。例如,Slack的桌面应用是Electron构建的。它能让你用JavaScript构建桌面应用程序。
就个人而言,如果我要开发桌面应用,我会选择使用JavaScript。它能让你重新使用网络版本的一些代码。
当然,我并不是桌面应用的专家,所以如果你有不同的看法,评论中告诉我。
Python 3还是Python 2
我会推荐Python 3,因为它更新而且更受欢迎。
后端代码与前端代码的区别
假设你想开发类似Instagram的产品,那么你需要为想要支持类型的设备创建前端代码。
你可能会用到:
· 面向iOS端的Swift
· 面向Android的Java
· 面向Web浏览器的JavaScript
每组代码将在每种类型的设备上运行。这类代码将决定应用的布局样式,点击按键的样式等。
但,您还需要存储用户信息和照片的功能。你要将它们存储在服务器上,而不仅仅存储在用户的设备上,以便每个用户的关注者都可以查看其照片。
这时需要用到后端代码/服务器端代码。你需要编写后端代码来执行以下操作:
· 记录关注情况
· 压缩照片,从而不占用太多存储空间
· 在发现功能中向每个用户推荐照片和新帐户
这是后端代码和前端代码之间的区别。
顺便说一下,Python不是编写后端代码的唯一选择,还有基于JavaScript的Node.js等选择。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28