
上周从买了两本书《谁说菜鸟不会数据分析》和《大数据时代》,学习过程中想把书本内容通过总结、理解、实践、内化掌握来变成自己的东西,把握好学习的节奏,坚持就好。
初级阶段我更多的是来转述前辈们总结出的东西,但自己若有实践中的体会也会写入其中(自己的体会粗体标出)。本来就是记录菜鸟成长过程,所以内容对行家来说太小儿科,对新手入门来说或许会有些帮助。
以下开始是对《谁说菜鸟不会分析数据》一书的学习总结,第一章:数据分析那些事儿。
1.何谓数据分析?
用适当的统计分析方法对收集来的大量数据进行详细研究和概括总结,以求最大化地发挥数据的作用,提取有用信息和形成结论,这一过程叫做数据分析。
2.数据分析的三大作用:现状分析、原因分析、预测分析。
1.明确分析思路:
首先要明确分析目的:菜鸟与数据分析师的区别就在于菜鸟做分析时目的不明确,从而导致分析过程非常盲目。这点有比较深的体会,在公司里做过关于搜索和新手的产品数据分析,自己对分析目的没考虑太多,靠的是前人留下的上期数据分析结果,倘若让我从零开始做,估计会很盲目。
然后确定分析思路:梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标。
最后还要确保分析框架的体系化,使分析结果具有说服力:营销方面的理论模型有4P、用户使用行为、STP理论、SWOT等;管理方面的理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART等。在上周一个汇报上使用了SWOT分析方法,对这些营销或管理的模型还都很陌生。
2.数据收集:
一般数据来源于以下几种方式:数据库、公开出版物(统计年鉴或报告)、互联网、市场调查。
3.数据处理:
数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。导师提过在做数据处理时,不要在原始数据上进行数据处理以防原始数据丢失,保留数据处理过程以便发现错误时查找。
4.数据分析:
数据分析是指用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。
与数据挖掘的关系是数据挖掘侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。
5.数据展现:
一般情况下,数据是通过表格和图形的方式来呈现的。常用的数据图表包括饼图、柱形图、条形图、折线图、散点图、雷达图等。进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。
在一般情况下,能用图说明问题的就不用表格,能用表说明问题的就不用文字。
6.报告撰写:
一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。
另外,数据分析报告需要有明确的结论,没有明确结论的分析称不上分析,好的分析报告一定要有建议或解决方案。
1.分析目的不明确,为分析而分析。
2.缺乏业务知识,分析结果偏离实际:数据分析师的任务不是单纯做数学题,数据分析师还必须懂营销,懂管理,更要懂策略。上周五听了公司专门做数据分析的同事做的关于新手留存的数据分析专题,他们数理统计专业知识必然过硬,而且对业务比较熟悉,能通过数据结合不同业务做出相应结论,还能为不同业务提出改进意见,不熟悉业务不懂策略怎行?
3.一味追求使用高级分析方法,热衷研究模型。
1.数据分析的广阔前景:根据美国劳工部预测,到2018年,数据分析师的需求量将增长20%。就算你不是数据分析师,但数据分析技能也是未来必不可少的工作技能之一。
2.数据分析师的职业要求:懂业务,懂管理,懂分析,懂工具,还要懂设计。
其中,懂分析中,基本的分析方法有:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等;高级的分析方法有:相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、对应分析法、时间序列等。
懂工具中,常用的数据分析工具有Excel、Access、SPSS、SAS,先学会用Excel,它能解决80%甚至100%的问题。
懂设计中,图表的设计是大学问,如图形的选择、版式的设计、颜色的搭配等,都需要掌握一定的设计原则。
以下几个常见的只是提一下:平均数、绝对数和相对数、百分比和百分点、频数和频率、比例和比率。
另外倍数与番数、同比与环比,我之前有疑问的特别提下。番数是指原来数量的2的N次方倍,比如翻一番为原来数量的2倍(2的一次方),翻两番为4倍(2的二次方)。同比是与历史同时期进行比较得到的数值,环比是指与前一个统计期进行比较得到的数值。(文章来源:CDA数据分析师培训官网)
这部分主要是对数据分析有了一个全面的了解而又粗略的认识,说实话这样的总结复述后很多地方我印象也不深,但总比看过一遍后不再管能多记住一些,当然能实践才会印象更深。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28PCU:游戏运营的 “实时晴雨表”—— 从数据监控到运营决策的落地指南 在游戏行业,DAU(日活跃用户)、MAU(月活跃用户)是衡量 ...
2025-08-28Excel 聚类分析:零代码实现数据分群,赋能中小团队业务决策 在数字化转型中,“数据分群” 是企业理解用户、优化运营的核心手段 ...
2025-08-28CDA 数据分析师:数字化时代数据思维的践行者与价值推动者 当数字经济成为全球经济增长的核心引擎,数据已从 “辅助性信息” 跃 ...
2025-08-28ALTER TABLE ADD 多个 INDEX:数据库批量索引优化的高效实践 在数据库运维与性能优化中,索引是提升查询效率的核心手段。当业务 ...
2025-08-27Power BI 去重函数:数据清洗与精准分析的核心工具 在企业数据分析流程中,数据质量直接决定分析结果的可靠性。Power BI 作为主 ...
2025-08-27CDA 数据分析师:数据探索与统计分析的实践与价值 在数字化浪潮席卷各行业的当下,数据已成为企业核心资产,而 CDA(Certif ...
2025-08-27t 检验与 Wilcoxon 检验:数据差异比较的两大统计利器 在数据分析中,“比较差异” 是核心需求之一 —— 如新药疗效是否优于旧药 ...
2025-08-26季节性分解外推法:解锁时间序列预测的规律密码 在商业决策、资源调度、政策制定等领域,准确的预测是规避风险、提升效率的关键 ...
2025-08-26CDA 数据分析师:数据治理驱动下的企业数据价值守护者 在数字经济时代,数据已成为企业核心战略资产,其价值的释放离不开高 ...
2025-08-26