
小明说,我是数据分析师!
今天浅谈一下数据分析师这个职业,以期望能有抛砖引玉之功效,为更多即将投入该职业的人稍有指引。“小明,听说你是数学专业出身的?”“是的,领导。”“那你去把这些手抄报表录入到电脑里去。”“老板,请你尊重我的专业”“那你把欧氏距离、闵可夫斯基距离、坎贝拉度量各自的计算方法和优缺点说明一下。”“老板,我去干活了。”
从业至今一直从事于互联网数据分析师这一职业,且较多精力都是致力于游戏行业的数据分析。一直以来经常被人问到:数据分析师到底是干什么的?你们能创造什么价值?刚开始的时候,每当被问到这种问题,一时语顿,还真不知道怎么去解答。但是随之从业时间的沉淀,感觉自己也有那么一丝觉悟。犹如练武之人,练久了,虽还不能打开任督二脉,但是气血确实旺盛了不少。只不过其中的来龙去脉还不能整理清晰道出个明白。今天尝试把其中整理一下思路给大家说说。
先回到:数据分析师是干什么的这个问题。我从数据分析师需要get的技能阐述,大家可自行领悟答案。
初级技能:剥茧抽丝、清晰明了。锱铢必较,严肃对待。
中级技能:财色兼收,有皮有肉。取其精华去其糟粕 刨根问底,头痛医头,脚痛医脚。
高级技能:融会贯通,了然于胸。八卦太极,借力生力。
下面就针对上面的几条把数据分析师扒皮剥肉,一层一层的看清他的真面目:
先说工作在前线的众多数据分析工作者,大部分面向的都是运营人员、产品或者业务人员。这些人可了不得,他们是公司流水靠的最近的一群人,为了公司的业绩能用上的资源都要给他们,包括数据分析师也是其中之一的资源(如果是一个初入行者看到这别担心,往后看,会翻身做主人的)。
我们的产品人员为了让我们的产品更受用户喜爱,能让更多的用户为我们的产品买单,他们就要想出非常多的好的创意去满足市场。但是用户究竟在想什么,他们到底是喜欢蓝色的还是红色的,他们是喜欢萌一点的还是喜欢肌肉怪叔叔。从业经验丰富的产品人员有很多可信度非常高的经验拿来言传身教。但是还有很多针对自己产品具体的东西,我们的用户在想什么是不能通过经验妄自揣测的,这时候我们就要出场了。
产品人员大量的时间都在想关于产品的创意,我们就需要把杂乱无章的用户行为,整理出来,好比我们不能告诉产品人员有很多数据给你自己去看。我们需要把庞大的数据化小,简单明了的告诉他,我们的用户选择蓝色用户占比70%,选择紫色的用户15%如此等等,不要让产品人员花在他不擅长的事情上很多时间。时间就是金钱,这也是一个公司设置那么多繁琐的岗位的道理之处。
承接上一点,我们把繁琐的数据处理成简单清晰地数据,最后丢给产品人员参考。他们没有时间去验证我们数据是有多少的可信度。如果我们数据有差,可能最后导致的整个产品失败(蝴蝶效应并不夸张)。所以作为一个初级者,你最起码要做到的是锱铢必较,严肃对待。在我们还没有成长到中级或者高级的时候我们最起码要保证我们的数据在我们手中处理的过程是透明的,真实的。
如果对于前面的两个技能你如果觉得感觉无法承受其枯燥,重复带来的痛苦,那就不用继续看下去了。因为到现在最多也就是一个刚获得了青铜战衣的青铜战士,要修炼的路还很久。如果你还有兴趣看下去的话,下面的技能较之前面乐趣会多了一些。
就好比一个上了几天驾校,刚拿到驾驶证的人来说,第一条要做的是安全。但是对于一个有那么一段时间驾龄的司机来说,除了安全之外还会寻求一点驾驶的乐趣,比如速度、花样之类的。
作为一个修炼到一定程度的盲流,只收财不收色不是我的作风。当你已经能够熟练地完成前面的工作的时候你需要给你的技能加点属性强化一下。大家都是爱美的,你不能总给产品扔过去一堆数字,好的产品需要产品人员每天都有好的心情。你想想他每天都看到你扔的一堆数字,他心情糟糕透了。硬着头皮把你的数据看完,也没有记住多少。对你对他都是损失,他损失了对产品有利的数据支持;而你损失的是地位和尊严。他们觉得你不那么重要的时候,最起码你的工资是没法涨的。
所以我们要把我们的数据包装一下,尽量图表化,漂亮的姑娘大家都爱看两眼。这里你需要详细的了解,不同类型的数据用什么样的图表展示效果最佳,最能引人注目,最能直击目标。
前面说了我们的产品人员没有很多精力去验证你的数据的可信度,他们是直接拿来用的。在初级的时候我们只能保证我们处理数据透明化的。但是暗藏在庞大数据体内的病菌在我们修炼了一段时间以后也要一眼识破。
就好比你去餐厅点了一支烤鸡,烤鸡上来之后看上去颜色火候都非常诱人。结果当你吃的时候发现悲催的是根本就没有去除内脏。你想想是不是很恶心。再举个列子,你去消(piao)遣(chang),你选了一个外表十分漂亮的小妞,等灯一关准备干一些龌龌龊龊的事情的时候,发现这小妞的家伙比你还猛。是不是恶心他妈给恶心开门,恶心到家了。
我们提供给产品的数据也是一样,我们把数据清洗梳理,包装完美提交给产品人员。最后发现因为原始数据中存在一定的脏数,因为我们没有剔除导致最后的产品失败,是不是很恶心。
在我们一点点的积累学习中,要练就取其精华去其糟粕的的火眼金睛。我们要不断地对我们的数据提出可能存在的质疑,然后去验证。保证我们最后提供的数据是干净卫生免检的。
只会看病不会治病的医生那很是危险啊。小明脚疼去看医生,医生诊断脚上长了个良性小瘤子。没啥大碍,割掉就好了。然后小明被推进了手术室,医生打开了小明的脑袋,割了一块脑花出来(此处建议不要脑补,略恶心)。小明猝,享年十八岁。作为数据分析师,我们不能单纯的为产品提供数据线索,我们要适时的为产品人员提供数据线索的背后。
假如我们发现我们产品的留存率变差了。我们不能只是单纯的告诉产品人员留存率变差了,他就是去趟医院开个脑壳也想不出来为啥变差了。我们需要发扬刨根问底的精神,挖掘到产品的哪一个点,是某一个功能,还是某一个按钮,更甚者就是某一个素材的明暗度让用不舒爽流失了。
到这里我们也仅仅是一个会看病的医生,我们要发挥我们的聪明才智,针对问题点梳理出可参考的改善性建议给产品人员参考。(当然这个过程是非常复杂的,建议数据同学要时不时的参与产品人员的各种会议,风暴。尽可能的多涉猎一些关于市场,产品更甚至于社会心理等等方面)
如果你已经把上面的技能都get了,恭喜你,你进化到了白银圣斗士。同时你获得的是产品人员更多的尊重和重视。当然你的生活品质也会被提升不少,
接下来讲的是白银圣斗士向黄金圣斗士的进阶,这也是最漫长最难得一段修炼过程。
圣斗士的最高境界不是身上的圣衣,而是小宇宙。这也是数据分析师达到非常高的境界。达到这个境界之后,你不需要什么工具,技能作为武器去战斗。你的经络已经打通,也就是大牛。当然这个时候你面向的人员一般就不是普通的产品,至少也是一个高级总监级别的。这时候扮演的是一个军师的角色。
我们了然各种产品的数据应该是怎样的,我们熟悉各种人群属性是怎样的,我们对于特定的产品特定的人群有清晰地思路和方案拿给产品人员参考。
太极的境界是借用外力打击外力,一个资深的数据分析师是对产品,市场,人文,社会,心理等等各个方面都有较深厚的涉猎和觉悟。我们能够清晰地了解当前市场是怎样的,我们清晰地对一个项目定位他的最适目标在哪里,最适定价等等。我们要做的是让公司的每一个立项都是最符合市场需要的,产品体现出来的功能效果是最佳用户体验的。我们让天生残缺的产品找到适合的市场方向,找到适合的支点发力。
综上,由于自身还未达到数据分析师的至高境界,所以还有很多探索空间,定有不足之处。也是为之奋斗的目标。另外以上各点仅针对产品某一项做的阐述,数据分析师的职位包括市场分析,绩效分析等等都有,请自行衍生。
对于数据分析师的技能get就讲到这里。接下来讲讲大家也比较关注的数据分析师的职业发展方向:
职业数据分析专家
数据方向产品专家
高级产品经理
如果你是一个天生宅,对于天文地理都有浓厚的探索兴趣,很明显你适合做第一个。你能通过你孜孜不倦的探索,为公司产品人员提供专业的数据指导,奋斗在产品研究的第一线。创造更多的大作。
如果你是满足于第一条而且你又不限于去指导产品,你希望你的数据能直接带来利润,为公司增收或者节支。很显然你适合第二个方向。你会致力于把你的数据经验投身到数据应用中,向现在比较火的广告投放等等都是数据应用的范畴。
如果你忍受不了你一次次高明的数据推断和产品设想被产品人员各种不屑或者你的想法无法被验证。那你去做一个产品经理奋斗在产品第一线是最适合不过了。你有深厚的数据基础,有丰富的市场、产品、用户群体的数据沉淀。再加上你不是一个天生宅在物理化的世界里的理科男,你是有那么一些文艺理想范儿的有志青年。走上一个高级产品经理的道路最适合不过。
以上介绍了数据分析师的现在和将来,接来下讲讲数据分析师的前世:要成为一个合格的数据分析师需要有哪些素质。
首先,你的是一个严谨认真的人。数据是不带有喜剧色彩的,我们需要严肃认真的对待他。他才会给我们严肃认真的回馈。
其次,你要耐得住枯燥。一开始的很长一段时间,是沉浸在各种繁琐无止尽的数据加工处理阶段。就好比开头小明老板让小明干的工作。只有在繁琐的数据清洗过程中加上自己的思考才能打下坚实的基础。
再次,你最好是一个有点情商的人。如果一个家伙智商超高,情商超低。那不好意思,数据分析师真的不适合你。数据的作用就好比桥梁,对岸是什么样的风景只有你自己过去看看才知道。数据也一样,他只会反馈用户表现出来的行为,但是行为反馈到用户的心理情感有时候是需要我们去带着那么一点猜测的。当然是不能胡乱揣测,你最起码需要有那么一点情商作为支撑才能干好。
还有就是你得是一个涉猎范围非常广的家伙。虽说术业有专攻,但是作为一个合格的数据分析师,你需要懂得东西更多。你得了解市场行情,你得了解用户群体,你得了解产品设计,你得了解行为心理。。。。。。如此等等,数据分析师应该是一个综合能力智商情商都非常高的人。
最后,对未来做一点畅想。试想在未来的某一天生物学和计算机学科结合。人类的感知通过你的随身设备,手机、游戏机等等反馈给计算机。到时候我们除了能收集用户行为数据,还能及时反馈用户的情感心理变动等等。那样我们能做的工作是不是会更美好,我们能够更有效的改变使用者的心态,我们可能通过我们的产品治疗好了一个抑郁症患者,把一个有自杀倾向的人挽救回来......
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14