
数据和数据分析师!
我们总是故意或无意跑偏,自从大数据火了以后,数据分析师摇身一变,成了大家眼中红人。貌似,有了分析师的分析以后,一个产品或者业务就能循着增长的曲线来前进,不再陷入那深深的黑暗中。可是,阿里巴巴创业的黑暗期,可有数据去分析?
没有数据分析,那玩什么?又怎么成功的?这个问题很重要,值得每个数据分析师去思考那个答案。舍本逐末。见利忘义。我们总是会掉到这个坑里面。比如教育,我们也会去谈“教育的目的”,但是,多少人真正懂得教育的目的?就算懂了,我们做的是否就是朝着这个目的来做?而不是做了一些看似合理但是以自己利益为驱动的事情?比如自由和民主,我们是真的不懂么?但是,我们的自由和民主,多少是口口声声的自由和民主?世界就是这个样子,目标就在那里,可是因为我们的愚昧、利益,我们又“顺其自然”的做了很多很多看似合理,其实完全错误的事情。教育这样,政治这样,工作和创业依然。我们都确定了工作和创业的方向了,最后在一个人,或者一帮人,经过日夜的讨论,打拼之后,发现跑偏了!崔健的《像一把刀子》里面有这样一句歌词:“这时我的心就像一把刀子,它要穿过你的喉咙去吻你的肺……”思考和解决问题的时候,我们就要用这样的态度,往往要穿过问题的喉咙去探它的肺才可以找到答案——像一把刀子。——From 李笑来
1,数据的前世今生
有了光,有了人,才有了世界。
有了人,有了产品,才有了数据。
从这个角度上说,数据是一个衍生品,而不是根本。
根据历史追溯,最初的“数据”是不是应该属于“结绳”?一天过去了,就系一个绳子疙瘩。
原始人从结绳开始,刻一些壁画,慢慢的进入了文字的世界。中国古代的数据,文本数据占大多数,比如经史子集,书法诗歌等等。进入近代社会,尤其伴随西方科学推动商业的发展,数值数据量随着商业膨胀的越来越大。现在我们说的数据,主要就是数值数据,和文本数据。
为什么大数据最近才有?因为近几年数值数据在互联网发展的效应下,记录和存储技术方面有了更多的突破,所以可以利用的数据越来越多。
为什么大数据会火呢?因为大家觉得大数据是“人”的行为痕迹,貌似知道了人的痕迹就可以知道这个人了。为什么以前不可以?以前不是不可以,我们有占卜、算命,也是根据数据来分析和预测,只不过这个数据太少,不能完全匹配人的行为,也就不能完全“还原”一个人。现在呢,大数据其实也是“算命”,只不过有了更多的数据而已。
2,数据人如何定位?
公司为什么会区分职位?
为什么不同的人有不同的技能?
因为专业的人,做事效率高,做事情成本低。
数据分析师,数据挖掘呢?
听着好牛啊,工资也高。可是,老陆的CEO的职位更好听,工资更高。认识世界有很多种,可以瞎猜,可以YY,可以去问,也可以通过数据。通过数据来看产品,是目前大家觉得最方便、最省力、最接近人真实情况的一种方式。只能说趋近人,到底趋近度多少,不知道。所以,相对PD和运营,数据人(分析师、挖掘)只是从另外一个视角来看产品和描述产品。仅此而已。产品是第一位,不管是产品经理、运营、分析师、挖掘工程师、算法等等,最终服务的都是这个“产品”。只不过,在去“罗马”这条路上,每个JOB TITLE的路不一样,责任不一样。就像一盘棋,每个棋子的作用不会很大,但是全部的棋子组合起来就可以决定输或者赢。
3,数据怎么去用?有了大数据,有了数据挖掘,感觉世界都可以换新天了。
数据到底如何去使用?数据分析,数据挖掘,数据可视化,各种词汇包围着“大数据”。一看上去,只要涉足这三个行业,就身价倍增的样子。看流量,看成交,写专题,做报告。每个里面都是图表,每个里面都有看似真实的世界的表现——数据。可是,做了这些东西以后,然后呢?
再然后呢?我们有了专题,我们也有了报告,我们更有了数据。但是,我们想过我们最初要什么?我们看数据是为了什么?我们做数据挖掘是为了什么?看数据,可能可以知道产品变化的地方,但是背后的原因我们知道么?产品背后为什么会有这样的变动?用户——这个所谓的人,TA们为什么会这样变化,为什么没有向另外的方向变化?这些是数据解释不了的。
4,数据靠谱么?
数据-------->>>>>>人,貌似数据越多,我们越可以趋近这个人,更好的“还原”这个人。有了大量的有关“人”的数据,大家觉得就可以去“还原”一个人了。从概率上来说,这个准确度确实在提高。但是有一个问题:我们是否拿到了足够的数据,以及是否拿到最能代表一个人的那些数据?搜索行为,购买记录,收藏点击,聊天记录,等等等。它是一个人真正的表现么?这些好多好多的数据,到底是一个人购物过程用到的数据的多少呢?我经常在考虑一个问题:我了解我自己么?我到底是怎么样一个人?我爱好什么?我喜欢什么?我的情绪怎么样变化?我发现我很难了解我自己。人啊,要认识自己。可是多么难。自己都不了解自己,数据真的可以么?
如果拿到的数据,只能预测一个人在某个时间段的5%的行为,是否有用?有人说,当然有用啊,不然推荐算法的效果是乱说的么?可是,我们怎么可以清晰的证明,人没有受到推荐的影响,而是真正的想购买或者点击?理性之非理性的情况下,点击和购买成本如此之低,随便买买和点点也可以吧?数据 = 人?这个等式永远不成立。可能大家在追求5%*人 = 数据?,或者更多。
5,世界的本质
说到最后,发现貌似数据分析,数据挖掘也没啥。恩,马总不懂挖掘,可以成功。乔布斯也不懂数据和挖掘,也不看用户分析和调研。为啥他们可以成功?因为他们可以更好的认识世界。认识世界,似乎可以从“道”和“术”两个维度来说。道,宇宙的法则;术,道的体现。道是本质,比如,人就是会倾向用“简单易用、符合天性“的产品;而iphone的畅销,仅仅是它顺承了人的天性而已。“术”可以做啥?通过iphone销量的分析,我们可以确定产品的确是符合“道”的;另外,通过分析和挖掘等,可以让这个IPHONE产品改进的更好,或者有Iphone 6这种大屏的新产品出来,可以卖更多的产品。从IPHONE的升级换代来看,本质的”道“没变——简单易用,其他的变得太多了。但是,万变不离其宗,所有的产品无不在“简单易用”这个法则上去无限的靠近,比如iphone 6,锤子。这个“道”,它就是自然存在的。是不是可以通过数据分析和挖掘发现呢?很难。但不是不可能。想想物理学中的定律,发现它们何其难。
6,现实呢,我们在做啥?
如果记录的数据有问题,或者有偏颇,数据分析的结果就是错的,一点价值木有。咳咳咳!分析师总觉得我觉得数据是这样子的,为啥产品不可以对应的去做,我们应该这样去做啊。但是,数据的表现,真的是产品后面的人体现出来的么?分析了一个又一个案例,分享了一个又一个案例,分析师好牛啊。等等,小明,把名字换成小王,这个题目你会做么?我们总是对产品,对数据分析又分析,从来没想想,产品和数据都是谁的产品和数据。到底,我们做的产品和数据是为了啥?是不是“人”才是我们最应该去回答的问题?如果产品不是为了“人”去做,如果数据不是还原“人”,我们的结果到底有啥价值?就算有点意义,是不是也是错的?
7,回到前言
不管是数据分析,产品经理,数据挖掘,运营,最终回归到的一个地方,就是:商业。商业的组成部分是:人。所以,全部的工作的核心就是:商业和人。这三个字,不管是数据分析、数据挖掘过程中,还是结果的展示中,都是我们唯一需要做的。这个就是数据的本质,也是数据分析师的本职。其他的分析也好,挖掘也罢,可视化也好,就是让人更好的去理解 商业和人 的途径和形式。无他。切莫舍本逐末,切莫看到了“1,2,3”便大叫,“吾得矣”,切莫做理性之非理性的事情。
8,世界很简单,又很复杂
道生一,一生二,三生万物。一,二,三。看着真简单。阴阳。两仪。八卦。六十四卦。简单中蕴藏着万物变动。但是,如果我们知道了世界运行的框架,是不是就会在复杂中看到最初的简单的一、二、三?对于数据分析师来说,最难也是最重要的,莫过于知道某个框架,了解其中的一、二、三。这样,不管这个题目是小明,还是小王,是去买菜,还是买水果,甚至是买钻石,都能更好的分析,理解。而框架是什么呢?我个人现在的选择是:人性和自然。
9,人性和自然
太阳从东方升起,从西方降落。
春花秋月,寒来暑往。
没有什么是固定的,本来就是无常,这个就是自然。
社会发展趋势,科技发展趋势,商业发展,莫不如此。
贪,嗔,痴。
说的细化一些,贪美,贪乐,贪吃,贪心,等等。
人的本性如此。
掌握了自然发展规律,了解人性,就明白了产品应该如何去做。
如果人人都发掘出“佛性”,即有出离心。
世界没有商业的存在。
本来,原始人就没有商业。一样可以存活。虽然不是更好的存活。
10,如何做一个数据分析师
我现在对于“数据分析师”这个title,关注已经越来越淡了。
如果要说如何做一个数据分析师,那就再啰嗦说几点自己的看法:
掌握一门功夫(编程语言,比如R,SQL,Python),练练套路(比如可视化,挖掘,分析方法),这些是硬实力。如果这个不会,很难在江湖上混了。
功夫在诗外。纵观古今,有大成就者,必定是格局的大。太极的厉害,不是套路的厉害,而是它的本质规律的厉害,即以柔克刚。认清和掌握了以柔克刚,太极功夫会更厉害。这是一个人的软实力。要具备这样的格局和软实力,分析师需要通过各种方式和途径去提高自己对本质——商业和人 的认识,比如看书,听讲座,请教,思考。这些功夫在分析师工作之外的,但是非常重要。个人觉得,软实力 > 硬实力。大师之所以是大师,在于TA视野和格局的大。世界本没有数据分析师,说的人多了,就有了数据分析师。如此而已。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 多列条件筛选:从基础语法到实战应用 在数据分析工作中,基于多列条件筛选数据是高频需求。无论是提取满足特定业务规则的 ...
2025-08-12游戏流水衰退率:计算方法与实践意义 在游戏行业中,流水(即游戏收入)是衡量一款游戏商业表现的核心指标之一。而游戏流水衰退 ...
2025-08-12CDA 一级:数据分析入门的基石 在当今数据驱动的时代,数据分析能力已成为职场中的一项重要技能。CDA(Certified Data Anal ...
2025-08-12破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-11数据时代的黄金入场券:CDA 认证解锁职业新蓝海 一、万亿级市场需求下的数据分析人才缺口 在数字化转型浪潮中,数据已成为企业核 ...
2025-08-11DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08CDA 数据分析师:解锁数据价值的专业力量 在当今这个数据爆炸的时代,数据已成为像石油一样珍贵的战略资源。而 CDA 数据分析师, ...
2025-08-08人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-08-07SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-08-07SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-08-07CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-07大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-08-07K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-08-07CDA 数据分析师考试全解析 在当今数字化时代,数据已成为企业发展的核心驱动力,数据分析师这一职业也愈发受到重视。CDA 数据分 ...
2025-08-07大数据时代的隐患:繁荣背后的隐忧 当我们在电商平台浏览商品时,系统总能 “精准” 推送心仪的物品;当我们刷短视频时,算法 ...
2025-08-07解析 F 边界检验:协整分析中的实用工具 在计量经济学的时间序列分析中,判断变量之间是否存在长期稳定的均衡关系(即协整关系) ...
2025-08-07CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-07通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-07