京公网安备 11010802034615号
经营许可证编号:京B2-20210330
关于大数据的七个观点_数据分析师
在第八届网上零售年会上,阿里巴巴集团数据委员会会长车品觉表示,对于企业而言,数据一定要“从看到用”,如果所掌握的数据没有到运用的阶段,那就算不上“大数据”。
车品觉指出,在数据运用上非常重要的一点是要用在核心的决策点上,这样企业才能得到大数据的价值。“比如在广告领域,我们要给一个价。‘在什么时间点给予什么价,可以得到最好的回报’就是一个核心的决策点,大数据就要放在这个地方。”
以下是车品觉关于大数据的几个重要观点。
第一,只有两种方法可以得到大数据。一种是在自身企业外的数据,当你拿到这些数据时可以更精准提炼自己的东西。另一种是把自己的数据提供给别人,别人可以用我的数据产生更大的价值。
第二,大数据是“一把手”工程,需要企业的最高层直接负责、下达命令。这是因为,一方面,公司内部可能对于大数据本身没有信心;另一方面,数据安全性是大多数人最担心的问题。“事实上,很多企业分公司与分公司之间,大家都不一定能够相互信任。你要把我的数据给另外一个分公司,拿着我的数据,我不放心。”
第三,大数据的成本是非常大的,所以企业要首先判断哪些数据是重要的,需要被优先使用。车品觉表示,大数据出成绩的时候很美,但事实上,企业做大数据的成本是极高的,且错误率非常高。数据备份的成本、人才的培养及挖掘等都需要很大的成本。
第四:行为数据的搜集有一个时间点,可以抛弃一些过往数据,以降低成本。“行为数据是基于整个网站的设计,当整个网站设计产生了非常大的变动之后,你也没有办法还原过来的话,这个数据就开始不要了。”
第五,无线数据非常重要,已经影响到企业的底层数据,是大数据的未来。且无线数据与PC数据有很大的不同。比如无线端的数据来自于APP、WAP和HTML5,这三个渠道,每个渠道的数据源和特性都存在很大的不同。“比如无线APP是没有cookie的,也没有点击数据这一说。” 从人才的角度来讲,要把数据的人提炼成更多的商业的感觉。
第六,大数据人才的培养的重点在于培养数据中间层,这个中间层用以连接研究数据和使用数据的两方人。从人才培养的角度来说,就是要培养数据人的商业感觉。
“我们发现做大数据的人中没有很多人想用这些数据;但是想用数据的人,但是我不知道数据从哪里来。所以比较有经验的人希望能有一个数据中间层出来,让用的人可以理解有什么数据可用,让做数据的人集合经验能成为一个中间者。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31