京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据关键七问_数据分析师
对很多人来说,大数据只是个流行词,谁会需要大数据?
答:任何可以成为流行词的东西,肯定是社会对它充满巨大的期望和想像。大数据也不例外。建议企业在考虑使用大数据之前要从当前的问题着手,然后思考:
1. 理解业务中有没有一些决策做得不好,使用数据可以解决吗?
2. 在营运的工作流程中,有没有错误可以利用数据快速纠正呢?
3. 数据是否有可能帮助提升产品或服务的品质?甚至直接成为创新的元素?
以上几个问题,是希望大家明白大数据的运用和你对业务是否有深入理解相关。从这个角度去看,数据化营运无孔不入,跟谁都有关系。然而在使用数据之前,企业还要关注一些基本功,数据平台的软、硬体支援、如何做好数据的加工准备(包括新旧数据整合)、提炼数据到解决问题的能力。如是,才有资格谈大数据。所以,中小企业都应该用数据去认知自己哪些做得好或者不好(数据化营运),数据作为一个工具,可以帮助中小企业去了解自己,也可以优化业务。但是经营的本质还是取决于创始人的方向与管理,大家不能本末倒置,一昧期待透过大数据就能解决企业的所有挑战。
问:台湾的中小企业可以如何应用大数据?
答:大数据的力量来自分享、整合和产品化。例如,Google地图之所以能告诉你前面的路塞车,其实是有赖于每个使用 Google地图的位置分享。所以我认为政府的推动,可以让小企业减少得到数据的门槛、增加业界的数据共用,这样就更有利于让小企业也享受到大数据的科技。从产业链来看,小公司联盟,把数据统一,用数据来解决一些业内彼此都不能解决的问题。
问:台湾大多是中小企业,相较于大公司,中小企业做大数据的方式、思维有何不同?
答:不管是中小企业还是大企业,在运用任何一种新科技的时候必然要量力而为。而中小企业和大企业的区别,在于中小企业的资源肯定没有大企业那么多,所以,中小企业不容易像大公司一样有庞大的数据团队。因此,中小企业在运用数据的时候一定要有更稳妥的方法,注重使用数据的效益,可以尝试从小专案着手再逐步拓展。
问:在资讯泛滥的环境,数据愈来愈容易收集,但也代表「噪音」愈多。企业该如何找到核心数据并成功应用?
答:根据过去的经验,我认为初期不要贸然就开始一个非常大的大数据项目,而应该是要从小处开始。数据比较适合以小、具体、容易评估效果作为起点的专案,以此锻链自己收集、加工、使用数据来做决策,以及衡量这个数据价值的能力,即以小知大。从小的场景开始,用数据在商业场景中不断优化。
问:您曾提到大数据的应用讲求跨界和创新,在实践大数据的过程中,最困难的地方为何?
答:大数据应用讲求跨界和创新,更准确地说,大数据的价值来自可以从多角度来看同一件事,全景观察可以减少误差及创造新的机会。但并不是要求你能够认知到全部外面的世界,而是能让其他人的数据为你所用。大数据实践中最困难的地方在于你对自身的理解,再加上,隔行如隔山,外部整合回来的数据可能很有价值但同时也有很多噪音,大家并不完全清楚数据的来源和定义。
问:成为一名杰出的数据部门主管应具备哪些关键能力?
答:据我的观察,目前非常缺乏一种数据管理人才:对业务要有足够的理解、明白数据能为业务起什么作用、了解技术更新对价值产生的关系、数据收集到加工、新数据与历史的整合、使用数据的便利性等等。其中,对业务和商业的理解,绝对是成为数据主管所需要的基本条件,但若是想达到杰出的程度,肯定要懂得如何在人才匮乏的大数据行业中吸引和保留住人才的眼光和能力了。
问:如何培养对大数据的敏锐度?
答:当在公司遇到业务问题时,问问自己:现在拥有的数据能帮我解决问题吗?假定所有数据可以获取,我需要什么数据来解决问题?要怎么做才能更容易获取需要的数据呢?举例来说,我过去看到路上的交通状况时曾经想过,大城市里的计程车服务会不会有可能改善?我那时想着,如果计程车上有个灯能显示过去客户对他的评价,那么司机为了保持住好评价,应该会提供更好的服务水准,这就是数据可能解决的一个简单例子,下一步才是如何设计一个容易的方法让顾客去评价,而现在的叫车软体就是一个很好的实现案例。这是训练数据敏感度的好方法,也是过去10年我个人一直在用的方法──透过周遭事物训练数据敏感度,让数字「说话」。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30在CDA(Certified Data Analyst)数据分析师的日常工作中,“无监督分组、挖掘数据内在聚类规律”是高频核心需求——电商场景中 ...
2026-03-30机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23在CDA(Certified Data Analyst)数据分析师的日常工作与认证考核中,分类变量的关联分析是高频核心场景。用户性别是否影响商品 ...
2026-03-23在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20