
如何让大数据好看又实用
现如今,每个人都在谈论大数据,但很大程度上是由于其挥之不去的复杂性,故而,企业真正对于大数据的采用率仍然相对较低。事实上,在最近的一项针对大数据从业者的调查发现,只有百分之十三的企业对于大数据已经实现了全方位的应用。
这一比例无疑是非常小的。
Zoomdata 公司首席执行官Justin Langseth在接受采访时告诉我说,当谈到大数据时,其设计与性能其实同样重要。事实证明,“大”数据如若不能转化为“有用的”数据的话,也没有多大意义。
大数据的小成功
大数据革命最好的特点之一是其由于有了零成本的开源软件变得更强大。而商务智能一直受困于复杂而价格昂贵的软件,但在今天,最具创新性的大数据技术仅仅只需一个下载即可获得。
至少,理论上是这样的。
但在实践中,任何曾试图下载过Hadoop的人都可能会告诉你说,其是否奏效要“看人品”。当Cloudera的联合创始人迈克·奥尔森宣称,“在过去的十年里,没有任何一款占主导地位的平台级软件基础架构是在封闭源代码,专有的形式下兴起并发展起来的。”他是绝对正确的,包括像Hadoop,MongoDB,Spark及Cassandra等最佳的数据基础设施。
但占据主导并不一定意味着容易。
根据凯捷的一项调研显示,其受访者中,只有27%的受访者认为他们所在企业的大数据项目是“成功的”;而只有8%的受访者将其大数据项目描述为“非常成功”。即使有概念证明项目陷入困境,成功率也只有38%。
有些问题很难从人们所部署的技术中分离出来,包括“处理分散的筒仓数据,分析计划协调不力,缺乏清晰的商业案例以支撑大数据,以及依赖于传统遗留的系统来处理和分析大数据”。
但所有这些最终都将归结为将大数据的承诺转化为企业充分利用大数据分析技术能力的困难程度。
大数据的设计也是相当重要的。Langseth告诉我说,他在Zoomdata公司所雇用的首批员工之一,是来自纽约的著名爵士乐Blue Note Records唱片公司,且屡获殊荣的专辑封面设计师。(想象一下John Coltrane,Thelonious Monk,Sonny Rollins,等等的专辑封面均出自他们之手)。
是的,一名曾经的专辑封面设计师现在正在设计大数据系统——而在Zoomdata公司的大数据项目设计团队雇佣这种背景的设计师更多的是规则而不是例外。显然,Zoomdata公司有着其不同的大数据方法。当我问Langseth如何以简洁的观点来提炼这种以设计为中心的方法时,他说,这可以归结为三个主要方面:
1、自上而下的授权委任。首先,必须要有来自企业高层的授权委任,以推动建设一款以设计驱动的应用程序的任务。这对于企业技术来说是非常罕见的。
托尼·法戴尔,iPod的“设计之父”之一,就显示出了优秀的设计如何有助于消费类产品的原理,如苹果公司的iPod,及其后来加盟的Nest公司,乃至现在的谷歌。史蒂夫·乔布斯是苹果公司具有前瞻性的标志性的领导。而托尼曾在史蒂夫的领导下工作,并把这种观点带到了Nest公司,以及谷歌。
尽管这在面向消费者的技术领域获得了成功,但几乎没有经企业领导授权成功开发企业软件这方面的例子。这就是为什么大多数企业软件均不乐观的原因所在了。
2、设计人员占员工数量的比例。Langseth还强调,企业需要将以设计为中心的理念纳入到自己的招聘中。也就是说,企业必须让其UX设计师在开发人员中占据一定的比例,以便能够影响企业的以设计为中心的任务。
Zoomdata公司,旨为在让团队中开发人员与设计人员的比例达到5比1。而在大多数的企业软件公司,这一比例则接近50比1。所以这也可以说是大多数软件企业的用户体验是如此糟糕的一个主要的原因——包括大数据,这毕竟是一个开发人员所推动的趋势。
3、定期让普通员工参与测试。Langseth的第三条建议是,整个UX团队必须定期让一般的普通员工参与进来,而不仅进只是让分析专家执行可用性测试。极客们固然非常擅长开发软件,但这真正关系到的是企业的项目运行,所以必须让主流用户能够充分理解并领会。
Langseth指出:
这能够使我们的应用程序更易于为大街上任何一个普通人随意使用,他们可能熟悉诸如Excel等软件,但可能并不是一位商务智能分析专员。从战略的角度来看,这让我们的应用程序能够面临更广泛的受众,而不仅仅只是关注于少数专家。
这是至关重要的。最终,大数据必须要当它能够适用于所有形式时才是真正可用的。数据专家Peter Goldmacher在一点年前就提出这样的观点。他说,在大数据领域,最大赢家是那些构建了易于使用的应用程序的企业。
设计人员也是开发人员
同时,企业需要了解开发人员毕竟比不上最优秀的设计师,Zoomdata希望公司的设计师了解如何编程。Langseth坚持认为,“所有的优秀的艺术家和设计师均要熟悉他们向外界传达艺术的媒介。举例来说,一个好画家肯定会自己调配颜料,并自己建画布。”
这意味着,她/他知道自己向外界传达艺术的媒介的局限性在哪里,以及如何更好的表达艺术。Zoomdata并不希望自己的设计师与开发人员不能很好的沟通,所以他们必须熟悉代码。
为我们其余的人设计
同样重要的是,使用程序语言运行大量的研究测试。Langseth建议,关键的一点在于“一定要避免在其中使用特定行业的专业术语,诸如Hive或Pig的细微差别?”千万不要!大数据项目的最终目标是成为民主化企业的数据资产,这意味着其必须为那些一般性的员工使用,而非核心数据科学家或分析师。
这应该是其最终的落脚点。大数据想要真正获得长足发展,就需要成为不仅仅只是数据科学家的工具。Gartner分析师Svetlana Sicular指出,“要让学习Hadoop比学习公司的业务更容易。”
至少,其应该是这样。但问题在于企业需要的是那些学会了Hadoop的人能够将其翻译成企业一般员工熟悉的业务语言。微软正在试图做到这一点,就像Zoomdata正在试图将非结构化数据从NoSQL数据库、Hadoop等等提取出来一样。
虽然大数据项目的设计并不是实现这一目标的唯一因素,但这其也是相当关键的组成部分,而大多数企业忽视了这一重要组成部分。这也可以说是大数据项目不断失败的一大原因。为了将大数据项目做到更好。专注于大数据的设计,可以提供帮助。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
基于 Python response.text 的科技新闻数据清洗去噪实践 在通过 Python requests 库的 response.text 获取 API 数据后,原始数据 ...
2025-08-21基于 Python response.text 的科技新闻综述 在 Python 网络爬虫与 API 调用场景中,response.text 是 requests 库发起请求后获取 ...
2025-08-21数据治理新浪潮:CDA 数据分析师的战略价值与驱动逻辑 一、数据治理的多维驱动引擎 在数字经济与人工智能深度融合的时代,数据治 ...
2025-08-21Power BI 热力地图制作指南:从数据准备到实战分析 在数据可视化领域,热力地图凭借 “直观呈现数据密度与分布趋势” 的核心优势 ...
2025-08-20PyTorch 矩阵运算加速库:从原理到实践的全面解析 在深度学习领域,矩阵运算堪称 “计算基石”。无论是卷积神经网络(CNN)中的 ...
2025-08-20数据建模:CDA 数据分析师的核心驱动力 在数字经济浪潮中,数据已成为企业决策的核心资产。CDA(Certified Data Analyst)数据分 ...
2025-08-20KS 曲线不光滑:模型评估的隐形陷阱,从原因到破局的全指南 在分类模型(如风控违约预测、电商用户流失预警、医疗疾病诊断)的评 ...
2025-08-20偏态分布:揭开数据背后的非对称真相,赋能精准决策 在数据分析的世界里,“正态分布” 常被视为 “理想模型”—— 数据围绕均值 ...
2025-08-19CDA 数据分析师:数字化时代的价值创造者与决策智囊 在数据洪流席卷全球的今天,“数据驱动” 已从企业战略口号落地为核心 ...
2025-08-19CDA 数据分析师:善用 Power BI 索引列,提升数据处理与分析效率 在 Power BI 数据分析流程中,“数据准备” 是决定后续分析质量 ...
2025-08-18CDA 数据分析师:巧用 SQL 多个聚合函数,解锁数据多维洞察 在企业数据分析场景中,单一维度的统计(如 “总销售额”“用户总数 ...
2025-08-18CDA 数据分析师:驾驭表格结构数据的核心角色与实践应用 在企业日常数据存储与分析场景中,表格结构数据(如 Excel 表格、数据库 ...
2025-08-18PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14CDA 数据分析师与业务数据分析步骤 在当今数据驱动的商业世界中,数据分析已成为企业决策和发展的核心驱动力。CDA 数据分析师作 ...
2025-08-14前台流量与后台流量:数据链路中的双重镜像 在商业数据分析体系中,流量数据是洞察用户行为与系统效能的核心依据。前台流量与 ...
2025-08-13商业数据分析体系构建与 CDA 数据分析师的协同赋能 在企业数字化转型的浪潮中,商业数据分析已从 “可选工具” 升级为 “核 ...
2025-08-13