京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析决定大数据成败
近几年来,我一直在与大数据公司的高管们探讨如何解决他们所遇到的问题。一些有趣的问题仍然持续存在。很明显,我们仍然还处在对于某些问题的初步了解阶段,要充分了解并使用有效的方案来解决这些问题,我们可能仍然还有很长的路要走。
Facebook和谷歌等公司获取了大量的信息。他们普遍遭到侵犯隐私的控诉,尽管我们并不知道这些企业利用他们收集的数据信息可以计算出关于我们的什么信息内容。我们总是假设他们使用这些数据信息是对我们不利的,即使他们很可能尝试的是使用这些信息为我们的谋利益。
没有更好的保护您的数据的方案
历来,围绕着大型数据存储库的许多问题均涉及到如何管理他们。这主要是指确保那些需要访问这些数据的人员的范围权限:从管理报告到遵守一切管理的制度规范,以便让这些人员在需要访问这些数据时可以得到他们所需要的信息。这还意味着必须确保数据存储的安全。这在历史上已然成为了供应商们铁一般坚不可摧的服务准则。
上述这些历来管理数据的方法说明我们一直以来对待这些数据就像海盗的宝藏一样,只是努力寻找创造性的、廉价的方法来埋葬他们。但却没有拿出同样有创意的方案来及时分析、得到他们。
我们可以肯定的是,宝藏是确实存在的,但我们不知道其究竟在何处。甚至有些数据信息已经真的非常老了,其索引和存储往往是如此糟糕,以至于我们有时会认为如果我们当初没有将其存储着首要位置会不会更好些。
新兴的公共云资源承诺低成本的存储与未来高可能性的访问。任意数据信息宝藏资源均被一排排整齐的存储。唯一需要权衡的,当然就是,安全、管理和遵守合规性的问题。
随着数据的不断增长和企业IT预算压缩,上述这些因素的权衡似乎已经不成其为问题了。也就是说,直到犯罪分子找到获得并发布了这些数据,才会造成风险。我们的企业甚至有了风险经理的职位,但这一职位也慢慢随着金融市场的崩溃而日渐变得对于保护企业资产没有什么意义。
数据分析才是决定大数据的成败的王道
现在,我们意识到,最关键的并非大数据本身。相反,是数据和移动设备接入的分析与结果报告。企业高管们越来越多地发现,如果他们能够从他们收集的数据中得到真实的信息,他们可以做出更好的决策,避免痛苦的重复错误,并提升他们在企业乃至整个行业中的地位。
事实证明,知识就是力量。因此,今天的成功人士已然开始把重点放在更多地了解他们的客户、合作伙伴、员工和企业环境,而不再是他们的竞争对手。
新时代的企业执行人员使用工具进行更强大的数据同步。这保证了被分析的数据的准确度和及时性。他们提供移动客户端,可以在智能手机和平板电脑上显示结果。他们利用云服务,可以同时解决企业的成本和安全性的要求。
Hadoop已经成为最大的数据分析平台,供应商之间正在使用Hadoop,进行提供最好的工具的竞争。然而,随着供应商开始花更多的时间开发附属品,而不是优化整个解决方案;或选择合作伙伴时无意造成了瓶颈,这些优化可能功亏一篑。
明智地选择你企业的数据分析解决方案
最后,当我听到奥巴马总统连任的CIO分析得出结论,大数据本身的部分并不重要。为您的管理人员提供他们所需要的答案才是最重要的。
这可能听起来很简单,但它确实需要供应商必须满足下列条件:
· 具有您企业和行业方面的大量经验。
· 愿意承担整个解决方案。
· 在达到您企业的期望方面有良好的记录。
· 具有公共和私有云资源的经验。
· 有能力处理传统的数据存储和实时数据流。
总之,这不是一个自己动手做的问题。您需要有经验、有信誉、有可靠性和值得信赖的供应商。只有少数供应商能满足上述这些标准。您需要进行明智的选择。
本文作者罗布·恩德勒是恩德勒集团的总裁兼首席分析师。之前他曾担任Forrester Research和Giga信息集团的高级研究员。在此之前,他曾供职于IBM担任过内部审计、市场竞争分析、市场营销,财务和安全管理等相关职务。目前,恩德勒为各种出版物撰写关于新兴技术、安全和Linux相关专栏文章,并受邀参与美国全国性的新闻电视节目录制:包括CNBC、FOX、彭博社和全国公共广播电台。(转)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11