
大数据来了 机会将被“数据鸿沟”所延宕
当前,苹果、Google、微软都在设法强化自身的生态系统,比如,微软最近几个月,已陆续宣布了Windows 8、Windows Phone 8等一系列新终端平台。
三年前,我首次提出了“三大平台之争”,这是一场注定要旷日持久的争夺战。如今,这场争夺战已进入新的阶段。
触摸技术及人机交互,让数以百亿计的新机器与传统的IT设备和网络连接到一起,大数据与云的结合,正为科技和商业生态带来巨大影响。云服务和彼 此连接的人群与海量设备,将发展出反映真实世界中人与人、人与机器、机器与机器关系的社会化网络,并诞生出消弭真实与虚拟界限、更加人性化、交互更自然的 商务和社交平台。
三大平台里,云是前提,是基础。
三年前,云计算对许多人来说还是新鲜和深奥的概念;而今,云已是触手可及。个人用户将文档、照片、视频、游戏存档记录上传至云中永久保存,企业客户根据自身需求,可以搭建自己的私有云,或托管、或租用公有云上的IT资源与服务,这些都已不是新鲜事。
我们看到,将现实社会关系数字化、网络化、商业化的尝试早已开始,但迄今为止,现实世界数字化的程度还不够,真正超越国别、种族和文化壁垒的社会化网络的平台仍未建成,这是中国IT产业的一个重大机遇。
无论是云计算本身、或是智能终端,还是凌驾于云和端之上的,基于社会化网络的平台和应用,都会让数以百亿计的机器、企业、个人随时随地都在获取 和产生新的数据,计算设备硬件性能进化的速度早已赶不上数据增长的速度,并且这一问题会日渐严峻——这样的背景下,只有云才能解决“赋予数据以更大价值” 的问题。这也就引出了最近产业和社会都非常关注的“大数据”话题。
和云计算一样,业界对达到怎样的数量级才算大数据并无定论,在很多行业的应用场景里,数据集本身的大小并不是最重要的,是否完整才最重要。
IT业界所指的数据,诞生不过60多年。而一直到PC普及到千家万户之前,由于存储、计算和分析工具的技术和成本限制,许多自然界和人类社会值得记录的信号,并未形成数据。
进入Web 2.0时代,智能设备用户不单单可以通过网络获取信息,还成为了信息的制造者和传播者。这个阶段,不仅是数据量开始了爆炸式增长,数据种类也开始变得繁多。
如今,通过各种有线和无线电网络,人和人、人和各种机器、机器和机器之间的连接无处不在。用户想驾车去吃饭,先用地图应用查询餐厅的位置、预计 行车路线的拥堵情况、停车场信息甚至是其他用户对餐厅的评论。吃饭的过程中,他会用手机拍摄食物的照片,编辑简短的评论,发布到微博上,还可以用LBS应 用查找在同一间餐厅吃饭的人,看有没有好友在附近……
通俗地说,就是将信号转化为数据,将数据分析为信息,将信息提炼为知识,以知识促成决策和行动。归根到底,大数据的最终意义在于获得洞察力和价值。
大数据意味着激动人心的业务与服务创新机会。零售连锁企业、电商业巨头都已在大数据挖掘与营销创新方面有着很多的成功案例,它们都是商业嗅觉极其敏锐、敢于投资未来的公司,也会因此获得丰厚的回报。
最近几年,我们还看到一些明星初创公司,比如Cloudera, Splunk, Klout, TellApart等,人员规模只在数十人,但对某个行业拥有深厚知识,并通过整合云和大数据的技术,快速解决共性需求和痛点。在未来数年,这样的“小而 精”、“快而准”企业会越来越多,并做出有可能改变世界的颠覆性产品。任何一家有雄心、渴望获取洞察力的企业,都应及早制定大数据战略和方案。否则,所有 的机会将被“数据鸿沟”所延宕。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26