
大数据应用 呼唤开放平台
在移动互联网时代,大数据的开发和利用已成为热点。
小米可以利用用户对安卓系统的优化需求数据,制定完善miu系统,并开发小米手机;京东利用广泛的网民手机购买记录,交给厂商订制jdphone手机;科学家能依据实验产生的大量数据,通过特定模型,寻找出某一事物的普遍规律,从而在药物设计、基因组研究等领域大有作为……
在日前相继召开的“科学数据大会”“全球移动互联网”大会上,大数据应用问题成为众多院士、专家、企业人士热议的焦点。探究大数据的应用前景,已成当务之急。
大数据无处不在
在互联网时代,普通大众早已习惯生活在大数据之中。无论是每天上网搜索新闻,还是利用互联网玩游戏,或登陆购物网站购买物品,每位网民每时每刻都在为互联网增加新的数据。
这些数据已成为科技企业瞄准的焦点。金山集团CEO张宏江向记者表示,当前互联网领域所有的企业都在利用用户的这些数据作一些非常关键的商务决定。
“金山的游戏、安全软件,都在充分利用大数据带来的便捷。例如,金山在市场上做得很成功的‘清理大师’,其月活跃用户已超过1.5亿。这款产品能够成功,离不开对所有应用特性的分析,而这本身就是大数据应用一个非常好的例子。”张宏江说。
在科研方面,对于大数据的分析也成为热点。“在基因组研究领域,对于大数据的分析有助于我们进行疾病的诊断与治疗、全新的药物设计与研发、动植物新品种的培育等。”中科院院士陈润生表示。
应用尚须实现“三步走”
与此同时,庞大的数据常让企业和科研单位束手无策,不知道如何挖掘其价值。
中国人民大学信息学院教授孟小峰认为,大数据代表着未来IT产业发展的重大方向。“现在的数据源是自动产生的,无处不在的感知系统源源不断地产生各种数据类型,其不但分布广泛,而且存在动态演化的趋势。”在这样的情况下,对大数据的分析和处理成为难点。
“现在的情况是大数据看上去前景很好,但是杂乱无序。”达沃时代科技有限公司法人张松坦言。
张宏江则认为,挖掘大数据的应用价值,发挥大数据的社会效用,关键在于能否完成三步进化,“即从数据到信息、从信息到智能、从智能到价值的转变”。
建立开放平台实现数据共享
一份IDC(互联网数据中心)的数字宇宙报告曾指出,当前大量有效数据正在丢失,大数据的前途取决于从大量未开发的数据中提取价值。然而,大多数新的数据是基于文档未被标记的非结构化数据,人们对其知之甚少。
IDC中国区总经理霍锦洁也表示,根据他们的一份研究报告,只有三分之一的数据是有价值的。这意味着有太多的数据仍须开发利用。
张宏江则认为,如果希望看到未来大数据的技术在更多行业得以应用,“很重要的一点就是有开放的平台,让更多的数据分享出来”。
他进一步指出,基本上所有互联网的服务商都是数据的重要来源,它们本身可能提供一些数据服务,为自己的产品服务,但这些数据对于其他公司可能也有价值。因此,未来可以在把好隐私、安全关卡的条件下,将数据本身作为资源分享给其他用户,让其创造价值。
“未来如果将大数据作为一种产业来看的话,一定需要一个开放平台,让大家可以共享。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14