
大数据在传统行业引爆后如何落地
大数据正悄然在我们身边发挥着作用。
1. 传统行业中的大数据应用
1)啤酒与尿布
美国沃尔玛超市里,啤酒与尿布总被摆放在同一个区域,方便“奶爸”购物;类似的情况还有出现在同一货架的方便面和火腿肠、口香糖和避孕套。这些贴心安排无不得益于超市供货人员对客户习惯的深刻解读,也得益于大数据在大型商超、购物中心中的使用。在传统购物中心向商业综合体转变的过程中,利用大数据对用户喜好和用户行为进行分析成为至关重要的一环。通常购物中心需要外部第三方数据来分析时下受欢迎的品牌、某地区人民的饮食口味、消费水平;同时内部数据,如相应时段的人流量、POS机的消费数据、cctv监控数据、购物产品清单数据等也显得至关重要。
2)余额宝
余额宝自2013年6月上线后,仅用了半年的时间就使背后的天弘基金规模增长40倍。截止2014年3月,余额宝的用户数量已经达到8100万,超过整个中国股市中的活跃帐户数。货币基金资产主要投资于短期货币工具,大规模的基金投资追求高收益,也要规避风险。通过大数据的支持,余额宝能够预测到流动性的趋势,适时做好流动性需求支持,合理规避风险。基金公司能通过支付宝提供的余额宝资金流动情况,通过模型预估流动趋势,安排投资。而传统行业没有大数据支持,自然就失去了这样的能力。
2. 大数据在传统行业落地难
1)相关人员稀缺。既懂业务又懂数据的人,在互联网行业中不难找到。而传统行业中,数据和业务的结合通常非常松散。具备大数据专业知识的专家,显然这个角色在传统行业以往的运作过程中是缺失的。传统行业的技术人员通常觉得大数据很潮很热,但回答不了以下问题:能拿到什么数据? 这些数据有什么用? 怎样用这些数据?
2)技术积累不足。在互联网行业中应用非常广泛的技术,传统行业的技术人员却接触很少。在大数据的实际实施中,像hadoop、消息队列、storm等这些大数据处理技术,传统行业还只是停留在初步了解阶段,能真正应用的比较少。
3)成本资金消耗。一些传统企业在准备独立做大数据应用的时候,发现实施的成本非常巨大,整个的IT方面预算的开支增加了1个甚至2个数量级,而这些投入是否能达到预期效果还不敢肯定。
3. UCloud云平台的针对性解决方案
对于人员稀缺的问题,除了积极的引入相关人才和内部技术人员的培养,传统企业也可以寻求外部合作。目前已经有很多企业在这些专业的领域内提供成熟的解决方案。UCloud,作为国内最为专业的基础云计算服务商,也针对性地开发了大数据产品UDDP (UCloud Distributed Data Processor) 能够帮助用户轻松、快速地处理TB甚至PB级的海量数据。目前,UDDP正被应用于数字营销、数据分析、商业智能、科学模拟等领域。
对于技术积累不足的问题,UCloud所提供的大数据产品服务可以有效帮助企业用户降低技术门槛,规避掉复杂的技术细节。同时,UCloud的专业技术负责人也会为客户有针对性的提供培训课程,并不时在实际实施中进行技术指导,帮助用户快速消除技术短板。
资金成本问题就更为简单,使用云计算服务是降低综合成本非常有效的方式。传统企业通过使用云服务,复用资源,可以大规模降低大数据应用的成本。例如,使用UCloud的大数据产品,按每天计算数据在10TB来估算,每个月的成本大概也就在数千元。
4. UCloud大数据产品系统设计
在UCloud大数据产品的整体系统框架中,最下层是数据采集的接口,通过摄像头、传感器、各种日志、数据库等采集数据,存储在HDFS上。在存储之上,我们支持两种分布式计算框架,SPARK和MapReduce,针对不同习惯用户使用。同时也会提供列式存储HBase。
在数据之上,会有很多的工具支持,如基于Spark的Spark SQL、Spark Streaming、Spark Mlib等,以及基于MapReduce的Hive、Pig等。计算后的数据可以继续存回HDFS,也可以输出到DB或其它地方用作其它用途,在此之上建立各种业务模型使用。
在集群内,我们会对数据分析任务进行调度,充分利用集群资源。同时对集群进行监控,对任务失败进行及时恢复,及时发现问题,并提供信息给集群日常维护。
UCloud大数据产品系统设计
5. 大数据在传统行业中应用的未来
1)智能视频监控
如今,智能视频监控已经应用到很多地方。比如奥林匹克公园内设的智能计数和密度分析系统,可以全天候的对入口区域、人流通道等重要区域的人流状况进行实时密度分析统计。
智能视频监控,核心就是将采集来的视频数据,按帧提取出来,应用到特征模型中进行匹配。然后将这些特征全部存储下来,添加标识、索引,在需要的时候再进行检索、或进行更深层次的分析。在这个过程中,我们需要视频原始数据能很快能够转换成特征模型,同时也需要海量存储去保存这部分视频数据。技术的核心在于特征模型的选取、转换的算法、海量数据的实时和离线分析能力。
特征模型的选取,可以通过和一线工作人员沟通把模型建立起来,也可以寻求一些模型库。很多开发者社区里则有转换算法的分享。UCloud对一些开发者社区提供资金、资源的支持,目的就是帮助开发社区沉淀经验,以便为更多人提供帮助。而海量数据的实时和离线分析能力可以在内部搭建,也可以考虑使用专业的大数据服务,比如UCloud的UDDP。这样智能视频监控应用将会很容易落地。
2)医疗健康系统
未来的医疗健康系统或可借鉴身份证采集的模式,拍摄照片上传到指定网站,然后办理个人医疗证件。无论到大型医院就医,还是到社区医院体检,相关检查数据都可以被传输到医疗系统。后续就医时,医生可以根据前期的体检数据直接开药,或者以这些数据为基础为病人诊断。这样即可大大提高医生的工作效率,有助解决就医难的问题。另外,这些检查数据汇聚在一起后,可以供卫生防疫部门来做分析,提供更为完善的公共健康服务。也可以由个人委托商业机构追踪个人生理情况,做事先预防、调养。
当然,医疗健康行业有一定特殊性,需要体制改革支持。需要在信息化上解决现有医院个人医疗信息的孤岛,再引申出来和大数据结合的个人、公众医疗健康服务。
时代变革,从一开始就不可逆。互联网诞生时,有人说过这样一句话“在网络上,没人知道你是一条狗”。然而在大数据时代,我们不但知道你是一条狗,而且知道你是一直羞涩、前腿短的柯基,不爱吃狗粮爱吃肉,最喜欢粉色的小外套……■
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-07-31大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-07-31CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-07-31SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-07-30SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-07-30人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-07-30MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-29左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-29CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-29CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-29解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-29解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-29鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-29用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-29从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-29CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-29解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-29用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-29从数据到决策:CDA 数据分析师如何重塑职场竞争力与行业价值 在数字经济席卷全球的今天,数据已从 “辅助工具” 升级为 “核心资 ...
2025-07-292025 年 CDA 数据分析师考纲焕新,引领行业人才新标准 在数字化浪潮奔涌向前的当下,数据已成为驱动各行业发展的核心要素。作为 ...
2025-07-29