京公网安备 11010802034615号
经营许可证编号:京B2-20210330
O2O需要的不是Hadoop 而是大数据
如题,但希望网友不要误解,这里的需要是指大数据技术在目前的发展进程中,是不会阻碍到O2O的应用,而对于O2O来说,最难的莫过于数据的来源。这想必也是众多掘金电商、O2O的厂商们的苦恼,更是未来抢占O2O市场先机的一个分水岭。
其实电商领域的O2O并不是一个新鲜的词汇,早在团购网站兴起时就已经开始出现。百度百科对于O2O的定义为Online To Offline(在线离线/线上到线下),是指将线下的商务机会与互联网结合,让互联网成为线下交易的前台,这个概念最早来源于美国。在最近公布的《流通蓝皮书:中国商业发展报告(2013~2014)》中指出,中国电子商务进入O2O时代。
以前,电子商务与实体经济的融合主要体现在产品融合方面,即在电子商务平台上交易的产品来源于实体,但在运营上二者相互独立。但是走进O2O时代,对于电子商务的运营似乎就有一些差别,实体与网络又多了一份联系,需要线上线下的高度结合。
新的方式,自然更需要新的模式。线上管理线下,无疑加大了存储量,不仅包括线上存储,实体店的每天客单价、进店人流量,来源渠道等等都需要记录存储。加以运用数据分析,用数据说话。
在O2O模式中,通过线上的“O” 积累口碑、提高品牌曝光并吸引精准客户群体的关注,最终为线下实体店导入客流;线下的“O”提供完善的售前售中和售后服务,大数据成为串联这两个“O”,实现O2O营销闭环的关键。
立足中国本土,不难发现,2013年O2O进入高速发展阶段,众多商家都齐齐涌入。微信推出“扫购”功能,用户可以线下扫码、线上购买。苏宁推出“附近苏宁”功能,用户可在线上查找门店,关注促销信息,线下体验和购买。而天猫则将广告和促销环节向线下渗透,线下宣传“双十一”活动、线上下单。
百分点科技公司一景
在记者最近采访的国内大数据服务商百分点科技公司,也看了O2O未来的发展潜力,毕竟在中国线下的零售占据总体的90%,而线上购买还不到10%。为此,百分点成立O2O子公司“信柏科技”,定位于O2O大数据,协助传统零售业的线下数据挖掘和分析。作为一家大数据初创公司,百分点一直专注于互联网企业的消费者偏好数据,并推出了大数据引擎。在电商、教育、旅游、媒体、金融、证券、制造业等多个领域都有涉及。
达到千家的合作伙伴,也就意味着千个商家的数据量,这也是促进百分点在大数据技术层面上的不断发展。百分点运营副总裁韩志勇告诉记者其后台的数据处理技术也是经历了四个阶段的,它所构建的大数据处理平台包含了数据存储和数据处理两个层次。
底层的基础架构自然少不了hadoop,但它也只是其中的一个组件,这包括分布式文件系统(HadoopHDFS)、分布式SQL数据库(MySQL)、分布式NoSQL数据库(Redis、MongoDB、HBase)、分布式消息队列(ApacheKafka)、分布式搜索引擎(ApacheSolr)以及必不可少的ApacheZookeeper。
其中,流式实时计算帮助客户获得肉眼无感知的性能。如此架构的数据处理,相信可以适用不论是B2B、B2C还是O2O等等各种电商模式,所以O2O所需求的大数据处理技术并非需要重新架构,它所面对的技术性挑战也并非是其发展的最大阻滞。
百分点科技公司董事长苏萌表示,O2O面临的最大挑战应该是数据的收集,因为目前线下搜集的数据可用性并不高。而百分点所做的是对中国消费者用户的习惯的研究,包括用户的购买时间、购买习惯和可接受的价格,基于这样的先天优势,可在一定程度上帮助到线下零售。
但这还是远远不够的,线下零售还需要寻求一种方式,这在中国可能还是起步阶段。而在美国,很早就已经注意到对于实体销售的数据收集工作。当你去逛沃尔玛,它所给你配备的购物车就会跟踪你的行为轨迹并记录,沿着人们行走的轨迹,不仅可以知道用户的购物习惯,也在一定程度上方面超市的货架、物品摆放的布局。当然现在随着WIFI的普及似乎也可以轻松做到,当你超市内部网络时,你消费者行为轨迹也就这样轻松获取了。
在中国O2O前景的规划设想中,苏萌举例,未来的购物中心,单单凭借线下销售已经不能满足消费者,但是人们的需求又不能只是在网上满足,这就需要一个结合点。基于以前所收集的数据模型、算法,以及移动端的引导,吸引了前来购物中心的人流,再运用数据分析将他们精准的分流和引导。
据悉阿里巴巴在今年所投入的O2O的领域中,也是相同的想法。这是信柏科技对于O2O市场的构想蓝图,但具体的实施策略,苏萌并未透漏。以一见百,看中O2O大数据市场的当然不止百分点,这也是更多觊觎这块大蛋糕的厂商们在寻求的突破口。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27