京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据将成在线旅游价格战的挡箭牌
在线旅游行业下一阶段的增长点将从此前的标准品走向以自由行为代表的非标品,市场鏖战的手段亦将从价格战转向大数据能力的比拼。
在线旅游市场的价格战如火如荼。
最近,部分在线旅游平台的“1元营销”被叫停;与此同时,价格战亦导致多家企业出现亏损。
“标准旅游品的竞争最终肯定是走向价格战。”对此现象,北京蚂蜂窝网络科技有限公司CEO陈罡近日在接受21世纪经济报道记者采访时表示,在线旅游市场空间巨大,热钱涌入使得市场竞争空前激烈,用户获取成本不断上升。
陈罡认为,在线旅游行业下一阶段的增长点将从此前的标准品走向以自由行为代表的非标品,市场鏖战的手段亦将从价格战转向大数据能力的比拼。
蚂蜂窝旅行网由陈罡和吕刚创立于2006年,2010年正式开始公司化运营。今年3月,其宣布完成C轮融资,投资方包括高瓴资本、Coatue、CoBuilder、启明创投等。
基于UGC内容的数据化
《21世纪》:你们在刚刚完成C轮融资的同时,也提出进行战略升级,全面进军“自由行”。这是基于什么判断?
陈罡:蚂蜂窝从旅游社区起步,凭借口碑获得了可观的用户数量。截至2015年2月,蚂蜂窝已积累8000多万用户。这是基于我们过去积累的旅游大数据的商业闭环打造。
从蚂蜂窝的发展来看,到目前主要经历了三个阶段。第一个阶段是在2012年以前,蚂蜂窝是一个社区的形态为主,我们两个创始人(另一个为蚂蜂窝COO吕刚)本身就是旅行爱好者,然后就有了蚂蜂窝最原始的社区的种子,这个DNA随着时间的沉淀,逐步形成了中国最活跃、质量最高的一个旅游社区。
从2012年到2014年,我们最主要的工作就是把基于用户UGC的内容进行数据化。大家都知道,社区的本质就是UGC,就是来自于用户最真实最原始的这种分享。过去两三年我们就是把这种UGC进行大量的技术转化,把它变成数据,因为UGC是杂乱无章的,每个人的背景、喜好,包括他的心情,可能都千差万别。
当然,这个过程中,蚂蜂窝平台上的用户实现了快速增长。2010年,我们的用户大概15万,然后到2011年的时候就突破百万了,2014年破5000万,发展非常快,我们今天就已经有超过8000万用户。
现在进入第三个阶段,就是通过过去积累的旅游大数据来帮助用户完成消费决策。我们在今年3月刚刚上线了一个新APP——蚂蜂窝自由行。
蚂蜂窝将利用C轮新获得的资金,以“自由行”为方向进行商业战略升级,发力酒店、当地游等下游业务以及O2O移动商业闭环打造。
目前,围绕“自由行”,蚂蜂窝向用户提供全球6万多个旅游目的地的旅游攻略、旅游问答、旅游点评等信息,以及经过“旅游大数据”优化处理后推荐的全球交通、酒店、当地游等自由行产品及服务。
第三个阶段就是从2015年开始,说得通俗点就是,用户做完消费决策之后还是要买东西,我们开始为用户提供交易。
《21世纪》:互联网企业归根结底都是以数据为基础的,从在线旅游这个行业来看,在“众说大数据”的当下,蚂蜂窝的数据有什么特点?
陈罡:蚂蜂窝的大数据有两个很核心的竞争力,第一个我们有原始数据,有海量的UGC来源,因为我们有社区;第二个呢,我们有自己特有的大数据技术,我们有语义分析的技术和数据挖掘的技术,把用户的大量UGC信息变成结构化的数据,然后帮助用户做消费决策。
在线旅游:
从B2C到C2B
《21世纪》:我们知道目前在线旅游行业的一大关键词是价格战。与其他在线旅游平台相比,蚂蜂窝基于UGC和旅游大数据,能提供什么差异化的服务?
陈罡:在蚂蜂窝自由行上线之前,我们很大精力放在旅游攻略上。旅游攻略的本质就是大量用户的真实信息,并且蚂蜂窝把这些信息进行很好数据化的处理。所以说能让用户去到每一个目的地也好,一个酒店也好,一个餐厅也好,都能迅速看到来自于曾经去过这个地方旅行者真实的评价,还有所拍的真实照片。这些东西我们就可以透过大数据的方法,挖掘分析提取出来。
这些基于不同游记和用户真实评论合并同类项后的信息,与景点或酒店的官方网站所提供的信息是不一样的。官网或传统的在线旅游网站,他们所提供的信息可能会把房型、价格写得很清楚,虽然也可能有用户的评价,但他们的核心诉求是卖房。
举个例子,我们来看这个酒店(蚂蜂窝网站上随机点入一个酒店),9个用户评价中有4个提到了“通塞湾”这个词,那么相对于这个酒店来说就是一个非常重要的关键词。大家关注的是从“通塞湾”到这个酒店的交通方式。但酒店的官方不见得会提供这样的信息。后者可能会提供的信息包括:房间设施、付款方式、房型、早餐等等。
那么,这样一来就体现出了蚂蜂窝的价值。我们的价值在于,通过大数据,尤其是通过用户的评价,帮用户完成消费决策。这就是用户在蚂蜂窝上订酒店,与在其他在线旅游平台订酒店不一样的原因。
其他在线旅游平台上,他提供的酒店排名一定是根据空房率和利润率,优先推荐给用户空房率最高、利润率最高的酒店。而且基本上以价格为导向。蚂蜂窝上展示的酒店是跟区域相关,就是通过大数据给出基于某个旅行目的地的相关区域内的酒店。
《21世纪》:对于在线旅游业的上游或者说供应商来说,这种差异化怎么体现?
陈罡:蚂蜂窝可以通过我们的数据分析告诉供应商,用户需要什么样的东西。还以酒店为例,酒店可以通过蚂蜂窝平台上面的预订进行大量的预测和预知,判断接下来用户会去到什么样目的地,包括他以前的行为习惯。
在线旅游行业一个非常重要的问题就是营销成本太高,单个用户的获取成本非常高。蚂蜂窝本身有很多的用户和流量,这对UGC来说是天然的,我们不用去花成本买回来,然后通过我们大数据的分析,我们能把这些用户的需求和供应商的商品服务信息进行对接匹配。
《21世纪》:就是C2B?
陈罡:对,这个就是C2B。任何一个旅游产品都是有库存的,如果一个平台能把你的库存提前消耗掉,其实你对价格会有更好的主动权。蚂蜂窝的平台可以看到海量用户的行为,而且可以提前半年就知道,因为很多用户会提前半年做旅行规划。而传统旅行社的销售周期比较短,因为他不知道用户在什么地方。
一个供应商如果能把我一部分的库存提前消化掉,库存压力就释放掉了,那么它定价的时候就会更有策略,比如有效避免那种尾货、尾单的甩仓情况。还可以基于对路线或商品的预售情况,进行补仓。这对供应商有极高的价值。
这就是一种预售+反向定制的C2B模式(从顾客到商家),本质上说,它区别于以往携程或去哪儿等传统OTA服务商的B2C模式。蚂蜂窝要通过自己后端产品的力量帮助合作伙伴节省营销成本,找到更精准的用户和流量,提升销售额。
对用户来说,他们就有可能以淡季的价格购买到旺季的产品。
当然,所有这些,其核心归结起来就是两个字:数据。
技术是一种DNA
《21世纪》:那么为了在“数据”这个核心上获取竞争力,蚂蜂窝做了哪些工作?
陈罡:蚂蜂窝现在有270多个人,其中超过50%是研发类的。目前蚂蜂窝已经完成了数据的积累,我们有超过全球380万POI的数据,覆盖全球6万多个目的地、72万家酒店。我们投入了大量的语义分析和数据挖掘力量。举一个例子,香格里拉这个词,没有语义分析,你无法知道它是指一个酒店还是目的地。
我本人就是做技术出身,做了很长时间,整体团队也有这方面的经验。其实“大数据”这个词谁都可以说,但这个行业里很多人是伪数据,真的拥有大数据能力的平台是非常少的。有些公司可能有很多用户,有很活跃用户交易记录,但没有办法去完成数据的一致性,把这些东西变成结构化的数据,也就更没有办法应用这些数据。这里面既有数据源的问题,也有数据加工处理的问题。
《21世纪》:从长期来看,技术会成为门槛吗?
陈罡:技术其实是这个行业里面最核心的门槛之一,因为技术决定你的能力,是否能有快速迭代的能力。
技术某种程度上也是一种DNA。现在我们熟知的几个大平台其实是卖方时代的代表,他们的共性就是所售卖的商品都是简单化商品、同质化商品,最后的结果就是价格战。
目前在线旅游行业正从卖方市场向买方市场发展,随之而来的就是市场的细分化、专业化和个性化。用户需求已经个性化了,这就需要更精准的营销和对接,而有些平台可能工具还不匹配。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20