
信息化程度很低的旅游行业如何玩转大数据?
一段时间之前,多如牛毛的游记,大部分时候只是满足了分享者快感的文字,而没有变成数据。后来沉淀了大量游记的平台如穷游、蚂蜂窝都开始想办法把游记“结构化”,变成能够更广泛应用的数据。
在旅游行业,可能最核心的数据就是POI(兴趣点),具有极强规则的、完整的、标签极度碎片化的POI信息是这个行业里非常值钱的东西,也成为了诸如TripAdvisor(猫途鹰)的核心竞争力。猫途鹰的POI信息几乎是不可能对外大规模释放的,第三方无论是购买、还是数据交换,都很难拿到完整的TripAdvisor的POI数据。TripAdvisor开放的API接口,只能够为第三方提供所有POI的评论信息。
境内在线旅游行业,持有境外 POI 信息主要有三拨(如有遗漏欢迎补充,大众点评之类暂不考虑):
擅长以抓取方式收集并整理信息的一些创业公司,如口碑旅行、梦想旅行,妙计旅行;
基于UGC内容整理的POI信息:主要就是穷游;
自采POI信息的创业公司:游谱旅行、四万公里。
之前我们和穷游负责大数据的VP张棋就这件事聊了聊,张棋坦言这是一个庞大的工程,迄今为止穷游覆盖了300多个国家和地区,7000多个城市和区域,包括了景点、美食等POI的数量已经达到了百万量级。而随着目的地信息的变化,这些POI必须持续更新,除了基础信息之外,评论也在随之更新。
张棋介绍,最初做POI的方式是通过 “网友贡献+编辑审核”的方式,以比较粗的维度划分国家、地区、城市,然后尽量保证各个维度下面都有相应的POI信息做到 “该有的地方都有”。而第二期的做法是“掘金”,一直持续到现在,通过“运营编辑+ 算法支持”的方式:编辑给大致的框架,例如什么算是优秀内容,以人工做范例(在长游记中找到几张图和一段话),然后技术团队通过数据建模和算法,用文本挖掘的手段覆盖所有内容,把结果填充到POI和目的地的架构中。
在整个穷游收集POI的过程中,除了根据论坛的内容做筛选和挖掘以及用户主动提交之外,也有一些外部数据源做实时不断的更新,例如大巴车的时刻表。这一点上,妙计也用的相应的方式,从而保证动态的行程规划是可行的——如果行程助手让你去搭乘巴士,而巴士停运了会怎么样?
在这里张棋分享了一些穷游的做法,工作节奏上他们会每一段时间重点攻克一个主题,先是酒店,然后是餐厅。在文本挖掘上,穷游除了抓取文字之外还会抓取相应的图片,张棋坦言这里没有通用且完美的解决方案,只能不断的通过运营编辑反馈机器的抓取结果,不断提高覆盖度,争取少漏掉一些重点信息。
通过不断的外部数据源更新、用户提交和内部挖掘,穷游的POI信息维度已经超过了100个,主要可以分为两类,一类是属性维度,以清迈女子监狱按摩店为例,包括了中文名、当地原名称、英文名、地址、经纬度坐标、平均价位等;另一类是标签属性,也可以理解为“属于哪一类”,休闲、刺激、适合什么人群、亲子或单身等等。
在保证POI覆盖度之后,POI的另外一个要点是标签体系:一个POI都需要标签?标签需要多细化的颗粒度?这都是需要考虑的问题。一套成熟的标签体系能够极大的提高用户筛选的效率,自然也会提高转化率。
以酒店为例,穷游的运营编辑会提供诸如“交通”、“设施”、“餐饮”、“服务”、“干净卫生”、“汉语”等维度,然后机器根据这些语义做抽象出相关内容,做主题挖掘。当用户评论或游记中有描述命中了这个主题,机器就会放进“池子”做第一轮的筛选。在这个“初选”的池子中,机器会为每个话术赋值,然后根据权重得出最终结果。当然,餐厅就会有不同的维度,景点也有不同。
POI的价值毋庸置疑,如上面所说,妙计和穷游都在多个维度丰富自己的POI信息,尤其是动态更新的信息,以保证智能生成的行程规划是切实可行的。张棋说,行程助手就是POI信息的串联,一天可能就涉及50-70个POI。如果不能够保证丰富度和准确度,整个行程助手是缺乏价值的。
而进一步挖掘,在商业化的路上POI是重要的连接机制(我们之前在讨论游谱旅行的时候也说过)。与游谱旅行的创始人李小坚相似,张棋也认为,内容向商品的转化需要POI作为载体——当用户浏览景点信息的时候,如果有对应商品,直接就可以完成预定。“这也是穷游预定转化上很重要也很成功的尝试。”张棋说。
此外,在目的地的智能推荐上,如果没有准确实时的POI信息,推荐就可能是“不靠谱的”,例如清迈有“周六夜市”和“周日夜市”,仅在当天开放,而如果推荐周一前往,就太不智能了。
在POI的基础之上,很多玩家都在尝试智能推荐,这也是旅游进入移动端时代的一大想象空间——基于用户所在的地理位置和用户画像,随时做智能推荐,从而大幅提高转化率。之前有一些创业公司讲过相似的故事,但迄今还没有人实现。
没实现的原因也不难理解,没有很大的用户基数,用户画像的准确度就会打折扣,自然也会影响推荐的准确性;另一端,如果没有优质的POI数据库,推荐的都是老套路,用户也不会喜欢。大平台如阿里旅行,可以基于用户在阿里其他平台(淘宝、天猫)的购买行为做智能推荐,也还没有到达行中、实时的级别。
事实上,在一些数据交易平台或数据抓取公司那里,用户画像是可以获得的,但我个人了解到,用户画像的准确程度,以及关于这个用户的信息维度,其实并不完全适合旅游行业——大部分关于用户的画像集中在其日常购买、金融理财等层面,通过这些层面的数据推导至旅游行业,准确性自然会降低。
作为拥有数千万出境游注册用户的穷游,从2011年开始积累用户的访问和点击行为,打算为日后的智能推荐和精准营销做准备。张棋介绍,穷游会格外关注“平时生活在哪里、关注的旅行信息是什么、潜在目的地是什么、处于旅行周期的什么阶段”等信息。之后穷游把用户分为:行前观望、行前准备(多次看多次买,可能推翻之前的选择)、即将出发(开始购买轻量级的商品例如WIFI 或目的地商品如CityWalk)、行中、回来等阶段,匹配相应的产品。张棋说,穷游目前格外关注出发前一两天的用户,通过其酒店预订行为,重点推送相应的轻量级商品。
张棋坦言,精准的智能推荐可能会让转化率呈10倍的改善,而最大的挑战在于,必须将用户画像和POI信息都实现高颗粒度,才能做准确的匹配——这里的前提是有这些数据。
我们了解到,包括阿里旅行在内的在线旅游玩家都在寻求高品质的POI和用户画像数据。这可能不是一家企业的核心竞争力(在数据上的应用层面才是),但应该能构筑起一些壁垒。当各家都在构建自己的POI数据库的时候,重复劳动是不可避免的,这里也许有合作共赢的空间。
更值得关注的是,谁能依托自己的实力(这可能是用户基数、可能是分销实力、可能是对旅游行业的理解,行业里可能还没有定论)为POI数据制定发布规则,反而可能去争夺制高点。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-06-052025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27