
来点逆反思维:什么不是大数据
如果大数据是一种潮流,那这个3年前火起来的概念应该早过时了。但大数据不仅是一种潮流。事实证明,各种细分行业的人们,仍热衷于谈论它,而且在长期的将来,还得持续挖掘。
谈论大数据可以引申出一切,谈论一切最终又会归于大数据。像马云说的,我们所处的时代,已经由IT转向了DT(Data Technology)时代。大数据是网络世界的土壤和空气,转而进入我们的血液和思维。
于深圳软件产业基地创新谷举办的环球旅讯第四期开放日TDAY,主题即“旅游业玩转大数据+”,来看活动上讨论了些什么。
大国企:用大数据打破集团下的业务艰墙
夏轶介绍,锦江电商要做大数据,除了有跟上对近年来风潮的原因,更本质的原因,还在于作为大国企的锦江电商,各种业务及其用户之间存在长期的隔离,正如他PPT里展示的那样,本该打通的,却被坚实的无形之墙给阻得死死的。以及集团下各品牌互为孤岛,没有形成理论上应该存在的多品牌互助优势。于是他们需要借由开发大数据功能来进行联通和交叉,以提升效率。
夏轶介绍,事实上大数据的应用,让他们个性化精准营销的效率,相比以前的“手动”,提高了80%之多。
对于使用大数据的心得,夏轶说,有一些事实上的关联,是人看不出的,因此需要用数据来印证。而数据与外部数据的合作,能产生价值,外部数据对于使用者越是未知,这种合作产生的价值可能就越大,“大数据最大的价值是看不到价值”,夏轶说。
在发展大数据过程中,夏轶也遇到了难题,即他所在的传统企业而且是大型国企,业务数据结构比较凌乱,数据采集和清洗存在困难。
在分享的后半部分,夏轶拿出了一些有趣的图表,比如当酒店房价高于300时,双鱼座表现出的消费能力最强(原因或许是最容易受到广告的影响),巨蟹座最分裂,而摩羯座最“勤俭持家”,济南、天津、郑州的人,去北京的人数相当高……
那么,这就是传说中的大数据吗?这些洞察结论,应该怎么利用?埋个伏笔,下面的环节将会讨论到。
分析能力>分析工具
接下来上台的E-Bizcamp 创始人兼CEO 顾青。据顾青透露,准备环球旅讯TDAY演讲的PPT,花费了他50个小时!内容非常丰富,以下是为各位读者精选的要点:
1、大数据是不是骗人的?
大数据到底有没有用?顾青以一只小猪为例:按照大数据的思维,小猪把自己所有与自己的有关的数据都统计处理了,由此算出自己还有很长的寿命。结果第二天小猪却被宰了,被宰之前,小猪骂道:“尼玛,大数据都是骗人的”。问题出在哪里?
大数据失灵了吗?在顾青看来,可能恰恰是因为数据不够大,小猪漏算了它父母寿命这个维度。
2、Google为什么强?
在互联网早期,曾经有150个左右的收费搜索引擎,如今,主流的仅剩下Google、Bing、百度数家,其中Google之强大又是毋庸置疑的。那么,Google凭什么强?
顾青介绍,在登录状态下,Google会收集用户在其他网站上的访问行为数据,从而为用户呈现出个性化的搜索结果。“在2010年之前,搜索引擎之间拼的是算法和技术,而到一定阶段后,算法都差不多了,而Google拥有的用户数据,这成为它在竞争中胜出的关键”。
由此,顾青总结,对于发展大数据而言,收集用户行为数据是至关重要的。
3、移动端更应该注重分析
如果说传统网页几乎只有一个来源即PC浏览器的话,那在移动时代,手机、Pad甚至是智能手表等多设备,以及App、H5网页、微信等多渠道……数据来源种类急剧增多,这时候,商家往往不能清晰分析,从未不能做出应用优化。
4、大数据事业,90%资金应投入给人员培训
在顾青看来,对于大数据,分析能力比分析工具更为重要。因此他提出了投资大数据事业的10/90原则:10%投资于工具,90%投资于人。顾青认为,应该培育有分析思考能力的团队,鼓励小团队管理自己的分析工作,最终更加关注分析和结果,而不是报告。
云PMS+点评大数据,住中+住后,让预测更精准
作为云PMS厂商的绿云与酒店大数据公司众荟进行了主题为“大数据+云PMS”的演讲。众荟拥有用户在酒店留下的点评信息,由此可以获得用户的喜好,比如一位用户点评过游泳池、枕头,就说明该用户对相应方面是有需求或者敏感的。
再看绿云这边,他们可以从住中获得客户的喜好信息,比如喜欢高楼层房间、需要SPA等。两者相结合,就可以更加深度全面的获得用户画像,从而做出更精准的预测和推荐。
最后的环节是座谈,亚朵酒店副总裁朱林海、IDeaS大中华区咨询总经理王越、TalkingData合伙人&高级副总裁蒋奇以及南方航空电子商务部的一位高层人士,共同坐而论道大数据。
南航:航空公司与乘客有50多个接触点可开发
南航电商的高层人士首先发言:航空公司目前具有常旅客系统、积分系统、收益管理系统等几个经典的数据系统,在此基础上,还希望通过捕捉乘客在航空公司官网、呼叫中心留下的痕迹,包括投诉,来存储更多、更复杂、更实时的数据。
该嘉宾还介绍,航空公司的整个服务流程理论上与乘客有50多个接触点,如果能通过这些信息点,采集更多维度的信息,则能让服务更细化和周到。
亚朵:《头脑特工队》就是大数据的故事
亚朵酒店讲技术问题也带着人文范。亚朵副总裁朱林海信手拈来最近上映的电影《头脑特工队》,“这就是个大数据的故事,人脑里面5个小人对应5种情绪,有点像我们说的喜怒哀乐”。
亚朵酒店的一大特色是大堂都带有书吧,住客可以免费借阅,在这件事情上,他们累计了一定的数据。“我们发现有的店记录了,有的店没做记录。结束最多的,是西安的高新店,我们分析了一下,原来这家店的书吧很漂亮。陕西人爱读书,上海人、广东人这方面不行……”,不过朱林海也很清醒地说:“当然,我这可能不叫大数据。”
最后做通信出身的朱林海谈了他对目前大数据发展的三点观感:1、数据还不够大,2、维度太少,想降维都没得降,3、太功利,几乎所有大数据都是围绕着交易的。
TalkingData:光收集罗列数据不叫大数据
TalkingData合伙人&高级副总裁蒋奇从专业大数据技术服务公司的角度指出,光收集罗列数据是没有意义的,到最后归纳出来有用的是“标签”,而专门的大数据公司,则掌握着各行各业的众多标签。
蒋奇指出,数据的收集不等于数据分析,把数据都罗列出来不等于大数据。
IDeaS:大数据要指向具体问题
IDeaS大中华区咨询总经理王越与蒋奇的思路很接近,王越说:“如果大数据预测到酒店因为某个原因可以涨价,那到底应该涨多少?双床房涨多少?大床房涨多少?为什么要涨100,而不是98或者102?大数据应该解决具体的问题,而不是说泛泛的所谓大数据。”
王越还表示,企业运用大数据,应该要指向具体的问题,是想要用大数据来解决客服问题,还是提升收益管理,这个有必要搞清楚。
这时候主持人环球旅讯CEO李超提问,有一些很大的企业,比如海航,有飞机有酒店,按理来说,最应该进行数据的打通,比如搭了海航的飞机,有延误,去到海航的酒店,就可以给客人一个房间升级。但是为什么没有打通?
对此,王越的回答是,这不是技术,而是工作机制和流程的问题。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30