京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代数据因分享而值钱_数据分析师考试
在过去土地是资源,人力是资源,在未来数据是非常非常重要的资源,数据可以客观帮我们分析出我们没有发现的事实,数据可以让我们生活更加美好,数据也可以创造出更多的商业模式。得数据者得天下。
“得数据者得天下,这是大数据和移动互联网时代给我们的福利。”昨日下午,在东郊记忆演艺中心,银泰中心·成都商报未来中国青年领袖大型公益演讲迎来了第二位嘉宾—飞常准创始人郑洪峰。
这位22岁开始创业,一手打造了航空业内最大资讯平台民航资源网以及被国人赞为“航班神器”飞常准的青年创业家,昨日下午以“数据的创业”为题目,给现场听众带来了一场极为真诚的演讲。因为创立的产品与人们的出行息息相关,郑洪峰的演讲吸引了不少热情的读者前来聆听,这其中有关注航空领域的专业人士,也有来自成都职业技术学院空中乘务专业的“准航空人”,还有正在进行互联网时代数据平台打造的创业者。
而郑洪峰也没有让专门为他而来的听众们失望。思路清晰、语言中肯、观点鲜明,在一个多小时的演讲和接下来的现场互动中,他畅谈了自己对行业的思考,对公司的想法和未来的期许。
演讲中,郑洪峰提及对创业的看法,“创业,顺势而为特别重要”,“大家一定要记住创业有巨大的风险,我们看到的都是成功的故事,背后一将功成万骨枯,真是这样的,所以一定要先考虑风险。”
演讲中,郑洪峰多次谈及对人才的重视,“开发资源,开发人才是最需要最需要的,尤其是有行业经验的。”郑洪峰表示,“我感觉成都是一个很好的地方,有可能我们将来会在这里放一个研发基地,人才是最重要的。”
精彩观点
关于创业
创业很多时候要跟形势走,顺势而为特别重要。
大家一定要记住创业有巨大的风险,我们看到的都是成功的故事,背后一将功成万骨枯。
关于竞争
我觉得这是好事,如果一个行业里就你一个人玩,要么是你走错了,要么是这个行业人家都不值得过来跟你一起玩,你有很多竞争对手的时候证明你走对了,所以我们也希望更多的竞争对手进来。
关于分享
现在是一个大数据时代,你的数据不是因为封闭起来值钱,而是因为你分享得越多,大家依赖你数据的程度决定了你的价值。
关于盈利
互联网行业熟知的话,你要挣钱,羊毛出在狼身上,反正你羊毛是不能出在羊身上的,就是旅客使用是免费的。我们挣钱是在业内,像携程、艺龙都是我的客户,包括招行等也是我的用户,物流行业也有我们的用户,这是挣钱的。
实录
收集数据/
就是坐在接机大屏幕下面,24小时用人手去抄,也得把这个事情做了。
今天我想说一下过去这些年我所做的事情,希望能对大家有一些帮助。
首先说一下为什么做航班延误这个事。我最早是学民航的,电信专业,也是民航最后一批学莫尔斯电码的人,民航大量的航班信息是通过电报传输的,所以我1996年毕业后做得最早的一个项目就是把电报里的航班信息提取出来,然后为当时的BB机台使用。很多年轻人可能不知道BB机是什么东西,但是那时候是非常时髦的新科技,当时我也没有想到我学习的技术会在2007年成为创业重要的技术基础。
为什么是2007年?不是更早也不是更晚?创业很多时候要跟形势走,顺势而为特别重要。当时中国航班量增长非常快,但是既有的运行体制没办法快速承担起这么大的运输量,这造成了大量航班延误。当时有一个投资人,我叫他李老师,他发了一封邮件给我们,说想一起做航班动态的事情,我们一起帮助旅客了解为什么会延误,会延误多久。
这在当时是很难的。2007年的时候,很多航空公司、机场连网站都没有,而且在民航内部,所有数据都是割裂的。航空公司、机场、空管、油料、管理局,这些信息界点都被分散到很多很多不同的领域和地方,而我们要把这些不同地方的数据全部整合起来,这是非常非常困难的一件事。
当时我们的投资人就鼓励我们说不用怕,哪怕在我们就坐在接机大屏幕下面,24小时用人手去抄,也得把这个事情做了,这当然是一句玩笑话。但也是这句话让创业团队最终把思想统一了。团队思想统一是很关键的,剩下的就是拼命去干活了。我们当时去航空公司、机场求爷爷告奶奶,一家一家“磕头”,很艰难地拿到数据,慢慢地数据就开始丰富起来了。
组织数据/ 从0到60很容易,而从95到100是最难的,需要耗费更大量的精力和时间。
在数据创业这方面,大家一定要注意一个原则,世界上没有百分之百完美的数据,所有的数据都是从0到1,从1到60,再从60到80,再从80到90。
刚开始做的时候,“飞常准”对整个中国航班数据覆盖大概也就60%左右,经过8年的不断完善,到现在我们整个国内航班动态数据覆盖已经达到99.9%以上,同时,国际航班已经覆盖到全球80%的航班动态数据。这一切都是慢慢慢慢积累起来的,而后续还有很多需要完善。因为从0到60很容易,而从95到100是最难的,需要耗费更大量的精力和时间。
有了数据之后我们怎么组织数据?这是“飞常准”吸引用户最重要的。我们当时定了一个原则,所有数据透明化,对此我们提出了一系列标准,比如精准预计起飞和降落时间,飞机的机龄,飞机座位图,相关机场天气、流量等等,一切有助于旅客分析航班延误的数据我们都提供,这些数据也成为了后来所有航空公司参考的规范、标准和原则。
有足够透明和丰富的航班信息;有运气,比如我们赶上了移动互联网时代;还有我们之前准确的形势判断,就是老百姓需要的航班信息越来越多,个人用户对“飞常准”的使用量增长非常快。我们APP上线之后,第一年就积攒了一百万用户,这个成绩是我们之前做民航资源网时万万想不到的,那时我们积累了十年才不到10万用户。而在移动互联网时代,“飞常准”能达到一年100万,而此后的增长速度还更快。
数据掘金/ 让航班动态成为所有在线旅行分销商的标配,如果没有它就会被淘汰。
用户上来了,核心的问题还是要挣钱。最早我们想挣钱的渠道,就是我们对移动运营商提供内容,它们把这些内容让用户定制,比如说当年很流行的手机报等这些服务。但这一套放在航班动态上行不通,老百姓不买账。为什么呢?因为坐飞机不是高频次的事情,不是每天都会用,而且它很随机,不像手机报每天定点推给你内容。而航班动态这种数据,旅客来花钱购买的可能性很小,但是也很幸运,正是这样的现状让我们变换思路,最终走上了正确的路—做数据平台,而不是把数据封闭起来给自己用。
我们立下一个愿望,让航班动态成为在线旅行分销商的标准配置,我们说总有一天所有的分销商的产品里边都会有航班动态,如果没有,他就会被竞争对手淘汰。有了这个愿景之后,我们一家家去谈,当时真的很可怜,因为没有人理我们,没有人相信我们可以把这个东西做出来,也没有人接受一个名不见经传的小公司。但是在坚持下,我们一家家谈了下来,现在航班动态数据已经成为整个旅行行业、保险行业、银行业、物流行业的标准配置,如果没有这块的数据,对于它们的服务来说就是很严重的缺失。
包括我们的竞争对手,他们也是拿着我们的数据起家的。这种开放的心态很重要,现在是一个大数据时代,你的数据不是因为封闭起来值钱,而是因为你分享得越多,大家依赖你数据的程度决定了你的价值。
随着原有这些目标的达成,航班信息已经足够透明了,我们现在又有一些新的目标,希望真正去提高中国民航的准点率。
数据价值/ 海量数据面前,要把用户需要的数据做好后给用户,这才是有价值的。
今天的“飞常准”,一秒钟要更新一百多个航班的数据,每秒钟将近100K这样的数据,这还只是更新数据库的频次,还不包括所有的客户调阅数据的量。我们对飞行轨迹跟踪上,一个机场、一个数据节点的数据已经达到每毫秒更新600航班的动态数据,这只是一个节点,还不含全球所有数据的汇总。
这些海量数据到来之后,我们发现一个很明显的趋势,就是你不能把这些海量数据一下推给用户,那是不值钱的,也就是说我们不能按照以前按字符收费的模式收钱。而是你要把旅客和用户需要的数据做好,然后给用户,这才是有价值的。
刚才说的是数据更新频率,换另外一个角度说数据丰富。我们最早做的时候,大家都觉得这个东西难是难了一点,但是可能也就六个数据,实际、预计、计划起飞和降落时间。实际上我们做到现在围绕航空器的时间有30多个数据节点,而且我们发现这30多个数据节点你不取全,你是没有办法分析出这个航班延误的真实原因,只有更全面的数据才能帮助我们实现下一步的愿景,也就是帮助民航行业提高准点率。
面向未来,我有一种感觉。在过去土地是资源,人力是资源,在未来数据是非常非常重要的资源,数据可以客观帮我们分析出我们没有发现的事实,数据可以让我们生活更加美好,数据也可以创造出更多的商业模式。得数据者得天下,期待更多的数据创业合作伙伴。成都商报记者 田园
反响
成都电商协会会长徐震:
郑洪峰创业对整个行业都有借鉴性
成都电商协会会长徐震昨日也专程到现场聆听郑洪峰的演讲,徐震说,郑洪峰创业给我们非常大的启示,对整个行业都有借鉴性。
首先,创业应该在一个垂直行业里深耕多年之后累积,观察问题与找对痛点,整合资源,其成功率相对也就更高,这在其他创业公司里也反复得到印证。
其次,飞常准的发展模式再次证明了中国特色商业环境里,一定要把握住行业代表性的客户也就是B端,飞常准其实是C端用户造势,B端用户买单。
最后,给我最大的一个启发就是,专注自己擅长的和想做的,而不是无限扩张团队和产品线。任何最艰难最没有资源的时候,创业者的成熟度和综合能力决定了竞争中谁走到最后。不要怕培养竞争对手,比如飞常准也面临“国家队”航旅纵横、航班管家这些对手的竞争,但它们是良性生态圈的重要组成部分。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27