京公网安备 11010802034615号
经营许可证编号:京B2-20210330
收集航空大数据 靠专利算法推演到秒
当你被困在机场,看着满屏的航班延误信息时,如果有一款手机软件,能为你提供比机场还要详细的航班信息,同时更进一步地帮你查到你的前序航班已经飞到哪里了、航班晚点了多久、航班历史准点率多少……甚至连哪一边的座位更容易晒到太阳都细心告知,这样的软件你会埋单吗?
由于特殊的航路管制等原因,国内航班的准点率并不算高。也正是因为如此,在移动端意外地催生出了一块航班动态信息查询市场。2011年开始,一款叫“飞常准”的软件开始在各类APP榜单、微博上频频现身,到目前已拥有超4000万的客户端下载量及500万的注册客户。
飞常准究竟怎样获取到成千上万条航班实时信息,并迅速向用户通报?它又是如何变成热门软件,乃至于一个成功的商业范本?近日,成都商报记者在飞常准的总部合肥专访了其创始人、飞友科技CEO郑洪峰,为您揭开飞常准的生意经。本组稿件均由成都商报记者 胡沛 采写
飞常准创业如何起步?
主营业务被一封邮件所改变
很少有人知道,作为航空数据业内的“隐形冠军”,飞常准的总部安家在合肥闹市一处普通的写字楼里。进入该总部,在一些门口标注着“商务舱”、“头等舱”等字样的办公室中,桌上摆放了大堆的零食或方便面,显示这一互联网新军并没有那么多条条框框。
让成都商报记者略感意外的是,今年37岁的飞常准创始人郑洪峰并没有一间自己的专属办公室。因为大量时间会用于在外地出差,回到总部后他常常在普通员工的写字间里“打游击”,有时摸出笔记本电脑就直接办公。郑洪峰有着超过10年的民航系统工作经历,为此积攒了大量民航内部人脉以及对数据分析的技能。上周,他刚去了广汉民航飞行学院招聘,为来年数据分析做储备。
“这个网站原先主要用户和访问量来自民航系统内部,注册用户不到100万,主要提供民航新闻。”郑洪峰告诉记者,考虑到未来的发展,自己又创办了合肥飞友网络科技公司,准备打入航空旅客市场。和酷讯、去哪儿等类似,飞友旗下的飞友网原先也打算做一个机票搜索网站,不过网站运营得并不算好,郑洪峰明白,即使自己再努力,也很难将便宜机票搜索引擎快速推广。
“做了两年机票搜索网站之后,感觉做不下去了。之后的路也是被逼出来的。”谈到为何调头做民航数据,郑洪峰告诉记者,曾经有一个投资人给他发来一封邮件,谈到自己坐飞机时遭遇航班严重延误的感受,为此向他建议改做航班动态数据,并坚信这是一个很大市场。这封邮件最终成为郑洪峰事业的转折点。
磨嘴皮近半年 啃下第一家信息源
当时,国外的航班信息提供服务已渐成规模,但国内还没有人开始尝试,唯一能向旅客提供航班动态信息的就只有机场内电子显示屏上滚动的红绿字,以及一些航空公司的官方网站。由于航班信息往往散落在民航各个组成部分,如机场、航空公司、空管部门,这样北京的机场只知道北京的航班信息,上海的机场也只能知道上海的航班信息,这些信息之间基本相互割裂。
“早期业内曾经流传着一个段子,说飞常准派了几十个人,到全国各大机场的候机楼里,盯着大屏幕一个一个抄录数据。”郑洪峰介绍说,实际上自己是拿出上门“磨嘴皮”的绝招,到各家航空公司寻求资源的共享。“好在大家知道我是系统内部人士,做了很多年的民航资源网,不会出格,所以到处拜访的时候没有直接吃闭门羹。”
即使如此,第一家“拿下”的山东航空公司也花去了近半年时间,其间屡挫屡战,直到签下了一份一寸厚的安全“军令状”并保证信息不外泄,才算合作成功。此后后,其他航空公司、机场、空管也陆续向飞常准敞开大门。
航空大数据如何应用?
大看飞机“身份证”
小览配餐、关舱时间
经历起步阶段之后,现在的飞常准不仅能告诉用户所乘的机型是哪种、机龄有多少年,还能给出前面有几架飞机在跑道排队等待起飞这类“神秘”信息。那么飞常准的数据来源有哪些呢?
与想象中炫目的数据研发车间不同,在飞常准合肥总部普普通通的办公室中,数十台电脑联通服务器可以堪称民航数据的集散中心。显示器上翻滚的绿色底层数据处理代码每一秒钟就带来近百个航班的数据更新,而远在千里之外的北京,近两百台服务器正源源不断为合肥总部的数据团队提供全球各地的航班动态原始数据。
郑洪峰为成都商报记者现场演示了“飞常准”如何使用相关数据:一种是从空管局、航空公司、机场等处获得的气象、航班、空域流量等数据。“现在飞机操控都数字化了,航空公司通过飞机通信寻址与报告系统能自动获得实时数据,包含位置、速度、高度以及在高空中的天气状况,这些数据有的是公开发布的,有些则需要购买或交换,交换条件包括为航空公司设计网页、后台运营、做大数据分析报告等。”另一种则是由飞常准自建渠道,在全国20多个机场合作搭建“基站”,监控区域内所有飞机的飞行轨迹,这也作为前一种数据的补充。
郑洪峰用笔记本电脑里的后台运行系统向记者演示,核心的数据主要有三大系统:其一是每天从航空公司、机场、空管三方获取的最新航班时刻表,包括航班号、出发地、目的地、计划起飞、计划到达、实际起飞、实际到达、行李转盘、到达口、气象、航路等近20个报文数据;其二是国内飞机的编号库,就像每一个汽车有牌照一样,民航飞机都有自己的身份证;其三也是飞常准最核心的技能———航班动态的数据分析。“飞常准从航空公司那里拿到哪一个飞机执飞的信息,我们就要将飞机匹配到执行的航班。”这样,大到飞机编号,小到最后飞机配餐或关舱门的时间,飞常准都能获得相关数据。
20个进程精确到秒
登机前测准起飞时间
有了这些原始数据还远远不够,如何加工才是飞常准的核心技能所在。目前,飞友科技团队数据处理部门有近20人,他们要专门对未加工原始数据和自己计算的数据等进行再加工,以生产出更多符合市场需要的数据产品。按照郑洪峰的说法,目前飞常准的精准度高于航空公司公布的数据,精准度在92%以上,而这套算法目前已获得了专利。
“对旅客而言,重要的是知道最新的预计起飞时间。”郑洪峰以一套计算延误时间以及新预计起飞时间的操作过程举例:首先,要知道执飞该航班的飞机是否已到达起飞机场,如果已抵达,那么需要考虑起飞机场和目的地机场的天气和流量状况,还要考虑飞机加油、配餐、打扫卫生等多个因素;如果前段航班未抵达,则要根据飞机的关联航班来判断前序航班对后续航班的影响。如果天气和流控因素都正常,那么只需考虑机场当前的出港率(平均每架飞机的起飞时间)和排队等候起飞的飞机数量,将两者相乘,大致就能计算出目标航班的起飞时间了。
在后台保障系统中,飞常准技术总监朱睿随手打开一个11月27日的航班动态,成都经停昆明飞芒市的航班进程保障系统一目了然:该航班中午11:50在昆明落地后,到达机位、上轮档、靠桥、开客舱、开货舱、保洁开始至结束总共花去8分46秒,算上加清水、排污、机组到位、加油完成,总共花去11分30秒,截至配餐完成共花去31分52秒,随后关客舱门、关货舱门、离桥、撤轮档、起飞等数据陆续滚动,共20个进程一一呈现,最终这架飞机在12:53关上舱门。而此前经过系列计算,飞常准在旅客登机之前,就预计起飞时间在12:53左右,差距基本不超过两分钟。“这套算法是长期经验累积的结果。”
不过即使在这样精细的“数据加工车间”中,面对海量的数据,因为数据很多不透明,信息共享不完善,有些还需要人工处理。比如某一航班预计起飞时间是6:50,但因为当地大雾,直到上午10:34才起飞。飞常准数据团队提前从系统中获得了机场天气异常的告警信息,预测前序航班要晚到3个多小时,后续航班的计划起飞时间可能延迟。“一份航班数据,至少要通过两个以上的渠道确认才敢用,然后再用一套数学模型去计算航班的预计起飞和到达时间。我们有专门的15人的人工数据团队,当数据出现冲突时,比如机场和航空公司同一个报文不一样,这时需要人工介入去校验,并通过信息通报群或者电话来进行确认。”
航班信息APP市场三国杀
目前在航班动态查询APP(应用软件)可谓三分天下,除了“飞常准”外,号称拥有4000万用户的“航班管家”和带有官方背景的“航旅纵横”也加入了市场争夺。
记者注意到,航班管家、飞常准、航旅纵横三款APP应用的核心业务虽然都是为用户提供即时的航班信息,但三家各有侧重:航班管家提供机票搜索、预订以及详细机场攻略,意在通过综合的航班、机场信息帮助用户做出航旅决策;飞常准从“准”字切入,强调信息的及时和准确;航旅纵横则依靠中航信的优势掌握着用户行程信息,旅客只要输入身份证号,全部行程就会呈现在手机上,并可在APP上选座,甚至通过手机二维码登机。不过,后者最大的优势也引发业界对旅客信息隐私权的担忧。
“飞常准”创始人郑洪峰在接受记者采访时表示,飞常准的优势在于航班动态数据分析,飞常准的预计起飞时间预测的准确率高于航空公司的准确率。他坦言,在交互性上还落后于对手,不过他认为,中航信的数据只局限于在中国的航空公司,而从去年开始,飞常准已经在筹划全球的航班动态数据了,目前每天更新全球超过98万个航班信息,可以提供接近全球总计航班近8成的数据。
而航班管家目前也已“转型”,两年前就加入航空公司的直销票资源,而保险、旅行、酒店、租车等业务也被整合到服务体系中去。航班管家一位负责人表示,动态数据主要来自于国家空管局的授权,还有一部分和航空公司和航空类企业合作,但航班动态数据仅是其业务的一部分。“机票和酒店销售收入基本能占公司收入的95%以上,未来的利润增长点在与出行有关的服务中。”
手握数据为王的利器,郑洪峰说,从飞常准诞生至今,他最简单的愿望就是让老百姓能知道自己航班的时间,并由此促成民航数据的开放。这一成就已经让飞常准有了足够的收益。“我并不追求让飞常准拥有十八般武艺,但要查询航班动态信息,或者遇到航班延误时,想到我们就好。”郑洪峰告诉成都商报记者,“现在飞常准是盈利的,大概一年能翻一番。今年有投资机构找我们想上新三板,飞常准所有的条件都已经符合,但我认为这个市场不足够大,而且飞常准的核心业务肯定不是资本运作,还是要安心把数据业务做好。”
郑洪峰表示,飞常准主要针对B客户,像携程网、招行、淘宝等,有上千家客户正使用其航班动态大数据和数据分析服务,这是主要的收入来源。另外还有C客户,也就是普通的软件使用者。“我们在尝试广告模式,另外通过租车、保险等增值服务拓宽盈利模式。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01在数据驱动决策的时代,企业与从业者每天都会面对海量数据——电商平台的用户行为数据、金融机构的信贷风险数据、快消品牌的营销 ...
2026-04-01在数字化转型的浪潮中,企业数据已从“辅助运营的附属资源”升级为“驱动增长的核心资产”,而一套科学、可落地的企业数据管理方 ...
2026-04-01在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30