京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据如何保障舌尖安全
近日,全国食品安全示范城市创建和农产品质量安全县创建工作现场会在四川成都召开。在互联网时代,怎样吃得更安全?与会专家建言献策,提出要重视利用现代信息技术手段创新监管办法,提高监管效能。
作为近年来最热门的信息技术之一,大数据技术如何提高食品安全的监管效能?在正在创建食品安全示范城市的成都,我们看到了一种可能。
打通信息孤岛
与很多食品安全监管人员不同,王立山不需要去农贸市场、超市、餐馆,他多数时候都坐在桌前,他的“检查”对象是一堆数据。“数据分析可以提升食品安全监管的效率。”他说。
王立山是成都市食品安全风险监测数据中心的主任,该中心正在创建“智慧食安”的核心技术支持系统。“智慧监管,数据先行”,这是他们的口号。
走进数据中心,最引人注目的是一块黑色电子屏幕,上面的数据不断刷新。此刻,屏幕上的数据显示,检测批次总数674136,检测项次总数8469618,不合格样品总数15619,不合格样品待处理数4、正在处理数3……
这些数据并非全部。王立山和同事们面对的数据不仅来自各类食品检测机构,还来自当地农业、质检、卫生、工商等部门。数据内容包括食品检测信息、食品安全舆情信息、企业工商登记和信用数据、食源性疾病病例数据以及环境数据等。
“成都有食品生产经营主体近20万户。从农田到餐桌,每个环节都分散着海量数据,碎片化严重。”王立山说,他们要做的就是整合这些数据,建立基础数据库,打通信息孤岛,实现数据互通、资源共享。
目前,数据库已积累7万条政府部门共享数据、860万条检验检测数据,接入30万条生产商基础数据和7000万条全球商品数据,同步监测多家网媒舆情数据,并保持月均20万条的增长幅度。
“但大数据不等于数据量大,而是要产生1加1远大于2的价值。”王立山说。
他们做到了。今年1月到8月,通过大数据挖掘和分析,成都市食品安全监督性抽检问题发现率从2.36%提高到了10.71%,监管效能大幅提高。
那么,他们到底是怎么做的呢?
实现靶向打击
凌晨四点,成都农产品中心批发市场就开始忙碌了。满载各类蔬菜的货车驶入市场,分成两列。一列货车上装有磁卡,一列则没有。磁卡里有蔬菜商的来货备案登记信息和安全证明。没有磁卡的货车,货品被送入快筛检测实验室,检测合格方能入场,检测数据则自动上传至几十公里外的成都市食品安全风险监测数据中心。
在这里,快检24分钟就可以出结果,每天快检量600批次以上。检测信息上传到数据中心后,作用在下一个环节很快得到体现。
那些装有磁卡的货车,尽管有安全证明,但按规定仍然需要做一定比例的抽检。于是遇到一个难题,具体该抽检哪些蔬菜才最有可能发现问题?
王立山说,他们通过数据分析发现,不合格食品在地域上、季节上分布高度不均匀,在不同季节和不同气候条件下,容易出现安全问题的食品都不一样。而且,股东结构单一且没有法人股东、实缴资本较低的企业更容易被检出不合格食品。这启发他们综合各类检验数据、企业登记信息和信用数据等,建立了一种机器学习模型。这些工作是他们与电子科技大学的团队共同完成的。
“机器学习模型通过一定的算法,可定量评估待检品出现检验不合格的可能性,从而实现针对高风险食品的靶向抽检。”数据中心首席专家、电子科技大学教授周涛说。批发市场的信息平台与数据中心联通,数据分析得出的高危食品信息直接传送给批发市场。
“我们每天都将接收来自他们的高危产品数据,数据将使我们的安全监管更具效力。”批发市场副总经理郑克克告诉记者。
数据中心还整合了卫生部门所有食源性肠胃病的病例数据。王立山说,通过监测不同菌种感染病例数随季节和天气的变化,并分析860万条检验数据,他们获得了食品和检出菌种之间的关联性,由此建立了从相关病例上升到有针对性抽检之间的自动决策通道。
这种依靠大数据分析作出的针对性抽检,最终使他们获得了上文所述的监管效率,对不合格食品实现更精准的打击。
提前终止谣言
更有效率地发现食品安全问题,只是大数据的“魔力”之一。周涛和王立山等一度困惑的是,对于网络上每天流传的各种食品安全谣言及其给公众带来的恐慌情绪,是否也可以及时监测,甚至提前终止呢?
他们监控了上百家知名网站、论坛、贴吧等累计30多亿条舆情数据,其中与食品安全有关的舆情近800万条。“获取舆情信息后,通过后台算法,对舆情事件按照关键语义提取和自动聚类,我们可以判断舆情传播的趋势。”周涛说。
接下来,是更关键的一步:把挖掘出来的所有舆情数据分为正面情绪和负面情绪,分析正负情绪的激烈程度。“通过这种分析可以评估某个食品安全舆情的风险程度,监管部门是否应该主动介入,通过及时检验或严厉执法,破除谣言和消除安全隐患。”周涛介绍。
不久前,他们第一时间监测发现成都地区网传“白菜蘸甲醛来保鲜”。当时,这个舆情尚未大面积传播,但他们分析后认为风险程度很高,及时通知监管部门去市场上大面积抽检白菜。“最终并没有发现甲醛白菜,还向公证机构公示了权威的检验报告,提前终止谣言。”王立山说,他们还通过数据分析及时发现了面制品铝、水产品孔雀石绿等食品安全隐患30项,及时开展有针对性的整治,消除了安全风险。
其实,从苗头里掌握风险,这种“关口前移”的做法很多监管部门并不陌生。“但手段大都比较落后,数据量少,依靠人去特意关注一些网站,定期做汇报。现在数据信息越来越大,单纯靠人不太现实。”周涛说。
数据是一种重要资源
更让王立山兴奋的是,数据分析还可以主动发现现行标准中可能存在的缺陷,优化检验检测标准。
他们的数据库中有大量关于注水肉的检测信息,分析后发现,猪肉含水量的检验数据集中在63%附近和73%~77%之间,而国家标准是77%。“很多商家正好将猪肉注水到标准线附近,通过检测。但实际上,含水量76%的猪肉已经是严重的注水肉了。”王立山说。
基于此,他们向上级农业主管部门建议,提高标准的要求,将注水肉国家标准中含水量指标由77%降低到73%左右。目前,农业部正在修订该标准。
大数据的应用使他们对食品安全监管有了更大的信心,也有了更多期待。王立山对记者说:“如果实现了大部分政务数据的共享,并且打通了内外部数据,整个社会因为决策效率和决策效果的提升可以获得可观的价值增量。”
目前,他们在进一步探索大数据在政府管理上的革新。“我们现在能够实时知道每一个食品抽检和执法人员的位置和处理的业务,能够回溯每一个处置指令的发出和执行情况。在这种完全透明的环境下,工作人员的效率会大幅提高,权力寻租的空间也会消失。”王立山说。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10