京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据如何保障舌尖安全
近日,全国食品安全示范城市创建和农产品质量安全县创建工作现场会在四川成都召开。在互联网时代,怎样吃得更安全?与会专家建言献策,提出要重视利用现代信息技术手段创新监管办法,提高监管效能。
作为近年来最热门的信息技术之一,大数据技术如何提高食品安全的监管效能?在正在创建食品安全示范城市的成都,我们看到了一种可能。
打通信息孤岛
与很多食品安全监管人员不同,王立山不需要去农贸市场、超市、餐馆,他多数时候都坐在桌前,他的“检查”对象是一堆数据。“数据分析可以提升食品安全监管的效率。”他说。
王立山是成都市食品安全风险监测数据中心的主任,该中心正在创建“智慧食安”的核心技术支持系统。“智慧监管,数据先行”,这是他们的口号。
走进数据中心,最引人注目的是一块黑色电子屏幕,上面的数据不断刷新。此刻,屏幕上的数据显示,检测批次总数674136,检测项次总数8469618,不合格样品总数15619,不合格样品待处理数4、正在处理数3……
这些数据并非全部。王立山和同事们面对的数据不仅来自各类食品检测机构,还来自当地农业、质检、卫生、工商等部门。数据内容包括食品检测信息、食品安全舆情信息、企业工商登记和信用数据、食源性疾病病例数据以及环境数据等。
“成都有食品生产经营主体近20万户。从农田到餐桌,每个环节都分散着海量数据,碎片化严重。”王立山说,他们要做的就是整合这些数据,建立基础数据库,打通信息孤岛,实现数据互通、资源共享。
目前,数据库已积累7万条政府部门共享数据、860万条检验检测数据,接入30万条生产商基础数据和7000万条全球商品数据,同步监测多家网媒舆情数据,并保持月均20万条的增长幅度。
“但大数据不等于数据量大,而是要产生1加1远大于2的价值。”王立山说。
他们做到了。今年1月到8月,通过大数据挖掘和分析,成都市食品安全监督性抽检问题发现率从2.36%提高到了10.71%,监管效能大幅提高。
那么,他们到底是怎么做的呢?
实现靶向打击
凌晨四点,成都农产品中心批发市场就开始忙碌了。满载各类蔬菜的货车驶入市场,分成两列。一列货车上装有磁卡,一列则没有。磁卡里有蔬菜商的来货备案登记信息和安全证明。没有磁卡的货车,货品被送入快筛检测实验室,检测合格方能入场,检测数据则自动上传至几十公里外的成都市食品安全风险监测数据中心。
在这里,快检24分钟就可以出结果,每天快检量600批次以上。检测信息上传到数据中心后,作用在下一个环节很快得到体现。
那些装有磁卡的货车,尽管有安全证明,但按规定仍然需要做一定比例的抽检。于是遇到一个难题,具体该抽检哪些蔬菜才最有可能发现问题?
王立山说,他们通过数据分析发现,不合格食品在地域上、季节上分布高度不均匀,在不同季节和不同气候条件下,容易出现安全问题的食品都不一样。而且,股东结构单一且没有法人股东、实缴资本较低的企业更容易被检出不合格食品。这启发他们综合各类检验数据、企业登记信息和信用数据等,建立了一种机器学习模型。这些工作是他们与电子科技大学的团队共同完成的。
“机器学习模型通过一定的算法,可定量评估待检品出现检验不合格的可能性,从而实现针对高风险食品的靶向抽检。”数据中心首席专家、电子科技大学教授周涛说。批发市场的信息平台与数据中心联通,数据分析得出的高危食品信息直接传送给批发市场。
“我们每天都将接收来自他们的高危产品数据,数据将使我们的安全监管更具效力。”批发市场副总经理郑克克告诉记者。
数据中心还整合了卫生部门所有食源性肠胃病的病例数据。王立山说,通过监测不同菌种感染病例数随季节和天气的变化,并分析860万条检验数据,他们获得了食品和检出菌种之间的关联性,由此建立了从相关病例上升到有针对性抽检之间的自动决策通道。
这种依靠大数据分析作出的针对性抽检,最终使他们获得了上文所述的监管效率,对不合格食品实现更精准的打击。
提前终止谣言
更有效率地发现食品安全问题,只是大数据的“魔力”之一。周涛和王立山等一度困惑的是,对于网络上每天流传的各种食品安全谣言及其给公众带来的恐慌情绪,是否也可以及时监测,甚至提前终止呢?
他们监控了上百家知名网站、论坛、贴吧等累计30多亿条舆情数据,其中与食品安全有关的舆情近800万条。“获取舆情信息后,通过后台算法,对舆情事件按照关键语义提取和自动聚类,我们可以判断舆情传播的趋势。”周涛说。
接下来,是更关键的一步:把挖掘出来的所有舆情数据分为正面情绪和负面情绪,分析正负情绪的激烈程度。“通过这种分析可以评估某个食品安全舆情的风险程度,监管部门是否应该主动介入,通过及时检验或严厉执法,破除谣言和消除安全隐患。”周涛介绍。
不久前,他们第一时间监测发现成都地区网传“白菜蘸甲醛来保鲜”。当时,这个舆情尚未大面积传播,但他们分析后认为风险程度很高,及时通知监管部门去市场上大面积抽检白菜。“最终并没有发现甲醛白菜,还向公证机构公示了权威的检验报告,提前终止谣言。”王立山说,他们还通过数据分析及时发现了面制品铝、水产品孔雀石绿等食品安全隐患30项,及时开展有针对性的整治,消除了安全风险。
其实,从苗头里掌握风险,这种“关口前移”的做法很多监管部门并不陌生。“但手段大都比较落后,数据量少,依靠人去特意关注一些网站,定期做汇报。现在数据信息越来越大,单纯靠人不太现实。”周涛说。
数据是一种重要资源
更让王立山兴奋的是,数据分析还可以主动发现现行标准中可能存在的缺陷,优化检验检测标准。
他们的数据库中有大量关于注水肉的检测信息,分析后发现,猪肉含水量的检验数据集中在63%附近和73%~77%之间,而国家标准是77%。“很多商家正好将猪肉注水到标准线附近,通过检测。但实际上,含水量76%的猪肉已经是严重的注水肉了。”王立山说。
基于此,他们向上级农业主管部门建议,提高标准的要求,将注水肉国家标准中含水量指标由77%降低到73%左右。目前,农业部正在修订该标准。
大数据的应用使他们对食品安全监管有了更大的信心,也有了更多期待。王立山对记者说:“如果实现了大部分政务数据的共享,并且打通了内外部数据,整个社会因为决策效率和决策效果的提升可以获得可观的价值增量。”
目前,他们在进一步探索大数据在政府管理上的革新。“我们现在能够实时知道每一个食品抽检和执法人员的位置和处理的业务,能够回溯每一个处置指令的发出和执行情况。在这种完全透明的环境下,工作人员的效率会大幅提高,权力寻租的空间也会消失。”王立山说。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12