京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据如何保障舌尖安全
近日,全国食品安全示范城市创建和农产品质量安全县创建工作现场会在四川成都召开。在互联网时代,怎样吃得更安全?与会专家建言献策,提出要重视利用现代信息技术手段创新监管办法,提高监管效能。
作为近年来最热门的信息技术之一,大数据技术如何提高食品安全的监管效能?在正在创建食品安全示范城市的成都,我们看到了一种可能。
打通信息孤岛
与很多食品安全监管人员不同,王立山不需要去农贸市场、超市、餐馆,他多数时候都坐在桌前,他的“检查”对象是一堆数据。“数据分析可以提升食品安全监管的效率。”他说。
王立山是成都市食品安全风险监测数据中心的主任,该中心正在创建“智慧食安”的核心技术支持系统。“智慧监管,数据先行”,这是他们的口号。
走进数据中心,最引人注目的是一块黑色电子屏幕,上面的数据不断刷新。此刻,屏幕上的数据显示,检测批次总数674136,检测项次总数8469618,不合格样品总数15619,不合格样品待处理数4、正在处理数3……
这些数据并非全部。王立山和同事们面对的数据不仅来自各类食品检测机构,还来自当地农业、质检、卫生、工商等部门。数据内容包括食品检测信息、食品安全舆情信息、企业工商登记和信用数据、食源性疾病病例数据以及环境数据等。
“成都有食品生产经营主体近20万户。从农田到餐桌,每个环节都分散着海量数据,碎片化严重。”王立山说,他们要做的就是整合这些数据,建立基础数据库,打通信息孤岛,实现数据互通、资源共享。
目前,数据库已积累7万条政府部门共享数据、860万条检验检测数据,接入30万条生产商基础数据和7000万条全球商品数据,同步监测多家网媒舆情数据,并保持月均20万条的增长幅度。
“但大数据不等于数据量大,而是要产生1加1远大于2的价值。”王立山说。
他们做到了。今年1月到8月,通过大数据挖掘和分析,成都市食品安全监督性抽检问题发现率从2.36%提高到了10.71%,监管效能大幅提高。
那么,他们到底是怎么做的呢?
实现靶向打击
凌晨四点,成都农产品中心批发市场就开始忙碌了。满载各类蔬菜的货车驶入市场,分成两列。一列货车上装有磁卡,一列则没有。磁卡里有蔬菜商的来货备案登记信息和安全证明。没有磁卡的货车,货品被送入快筛检测实验室,检测合格方能入场,检测数据则自动上传至几十公里外的成都市食品安全风险监测数据中心。
在这里,快检24分钟就可以出结果,每天快检量600批次以上。检测信息上传到数据中心后,作用在下一个环节很快得到体现。
那些装有磁卡的货车,尽管有安全证明,但按规定仍然需要做一定比例的抽检。于是遇到一个难题,具体该抽检哪些蔬菜才最有可能发现问题?
王立山说,他们通过数据分析发现,不合格食品在地域上、季节上分布高度不均匀,在不同季节和不同气候条件下,容易出现安全问题的食品都不一样。而且,股东结构单一且没有法人股东、实缴资本较低的企业更容易被检出不合格食品。这启发他们综合各类检验数据、企业登记信息和信用数据等,建立了一种机器学习模型。这些工作是他们与电子科技大学的团队共同完成的。
“机器学习模型通过一定的算法,可定量评估待检品出现检验不合格的可能性,从而实现针对高风险食品的靶向抽检。”数据中心首席专家、电子科技大学教授周涛说。批发市场的信息平台与数据中心联通,数据分析得出的高危食品信息直接传送给批发市场。
“我们每天都将接收来自他们的高危产品数据,数据将使我们的安全监管更具效力。”批发市场副总经理郑克克告诉记者。
数据中心还整合了卫生部门所有食源性肠胃病的病例数据。王立山说,通过监测不同菌种感染病例数随季节和天气的变化,并分析860万条检验数据,他们获得了食品和检出菌种之间的关联性,由此建立了从相关病例上升到有针对性抽检之间的自动决策通道。
这种依靠大数据分析作出的针对性抽检,最终使他们获得了上文所述的监管效率,对不合格食品实现更精准的打击。
提前终止谣言
更有效率地发现食品安全问题,只是大数据的“魔力”之一。周涛和王立山等一度困惑的是,对于网络上每天流传的各种食品安全谣言及其给公众带来的恐慌情绪,是否也可以及时监测,甚至提前终止呢?
他们监控了上百家知名网站、论坛、贴吧等累计30多亿条舆情数据,其中与食品安全有关的舆情近800万条。“获取舆情信息后,通过后台算法,对舆情事件按照关键语义提取和自动聚类,我们可以判断舆情传播的趋势。”周涛说。
接下来,是更关键的一步:把挖掘出来的所有舆情数据分为正面情绪和负面情绪,分析正负情绪的激烈程度。“通过这种分析可以评估某个食品安全舆情的风险程度,监管部门是否应该主动介入,通过及时检验或严厉执法,破除谣言和消除安全隐患。”周涛介绍。
不久前,他们第一时间监测发现成都地区网传“白菜蘸甲醛来保鲜”。当时,这个舆情尚未大面积传播,但他们分析后认为风险程度很高,及时通知监管部门去市场上大面积抽检白菜。“最终并没有发现甲醛白菜,还向公证机构公示了权威的检验报告,提前终止谣言。”王立山说,他们还通过数据分析及时发现了面制品铝、水产品孔雀石绿等食品安全隐患30项,及时开展有针对性的整治,消除了安全风险。
其实,从苗头里掌握风险,这种“关口前移”的做法很多监管部门并不陌生。“但手段大都比较落后,数据量少,依靠人去特意关注一些网站,定期做汇报。现在数据信息越来越大,单纯靠人不太现实。”周涛说。
数据是一种重要资源
更让王立山兴奋的是,数据分析还可以主动发现现行标准中可能存在的缺陷,优化检验检测标准。
他们的数据库中有大量关于注水肉的检测信息,分析后发现,猪肉含水量的检验数据集中在63%附近和73%~77%之间,而国家标准是77%。“很多商家正好将猪肉注水到标准线附近,通过检测。但实际上,含水量76%的猪肉已经是严重的注水肉了。”王立山说。
基于此,他们向上级农业主管部门建议,提高标准的要求,将注水肉国家标准中含水量指标由77%降低到73%左右。目前,农业部正在修订该标准。
大数据的应用使他们对食品安全监管有了更大的信心,也有了更多期待。王立山对记者说:“如果实现了大部分政务数据的共享,并且打通了内外部数据,整个社会因为决策效率和决策效果的提升可以获得可观的价值增量。”
目前,他们在进一步探索大数据在政府管理上的革新。“我们现在能够实时知道每一个食品抽检和执法人员的位置和处理的业务,能够回溯每一个处置指令的发出和执行情况。在这种完全透明的环境下,工作人员的效率会大幅提高,权力寻租的空间也会消失。”王立山说。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03