京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据如何保障舌尖安全
近日,全国食品安全示范城市创建和农产品质量安全县创建工作现场会在四川成都召开。在互联网时代,怎样吃得更安全?与会专家建言献策,提出要重视利用现代信息技术手段创新监管办法,提高监管效能。
作为近年来最热门的信息技术之一,大数据技术如何提高食品安全的监管效能?在正在创建食品安全示范城市的成都,我们看到了一种可能。
打通信息孤岛
与很多食品安全监管人员不同,王立山不需要去农贸市场、超市、餐馆,他多数时候都坐在桌前,他的“检查”对象是一堆数据。“数据分析可以提升食品安全监管的效率。”他说。
王立山是成都市食品安全风险监测数据中心的主任,该中心正在创建“智慧食安”的核心技术支持系统。“智慧监管,数据先行”,这是他们的口号。
走进数据中心,最引人注目的是一块黑色电子屏幕,上面的数据不断刷新。此刻,屏幕上的数据显示,检测批次总数674136,检测项次总数8469618,不合格样品总数15619,不合格样品待处理数4、正在处理数3……
这些数据并非全部。王立山和同事们面对的数据不仅来自各类食品检测机构,还来自当地农业、质检、卫生、工商等部门。数据内容包括食品检测信息、食品安全舆情信息、企业工商登记和信用数据、食源性疾病病例数据以及环境数据等。
“成都有食品生产经营主体近20万户。从农田到餐桌,每个环节都分散着海量数据,碎片化严重。”王立山说,他们要做的就是整合这些数据,建立基础数据库,打通信息孤岛,实现数据互通、资源共享。
目前,数据库已积累7万条政府部门共享数据、860万条检验检测数据,接入30万条生产商基础数据和7000万条全球商品数据,同步监测多家网媒舆情数据,并保持月均20万条的增长幅度。
“但大数据不等于数据量大,而是要产生1加1远大于2的价值。”王立山说。
他们做到了。今年1月到8月,通过大数据挖掘和分析,成都市食品安全监督性抽检问题发现率从2.36%提高到了10.71%,监管效能大幅提高。
那么,他们到底是怎么做的呢?
实现靶向打击
凌晨四点,成都农产品中心批发市场就开始忙碌了。满载各类蔬菜的货车驶入市场,分成两列。一列货车上装有磁卡,一列则没有。磁卡里有蔬菜商的来货备案登记信息和安全证明。没有磁卡的货车,货品被送入快筛检测实验室,检测合格方能入场,检测数据则自动上传至几十公里外的成都市食品安全风险监测数据中心。
在这里,快检24分钟就可以出结果,每天快检量600批次以上。检测信息上传到数据中心后,作用在下一个环节很快得到体现。
那些装有磁卡的货车,尽管有安全证明,但按规定仍然需要做一定比例的抽检。于是遇到一个难题,具体该抽检哪些蔬菜才最有可能发现问题?
王立山说,他们通过数据分析发现,不合格食品在地域上、季节上分布高度不均匀,在不同季节和不同气候条件下,容易出现安全问题的食品都不一样。而且,股东结构单一且没有法人股东、实缴资本较低的企业更容易被检出不合格食品。这启发他们综合各类检验数据、企业登记信息和信用数据等,建立了一种机器学习模型。这些工作是他们与电子科技大学的团队共同完成的。
“机器学习模型通过一定的算法,可定量评估待检品出现检验不合格的可能性,从而实现针对高风险食品的靶向抽检。”数据中心首席专家、电子科技大学教授周涛说。批发市场的信息平台与数据中心联通,数据分析得出的高危食品信息直接传送给批发市场。
“我们每天都将接收来自他们的高危产品数据,数据将使我们的安全监管更具效力。”批发市场副总经理郑克克告诉记者。
数据中心还整合了卫生部门所有食源性肠胃病的病例数据。王立山说,通过监测不同菌种感染病例数随季节和天气的变化,并分析860万条检验数据,他们获得了食品和检出菌种之间的关联性,由此建立了从相关病例上升到有针对性抽检之间的自动决策通道。
这种依靠大数据分析作出的针对性抽检,最终使他们获得了上文所述的监管效率,对不合格食品实现更精准的打击。
提前终止谣言
更有效率地发现食品安全问题,只是大数据的“魔力”之一。周涛和王立山等一度困惑的是,对于网络上每天流传的各种食品安全谣言及其给公众带来的恐慌情绪,是否也可以及时监测,甚至提前终止呢?
他们监控了上百家知名网站、论坛、贴吧等累计30多亿条舆情数据,其中与食品安全有关的舆情近800万条。“获取舆情信息后,通过后台算法,对舆情事件按照关键语义提取和自动聚类,我们可以判断舆情传播的趋势。”周涛说。
接下来,是更关键的一步:把挖掘出来的所有舆情数据分为正面情绪和负面情绪,分析正负情绪的激烈程度。“通过这种分析可以评估某个食品安全舆情的风险程度,监管部门是否应该主动介入,通过及时检验或严厉执法,破除谣言和消除安全隐患。”周涛介绍。
不久前,他们第一时间监测发现成都地区网传“白菜蘸甲醛来保鲜”。当时,这个舆情尚未大面积传播,但他们分析后认为风险程度很高,及时通知监管部门去市场上大面积抽检白菜。“最终并没有发现甲醛白菜,还向公证机构公示了权威的检验报告,提前终止谣言。”王立山说,他们还通过数据分析及时发现了面制品铝、水产品孔雀石绿等食品安全隐患30项,及时开展有针对性的整治,消除了安全风险。
其实,从苗头里掌握风险,这种“关口前移”的做法很多监管部门并不陌生。“但手段大都比较落后,数据量少,依靠人去特意关注一些网站,定期做汇报。现在数据信息越来越大,单纯靠人不太现实。”周涛说。
数据是一种重要资源
更让王立山兴奋的是,数据分析还可以主动发现现行标准中可能存在的缺陷,优化检验检测标准。
他们的数据库中有大量关于注水肉的检测信息,分析后发现,猪肉含水量的检验数据集中在63%附近和73%~77%之间,而国家标准是77%。“很多商家正好将猪肉注水到标准线附近,通过检测。但实际上,含水量76%的猪肉已经是严重的注水肉了。”王立山说。
基于此,他们向上级农业主管部门建议,提高标准的要求,将注水肉国家标准中含水量指标由77%降低到73%左右。目前,农业部正在修订该标准。
大数据的应用使他们对食品安全监管有了更大的信心,也有了更多期待。王立山对记者说:“如果实现了大部分政务数据的共享,并且打通了内外部数据,整个社会因为决策效率和决策效果的提升可以获得可观的价值增量。”
目前,他们在进一步探索大数据在政府管理上的革新。“我们现在能够实时知道每一个食品抽检和执法人员的位置和处理的业务,能够回溯每一个处置指令的发出和执行情况。在这种完全透明的环境下,工作人员的效率会大幅提高,权力寻租的空间也会消失。”王立山说。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23