
大数据如何保障舌尖安全
近日,全国食品安全示范城市创建和农产品质量安全县创建工作现场会在四川成都召开。在互联网时代,怎样吃得更安全?与会专家建言献策,提出要重视利用现代信息技术手段创新监管办法,提高监管效能。
作为近年来最热门的信息技术之一,大数据技术如何提高食品安全的监管效能?在正在创建食品安全示范城市的成都,我们看到了一种可能。
打通信息孤岛
与很多食品安全监管人员不同,王立山不需要去农贸市场、超市、餐馆,他多数时候都坐在桌前,他的“检查”对象是一堆数据。“数据分析可以提升食品安全监管的效率。”他说。
王立山是成都市食品安全风险监测数据中心的主任,该中心正在创建“智慧食安”的核心技术支持系统。“智慧监管,数据先行”,这是他们的口号。
走进数据中心,最引人注目的是一块黑色电子屏幕,上面的数据不断刷新。此刻,屏幕上的数据显示,检测批次总数674136,检测项次总数8469618,不合格样品总数15619,不合格样品待处理数4、正在处理数3……
这些数据并非全部。王立山和同事们面对的数据不仅来自各类食品检测机构,还来自当地农业、质检、卫生、工商等部门。数据内容包括食品检测信息、食品安全舆情信息、企业工商登记和信用数据、食源性疾病病例数据以及环境数据等。
“成都有食品生产经营主体近20万户。从农田到餐桌,每个环节都分散着海量数据,碎片化严重。”王立山说,他们要做的就是整合这些数据,建立基础数据库,打通信息孤岛,实现数据互通、资源共享。
目前,数据库已积累7万条政府部门共享数据、860万条检验检测数据,接入30万条生产商基础数据和7000万条全球商品数据,同步监测多家网媒舆情数据,并保持月均20万条的增长幅度。
“但大数据不等于数据量大,而是要产生1加1远大于2的价值。”王立山说。
他们做到了。今年1月到8月,通过大数据挖掘和分析,成都市食品安全监督性抽检问题发现率从2.36%提高到了10.71%,监管效能大幅提高。
那么,他们到底是怎么做的呢?
实现靶向打击
凌晨四点,成都农产品中心批发市场就开始忙碌了。满载各类蔬菜的货车驶入市场,分成两列。一列货车上装有磁卡,一列则没有。磁卡里有蔬菜商的来货备案登记信息和安全证明。没有磁卡的货车,货品被送入快筛检测实验室,检测合格方能入场,检测数据则自动上传至几十公里外的成都市食品安全风险监测数据中心。
在这里,快检24分钟就可以出结果,每天快检量600批次以上。检测信息上传到数据中心后,作用在下一个环节很快得到体现。
那些装有磁卡的货车,尽管有安全证明,但按规定仍然需要做一定比例的抽检。于是遇到一个难题,具体该抽检哪些蔬菜才最有可能发现问题?
王立山说,他们通过数据分析发现,不合格食品在地域上、季节上分布高度不均匀,在不同季节和不同气候条件下,容易出现安全问题的食品都不一样。而且,股东结构单一且没有法人股东、实缴资本较低的企业更容易被检出不合格食品。这启发他们综合各类检验数据、企业登记信息和信用数据等,建立了一种机器学习模型。这些工作是他们与电子科技大学的团队共同完成的。
“机器学习模型通过一定的算法,可定量评估待检品出现检验不合格的可能性,从而实现针对高风险食品的靶向抽检。”数据中心首席专家、电子科技大学教授周涛说。批发市场的信息平台与数据中心联通,数据分析得出的高危食品信息直接传送给批发市场。
“我们每天都将接收来自他们的高危产品数据,数据将使我们的安全监管更具效力。”批发市场副总经理郑克克告诉记者。
数据中心还整合了卫生部门所有食源性肠胃病的病例数据。王立山说,通过监测不同菌种感染病例数随季节和天气的变化,并分析860万条检验数据,他们获得了食品和检出菌种之间的关联性,由此建立了从相关病例上升到有针对性抽检之间的自动决策通道。
这种依靠大数据分析作出的针对性抽检,最终使他们获得了上文所述的监管效率,对不合格食品实现更精准的打击。
提前终止谣言
更有效率地发现食品安全问题,只是大数据的“魔力”之一。周涛和王立山等一度困惑的是,对于网络上每天流传的各种食品安全谣言及其给公众带来的恐慌情绪,是否也可以及时监测,甚至提前终止呢?
他们监控了上百家知名网站、论坛、贴吧等累计30多亿条舆情数据,其中与食品安全有关的舆情近800万条。“获取舆情信息后,通过后台算法,对舆情事件按照关键语义提取和自动聚类,我们可以判断舆情传播的趋势。”周涛说。
接下来,是更关键的一步:把挖掘出来的所有舆情数据分为正面情绪和负面情绪,分析正负情绪的激烈程度。“通过这种分析可以评估某个食品安全舆情的风险程度,监管部门是否应该主动介入,通过及时检验或严厉执法,破除谣言和消除安全隐患。”周涛介绍。
不久前,他们第一时间监测发现成都地区网传“白菜蘸甲醛来保鲜”。当时,这个舆情尚未大面积传播,但他们分析后认为风险程度很高,及时通知监管部门去市场上大面积抽检白菜。“最终并没有发现甲醛白菜,还向公证机构公示了权威的检验报告,提前终止谣言。”王立山说,他们还通过数据分析及时发现了面制品铝、水产品孔雀石绿等食品安全隐患30项,及时开展有针对性的整治,消除了安全风险。
其实,从苗头里掌握风险,这种“关口前移”的做法很多监管部门并不陌生。“但手段大都比较落后,数据量少,依靠人去特意关注一些网站,定期做汇报。现在数据信息越来越大,单纯靠人不太现实。”周涛说。
数据是一种重要资源
更让王立山兴奋的是,数据分析还可以主动发现现行标准中可能存在的缺陷,优化检验检测标准。
他们的数据库中有大量关于注水肉的检测信息,分析后发现,猪肉含水量的检验数据集中在63%附近和73%~77%之间,而国家标准是77%。“很多商家正好将猪肉注水到标准线附近,通过检测。但实际上,含水量76%的猪肉已经是严重的注水肉了。”王立山说。
基于此,他们向上级农业主管部门建议,提高标准的要求,将注水肉国家标准中含水量指标由77%降低到73%左右。目前,农业部正在修订该标准。
大数据的应用使他们对食品安全监管有了更大的信心,也有了更多期待。王立山对记者说:“如果实现了大部分政务数据的共享,并且打通了内外部数据,整个社会因为决策效率和决策效果的提升可以获得可观的价值增量。”
目前,他们在进一步探索大数据在政府管理上的革新。“我们现在能够实时知道每一个食品抽检和执法人员的位置和处理的业务,能够回溯每一个处置指令的发出和执行情况。在这种完全透明的环境下,工作人员的效率会大幅提高,权力寻租的空间也会消失。”王立山说。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04