京公网安备 11010802034615号
经营许可证编号:京B2-20210330

【核心关键词】大数据、零售商、消费者、供应链、运营、企业、产品、客户、数据模型、大数据平台、数据开发、系统运维、业务逻辑、最佳实践、业务流程、零售行业、数据驱动、优化供应链
【专访摘要】本次CDA持证专访邀请到广东北云智数科技有限公司的冯卓基,他详解了制造业与零售行业的数字化解决方案,拆解了大数据平台搭建、数据开发的难点及解决方法,分析了数据量增大给系统运维带来的挑战,分享了零售商利用数据改善运营的思路及岗位必备技能,为大数据领域从业者提供了实用参考。
【主持人】大家好,今天我们邀请到了冯卓基来参加我们的CDA持证人专访,卓基可以先来和大家打个招呼。
【嘉宾】哈喽,大家好,我叫冯卓基,广东工业大学毕业,目前就职于广东北云智数科技有限公司,主要负责系统运维、大数据开发工作,重点负责制造和零售行业大数据中台解决方案。
【主持人】好的,那卓基能简单分享一下你在制造业还有零售行业的一些数字化方案吗?
【嘉宾】主要是通过搭建处理能力更强、更容易扩展、性能更高的统一大数据平台,实现跨领域、跨系统的数据拉通与整合,做到统一采集、统一处理、统一存储,建立相关数据模型,并为各个重点指标做预警,把之前无法利用的数据充分利用起来,帮助客户提升对数据的认知,通过数据和分析有效驱动生产、销售、库存管理,合理整合渠道,优化供应链,推进全员作业效率闭环改进,打造新型的数据化模式,也为企业后续做数据挖掘、发现新机遇做好铺垫。
【主持人】行业大数据平台搭建和数据开发分别有哪些难点?卓基又是如何克服这些难点的呢?
【嘉宾】万事开头难,但只要一步步往前走,就能看到希望。大数据平台搭建主要靠技术和经验,首先得了解Hadoop相关技术,Hadoop里面的核心组件比如HDFS、YARN、MapReduce、Zookeeper等重点知识要掌握,服务器的硬件设备也需要了解,目前大多数大数据都运行在Linux系统上,Linux方面的知识也要学习一些。所以应该多找一些项目实践,慢慢积累经验就好。
【嘉宾】大数据开发则是技术、业务和经验的结合。技术方面,要熟悉多个数据库的语法,比如MySQL、Oracle、SQL Server、Doris、Hive等;业务方面,要通过沟通清楚了解业务流程,再去设计数据模型、做好数据分层,开发出高效的数据模型;经验方面,因为业务是共通的,比如财务、营业收入,每个公司基本都一样,这些都可以积累。总之,放好心态,主动学习、积极实践,尽快适应工作,并总结项目经验,提升自身效能。
【主持人】系统运维过程中,随着数据量的增大,运维工作会有什么新的挑战呢?
【嘉宾】在目前这么多项目中,数据量增大是每个项目都要面对的问题。面对数据量增大,我们一般有资源扩容、参数调优、链路优化等方案可参考,通过评估数据发展趋势,做出相应的扩容方案,如果发现不合理的地方就进行调整。当然,服务器成本较高,扩容也是比较耗钱的,是“换空间”还是“换时间”,需要甲方领导或相关负责人来抉择。
【嘉宾】另外,数据量的增加必然会给系统运维带来各种压力,所以操作标准、流程规范是必须的。未来的挑战是,在当前移动化、大数据、云计算、人工智能等技术的推动下,企业的IT技术架构悄然变迁,互联网架构所涉及的网元数、技术栈、服务树等元素成倍剧增,使得运维压力越来越大,庞大的数据量也是运维工作面临的巨大挑战。
【嘉宾】很多企业的服务数量不少,每时每刻都产生海量数据,这些数据里隐藏着大量关键信息,比如某系统的日质量数据不正常,可能会造成未来数小时的业务流程缓慢甚至中断。而目前很多公司出现IT系统故障后,还需要手工排查,效率非常低,所以未来的方向是智能运维模式。作为运维人员,不仅要努力学好新知识,还要把握新方向,与时俱进。
【主持人】我们现在处于一个流量时代,零售商又是如何利用数据来改善运营的呢?
【嘉宾】现在“流量”这个词比较敏感,据我所知,目前淘宝直播、抖音直播等直播平台吸引了庞大的消费者,也带来了巨大的消费能力。大多数零售商的利润空间不大,因此零售商可以利用数据驱动推进品牌建设、精准运营和营销,通过数据化方式实现供应链各环节的更好协同,同时利用数据驱动决策,对经营策略有明确的衡量和优化手段,在不断提高质量、保持消费者满意度的同时,追求成本与效率优先原则,从降本、增效、提值三方面重塑竞争力。
【嘉宾】未来,随着消费者越来越追求个性化的产品和服务,零售场景会越来越分化、碎片化,零售企业需要收集、整合更系统、全面的信息,迅速、敏捷地适应消费者的需求。
【主持人】胜任卓基这个岗位有哪些技能是必备的呢?比如工具、思维、经验、教训等等。
【嘉宾】这个要从运维和数据两方面来说,因为我负责这两方面的工作。先说说运维方面:首先得熟悉CDH产品,比如HDFS、Hive等,深入了解Java、Python、C语言;还要熟悉Linux系统,这可以说是运维工程师的必备技能,越精通越好,基础的命令操作、查看日志、监控中间件甚至虚拟化、K8S技术,涉及Linux的会的越多越好;数据库不需要精通,会配置环境、简单的语句查询和调优就可以;另外还要熟悉网络技术,包括基础架构、路由和交换、常用路由协议等。
【嘉宾】数据方面,也要熟悉CDH产品,熟悉传统数据库比如MySQL、Oracle、SQL Server,大数据方面则要掌握Hive、Doris等数据库,还要熟悉离线和实时技术;数据开发方面,还要熟悉业务,了解业务系统的业务逻辑,并能够设计数据模型,因为数据开发需要根据业务逻辑构建数据模型,所以经常要跟业务打交道,可能还需要中短期出差,因此必须具备良好的沟通能力和心态。
【嘉宾】教训方面,之前在美云公司的时候,有个项目进度非常紧,我在没有了解清楚需求的情况下,缺少了某个流程就进行开发,最终导致重做,不仅拖慢了进度,还被甲方投诉。所以,做事不用心急,按照正常的实施规则开展工作就好。
【主持人】好的,感谢卓基今天为大家带来的分享。大数据作为新一轮工业革命中最为活跃的技术创新要素,正在全面渗透全球生产、流通、分配、消费等领域,对全球竞争、国家治理、经济发展、产业转型、社会生活等方面产生全面深刻的影响。大数据将在数字经济发展中发挥更加重要的创新作用。好了,今天的分享就到这里了,我们下期再见。

【核心关键词】大数据、零售商、消费者、供应链、运营、企业、产品、客户、数据模型、大数据平台、数据开发、系统运维、业务逻 ...
2026-06-26在物流配送、供应链履约、终端供货等业务场景中,送货率是衡量企业履约能力、服务质量、供应链稳定性的核心业务指标,直接关联客 ...
2026-06-26 很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度” ...
2026-06-26在数字化管理与数据化运营体系中,指标是连接原始数据与业务决策的核心载体。零散的原始数据只是无意义的数值堆砌,无法直接反映 ...
2026-06-25在Excel数据汇总、财务统计、业务复盘等日常办公场景中,经常需要完成逐行相乘、整体汇总求和的计算需求,最典型的场景就是:单 ...
2026-06-25 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-06-25【核心关键词】主数据、资产、供应商、现金流、企业、精细化、集团、数字化、中国、数据质量、数据管理、经营管理、地产行业、 ...
2026-06-24在数据分析、假设检验、AB测试、学术研究等统计场景中,显著水平(α)与P值(P-value)是判断统计结果是否具有统计学意义的两个 ...
2026-06-24小李刚入职了一家互联网公司的运营部门。第一次参加业务复盘会,运营主管问了一个看似简单的问题:“这个月新用户留存率下降了5 ...
2026-06-24在数字化转型全面渗透的产业背景下,数据分析已成为互联网、金融、零售、制造等几乎所有行业的核心岗位能力。很多初学者对数据分 ...
2026-06-23在企业并购、股权定价、投融资评估、资产核算等资本市场核心场景中,市场法是应用最广泛、市场认可度最高的企业价值评估方法。传 ...
2026-06-23 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-06-23【核心关键词】运营、证书、金融、客户、产品、软件、销售额、量化、科技、数据分析、金融行业、证券类软件、业务流程、金融机 ...
2026-06-22在企业方案选型、产品迭代评审、供应商筛选、运营效果复盘等决策场景中,单一指标的优劣判断往往无法支撑科学决策。一套转化效果 ...
2026-06-22 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-06-22【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17