京公网安备 11010802034615号
经营许可证编号:京B2-20210330
张溪梦:拿什么拯救你,疲于污水处理的数据分析师
大数据时代,数据成为企业决策最为重要的参考之一。尽管数据源的生成量正以几何倍数的速度增加,尽管各行各业都在标榜自己生产了多少有价值的数据,但究竟哪些数据可以为企业所用,如何基于高效的数据分析创造商业价值,仍是非常具有挑战性的话题。
对于以上问题,【WOT2015"互联网+"时代大数据技术峰会】特邀讲师、GrowingIO创始人张溪梦分别基于企业运营需求及技术发展角度进行了分析,下面就让我们一起学习,最新一代的数据分析技术将如何帮助企业最大限度发挥数据运营效率。
【WOT2015"互联网+"时代大数据技术峰会】特邀嘉宾 张溪梦
张溪梦,GrowingIO创始人、CEO,前LinkedIn分析部高级总监。美国Data Science Central评选其为"世界前十位前沿数据科学家",前LinkedIn美国商业分析部高级总监,亲手建立了LinkedIn将近90人商业数据分析和数据科学团队,支撑了LinkedIn公司所有与营收相关业务的高速增长。 2015年5月,创立新一代网站和移动端数据分析平台GrowingIO,创始团队来自LinkedIn 、eBay 、Coursera、亚信等国内外顶级互联网及数据公司,具有强大的商业分析、数据产品、企业软件研发以及机器学习等专业背景、先进的数据分析技术和丰富的实战经验。
数据分析创造商业价值
现在,几乎再没有人会质疑数据驱动对于企业运营和商业价值的重要性,工业4.0都将大数据的存储、剖析、安全保障和数据价值的呈现和利用,列为未来三大核心诉求之一。
为什么数据化运营如此重要?因为基于证据的决策更可靠。依照数据分析得到的结论,企业可以快速发现问题、判断趋势、有效行动,从而指导公司未来的发展方向。
张溪梦认为,企业中的每一位员工都应该参与到数据化运营的工作中来。数据可以直观的将一些原本无形的标准进行量化,从而帮助员工发现自己的工作与业务结果之间的联系,有针对性的开展工作。
可让这个想法落地并不简单,因为这不仅仅是收集收据、定期查看而已。培养专业人才、在更短的时间内处理更多的数据、保证处理数据的质量和性能、让合适的人员使用合适的工具……有太多太多困难都在拖慢企业数据化运营的进程。
企业数据分析流程的90%耗费于初级阶段
互联网技术的发展为企业加速创新提供前所未有的机遇。在快速变化的商业格局下,企业是否有迅速做出决策的能力,成为影响未来生存和发展的关键。
然而现实往往是残酷而无奈的。张溪梦告诉我们:“去年美国某研究机构做过一份关于企业数据分析流程的调查,结果显示,仅仅是在数据收集阶段,就要花费5个星期的时间”。
造成这种局面的关键因素之一,是目前的大数据分析需要专业技术人员同时具备编程和数据分析两种能力。张溪梦将数据分析的流程形象地比喻为将一条被污染的河水变清的过程。我们收集的大量数据就像流入源头的污水,需要人力进行各种监控,然后放入一个池子里进行沉淀。之后则要开展各种清洗、聚合、再清洗、再消毒,再传输等庞大、繁杂的工作,这个过程占用了数据工程和分析师几乎90%的时间。企业急需更加先进的技术和更具指导性的方法论,来提升数据化运营的效率。
“自动化”是下一代数据分析技术的核心
要想突破目前企业数据分析中的瓶颈,关键要对现有的业务的数据分析流程进行大规模的简化,将人类的智慧集中到最能够创造商业价值的环节中。
张梦溪认为,取代今天这种功能化的数据分析的下一代数据分析技术,一定是基于以自动化为核心的一套框架。这需要企业对沉淀多年的传统技术框架进行革新。过去,为了应对基础设施在计算、存储等能力上的缺陷,往往需要将来源不同、类型不同的数据制成多维度的各种表格,来达到减少存储量的目的,这会大大拖慢企业数据处理效率。
对于未来数据分析技术趋势,张溪梦主要提到以下两个方面:
流式处理框架:这是企业实现数据自动化的核心技术。流处理的优势是可以任意数据格式进行转换,实现近乎实时的数据处理能力。
数据分析云化:云计算技术为企业IT的基础设施带来革命性的力量。将数据分析做成云端的SaaS服务后,开发人员将不再需要维护大量系统和工作流。最重要的一点,我们大幅度的降低数据分析埋点才可以详细地收集用户数据的这个巨大的限制,只需要结合业务需求,进行简单的拖拽实现定制化的数据采集规则。
流处理和云两种技术的结合,会使数据像雨滴一样,慢慢聚集在云端的服务器里面开始积累,用户将不再需要做大量的IT的基础设施的工作,或者是做各种数据清洗、整合、线上、线下聚合。
张梦溪表示,“在未来分工化、协作化的格局下,企业应该将一些相对支持性的功能外包给真正的专家或者是产品,专注做好自己最擅长的事情,所以数据分析云端化这是一个必然的趋势。”
WOT峰会将分享如何用数据化运营创造商业价值
在11月28-29日由主办位于深圳的【“互联网+”时代大数据技术峰会】中,张溪梦将带来目前最先进的全自动化数据分析的相关技术和方法论,并与大家探讨何利用实时数据分析,帮助企业最大程度地创造商业价值。
采访最后,张溪梦描述了这样的愿景:“我希望现在的企业家们都能看到云端数据分析自动化的趋势,未来每一家企业和个人都可以做自己最擅长和关注的工作,一起来把这个世界构建的更美好。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10