京公网安备 11010802034615号
经营许可证编号:京B2-20210330
张溪梦:拿什么拯救你,疲于污水处理的数据分析师
大数据时代,数据成为企业决策最为重要的参考之一。尽管数据源的生成量正以几何倍数的速度增加,尽管各行各业都在标榜自己生产了多少有价值的数据,但究竟哪些数据可以为企业所用,如何基于高效的数据分析创造商业价值,仍是非常具有挑战性的话题。
对于以上问题,【WOT2015"互联网+"时代大数据技术峰会】特邀讲师、GrowingIO创始人张溪梦分别基于企业运营需求及技术发展角度进行了分析,下面就让我们一起学习,最新一代的数据分析技术将如何帮助企业最大限度发挥数据运营效率。
【WOT2015"互联网+"时代大数据技术峰会】特邀嘉宾 张溪梦
张溪梦,GrowingIO创始人、CEO,前LinkedIn分析部高级总监。美国Data Science Central评选其为"世界前十位前沿数据科学家",前LinkedIn美国商业分析部高级总监,亲手建立了LinkedIn将近90人商业数据分析和数据科学团队,支撑了LinkedIn公司所有与营收相关业务的高速增长。 2015年5月,创立新一代网站和移动端数据分析平台GrowingIO,创始团队来自LinkedIn 、eBay 、Coursera、亚信等国内外顶级互联网及数据公司,具有强大的商业分析、数据产品、企业软件研发以及机器学习等专业背景、先进的数据分析技术和丰富的实战经验。
数据分析创造商业价值
现在,几乎再没有人会质疑数据驱动对于企业运营和商业价值的重要性,工业4.0都将大数据的存储、剖析、安全保障和数据价值的呈现和利用,列为未来三大核心诉求之一。
为什么数据化运营如此重要?因为基于证据的决策更可靠。依照数据分析得到的结论,企业可以快速发现问题、判断趋势、有效行动,从而指导公司未来的发展方向。
张溪梦认为,企业中的每一位员工都应该参与到数据化运营的工作中来。数据可以直观的将一些原本无形的标准进行量化,从而帮助员工发现自己的工作与业务结果之间的联系,有针对性的开展工作。
可让这个想法落地并不简单,因为这不仅仅是收集收据、定期查看而已。培养专业人才、在更短的时间内处理更多的数据、保证处理数据的质量和性能、让合适的人员使用合适的工具……有太多太多困难都在拖慢企业数据化运营的进程。
企业数据分析流程的90%耗费于初级阶段
互联网技术的发展为企业加速创新提供前所未有的机遇。在快速变化的商业格局下,企业是否有迅速做出决策的能力,成为影响未来生存和发展的关键。
然而现实往往是残酷而无奈的。张溪梦告诉我们:“去年美国某研究机构做过一份关于企业数据分析流程的调查,结果显示,仅仅是在数据收集阶段,就要花费5个星期的时间”。
造成这种局面的关键因素之一,是目前的大数据分析需要专业技术人员同时具备编程和数据分析两种能力。张溪梦将数据分析的流程形象地比喻为将一条被污染的河水变清的过程。我们收集的大量数据就像流入源头的污水,需要人力进行各种监控,然后放入一个池子里进行沉淀。之后则要开展各种清洗、聚合、再清洗、再消毒,再传输等庞大、繁杂的工作,这个过程占用了数据工程和分析师几乎90%的时间。企业急需更加先进的技术和更具指导性的方法论,来提升数据化运营的效率。
“自动化”是下一代数据分析技术的核心
要想突破目前企业数据分析中的瓶颈,关键要对现有的业务的数据分析流程进行大规模的简化,将人类的智慧集中到最能够创造商业价值的环节中。
张梦溪认为,取代今天这种功能化的数据分析的下一代数据分析技术,一定是基于以自动化为核心的一套框架。这需要企业对沉淀多年的传统技术框架进行革新。过去,为了应对基础设施在计算、存储等能力上的缺陷,往往需要将来源不同、类型不同的数据制成多维度的各种表格,来达到减少存储量的目的,这会大大拖慢企业数据处理效率。
对于未来数据分析技术趋势,张溪梦主要提到以下两个方面:
流式处理框架:这是企业实现数据自动化的核心技术。流处理的优势是可以任意数据格式进行转换,实现近乎实时的数据处理能力。
数据分析云化:云计算技术为企业IT的基础设施带来革命性的力量。将数据分析做成云端的SaaS服务后,开发人员将不再需要维护大量系统和工作流。最重要的一点,我们大幅度的降低数据分析埋点才可以详细地收集用户数据的这个巨大的限制,只需要结合业务需求,进行简单的拖拽实现定制化的数据采集规则。
流处理和云两种技术的结合,会使数据像雨滴一样,慢慢聚集在云端的服务器里面开始积累,用户将不再需要做大量的IT的基础设施的工作,或者是做各种数据清洗、整合、线上、线下聚合。
张梦溪表示,“在未来分工化、协作化的格局下,企业应该将一些相对支持性的功能外包给真正的专家或者是产品,专注做好自己最擅长的事情,所以数据分析云端化这是一个必然的趋势。”
WOT峰会将分享如何用数据化运营创造商业价值
在11月28-29日由主办位于深圳的【“互联网+”时代大数据技术峰会】中,张溪梦将带来目前最先进的全自动化数据分析的相关技术和方法论,并与大家探讨何利用实时数据分析,帮助企业最大程度地创造商业价值。
采访最后,张溪梦描述了这样的愿景:“我希望现在的企业家们都能看到云端数据分析自动化的趋势,未来每一家企业和个人都可以做自己最擅长和关注的工作,一起来把这个世界构建的更美好。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23