京公网安备 11010802034615号
经营许可证编号:京B2-20210330
张溪梦:拿什么拯救你,疲于污水处理的数据分析师
大数据时代,数据成为企业决策最为重要的参考之一。尽管数据源的生成量正以几何倍数的速度增加,尽管各行各业都在标榜自己生产了多少有价值的数据,但究竟哪些数据可以为企业所用,如何基于高效的数据分析创造商业价值,仍是非常具有挑战性的话题。
对于以上问题,【WOT2015"互联网+"时代大数据技术峰会】特邀讲师、GrowingIO创始人张溪梦分别基于企业运营需求及技术发展角度进行了分析,下面就让我们一起学习,最新一代的数据分析技术将如何帮助企业最大限度发挥数据运营效率。
【WOT2015"互联网+"时代大数据技术峰会】特邀嘉宾 张溪梦
张溪梦,GrowingIO创始人、CEO,前LinkedIn分析部高级总监。美国Data Science Central评选其为"世界前十位前沿数据科学家",前LinkedIn美国商业分析部高级总监,亲手建立了LinkedIn将近90人商业数据分析和数据科学团队,支撑了LinkedIn公司所有与营收相关业务的高速增长。 2015年5月,创立新一代网站和移动端数据分析平台GrowingIO,创始团队来自LinkedIn 、eBay 、Coursera、亚信等国内外顶级互联网及数据公司,具有强大的商业分析、数据产品、企业软件研发以及机器学习等专业背景、先进的数据分析技术和丰富的实战经验。
数据分析创造商业价值
现在,几乎再没有人会质疑数据驱动对于企业运营和商业价值的重要性,工业4.0都将大数据的存储、剖析、安全保障和数据价值的呈现和利用,列为未来三大核心诉求之一。
为什么数据化运营如此重要?因为基于证据的决策更可靠。依照数据分析得到的结论,企业可以快速发现问题、判断趋势、有效行动,从而指导公司未来的发展方向。
张溪梦认为,企业中的每一位员工都应该参与到数据化运营的工作中来。数据可以直观的将一些原本无形的标准进行量化,从而帮助员工发现自己的工作与业务结果之间的联系,有针对性的开展工作。
可让这个想法落地并不简单,因为这不仅仅是收集收据、定期查看而已。培养专业人才、在更短的时间内处理更多的数据、保证处理数据的质量和性能、让合适的人员使用合适的工具……有太多太多困难都在拖慢企业数据化运营的进程。
企业数据分析流程的90%耗费于初级阶段
互联网技术的发展为企业加速创新提供前所未有的机遇。在快速变化的商业格局下,企业是否有迅速做出决策的能力,成为影响未来生存和发展的关键。
然而现实往往是残酷而无奈的。张溪梦告诉我们:“去年美国某研究机构做过一份关于企业数据分析流程的调查,结果显示,仅仅是在数据收集阶段,就要花费5个星期的时间”。
造成这种局面的关键因素之一,是目前的大数据分析需要专业技术人员同时具备编程和数据分析两种能力。张溪梦将数据分析的流程形象地比喻为将一条被污染的河水变清的过程。我们收集的大量数据就像流入源头的污水,需要人力进行各种监控,然后放入一个池子里进行沉淀。之后则要开展各种清洗、聚合、再清洗、再消毒,再传输等庞大、繁杂的工作,这个过程占用了数据工程和分析师几乎90%的时间。企业急需更加先进的技术和更具指导性的方法论,来提升数据化运营的效率。
“自动化”是下一代数据分析技术的核心
要想突破目前企业数据分析中的瓶颈,关键要对现有的业务的数据分析流程进行大规模的简化,将人类的智慧集中到最能够创造商业价值的环节中。
张梦溪认为,取代今天这种功能化的数据分析的下一代数据分析技术,一定是基于以自动化为核心的一套框架。这需要企业对沉淀多年的传统技术框架进行革新。过去,为了应对基础设施在计算、存储等能力上的缺陷,往往需要将来源不同、类型不同的数据制成多维度的各种表格,来达到减少存储量的目的,这会大大拖慢企业数据处理效率。
对于未来数据分析技术趋势,张溪梦主要提到以下两个方面:
流式处理框架:这是企业实现数据自动化的核心技术。流处理的优势是可以任意数据格式进行转换,实现近乎实时的数据处理能力。
数据分析云化:云计算技术为企业IT的基础设施带来革命性的力量。将数据分析做成云端的SaaS服务后,开发人员将不再需要维护大量系统和工作流。最重要的一点,我们大幅度的降低数据分析埋点才可以详细地收集用户数据的这个巨大的限制,只需要结合业务需求,进行简单的拖拽实现定制化的数据采集规则。
流处理和云两种技术的结合,会使数据像雨滴一样,慢慢聚集在云端的服务器里面开始积累,用户将不再需要做大量的IT的基础设施的工作,或者是做各种数据清洗、整合、线上、线下聚合。
张梦溪表示,“在未来分工化、协作化的格局下,企业应该将一些相对支持性的功能外包给真正的专家或者是产品,专注做好自己最擅长的事情,所以数据分析云端化这是一个必然的趋势。”
WOT峰会将分享如何用数据化运营创造商业价值
在11月28-29日由主办位于深圳的【“互联网+”时代大数据技术峰会】中,张溪梦将带来目前最先进的全自动化数据分析的相关技术和方法论,并与大家探讨何利用实时数据分析,帮助企业最大程度地创造商业价值。
采访最后,张溪梦描述了这样的愿景:“我希望现在的企业家们都能看到云端数据分析自动化的趋势,未来每一家企业和个人都可以做自己最擅长和关注的工作,一起来把这个世界构建的更美好。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12