京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析工具独领风骚 数据科学服务表示不服
企业需要从大量收集的数据中攫取价值,但很多企业似乎无法找到足够的数据科学家来做这件事。因此数据科学作为一项服务变呼之而出。
处于如此困境的企业可以把他们的原生数据外包给类似DataScience这样的公司,这是一家位于加利福尼亚Culver City的创业公司。其分析团队对数据进行清理并使用复杂的建模工具、国产软件来提供建议,这样客户就可以根据这些建议来改进产品和服务,展他们的客户群,最终增加收入。
SearchBusinessAnalytics与DataScience的CEO兼创始人Ian Swanson谈论关于新兴数据科学作为一项服务的发展空间。他谈及其数据科学家组成的团队能够提供数据分析工具无法提供东西,数据科学驱动收入的方式以及其风险投资公司如何在不到两年的时间内获得并发展了一个强大而稳定的数据科学家和数据工程师团队,而与此同时大量的科技公司却往往是很艰难地做着同样的事。
公司们长期以来便利用数据来改善运营效率,但如今越来越多的是强调以新的方式来使用数据连接客户以促进销售。那么如今还有哪些新颖的方式可以让你来使用数据呢?
Ian Swanson:我们拥有的订阅电子商务公司每年的业务超过十亿。我们能够识别哪些客户会有在下月离开的风险,他们生命周期的潜力是什么以及如何才能留住他们。生命周期价值是我们连接顾客的核心。很多企业试图使用疯狂的Excel数学来解决该问题。我们在细粒度水平进行观察(很多属性和特性)以决定一名客户的生命周期价值。我们可以通过在该属性上有针对性的投放特定广告来增加客户。
数据货币化对于你的客户来说到底有多重要?
Swanson:某些公司将其看得很简单,即我们要如何销售数据?而我们看待它的方式是:我们要如何利用数据来增加收入?
我们与一家连接技术公司协作来找出他们的客户到底是如何使用他们的产品的。企业可能会使用典型群体来了解如何对自己进行营销,但是这些我们能够收集在一起的元素显示了客户是为什么以及如何使用他们产品的。我们查看了他们所有的数据并雇用了几个数据科学技师来发掘大多数人是如何使用产品的并决定如何来对产品进行营销。我们提供建议来帮助客户支持团队利用我们客户能够控制的东西将顾客从批评者转变为促进者
我们还可以对一款尚未上马的产品预测供需,因此一家公司就能够将其并入他们的财务预测。公司通常会用遥不可及的逻辑来做这件事,但我们会用科学手段来完成。
对于那些将数据科学作为一项服务的公司来说,他们的员工中是否有数据科学家呢?
Swanson:是的,我们所有的客户都至少会拥有一个。财富500强公司拥有强大的数据科学团队,但他们可能不会集中在市场营销和客户服务以及人力资源上。内部数据科学团队通常不具有技术或能力完成所有工作。我们是一个75人的团队,其中70人是数据工程师或数据科学家。
对于这一点,我们非常重视,但是我们也已经在构建知识产权,以处理人们需要解决的问题。我告诉我的团队,任何你需要用来让工作变得高效的工具都可以购买。在这样的环境中,有一些相互并不连贯的工具用于连接,清理,探索,数据角力,建模,但它们结合的并不好。我们已经在内部生产中使用了自己的工具,而且我们将会把它们打包并提供给客户使用,这样他们就能使用和我们一样的工具。
你使用什么类型的基础设施来支持你所有的数据处理工作?
Swanson:我们是Amazon Web Services的重度使用者,但是我们的技术还可用于Azure,因此我们并不受困于此。根据数据科学工具,如果你考虑一名数据分析师的路径,它们使用的是R,Python或者Scala语言。我们5%是R语言,大部分是Python,但也处在Scala和Spark的前沿位置。我们建立了真正的预测模型。
数据科学作为一项服务是否成功取决于公司是否以他们最为珍贵的财富(即数据)来信任第三方。你是如何克服这一信任问题和数据安全考量的?
Swanson:数据隐私和安全对我们来说是相当重要的,而且我们并不需要个人身份信息。例如,我不需要知道一名客户的姓名是Joe Smith,我可能只需要他的用户ID。因此,我们可以与大型上市公司进行协作。
我们已经通了数据隐私和安全测试,这是由American Express的一个90人的团队对我们进行审查的(American Express在2011年收购了Swanson的虚拟货币公司Sometrics)。还没有一家客户因为数据安全方面的考虑而拒绝过我们。
你正在和如此之多的公司竞争,他们雇用了数据科学家,而且在人才资源有限的环境下,你要如何为你的团队聚拢人才呢?
Swanson:我们在过去一年半筹集了3000万美元的风险基金,而且当我在和VC公司讨论的时候,他们都说我们疯了,认为我们永远无法招到合适的人。我们在三个月内证明了我们业务规模的扩张和增长。现在我们一个月可以收到超过1000份求职数据科学职位的简历。
我们还会穿梭于各种会议、活动,而且我们开展了DS12,这是一项为期12周的面向学生的数据科学实习项目。它是一个真正的并非入门级数据科学课程,而且我们并不对它收费;我们会支付他们的住宿,而且他们会获得少量报酬。我们会向其他公司开放该课程,这样他们也能从中学到东西。这关系到为数据科学领域增值。
像IBM和Microsoft这样的大型科技公司强调大数据分析,而且他们正在寻求雇用数据科学专家。我可以想象类似这样的人收购你的公司,从而迅速获得人才。你是否有被主流科技公司接洽过关于收购的事宜呢?
Swanson:是的,有很多。
对于要如何谈论这个问题我必须谨慎——大公司们已经找过我们,而且我们已经拒绝了,而原因是在这一领域中公司众多,但没有几家知道如何去增值。DataScience可以成长为一家大公司。我们的五年愿景是想成为研究,教育,服务和知识产权领域的思想领袖,而在今天这样的组合并不存在。
博士学位并不是成为数据科学家的前提,你需要成为某项技术,特定业务线的专家,这样我们的人才混合才是独一无二的,而且这对于公司才是有价值的。
与此同时,有很多的自助分析工具来协助人们在没有数据专家帮助的情况下连点成线并作出更好的业务决策。公司需要数据科学家的真谛是什么呢?
Swanson:类似Tableau或Domo的工具对可视化和常识是有好处的,但不适用于影响公司未来的营销决策。它们是回到过去的一扇窗,但这扇窗并不通向未来。它们可以反映公司当前状况,但无法给出公司的未来描述。
我们使用模型做的事包括以95%的准确率预测客户流失。有些客户想知道这样的百分比是真的么?但是想想现在人们是如何做出决策的。他们是在一间会议室里看着Excel表格决策的。我们认为要将科学应用到该过程中来。这是与你的直觉和经验并驾齐驱的另一款武器。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16