
作者Zulie Rane,自由撰稿人和编码爱好者
20世纪60年代以来,大数据在全球范围内生根发芽、不断拓展。根据toOracle的说法,大数据是“包含更多种类、以越来越大的数量和更快的速度到达的数据。”随着大数据的出现,我们现在拥有庞大、复杂的数据集,可以为比以往任何时候都更多的业务问题提供洞察力。数据科学公司在每个行业都涌现出来,分析这些数据以获得商业洞察力。
所有这些商机都直接转化为工作机会。尽管很少有大学开设数据科学项目,但该行业正以贪婪的胃口发展。那里有大量的数据科学公司,几乎每个重要的公司都会有一些数据科学家为他们工作。Bernhardt Schroeder在Forbesthat上报道,根据美国劳工统计局的数据,到2026年,美国的数据科学行业将增长28%。在数据科学领域有大量的空缺职位,所以如果你有技能和兴趣,你可以选择你的选择。最好的数据科学公司是什么?你怎么知道哪一个最适合你?
当你想成为一名数据科学家时,大多数人首先想到谷歌的数据科学工作,或者想在脸书找到一份工作。我们有五大数据科学公司的终极指南,在那里我们讨论了这些大科技公司的数据科学角色。当然,这些都是经典的数据科学雇主,但这份名单旨在超越通常和预期。我想为你提供一些伟大的,也许被低估的选择,以获得一份数据科学家的工作。
当谈到寻找最好的数据科学家公司工作时,有很多因素需要考虑。您可能更喜欢规模较小的数据科学公司,数据科学工作在某个行业,或者您可能有地理限制。我个人更喜欢以客户为中心的公司,有很多范围来探索我自己的数据科学兴趣,但每个人都不一样!我将带你了解我认为作为一名数据科学家工作的最佳公司。我考虑了薪酬、工作/生活平衡和行业重要性的结合--工作有多酷。最后,我根据大小将它们分成了几类。
让我们深入研究一下为之工作的最好的数据科学公司。
微软有很多很酷的数据科学项目和产品。尽管微软以企业和消费者软件公司而闻名,但它是一家科技巨头,仍然是一家令人生畏的数据科学公司。举个例子,他们有一个名为地球的项目,该项目将他们的云和人工智能工具交到致力于改善环境的人手中。他们开发开放源码工具、数据、API和模型,以支持可持续发展工作的技术开发。他们还有旨在缩小“数据沙漠”并为残疾人填补人工智能数据集空白的人工智能辅助辅助项目。
除了令人钦佩的研究和开源项目之外,Microsoft还为消费者、企业和开发人员提供了广泛的产品。您可以使用从Microsoft Word到Xbox的产品。有了如此广泛的终端用户和产品,您可能会找到一个适合您兴趣的领域,或者通过在内部移动来尝试几个不同的产品领域。
他们在世界各地开放了大量数据、分析和助手。您可以选择专注于一个纯粹的数据科学角色,优化销售策略,或者作为一个专注于数据科学的软件工程师工作。这一系列的项目是微软成为最好的数据科学公司之一的原因之一。有很多团队有不同的需求和工作机会,所以你自己看看是否有一个产品领域或团队让你感兴趣。看看一份全面的指南,作为一名职业生涯道路上感兴趣的数据科学家,在微软寻找一份工作。
亚马逊早已摆脱了仅仅是在线书商的日子,成为数据科学家的最佳工作场所之一。(我们有关于如何成为亚马逊数据科学家的aguide。)亚马逊网络服务(AWS)是云服务行业中最大的个人市场份额持有者。就数据科学公司而言,亚马逊是一个雇佣数据科学家的发电站,目的是提供机器学习和数据科学解决方案以及他们的AWS云服务。
除了以AWS为中心的数据科学服务之外,亚马逊还为在线零售客户提供反欺诈产品,使用机器学习来检测他们过多交易中的欺诈行为。
考虑到亚马逊通过其电子商务业务生成和收集的所有数据,亚马逊控制下有许多非常有趣和信息丰富的数据。你不想拿到它吗?亚马逊有大量开放的数据科学定位,从优化供应链到预测需求。对于亚马逊的数据科学家来说,有大量迷人的问题需要解决。
爱彼迎投入了大量艰苦的工作来革新旅游业。爱彼迎很大程度上利用了数据科学家。他们的前数据科学主管表示,爱彼迎“将数据视为客户的声音,而数据科学则是对这种声音的解释。”我发现以客户为中心的公司很适合为之工作。做出的决策是有目的和逻辑的,它们旨在使客户和业务都受益。
爱彼迎利用数据科学改善了他们的服务和搜索,也改善了他们的招聘实践。他们使用数据科学来分析和消除自己招聘行为中的偏见。数据科学公司可以选择使用他们在内部流程方面的大量知识,爱彼迎就是一个很好的例子。他们的自我反省和批评文化是为什么我认为爱彼迎是最好的数据科学公司之一。
爱彼迎数据科学的另一个很酷的地方是,他们在金融、信托和客户体验方面有开放的数据科学职位。有了如此广泛的关注领域,一个数据科学家可以在爱彼迎四处走动,接触许多不同的行业。我一直认为未雨绸缪,想想你接下来的三步棋是个好主意。在爱彼迎作为数据科学家工作可能会导致与金融科技公司、安全部门或更面向客户的角色合作,所以如果这是你感兴趣的事情,请查看Airbnbs开放数据科学位置列表,找到一个适合你兴趣的位置。
有数据科学公司,然后是英伟达。英伟达定义了“加速分析”,它处理数据的速度快20倍,不需要通过使用GPU进行重构,就像他们的英伟达DGX A100S一样。在商业世界里,时间就是金钱,这些优化为NVIDIA的图形卡带来了很多成功。他们让他们的数据科学家使用尖端芯片和图形卡来优化它们,以便处理大量数据。
在英伟达,你有机会改进世界各地数据科学家的工作。您可以对数据科学工作的效率产生乘数效应,这就是为什么英伟达是最好的数据科学公司之一--您有如此高的影响和实现的机会。
英伟达还向客户提供数据科学咨询,并在内部使用数据科学来优化开发产品的受欢迎程度。作为一家大公司,他们有数百个开放的数据科学职位,从数据架构师到数据生成工程师。
Oracle有一个非常酷的云平台,使他们的客户能够通过机器学习模型、可视化和预测分析来利用他们的数据。作为一名致力于开发此平台的数据科学家,您可以开发所有这些奇妙的模型和工具,供最终用户应用于他们的数据。
AnalyticsPlatform拥有“嵌入式机器学习和自然语言处理技术,有助于提高生产率。”这种工作给你一个很大的机会来提高客户的(工作)生活质量。你可以做广告,设计以数据科学为中心的产品,找到组织和分析非结构化数据的新方法,或者在噪音中搜索以揭示意义。
Oracle拥有数以千计的开放数据科学职位,遍布其内部部门,几乎适用于每一个经验级别。鉴于开放数据科学职位的数量,如果你想在许多不同的领域获得声誉和经验,Oracle是最好的数据科学公司之一。
你可能不会马上想到这家总部位于亚特兰大的航空公司,但达美应该被认为是数据科学公司之一。达美航空将机器学习应用于决策科学,“规模之大前所未有”。通过访问德尔塔的历史数据,德尔塔的数据科学家模拟运营挑战,以提出将客户影响最小化的解决方案。作为一个曾因许多航空公司的无能而感到沮丧的人,发现一家正在利用数据的力量优化客户体验的公司令人耳目一新。
作为世界上最繁忙的机场哈茨菲尔德杰克逊国际机场的主要航空公司,效率和优化是达美的关键目标。德尔塔有大量的开放数据科学记录,但其中绝大多数在佐治亚州的亚特兰大。Delta绝对是东南部最好的数据科学公司之一。你的工作范围可以从健康分析到运营决策科学再到数据策略师。谈变化多端!
Splunk的主要产品是acentral data Platform,它允许用户以安全的方式监控、调查、分析和处理他们的数据,从而更有效地操作。他们的机器学习内置包括离群点检测、预测、事件聚类和预测分析。就数据科学公司而言,如果您对硬核机器学习模型有热情,那么Splunk将非常适合您。
他们的中央数据平台允许跨多云环境的数据流。Splunk的平台还具有对结构化和非结构化数据执行实时搜索的能力。看看Splunk的开放数据科学位置。
作为自称的“混合云公司”,Cloudera允许客户将私有云和公有云结合起来。这意味着您可以混合内部和外部数据,为客户提供更强大的洞察力。Cloudera凭借其强大且可扩展的云数据平台,在数据科学公司的世界中独树一帜。他们的Cloudera data platform(CDP)混合云运行在客户机数据所在的地方,使其工作更快、更安全。
Cloudera的数据科学家倾向于更多地关注数据管理和他们的机器学习平台,所以如果你对这些重点领域感兴趣,请看看这里。
分子是一家专注于电子商务客户洞察的数据科学公司。他们的目标是提供洞察力,“帮助你向消费者推销--而不是人口统计数据。”分子专注于他们的产品易于实现,并声称它可以在购买后72小时内发布。
分子是最大,最多样化的消费者购买面板。他们提供大量数据,并竭尽全力提供分析。数据科学家的工作是直接从消费者那里收集数据,并对其进行分析,为分子的客户提供洞察力。Menerator喜欢让他们的数据科学家尽可能自主地工作,这样您就可以将项目从初始阶段推进到生产阶段。如果你喜欢开放式问题的非结构化工作,分子是最好的数据科学公司之一。看看分子的职业门户,在那里你可以为客户提供有价值的市场分析。
与Cloudera类似,Teradata是一个混合云平台,允许您将公共云(如Azure和AWS)与内部解决方案混合在一起。像许多数据科学公司一样,Teradata也向企业客户提供咨询团队,以帮助最大限度地利用他们的解决方案。
他们的主要产品Vantage是包含集成分析功能的软件,可以在多个混合平台上执行,以提供大规模的洞察力。
您可以在高度并行和高效的发行版中扩展所提供的分析功能(ML、统计、文本等)。Teradata对他们的工作和验证采取了学术方法,因此他们鼓励申请专利、在期刊上发表文章和参加会议。如果你想成为一个数据智囊团,Teradata可以为你提供一个优秀的专业社区和连接,让你成为一名数据科学家。
Teradata的定位遍布全球,他们甚至有“数据科学家算法开发工程师”这个非常酷的角色。如果你想将对数据的热情与对算法和优化的深入了解结合起来,Teradata是最好的数据科学公司之一。
Databricks的LakeHousePlatform是数据湖和数据仓库的组合。它们的目标是像数据湖一样具有成本效益,同时提供通常与数据仓库相关的高端数据管理和性能。
他们希望消除数据孤岛,将分析、数据科学和机器学习融为一体。Lakehouse构建在开源平台之上,以最大化其可用性和灵活性。数据科学公司可以非常保护他们的专有系统和软件,所以我认为Databricks选择在开源平台上构建他们的主要产品是非常酷的。
他们的开放数据科学家职位具有很大的影响力,因为他们的职责包括塑造他们的数据科学解决方案的方向,包括“预测、产品分析、流失预测和洞察力、细分和建议”。您还可以在整个公司范围内代表数据科学,并促进数据驱动的心态。
他们有数据解决方案架构师、机器学习平台工程师、分布式数据系统工程师,以及更多与数据科学有关的人。
有很多公司雇佣数据科学家。数据科学工作需要机器学习或数据科学的专有平台,或者在另一个行业使用数据科学。最适合你的公司和职位取决于你的兴趣爱好。
如果你对环境非常热情,你可能想作为一名数据科学家为微软的Earthfrom做一个类似AI的项目。然而,如果您对纯数据有强烈的热情,并且对电子商务感兴趣,那么分子可能是更合适的选择。
好消息是你被宠坏了选择。如果你没有正式学习过计算机科学或数据科学,我认为留在你所处的行业并在那里寻找数据科学的职位是个好主意。你现有的背景知识将使你比其他不了解该行业的数据科学家更有优势。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03