京公网安备 11010802034615号
经营许可证编号:京B2-20210330
靠大数据赚钱的10个例子
从 2012 年到 2015 年,大数据持续发威,IDC 市场调查机构预测 2017 年大数据市场将价值 324 亿,拥有这样“Big Data、Big Deal”远见的人,正在利用大数据激荡出最有创意的构想,用数据的力量来创造出大量的价值。从让资料搜寻分析平台,到利用大数据帮助癌症治疗,大数据新创公司这几年内如雨后春笋般出现,2015 年这些“Big Data Startups”也会持续挖掘大数据的价值、微调其企业策略,期盼在市场中展露头角。以下几家新创公司都已经各自获得好几轮金额可观的融资,在大数据市场中十分有潜力,值得我们关注并参考,从中瞭解大数据的应用方向及潜能。
SumAll
SumAll 是一家位于纽约的新创公司,成立于 2011 年,主要为中小型企业提供即时数据分析服务。SumAll 的线上分析平台收集社交媒体及电子商务上的数据,并进行分析后,把可视化的分析结果展示在互动介面上供企业客户参考。例如社交页面上的网页流量、ebay 上的销售量等数据,生成每星期、每个月的分析报导,让企业客户追踪且分析使用者/消费者。
这家公司还有一个很酷的地方:他们分了百分之十的股份给旗下的 SumAll.org —— 一家旨在用资料分析增加社会福利的非盈利组织。
Luminoso
Luminoso 成立于 2010 年,原本是麻省理工大学媒体实验室的一个研究项目,后来发展成利用人工智慧进行文本分析的新创公司。从通讯工具里的讯息、网络上的评论等数据来源,利用自然语言处理和机器学习技术,帮助企业分析消费者在各种通讯渠道中讨论的话题。
举例来说,Luminoso 提供的服务可以帮助企业追踪时下发生的热门讨论,还可以根据需求迅速回应,如果消费者对于某产品的缺陷在网上进行了投诉或者抱怨,企业可以及时进行补救。
Flatiron Health
同样发源于纽约的 Flatiron Health 成立于 2012 年,是大数据应用界中是十分有名的“医疗大数据技术”新创公司,主要专注于癌症数据分析1。
Flatiron Health 透过各种管道收集病患的临床纪录、医师诊断纪录、患者治疗结果、基因数据及缴费纪录等数据,透过分析整合后提交给肿瘤学家,透过分析过往的治疗方法跟纪录,帮助医生做出更好的临床诊断跟医治手段。全美现在有约 1000 名肿瘤学家在使用 Flatiron Health 的数据。
Flatiron 的分析平台 OncologyClound 百分之百致力于分析肿瘤学数据,不过 Flatiron 公司也表示,现在全美只有 4% 的癌症病人参与临床试验,另外 96% 无法取得的癌症病人数据则成为大数据分析中的缺口。
Domo
Domo 成立于 2010 年,总部位于犹他州盐湖城,是一家为企业决策层提供商业智慧(BI)的初创公司。2014 年就累积了约有 500 多家签约客户,其中包括了 National Geographic、eBay、Ogio 及 GoodWill 等。
Domo 的商业智慧云端平台可以即时分析多方资料,将多方来源提供的结构化及非结构化数据以即时、视觉化的方式呈现出来,不但帮助企业做决策,也是一个业务管理平台。
Tamr
Tamr 成立于 2013 年,其技术来自于麻省理工的电脑与人工智慧实验室,由麻省理工学院教授兼数据专家 Michael Stonebraker 跟种子投资家 Andy Palmer 共同创办,在 2014 年正式营运。
大数据的其中一个问题就是资料量太大了,而且资料来源剧增又不断变换,Tamr 的机器学习演算法跟软件能有效而大规模地广泛整合和管理现有和未来的多种数据来源,大量降低数据来源的搜集与连结所用的时间,同时辨别资料来源及之间的关联。
Alpine Data Labs
Alpine Data Labs 成立于 2010 年,总部位于旧金山,算是十分有名的大数据分析挖掘软件新创公司,该公司总裁兼首席执行长 Joe Otto 和首席产品长 Steven Hillion 都来自于被云端储存服务提供商 EMC 收购的 Greenplum 公司。
大部份的大数据新创公司都在做“资料可视化(Data Visualization)”,Alpine 则是提供大数据及 Hadoop 的预测性分析功能,且号称是全球第一个针对大数据的团队合作分析解决方案。
DataStax
DataStax 成立于 2010 年,总部位于加州,在去年 9 月曾获得惊人的 1 亿 600 万美元 E 轮融资。
DataStax 主要业务是开发和销售开源分布式数据库 Apache Cassandra 的商业化版本。Apache Cassandra 是高扩展性、高容错的 NoSQL 数据库,比传统的关系式数据库多了许多优势,其设计不仅兼顾了扩展性和开发灵活性,而且搜寻效率也相当不错,特别适合大数据的储存,像是 Cisco、eBay 等大公司都在使用这种数据库。
Altiscale
Hadoop 在这几年内被公认成为大数据的主流技术,而 Hadoop 也是 Altiscale 这家新创公司能够迅速成长茁壮的原因。
Altiscale 成立于 2012 年,总部在加州 Palo Alto,其 CEO 兼创办人是曾在 Yahoo 任职首席技术长(Chief Technology Officer)的 Raymie Stata ,其高层还有同样来自 Yahoo 曾担任首席架构师(Chief Architect)的 David Chaiken。相信大家都知道 Yahoo 就是 Hadoop 的发源地,那这家由 Yahoo 前任高管们所创立的大数据公司主打“Hadoop-as-a-Service”也就一点都不奇怪了。
Altiscale 的服务是解决 Hadoop 的抽象性与复杂度,为工程师搭建一个完整的 Hadoop 环境,并且对其进行维护与管理,让使用者可以更专注于数据和应用。
WibiData
WibiData 位于旧金山的创业公司,成立于 2010 年,联合创始人 Christophe Bisciglia 为企业数据管理分析公司Cloudera 的联合创始人之一,WibiData 的另一名联合创始人 Aaron Kimball 则是 Cloudera 聘用的第一个工程师2。
这家公司所开发的 WibiEnterprise 平台是由一系列的开源Apache 技术建构而成,其中包含了 Hadoop、HBase 和 Cassandra,以及用于即时收集、分析、服务数据的 Kiji 开源框架,其平台的功能是为消费者即时打造客制化的推荐内容及相关搜寻结果,和电子商务龙头 Amazon 所做的类似。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16