京公网安备 11010802034615号
经营许可证编号:京B2-20210330
寻找方向:如何看准大数据行业的风潮
大数据不仅仅是一个营销词汇,大数据是一种思维,一种技术。一言以蔽之,大数据最直接的意义就是让“随机性”的事情变得可提前预测,从而提高效率和行动价值。下文主要是跟大家分享大数据领域的创业思考,大数据行业的创业机会如何,未来的创业方向又有哪些。
1 资本层面关注点
对于大数据项目,投资人到底看什么?在写这篇文章之前,我们与多家投行的投资人曾经做过访谈,下面是我们根据访谈内容整理出来的内容。
大数据没有直截了当的变现模式,那么一个新创大数据企业想要获得成功,拿什么去拼?当然是人才。这也是投资人最关注的东西。
投资人告诉笔者,对于一个大数据项目,他们最看重的是团队。那怎么看团队呢?一般从团队技术能力、背景、过往项目经验和创始人四个方面来看。大数据对技术的要求非常高,投资人看项目的时候,首先看的就是创始人的技术能力。一般情况下,投资者会更加青睐拥有技术背景的创始人和他的项目。
还有就是看项目的商业模式和变现能力。看项目方面,投资人会去看你的项目对应的国外成熟企业,或者说你的项目对应的竞争者是谁。由竞争者经营的情况来预估你在其领域的市场份额和变现能力。商业模式方面,投资者会看你的客户(用户)体量和数据源。你的客户群体有多大?你手里有哪些具体业务上的数据?这些数据如何产生价值,应用到你的客户身上?解决好这3个问题就成功了一半。
大数据项目变现方向,投资人关注的是你的项目是否能够快速直接的产生价值,而且有持续的创收能力。
解决好以上几个问题,新创大数据公司想要拿到融资就非常容易了。
2 大数据垂直领域热门的投资方向
①Hadoop 商业化
简单来说就是做Hadoop的收费版本。Hadoop本来是开源的,但是在具体业务场景中,还缺乏很多功能,那么Hadoop 商业化就是去完善这些功能,使其更好的应用于企业的业务场景。Hadoop 商业化最典型的公司就是Hadoop的三驾马车,Hortonworks,Cloudera和MapR,Hortonworks目前已经在纳斯达克上市。中国相应的做Hadoop 商业化的公司是星环科技。
用大白话来说就是基于应用场景下的数据框架 。比如说大数据架构里的查询引擎、存储引擎、计算模型等等,这个主要是基于大数据技术方向的,比如说WibiData,它提供了对Hadoop的封装,连接前端应用到Hadoop基础设施。
③NoSQL数据库
非关系型数据库和云数据库服务。典型的国外企业有MongoDB 和Datastax。目前,创业公司MongoDB的估值已超过16亿美元,而在中国,基础云服务商青云QingCloud已经推出了基于MongoDB的集群服务,名字叫做青云QingCloud MongoDB。
④分析和可视化
对应的国外企业有Tableau、Datameer。国内新创的大数据企业中,也有很多大数据企业在做可视化服务。
⑤行业大数据应用
为社交媒体、广告公司、企业客户、电子商务等行业客户提供数据分析,帮助这些行业提升数据分析的水平,如DataSift、RelateIQ、RocketFuel等创业公司。
3 大数据行业现有的商业模式
谈到商业模式,肯定就要说到2B还2C的问题。
2B是目前大数据行业主要的商业模式,将大数据变为一种服务,服务的对象是企业或机构。比如现有的大数据企业里,星图数据,Hortonworks,Cloudera,星环科技、Talkingdata 都是2B的商业模式。从他们的运营状况,不难看出,2B的商业模式,要么是做解决方案(类似外包),要么就是做工具。
预计未来所有的互联网企业也好,传统企业也好,都会在企业内部成立大数据部门,那么到那个时候,解决方案的市场份额还会多么?不肯到也不否定。对于一家企业来说,大数据就是自己的资产,相信企业更倾向于自己管理自己的内部资产。所以我们大胆的预测,解决方案只是目前大数据行业的权宜之计,未来企业会用自己的人才管理自己的大数据,用自己的人才使用自己的大数据。做工具是目前较为主流的模式。Palantir其实也是做工具。
2C方面,在整理这份内容的时候,我们发现2C的产品非常少。女性经期助手、百度指数这样勉强算是2C的大数据产品。而大数据2C方面的产品,更多的是倾向于应用。可穿戴设备其实也算是大数据应用产品之一。
说了这么多,你肯定会问我了,那么腾讯、百度和阿里巴巴这样的企业,他们的大数据又是什么样的模式呢?在笔者看来,BAT企业的大数据商业模式都是2C+2B的模式,我们可以简称为复合型的商业模式,因为他们服务的用户有企业用户也有个人用户。
总结一下,现有的商业模式里,哪个最好?笔者个人认为是2B+2C模式。这样的模式是最健康的模式,形成了一个商业闭环。
用一句话来说就是:你收集用户的数据,分析出报告,然后给到的对应的企业,对应的企业根据数据反馈,从而开发或制造出更好的产品,让用户享受更智能更美好的生活。这整个过程中,大数据是贯穿始终的。
那么,现有的大数据公司,都是如何赚钱的呢?
①广告、营销
这一类主要集中在第三方大数据营销公司里。典型的企业包括缔元信、时趣这样的公司。他们主要的业务就是帮助大数据分析能力较弱的公司来做大数据分析,优化广告和营销的路径,使市场投入的非常产生更大的价值。
②直接卖数据的公司
典型的企业有数据堂。
③做工具或者服务
目前的移动统计工具就是这一类,还有做Hadoop套件的也是这一类公司。
④卖报告或解决方案的
做大数据解决方案的公司就太多太多了,典型的公司为IBM。
⑤跨界和融合
Talkingdata联合创始人蒋奇先生告诉我们,Talkingdata后台有移动互联网各个热门手机游戏的数据,包括用户的设备数据、行为数据、日常数据和游戏里的消费数据等等。根据这些数据,可以对这些游戏用户进行用户画像。
以招行信用卡推广为例,Talkingdata通过大数据分析发现,《刀塔传奇》以及《我叫MT》这两款游戏的用户属性和招商银行信用卡中心需要的用户属性很契合,于是促成了招商银行和的合作,还支持了后续的信用卡积分的礼包和活动等。
这次合作为招行信用卡带来了5万个绑定用户。一般情况下,银行类的应用要实现转化的平均成本在两百到三百块钱之间,而这样的跨界合作,招商银行基本上没花一分钱,就达到了5万转化率,理论上省掉了上千万的费用。这就是跨界和融合。
跨界和融合,其实也是大数据思维里最重要的一环。大数据就像是钱一样,你得让它流动起来才能产生价值。
4 大数据行业的创业方向和机会
①2B方向
大数据创业的2B方向,更多的是做工具和服务,如数据可视化、商务智能、CRM等。
现有的大数据工具有着技术门槛高、上手成本高、和实际业务结合较差以及部署成本高,小公司用不起等特点。那么新创企业就可以根据以往这些产品的缺陷,来做更适合市场和客户的大数据分析工具和服务。另外,将大数据工具完整化和产品化也是一个方向。新一代的大数据处理工具应该是有着漂亮UI,功能按键和数据可视化等模块的完整产品,而不是一堆代码。
②2C方向
大数据一个很大的作用就是为决策做依据,以前做决定是“拍脑袋”决定,现在,做决定是根据数据结果。在我们的生活中,需要做决策的时候太多太多,尤其是像笔者这样选择性困难的天秤座,非常需要大数据来辅助决策。个人理财(我的钱花哪去了,哪些可以省下来)、家庭决策(孩子报考哪所大学)、职业发展/自我量化(该不该跳槽,现在薪水到底合适不合适 )以及个人健康都可以用到大数据。
5 我们的创业建议
①想清楚谁为你买单(找用户);
②痛点是什么(找需求);
③稳定/独特的数据源(找数据);
④靠谱的人做靠谱的事(找人才);
⑤考虑2C的产品方向;
⑥忘记科技行业过往经验;
⑦将大数据产品化(小而美);
⑧深耕一个领域,不断的试错和迭代。
其他新创大数据公司创始人也提出过自己的建议。九次方大数据集团总裁王参寿认为深耕大数据领域,坚持才是王道:“大数据行业创业就像爬泰山,爬不到山顶,看不到太阳。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06