
大数据创业,绕开BAT,找准红利方可成功
随着大数据时代的到来,其中产业链的红利也将逐渐呈现,催生了诸多相关的创业项目。笔者以一家定义为大数据加工、分析、流通的创业公司“云见”为例,探讨下数据在流通过程中增值的可能性。
大数据的红利在哪?
处在大数据最上游的是数据产生端,其中最有代表性的是BAT这样的企业。与数据生存者对应的另一端是需求端,即服务主体,同样是包括政府、机构、企业、个人。而处在中间的则是数据的处理加工商,如云见这类公司。
那么,红利在哪里呢?首先,数据生产端红利已尽。BAT因为自有数据资源可以自嗨,比如百度有“百度迁徙”、“百度精算”;阿里有 “阿里云”、“支付宝-花呗”;腾讯有 “腾讯云分析”,BAT自产自销模式代表了大部分拥有数据源的玩家。
那么剩下的红利就集中在了中间部分,其中有两种模式:
模式一:与业务场景结合,做产业类平台,如同花顺、恒生电子。
模式二:数据的再加工利用,即从运营商、互联网公司获取原始数据信息来进行分析,再提供给用户关于价值和趋势的信息以换取价值。
相比于模式一的深耕,模式二因为进入门槛、资源要求度都相对较低,所以云见选择以这种形式进行切入。
既然类似云见这样的小微企业,先天没有数据源的优势,那么如何让数据在流通过程中增值呢?
让数据在流通过程中增值的方法
(1)降低数据来源的成本
最普遍的方法包括通过第三方购买数据、爬虫爬回数据、合作方授权数据、免费的开放数据。数据获取中肯定要付出人力、资金成本,所以解决数据源是大数据创业公司首要面临的问题。
目前行业做得较创新的是“数据堂”,这家作为挂牌新三板的第一个大数据资源公司,采用“众包”形式,由服务企业提出需求,数据堂直接通过众客堂采集数据。同时,众客堂用户也是处理数据的方式,可甄别数据真伪和有效性。
当然,相比于成熟型的数据公司,云见还未具备这样的数据采集实力,所以其倾向于用合作授权数据的形式,低成本获得独家数据源。
(2)着眼于未来的数据加工
数据加工包括整理合并、优化、排错等方面,数据本身庞杂无章,精炼后的数据能够发掘其中的规律性而进行精准应用。当然,这只是数据加工的通用价值,大数据创业公司关键要解决数据价值深化或兑现的问题。
云见做出两个选择:
与垂直领域对接发现价值
因为消费升级、移动互联网的人口红利消失,那些大规模的对受众社会属性不加区分的水平产品很难生产。在大数据时代,通用型信息的价值正减小,任何拥有数据加工能力的人都可说出用户画像,但针对垂直领域的数据价值需求则需深耕才能解决。
预测未来比看见现在更重要
云见从成立之初就专注在“算法”上,用模式识别的方式形成自己的经验库以预测用户的未来行为,区别于竞争对手赚解决方案服务费的方式,这也符合其技术驱动型团队的特点——更看中“稳”而不是“快”。
(3)用“mall”的形式
作为大数据元老级公司的“数据堂”15年推出了国内第一家网上数据商城“Data Mall”,数据商城的形式最大化地提高了数据交易效率,简单理解就是在通用的入口,用户可以进行重复消费;同时,平台方通过商城获得接入用户的机会,用户成为“传感器”——作为流量入口,又将数据反馈至商城上,担任消费端和供给端的双重角色。
云见也在筹建这样的“轻模式”,除了上述提及的优势,考虑到基于用户需求的非标准化特性,API接口(应用程序编程接口)本身是很难进行标准化的,所以“mall”的呈现方式在一定程度上解决了API形式上的标准化,同时,“mall”改变了传统打包服务的模式,减少在销售、推广、人力上的成本。
当然,大数据创业的成功还有一部分因素是依赖在大势上。
(4)政策上的大势
2015年7月,国务院办公厅发布《关于运用大数据加强对市场主体服务和监管的若干意见》,这是顺应大数据时代潮流,运用现代信息技术加强政府公共服务和市场监管,推动简政放权和政府职能转变的重要政策文件。
文件表示将充分认识运用大数据加强对市场主体服务和监管的重要性、运用大数据提高为市场主体服务水平、运用大数据加强和改进市场监管、推进政府和社会信息资源开放共享、提高政府运用大数据的能力和积极培育和发展社会化征信服务等。
(5)行业上的机会
目前较有代表性的大数据公司是“数据堂”和“聚合数据”,共同特点是拥有如BAT量级的大B用户。但相当部分的小B企业以及政府决策、公共服务、金融、电信等领域对数据存在需求,再加上数据供给端也出现了多元化的现状,所以大数据行业本身很难做到一家独大,类似于云见这样较小型的数据处理公司还是有机会在其中馋食大数据的红利。
创业的机会在哪里
池静若认为现在大数据产业链才开始发展,大众都把目光聚焦在大数据的两端:一是谁拥有这些数据,二是这些数据到底如何使用。但仅仅在两端是不能解决大数据问题的。
大数据产业的大量机会出现在中间环节,包括采集、聚合、机器学习加工后的数据通过智能管道合法流入到用户的手里。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13