京公网安备 11010802034615号
经营许可证编号:京B2-20210330
利用大数据做股权投资?投资人说“作用有限”
“双创”背景下各类创业项目层出不穷,如何在海量的项目中寻找亮点,如何提高投资前期的项目筛选和调研效率?如何给项目定一个合理的估值?这些问题困扰了不少投资人。
证券时报·创业资本汇记者发现,针对创业投资存在的痛点,有创业者开始利用大数据和人工智能来研发服务创业投资机构的相关产品,如大数据筛选项目、大数据做估值模型、大数据判断创业项目的有效专利等等,且此类的多个项目已经获得融资。然而,在信息不对称、非标资产为主的创业投资领域,大数据究竟能否派上用场?业内人士接受记者采访时表示,大数据或人工智能之类的工具或许能够提高投前研究阶段的效率,但从项目尽调之后就不太用得上,因此这类工具或许有一定的价值,但价值不大。
创业者:大数据助力
破解信息不对称
当前创新创业热潮迭起,但在投资市场上,投资方与技术型企业在对某项技术的认识常会出现信息不对称的问题,这容易导致投资上的失误。针对这一痛点,在去年11月的高交会上,德高行CEO白波发布了一款专门服务于创业投资领域的新产品“知情君”,通过自身研发的专利大数据与算法分析的方法,将投资机构最关心的企业技术问题进行分析展现。
白波向记者举例,在分析一家成长期的建筑行业的企业技术数据时可以发现,该企业虽然名称中包含“建筑”,但其专利技术结构更接近新能源,对比同行业的另一家公司,该企业的绿色发电技术更处于细分行业的领先地位,结合其财务状况可以更好地理解该企业的技术驱动力与发展潜力。“知情君可以帮助投资者理解企业的技术方向与技术优势,对比同类企业的技术特点与差异,挖掘企业技术积累与商业潜力的互动关系。”白波说。
大数据的应用还首次在母基金上试水。去年11月,宜信财富发布了国内首个私募股权母基金投资人工智能平台,该系统可以从60多个维度来展现一只直投基金的投资情况、业绩、基金、管理人等各方面表现的详尽报告,从而提高对基金的识别效率。据介绍,宜信推出的“AI+FOF”系统类似一个超级“金融大脑”,能实时地抓取、分析、结构化剖析各个基金背后的投资逻辑,不断进行追踪,通过技术和母基金团队经验进行双向赋能。宜信母基金管理合伙人廖俊霞向记者介绍,AI的应用可以从三个方面极大地提高私募股权的投资效率:第一是提高准确性;第二是加强投后管理;第三是判定行业风向标。
此外,还有创业者探索用AI的方式来破解传统的股权价值评估痛点。“传统的股权价值评估需要请会计师、评估师、律师等,成本高、时效性不强,应用的场景单一。而现实情况是企业家也不知道企业值多少钱。”前海梧桐(深圳)数据有限公司创始人李小强说,针对这一痛点,前海梧桐数据利用大数据、AI、区块链等新技术,推出业内第一个个人股权账户管理APP——金谷子,该工具为企业的AIEV估值提供了五种以上的应用场景,用互联网的方式提供一种实时、高效、低成本的估值服务,实现全网可查可比。
据记者了解,当前针对一级市场已经有不少投资管理产品,包括基于数据库的清科私募通、Fellow Data、因果树、IT桔子、36氪创投助手,以及提供SaaS服务的VC800、VC SaaS,此外还有少数华兴Alpha等FA的相关产品,但这些产品都尚处于发展期。
投资人:大数据对
股权投资作用有限
“大数据或许在筛选项目时起到一定的作用,但在其他阶段就不太用得上。”深圳一家FA机构人士叶女士告诉记者,在看项目的过程中,大数据的工具和产品可以通过公开新闻和信息抓取出哪些项目当下比较热、哪个APP下载量大、哪个公司招人比较多,还可以做相关项目所处行业的横向和纵向对比,这一定程度上为她们看项目节省了时间。
叶女士所说的这类大数据产品包括创投圈内已被广泛使用的企名片、鲸准、烯牛数据等,但这类产品的功能多集中在项目筛选和行业的简单分析阶段,“相对于企查查和天眼查而言,这类工具主要面向机构投资人和FA机构,所以设计上也迎合了我们的需求,我们操作起来也很便捷。”叶女士说。但在她看来,大数据应该难以企及项目估值预算这个层面,“估值模型可能有一定的参考价值,但是每个行业的估值逻辑都是不一样的,不同的行业有不同的评价维度和系数。”
千乘资本高级投资经理雷鑫也持同样的观点,“一级市场投资就是赚信息不对称的钱,创业项目的技术、产品、构架这些判断是无法量化的,需要跟团队、专家、同行或者竞争对手去了解,信息反馈回来后最终做相对主观的判断,因此辩证来看,大数据的工具可能有价值,但价值没那么大。”雷鑫介绍,比如在估值测算上,投资机构会看项目,也会对比竞争对手,但实际上市场上不存在完全一样的竞争对手,业务肯定会有差异化的,在这种情况下,用大数据去测算估值只能起到一定的参考作用。
此外,大数据在股权投资市场上的应用还要看行业。“互联网行业的信息比较公开,但如果是工业领域,则需要对行业上下游资源都很熟悉,通过专业渠道去了解项目情况。”雷鑫认为,大数据的应用或许在移动互联网和互联网创业项目的投资上有一定的作用,但已经有多家机构在这些领域的数据上做文章了,而且抓到的也只是公开的数据汇总和简单的分析,价值不是很大。而在投后服务方面,雷鑫认为,这个环节完全用不上这类工具,“投后服务主要是非标资源的服务和对接。”在雷鑫看来,大数据二级市场上的用处会比较大,但在股权投资上真正形成智能化、深度学习的阶段还远未到达。
前海母基金管理合伙人李思平此前接受记者采访时也表示,在母基金筛选子基金方面,肯定离不开技术手段,包括基于大数据的人工智能技术,特别是在数据分析方面可以提高筛选效率。但投资终究是投人,还有很多方面是需要定性判断而非定量判断,技术可以作为手段,但不会取代原有的分析方法论。
对于这类项目而言,雷鑫认为,这类工具和产品的形成大致可分为数据采集和数据分析两个步骤,在数据采集方面,可能有些创业者会有一些比较独特的数据,比如项目的商业计划书是PDF版本的,需要用到一些字符识别的工具把数据抓取出来,这在一定程度上有点门槛;而在数据分析上,抓过来的数据需要基于行业和客户需求做筛选,这涉及到大量的人力投入,但数据分析的程度大多处于比较初级的阶段,技术壁垒不是很高。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20