京公网安备 11010802034615号
经营许可证编号:京B2-20210330
我们用“大数据”做空_数据分析师考试
不是标题党,确有其事,不过不是我们做空,是我们帮助客户做空,那还是我在律师事务所做专职律师时候的事。
大家如果对反垄断法有一定的了解的话,就知道如果两个(或以上)企业之间发生集中(比如兼并收购),且参与集中的企业达到一定的规模(比如营业额达到一定的标准),那么这个集中就必需先申报(比如在中国向商务部进行申报),待申报被批准后方能实施集中。反垄断申报的目的在于防止一个集中会破坏一个相关市场的竞争秩序,从而损害消费者的利益。举个例子,如果可口可乐和百事可乐集中合并为一个企业,那么这个集中就极有可能导致可乐市场的竞争秩序被扭曲和破坏——可乐市场的竞争因为两个主要竞争者的消逝而消逝了,那么可乐的价格就极有可能飙升,从而损害消费者的利益。
如果可口可乐和百事可乐要集中合并的话,那么这个集中合并一定得去相关市场的政府部门申报,与此同时就会有很多券商、对冲基金或者其他人来决定是否做多还是做空这两个公司的股票。如果这个集中被批准的可能性较大,那么做多这两个公司股票的基本面就大——虽然集中可能损害消费者利益,但对两个公司而言是利好,这两个公司的股价就会上涨,因此做多的赢面大。反言之,如果这个集中被拒绝的可能性较大,那么做空这两个公司股票的基本面就大——因为集中申报一旦被拒绝,那么参与集中的公司的股票就会下跌,因此做空的赢面大。当然我用这两个可乐巨头来举例可能太过典型而不具实际意义,因为它们的集中被否几乎就是板上钉钉的事。那我们就用一个实战例子来说事。不过这个例子还是与可口可乐有关。
2008年9月3日,可口可乐宣布计划以现金收购中国汇源果汁集团有限公司(01886.HK)。可口可乐公司建议收购要约为每股12.20港元,并等价收购已发行的可换股债券及期权。可口可乐在宣布之前已取得汇源三个股东签署的接受要约不可撤销承诺,三个股东共拥有汇源66%股份。如此项建议交易获得接纳, 可口可乐付出的对价约24亿美元。该交易若完成,将成为可口可乐到当时为止在中国金额最大的一笔收购交易,汇源果汁也将撤市。
上述消息宣布之后,汇源与可口可乐的股价均大幅上扬。但问题是可口可乐对汇源的收购属于中国反垄断法下应当予以申报的一次集中,该集中是否能得到商务部的批准成为这次交易的X因素,对此有对冲基金找到我们做分析,我们按照我们做此类业务的套路和方法收集了相关数据进行分析(至于是什么样的数据和什么样的分析方法我们在此就不说了)。不管怎样,我们最终的分析结果是商务部反垄断局将不会批准这次集中,幸运的是我们这次分析结果是正确的。相应地,听从我们的建议而做空的客户也就赚了钱。
7年前我们在做上述案例分析的时候,还没有所谓“大数据”或者“小数据”的概念。现在回过头来想想,我们当时(和现在)所做的无非也就是数据分析,当然了,所涉及的数据从总量上看也许不是那么地大,但是相对于具体项目而言已经足够大。当然,是不是一定可以把这些数据看成我们现而今所称的“大数据”也许值得商榷,我们以后另行撰文来讨论,这也是我在本文标题中把“大数据”加上引号的原因。不管怎样,考虑到商务部迄今为止在所有的 1000多件反垄断申报案件中只有2个未获申报,我们当时对概率如此之小的事件能够准确地预判还是令人值得骄傲的,这应当归功于我们收集数据的准确与分析的到位。
如果我们可以把上述成功做空看成是采用“大数据”所做的一个有效分析的话,那么“大数据”分析似乎具有以下几个特点,我们在这里就所谓的特点试图做一个归纳以达到抛砖引玉的目的:
- 大数据分析首先应当是商品。不管数据采集和分析的方法是怎样的,最后出来的产品应当有人化钱购买。没有商业价值的大数据或大数据分析产品是没有价值的,换言之是做不下去的。
-大数据分析产品的开发应当有针对性的客户。不同的客户对大数据分析产品的需求是不一样的。就拿法律行业的上述大数据为例,对大数据及大数据分析产品有直接需求的基本上是做涉外业务的律师事务所及国际大公司,所以上述大数据及大数据分析产品的工作语言基本上都是英语。
- 大数据分析的生命力在于它的准确性。以我们上述案件为例,可口可乐收购汇源被否,汇源股价在紧接着开盘的当天全天暴跌42%。而在这之前可口可乐天价收购汇源的消息曾刺激汇源股价狂飙近200倍。可口可乐在宣布收购汇源果汁之后,其在纽约证交所的股价曾一度出现强劲上升,但在后来的半年里股价下降了20%,这与其收购汇源失败不是没有关联的。可以想象如果我们当时的分析是不准确的,那么客户就得赔钱了。当然,我们这个案件的成功不能不说有一定的偶然性,那么大数据分析是不是有一定的容错?我相信是有的。如果大数据不会犯错,那其就等同于上帝了,但大数据的错误率太高,那么也就没有商业价值,甚至连娱乐价值也都没有了。
在文章最后问一个问题:用数据(不管是大还是小)分析出来的结论来做空算不算是恶意呢?也许这个问题有点“然并卵”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30在CDA(Certified Data Analyst)数据分析师的日常工作中,“无监督分组、挖掘数据内在聚类规律”是高频核心需求——电商场景中 ...
2026-03-30机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23