
抓住大数据时代的精髓 展现其现实的魅力
在被热情的听众挤爆的西南财经大学柳江校区演讲厅,央视年度十大科技创新人物周涛,用了整整2个小时的酣畅演讲和交流向听众展示了大数据时代的魅力。
大数据时代是如何到来的?大数据产生的商业模式,将为企业带来怎样的发展机遇?大数据又能否支撑起国家经济社会的发展战略?面对这些宏观而现实的问题,思维缜密的周涛一一道来。针对人们关心的创业创新话题,周涛则表示出对下一代年轻创业者的期望。“要用你的一生去做伟大创新。”
(周涛教授现场和大家交流)
周涛教授本次演讲主要包括以下几方面的内容:
第一 什么力量把我们推动到今天这个所谓的大数据时代
第二 大数据怎么样去支撑整个中国未来经济社会发展的重大战略
第三 大数据的精髓和现实魅力
第四 对下一代,我们期望你们做什么样的一代人
1、大数据时代,不仅是技术和算法的变化
现在大数据这个概念很热,我希望通过这场论坛让大家能够去甄别:哪些是真正大数据创新、哪些是伪大数据。
驱动大数据产业发展走到今天,有三个趋势。第一个趋势是数据爆炸性增长。现在每天在亚马逊有几百万数据,淘宝有10多亿数据,互联网有4万多亿网页。这意味着,普通人甄别信息能力和可获得信息量爆炸性增长,这之间的矛盾我们把它叫信息过载。
很多商业模式都来自于此。比如说互联网上怎么样找喜欢的歌、喜爱的商品,甚至大家到百合网、珍爱网找个好对象,这就涉及对无穷多的信息处理。大数据中典型的商业模式,就是精准广告搜索推荐等。
第二个趋势就是数据形态正发生变化。比如,以前我们用excel表格管理一名学生,知道是男是女、在哪毕业、家庭住址等。有了这些数据,我们就可以通过建立回归、关联等方法,得到变量和变量的关系。举个例子,成都某中学哪些学生毕业后发展更好,女孩子是否更适合会计专业等,这些都不是大数据,这是几十年前的时候早期数据。
而现在我们面临的绝大部分数据都是非结构化数据,比如文本、视频、语音、图像,还包括社会关系网络,它们也有着巨大价值。举个例子,假如我们靠某个人手机行程的轨迹数据,只要有3年或以上的追踪,比如他经常去五星级酒店、高尔夫球场和高档会所,就可以很好地判断其经济收入水平。再往外延伸,比如我3年前曾经在北京帮一个关于医疗的手机APP做过一个商业项目。他们提出需要,要找在北京医院工作的医生。这些医院的经纬度我们是清楚的,但如何判断进出这些医院的人哪些是医生呢?通过比对这些医院进出人员的频次,我们发现如果某人进入医院很快就出来,那么他可能是病人;如果进入医院再也不出来,可能就去世了。我们从中找出那些每天有规律进出的人,很大可能他们就是医生或医疗工作者。
第三个大的趋势,是大数据真正不一样的地方,就是数据的关联发生了变化。以前的数据是单独的,比如一个人,淘宝知道他买了什么东西,新浪微博知道他有什么朋友,医院知道他患了什么病,但这些对同一个人的数据是没有打通的。我们现在通过商业模式、技术资本,可以把这些数据打通。比如阿里巴巴投资新浪微博,两年前推出新淘浪;还有企业通过一个软件管理所有社交账户、豆瓣账号、支付账户等,这里面带来一个很好玩的事情,就好像围绕一个人360度拍照,知道这个人的全息影像,就可能带来很大商业价值。比如这个人的征信。但这也可能影响到他的隐私。所以大数据的第三个挑战是,如何在安全隐私可控的情况下,充分利用这些关联数据来形成1+1>2的价值。
大数据时代不是说某种技术或者某种算法的变化,而是某种理念的变化。大数据是针对关联异构化数据深度分析。从关联性看,是生活方式、商业模式、管理流程等一切颠覆性变化的总和。未来新型的企业,乃至政府,对于他们而言数据的采集分析都是核心战略。
2、如何运用大数据,对企业进行征信评级
第二个大方面,大数据是怎么样在某些方面支撑一个国家的经济社会战略发展?
首先就要求创业者要把握好社会发展整个趋势。在今天创新创业驱动发展过程中,企业遇到的痛点是什么?创新企业尤其是小微企业,大多是轻资产企业,这些企业创业想的是先做个APP,而不会去拿一块地。绝大多数创新企业没有资产可以质押,他就没法通过传统渠道进行融资。
通过双创驱动解决中小微企业融资难问题,也是诸如数联铭品这类大数据公司的主要内容之一。我们怎样用大数据来解决这个问题?因为我们的目标是对企业进行征信评级,对公司债进行定价。解决这个问题不是走传统的道路,我们是在互联网上采集大量公开数据,包括它所处的行业、注册资本、实缴资本、股东、董事等方面。有了这些信息,我们再结合企业发展得到几个要素:第一,你所处的行业市盈率好不好,盈利情况,有没有上市潜力;第二,你是否存在关联交易的风险,比如你的股权关系是否有风险;第三,看你的董事、监事、高管和投资方关系,看你背后投资方和股东是不是优质良好。
其次,我们还有大量公司资产数据、人力资源招聘数据、招标投标数据和法律诉讼数据等。例如,一个企业发展好坏,很大程度上可以通过人力资源招聘看出来。同时,还可以看企业在招投标中胜出几率、价格。另外,企业有没有法律诉讼,尤其是关于合同、股权诈骗的诉讼,是评价企业很好的指标。利用这些指标,我们就可以不依赖于企业主动提供的有可能虚假的财务报表,对企业的信用和风险进行全面和精准的评估,从而推动真正针对小微轻资产企业的征信评级和公司债定价,这就是非常典型大数据运用。
从这些方面看,我认为大数据的分析和运用,一定程度上可以支撑国家的经济社会战略发展。
3、如何在3万人中,找出最孤独的那一个
我觉得大数据的精髓,就是能够把数据外部化。比如,谷歌曾经把它大量的搜索数据与疾控中心传染病报告的人数做了一个关联分析,实际上就是一个简单的线性回归模型,它最终能够比较好地预测传染病的流行,并且能够提前一周预测出突然的上升和下降。这个例子就说明了,表面上看起来是我的搜索数据和你传染病模型是风马牛不相及的事,但却通过这些数据解决了你的大问题。
我们在电子科大还做过一个课题——寻找校园中最孤独的人。我们从3万名在校生中,采集到了2亿多条行为数据,它们来自学生选课记录、进出图书馆、寝室,以及食堂用餐、超市购物等数据。通过对不同的校园一卡通“一前一后刷卡”的记录进行分析,可以发现一个学生在学校有多少亲密朋友,比如恋人、闺蜜。最后,我们找到了800多个校园中最孤独的人。他们平均在校两年半时间,一个知心朋友都没有。这些人中的17%可能产生心理疾病,剩下的则可能用意志力暂时战胜了症状,但需要学校和家长重点予以关爱。
这些例子,其实都透露了大数据的三个精髓:第一个,是数据的外围性。例如一卡通的数据,其实来自学校的后勤集团,本质上是一种消费数据,但我们利用这种数据来预测学习成绩、观察学生作息是否有异常,通过看起来没有关系的数据去透视问题;第二个,是数据的群集性。光有一张卡,你分析得再清楚,也看不出什么问题,只有把这张卡放在3万张卡里才能看出端倪;第三个,是这些数据其实存在很多年了,一卡通和学校的心理健康中心都存在十几年,但一直没有发现两者之间的关系,为什么?因为缺乏数据科学家,需要有人针对这些数据去进行分析。
4、年轻人创业,首先要考虑格局与方法
讲完了大数据,我还想对大家说一句,不管你们是要创业或做什么事情,都要考虑两个问题:格局和方法。
第一,你要思考自己做的事是否具有原始的重要的创新性?例如谷歌开发阿尔法狗,以前很多人都认为这是不可能的,但这件事的美妙之处就是在于,把以往不可能的事情变成可能。你要用你的一生去做伟大创新。企业的核心价值是它对社会的贡献,而不是挣了多少钱,选择的方向很重要。
其次,你们的价值观不能高度统一。你们一定要想清楚自己喜欢什么,如果你想的和全社会都一样,那么你其实可以消失了,因为有你没你都没关系。
最后我还想说,你要有战斗的情怀。今天很多人可能觉得我讲的这些都是务虚的,但人在不断往前走的历程中,你会发现我讲的这些都是需要的。
我对自己的定位,是希望我的工作和人生能去影响下一代,你们也要去想如何成为一代人的榜样,如何抓住这个时代脉搏发展中所缺失的东西。
另外,在人的一生之中,千万不要怕重大挫折和痛苦。从这个问题出发,我还想给大家讲我比较欣赏的一句话,是儒学乃至中国文化传统中着名的“十六字心传”——“人心惟危,道心惟微;惟精惟一,允执厥中”。我主要想讲的是中间这个“惟精惟一”,它说的是什么呢?
人生之中会有很多诱惑,但你要把所有能量集中起来做唯一的事,其他的事都不重要,不要把事做碎、做杂,很多事情你都想要做一做,那你就很难登上巅峰,所以,不是你的核心事情,不要去做。
5、大数据进行征信评级,同样需要保护企业隐私
问题1:你更多精力放在学术还是公司管理上?技术人才如何担当公司创始人?
周涛:我一方面做纯理论研究,我的这块理论研究其实是很难产业化的。另一方面,我在企业里主要进行战略决策、市场资源整合,以及投融资事务。我认为,任何一个人靠一己之力都很难撑起所有,像我就很难管理超过10人的团队。那么他如果想要成功,就要具备两个能力:一是领导力。不断给团队打鸡血,朝着共同的梦想去战斗;第二个是被领导的能力。你要给团队成员充分权力去做决策,你就跟着这样的决策走就是了。总之,千万别想让自己变成一个多面人,或去学着做一些本身不擅长的事情。
问题2:作为一家大数据公司,数联铭品如何保护企业隐私?你们开展企业征信业务,被你们“评级”的企业是否具有知情权和异议权?
周涛:我们的数据有两个来源,第一个是公开数据,例如企业工商登记中必须公开的法人等信息、法院判决的公开文书等,我们采集这些数据做成报告,这块不涉及隐私;当然,还有一部分数据的确涉及隐私,例如企业财务的真实数据。当我们在为企业提供服务时,就需要征得企业的授权,去查看这家公司的真实财务数据;如果企业不授权,我们就不会用这些数据。征信业务这块,目前我们拿到了企业征信牌照,企业如果向我们申请征信时,我们会告知这些征信会向哪些机构公开。
问题3:你对传统银行业的产品创新有没有研究?
周涛:例如债券市场,在美国的规模比中国大得多,一旦放开,就存在很大的机会。还有保险,目前我们国内的保险规模也比美国小,并且呈现高度同质化,实际上通过大数据,我们可以建立出很多精算模型,更好地为传统银行业服务。例如,如果我们能拿到个体的一些医疗数据,就可以推算一个人在多少年后有患上糖尿病概率,对应的,他的医疗保险应该如何变化,这些都可以计算出来。
大数据时代,或许你可以不会大数据,但是一定不能不知道大数据。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-06-052025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27