京公网安备 11010802034615号
经营许可证编号:京B2-20210330
传统领域是大数据创业蓝海
穿着拖鞋,牛仔裤挽着裤腿,手拿老款诺基亚直板手机,9月14日,在城南一家白领穿梭的高档商务写字楼,国内大数据行业领军人物——电子科技大学“80后”教授周涛走进了记者的视线。
“大数据时代已经来到我们身边,并没有那么多的云遮雾绕,而是相当接地气。”短短一个小时,周涛用身边的例子和最直白的表述,拨开大数据的神秘面纱,描述了一个可触摸的数字化时代。
专家简介
周涛,1982年4月出生于成都。2005年获中国科学技术大学学士学位,2010年获瑞士弗里堡大学物理系哲学博士学位。现任电子科技大学大数据研究中心主任,从事数据挖掘与复杂性科学研究。
26岁获教育部自然科学一等奖,27岁获聘电子科技大学正教授,29岁获中国青年科技奖,32岁入选Elsevier最具国际影响力中国科学家,33岁担任全国青联常委,科技界别副主任。
目前论文引用过万次,创立、联合创立和投资的大数据企业市值过百亿。
怎样理解大数据?
“一切都被记录,一切都被数字化。”
从硅谷到成都,大数据,这个新鲜的话题正全球同步热传。一场关乎每个人生活、工作和思维的大变革正在悄然发生。
到底什么是大数据?
周涛认为,“大数据”是“数据化”趋势下的必然产物。数据化的核心理念是:一切都被记录,一切都被数字化。“最近两年,数据量爆炸性剧增,几乎等同于2010年以前整个人类文明产生的数据量总和。”
浏览过的网页、去过的地方、吃过的东西、购买过的产品……不经意间,我们生活中的很多数据已经被记录。
这么多数据,有什么用?
周涛解释:“大数据要求数据能充分发挥其外部性,并通过与某些相关数据交叉融合,产生远大于简单加和的巨大价值。”比如,国家电网智能电表的数据可以用于估计房屋空置率,淘宝销售数据可以用来判断经济走势,微博上的关注关系和内容信息可以用于购物推荐和广告推送……
最近,周涛和他的团队正在做一件有意思的事情——寻找校园中最孤独的人。他们通过选课记录、食堂用餐刷卡等,从电子科大3万名在校生中,采集到了2亿多条学生行为数据。通过对不同ID卡“一前一后刷卡”的记录进行分析,可以发现一个学生在学校有多少亲密的朋友,比如恋人、闺蜜、死党。“我们寻找到了800多个最孤独的人。他们平均在校两年半时间,一个死党都没有,这是一件很可怕的事情。”周涛分析,数据表现出这些学生存在一定的社交障碍,这些人中17%的人可能产生心理疾病。由此,学校可以对这些学生更加关注,有针对性地帮助他们解决心理问题。
这项针对在校大学生行为的大数据研究,是教育部网络文化建设示范性项目中的亮点。在周涛看来,这样的行为数据研究还有广阔的应用市场,比如可以移植到高强度的劳动密集型行业中,关注广大产业工人的心理疾病问题。
如何利用好大数据?
“跨领域关联,才是大数据的精髓。”
近期,成都市设立全国第三个大数据管理局的消息,又一次提振了成都大数据产业发展的信心。“推动新兴产业发展,成都再一次走在了全国前列。”在周涛看来,大数据管理首先带来的改变,就是将实现全市政务数据的共融共通。目前,各部门都储备了大量既权威又高价值的数据,但却很难实现部门间的数据共享。现在通过大数据管理局的牵头,就能实现政府部门权威数据的高效管理和资源共享。
借助大数据,企业和政府管理人员的决策,也将从“经验即决策”过渡到“数据辅助决策”,最后实现“数据即决策”;教育培训、零售业和医疗服务等行业,也有望实现对服务对象的数字化和个性化定量服务。“分割的数据价值有限,只有实现数据的流动才能最大化数据价值。”周涛认为,这个观点也同样适用于当前电子商务的发展。“数据的关联形态正在发生变化,一名用户既在微信上,也在微博上,同时还有线下医保、社保等数据,以及交通出行数据。要了解一名用户,这些数据都需要关联起来进行处理。”
周涛提出,大数据的本质不在于数据量有多少,也不在于是否是异构的数据,而是在于数据是关联的,整体的数据可以流动起来。“跨领域关联,通过一加一产生远大于二的价值,才是大数据的精髓。”
大数据时代如何看待隐私问题?
政府和业界都要担责
每一次敲击键盘,每一次点击鼠标,每一次网上交易……在周涛的视野中,互联网生活中每一个习以为常的输入,都可能成为大数据企业的“原材料”。企业就可以利用其中的信息,分析消费者的行为,从而为消费者提供个性化、量身定做的服务。但不可避免的,这也会带来个人权利与自由遭到侵犯的隐忧。
实际上,自从有了互联网,保护隐私就成为一个问题,但是以前泄露的方式和途径比较零散,而大数据的技术和理念,使得企业和政府有可能以前所未有的力度掌握我们个人的信息,拼出一个人的全景信息。“大数据背景下,普通人基本没有能力去保护自己的个人隐私。”在周涛看来,科学和商业进步,都会是一把“双刃剑”,数字化生活中的隐私保护,个人的应对能力会显得渺小。“要真正融入大数据时代,享受个性化专属信息服务,就不得不牺牲一部分个人隐私。”周涛直言不讳,“付出巨大努力,放弃很多有意义的服务,尝试保护自己,往往是得不偿失。”
当然,政府和业界需要扛起担子,肩负起保护隐私的责任。周涛表示,政府应当设计出非常苛刻严格的法律条例和行业规则,这对大数据产业本身也是一种保护。针对那些非法利用个人隐私来收获不正当利益的企业,“职能部门必须下重手,要一棒打死。”
对能够处理隐私数据的企业,周涛建议必须尽快制定出准入机制。“我们现在正讨论一个方案,对隐私分等级。”企业如果需要处理某一个层级个人隐私数据,就必须要具备苛刻的准入资质,如企业的软件防火墙、硬件防火墙需要通过安全评测中心的评测,确保不被攻破而造成隐私数据的泄露。
大数据企业如何创业?
“从市场痛点入手,做一把杀牛的好刀。”
“80后”最年轻教授、电子科大博导、最具国际影响力科学家……走出一连串学术光环,周涛还是创业场上的实战派。
2009年联合创立的大数据科技公司,目前市值超过30亿元;2013年他出资1.2万元参与创立的一家注册资本仅3万元的公司,当下个人所持股份市值已超过3亿元。目前,周涛创立、联合创立和投资的20余家大数据企业,市值总和超过百亿。“创业的风险比较高,但也是一件令人兴奋的事情。”周涛认为,大数据创业,需要集中精力做好五方面功课:找准市场的痛点、具备有优势门槛的核心技术、组建一支专业管理团队、找到优质的数据合作方、选择一家懂自己的基金。
周涛认为,大数据创业首先需要从市场的痛处着手,找准市场的核心需求。如果只有技术,并没有寻找到匹配的市场,手中拿着刀去再找牛,这样的创业一般会失败。“如果现在大家都等着杀牛,就可以考虑如何去做一把好刀。”
8月底,周涛在成都参与创始的一家大数据科技公司,完成了1亿元人民币B轮融资。借助基金之手,短短两年时间,公司规模从3万元裂变成10亿元。“一定找到一个懂自己的基金。”在周涛看来,大数据是不能实现快速盈利的行业,很多创业公司会出现长时间的亏损局面,“你的投行不应在财报上有过多的要求,而是要一直支撑公司把技术做得更好更棒。”
成都的大数据创业环境如何?周涛认为,从全国范围比较来看,成都目前具备很好的大数据创业氛围,已有多家有业界影响的公司聚集。但比起北京、上海、杭州、深圳等地区,成都还有一定差距,主要表现在专业的顶级投资机构少,顶尖的技术、运营、市场和金融人才缺乏两个方面。
目前,国内大数据的发展多集中在泡沫较多的垂直应用领域,周涛认为,大数据未来创业的蓝海,应该集中在目前较少关注的传统领域,如医疗卫生、食品安全、工业制造、农业养殖等领域,创业者可以更多地关注具有颠覆性的硬技术创新,以及大数据在传统行业的巨大价值。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06