
大数据和创业到底有着什么神秘关系
怎样利用大数据的思维方式和大数据的分析方法帮助平台上的创业者?怎样用大数据创新创业?这是南开大学科技成果转化中心主任高翔思考最多的问题之一。在2015年全国大学生创业实训营的交流活动中,大咖云集的大数据讨论吸引了全场营员的注意。有人在朋友圈写道:“大数据时代来了,我们能做什么呢?”数据分析师应该重视!
“因为智能手机或者其他的智能终端的产生,大量以前不可以被数据化的东西被数据化;一旦被数据化,这个节点可以被周围的节点感知。就在此刻,这个世界正在迅速智能化。”长实资本合伙人、腾讯互联网社会研究院原副秘书长何华峰说,“这两年我很有运气能够看到行业重新构造,传统企业被颠覆,一大波创业企业产生。”
何华峰和团队研究滴滴打车,发现这家3年时间达到250亿美元市值的公司所做的“无非是连接两个点”,即汽车的位置信息和人的位置信息。
“只要能在数据中发掘出一个节点,让它发出数据跟周围的节点相连,就能造就很牛的企业。”何华峰说。
2012年天津市提出要发展大数据产业,规划被交给南开大学。高翔和一批专家一起研究了解学生创业者对大数据的思维方式和分析问题的方法。在他看来,大数据可以帮助青年创业者找到自己的“赛道”,即创业的需求和关键点所在。
携程网是产业中被何华峰看好的一个例子。沈南鹏从耶鲁大学毕业回国创办携程网一年后,从后台数据敏锐地发现:国内最紧缺的酒店是价格在每晚100~200元的酒店。对应这个需求,他创立了如家连锁酒店。
“不过对于学生来说,自己做一个携程网或者阿里巴巴这样的平台依然很遥远,一个现实的方式就是借势。”他说。
高维创业岛大数据投资总监冷静很明白开源资源的价值。
10年前百度刚开始推出竞价排名,在竞价排名里每一个关键词都有价格。冷静的团队通过技术手段一口气找到了将近100多万个关键词的价格,由高到低排序,明确 知道哪些是价格最高的行业。后来,他们又将淘宝的销量做了一个大数据分析,发现奶粉是淘宝上销量最热的产品之一。原来奶粉安全问题事件之后,大家都在通过 淘宝购买海外的奶粉,所以奶粉就成了一个非常好的赛道。
除了找赛道,大数据还可以为创业者找人。
确定与一个几乎陌生的人进行资金合作之前,冷静会去查找他的芝麻信用分。芝麻信用分是阿里巴巴基于之前的淘宝交易平台向大众提供的一个开放数据接口。如果芝麻信用分 高于750分,他会觉得这是一个可以信任的人。更方便的识人大数据来自微信朋友圈,很容易看到这个人是不是靠谱,是不是有资源跟自己进行匹配,从而帮助判 断可不可以合作。
在江苏中科龙梦科技有限公司总经理张福新看来,大数据为创业者提供的,是一个无限的资源平台。
这位我国第一款高性能通用CPU龙芯的主要设计人员之一毕业于中科大少年班,可以算是学霸。很多学生“年年都考试,年年都在做题,而有些成绩很好的同学会有总结错题的习惯,但还是有很多同学做完题就扔掉了”。于是,他的团队在推广龙芯的过程中,通过学生的错题纪录,归纳出这个学生哪个方向的学术结构有问题, 以便家长和老师有针对性地做更加有效的补偿措施。这样,让“没有主动发现能力的人能够得到纠正的机会”。
这里的大数据,可以是开源的,也可以是自己积累的。江苏常州养蟹产业发达,养蟹对水质要求很高,一旦某个晚上水温度太高或者氧气不足,螃蟹就全死了。监控水质可以搭建传感器,汇总信息。精做下去,数据积累多了,就是大数据,形成一个养蟹的智慧库。
张福新认为,如果大数据的产业是建大楼,那他所从事的国产系统研究是提供砖块的活动。任何有点子的团队没有设计能力,可以借助他们的力量完成基础硬件。而一旦大的大数据平台搭成,是年轻创业者寻求资源的极棒平台。
“在创业过程中,一定是要充分借助资源,把握住自己的定位,然后利用各个环节的数据来最高效率地完成自己的目标,应当把精力集中在最有创意、对社会最有价值的新的点子上。”张福新说
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14