京公网安备 11010802034615号
经营许可证编号:京B2-20210330
科幻迷+大数据,“星图数据”的大数据梦想_数据分析师
在今年的戛纳电影节上,加拿大导演大卫·柯南伯格的《星图》帮助朱丽安·摩尔斩获影后殊荣。作为科幻迷的星图数据创始人谷熠看到这则消息时,最开始还以为这是一部科幻电影,确实有点小兴奋,还想着可以借电影的名声加大公司的曝光。后来他才发现是一部批判好莱坞文化的影片,与科幻无关。但又仔细想了想,电影讲的其实是在好莱坞打拼的事情,而创业不就是打拼吗?谷熠的形容是“历尽苦难痴心不改”。
星图数据今年上线首款产品,8 月份就完成了数百万美元的 A 轮融资。谷熠说,自己带着对产品和大数据的梦想,走上了创业这条“不归路”。作为一家互联网大数据服务公司,星图数据基于海外技术团队的研究成果,开发出了一套适合中国企业的数据应用服务产品,主要为传统制造业公司提供完整的线上渠道数据,通过数据可视化的方式进行直观的呈现,帮助企业通过数据发现在拓展线上渠道过程中所产生的问题,从而进行精准经营与决策。
目前,星图数据的主要服务领域包括快速消费品、3C 与家电,以及家居家装等,美的、苏泊尔、九阳等知名家电品牌都是星图数据的合作对象。根据官方网站的介绍,星图数据的数据积累超过 24 个月,拥有超过 2400 个品类、12 万个品牌和 600 万个商品的线上零售数据,产品服务主要包括以下四个方面:
D-Matrix(数据矩阵)大数据分析系统—— 基于 iNebula(分布式大数据获取与存储系统)与 WarpEngine(大数据处理与分析引擎),集成了搜索引擎、分布式计算、机器自学习算法等大数据领域的领先技术,为品牌企业提供丰富、直观的数据查询、分析与预测功能。SkyScope(天镜)线上渠道巡检系统—— 通过搜索引擎、数据挖掘等技术,为品牌企业提供实时的渠道监控与管理工具。帮助企业及时了解渠道的经营状况、实时进行渠道巡查、发现和查处渠道的违规行为,并以短信、邮件、APP 推送等方式,实现实时预警。
AtomPower(原子力)SKU 单品分析系统——拥有及时、细致的庞大基础数据资源。能够实现数据每日更新。强大的大数据引擎,可以实现快速、自由的数据展现、分析与追溯,以及海量的数据整理和挖掘。
SARK(星舰)大数据代运营服务——帮助企业把自身拥有的数据与线上渠道消费数据结合起来,从而统览全局。借助数据分析,可以追溯每个业务流程中产生的庞大数据,并进行共享整合分析,从而帮助品牌企业从原始数据中获取新的市场洞察和预测分析能力。
从产品名字上就不难看出,星图数据的团队里,不仅谷熠是科幻迷,其他很多人也都是科幻迷。《星际穿越》上映的时候,公司组织大家一起去看电影,看完后还开会进行了一番热烈的讨论。谷熠说,原来,零散的数据就像星星一样散落在各个角落,希望可以用大数据将他们串联起来,真正发挥它们的意义和价值,这也是公司取名为“星图”的原因。
在上个月的“双十一”网络购物狂欢中,星图数据进行了全网销售数据直播。作为国内唯一一家直播全网销售情况的公司,星图数据是如何做到的呢?谷熠说,当然还是依靠技术的力量。区别于传统市场调研机构的”抽样推总“方式,星图数据采用的是”全网普查“方式,对全网 18 家主流的综合性 B2C 和垂直性 B2C 进行实时监测。“我们自主研发了两套底层系统 iNebula(数据星云)和 WarpEngine(曲速引擎)这是是我们基于大数据技术自主研发的数据获取和存储系统 & 数据处理与分析引擎,保障了我们所产出数据的及时性和准确性。”
不过,谷熠也提到,现在的数据处理过程还需要 3 个小时左右的延迟,希望在明年的“双十一”可以做到实时的数据播报,也就是真正意义上的“直播”。
成立之后没多久,星图数据就推出了“超新星+” 计划招募活动,通过申请的企业可以免费享用星图数据 D-Matrix(数据矩阵)产品 6 个月服务。被问及原因,谷熠说,在和传统企业的多年接触中,他们发现真正能够理解大数据、使用大数据的企业少之又少,“我们希望能够通过这一计划,让更多的企业了解大数据,体会到大数据给大家带来的好处和便利;也希望更多的大数据公司能够和我们一起扮演大数据传道者的角色,推动行业更快地发展。”
提到“大数据”,人们往往会想到数据安全,谷熠也被无数次问到这个问题。他说,如果从个人数据隐私的角度来讲,数据的来源和范畴其实需要一个比较清晰的界定:什么样的数据属于隐私数据?什么样的数据属于公开数据?行业中对此有很多争论,到现在也还没有一个最终的标准和结论。他说,近期出现的很多数据泄露的问题,其实是大家的风险意识不高所造成的——当然了,企业的技术安全水平也需要不断提升。“除了企业在道德层面的自律之外,也希望尽快能有相关的法律和行业规范出台。”
而“大数据”这个概念在国内火起来也不过两三年的时间。谷熠认为,这个崭新的时代才刚刚开始。他说,虽然很多人都在讲这个概念,但是真正理解的、能够应用好的还并不多。可以说,大数据的技术和商业化的进程都还在摸索和演进之中,市场也才开始逐步地开放。另外,也不应该只把大数据理解为一种技术或者是一种业务模式,大数据应该是一种能力、一种资产、一个崭新的市场,或者说是代表着一种新的生活与工作的方式。
那么,“大数据”这个概念会一直火下去吗?谷熠反问,你觉得"电力"这个概念现在还火吗?但是它已经改变了人类的工作和生活,而且它的影响也会一直持续下去。
在谷熠看来,大数据所带来的改变,一定会在未来极大地影响每个企业的运作模式和每个个人的生活方式。因此,星图数据也在考虑如何让自己的数据给消费者提供价值,换言之,toB 之外,星图数据或许会在以后推出 toC 的产品。
谷熠曾有 10 年的产品开发与管理经验,算是资深产品经理了。他曾在知名互联网企业主持设计并研发了系列基于云计算的信息服务产品、智能分析系统,并分管产品销售及市场工作;还曾参与中央部委的公共服务系统开发,并作为科研院所的专家组成员,参与了多项国家标准的编写和制定。被问及创业原因,他说,每个人应该都有自己的梦想吧,正是因为有了梦想的推动,人类社会才会发展和进步,“也正因为有一个用大数据改变世界的梦想,我们一直努力最大化地体现着数据的价值,同时也努力实现着自我的价值。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27