京公网安备 11010802034615号
经营许可证编号:京B2-20210330
12.12中关村大数据日暨CDA数据数据分析人才培养分论坛演讲嘉宾——SenzC创始人 冯小平
演讲实录如下:
大家好,各位领导、各位专家数据分析师们下午好。
这是我个人的简历,我叫冯小平,之前做信息安全,做一些工程、搜索,后来去了一家NGO,也是做技术,现在我们做的产品叫做情境感知技术,在国内是第一家,在国际上也差不多是两三年,即使在硅谷也是。
我请问大家有没有看过这个美剧,中文叫《疑犯追踪》,强烈推荐,不光是它评分特别高,它讲的就是大数据时代的社会的情况。我喜欢它的几点,我认为它真的是现实板的Matrix,我觉得这是非常现实,甚至有可能在当下发生的大数据故事。大家都说有些集表现上来说已经在日常生活中发生了,有人成立了POI教。它基本的故事是有一个AI通过收集大量的数据来控制整个社会发展,比如谁竞选、社会往哪边发展的故事。
里面有一句话讲,对于AI来说,人类社会最大的一个弱点就是人跟人之间的关系。这个趋势不可避免,大家想不到,我们先把自己炼化下来,看我能分析出什么,这是我当时的一个很小的想法,之后我创业的时候也是它的本源和初心就是这样。
刚才曹老师说Hadoop是这个数据的关键,我认为这都是工程师造出一堆堆的工具,反而不是数据分析师应该掌握的核心技能,数据分析师应该是用工具帮助你越来越高层地访问到这些数据、操作这些数据,不用管底层数据怎么存储、怎么扩展,所以你以后拿到的数据会越来越高层,你不知道从哪拿到,你输入一句话就可以拿到这样的数据了,我觉得数据分析师应该更多地了解工业界对数据分析的需求,就像刚才说造面包,数据分析师需要知道人类需要造什么,这些人需要买什么,除了面包之外,是不是我还要买起司、蛋挞之类的。我第一个方向的就是多玩Gadget,大家看到京东智能的一些小玩意,我觉得这是数据分析师的玩具。
这是我平时会随身携带收集数据用的东西,包括Kinect大家都很熟悉,Kinect windows你可以用的系统,包括iBeacon都是写几个代码就可以拿到数据;EyeX是一个民用级别的眼动移,这两个MotoX是我平时都会带的,录音记录,还有Nexus7是每天带在包里,你可以搜周围的信息。

Kinect for windows
比如说Kinect windows,这个是我摆在客厅、办公室里说这里什么时候有一个人在这边,这个东西持续记下来了,我们现在还不知道能分析什么,一旦有一天我们的算法更牛了,就可以算出来东西了。但是如果算法牛了,你没有这些数据就完了。
iBeacon
这是iBeacon,这个东西造价很便宜,如果你想知道你跟哪个东西距离多远,你就可以把这个贴到那个里面,你的手机如果接近这个东西,你就可以持续知道我离它1米、我离它3米,它是可以记录很多数据,比如你跟你的书包一天接触多久,当然你也可以做室内定位,比如说你在这个屋子里哪个位置待了多久。
MYO
MYO是一个绑在你手臂的机器,你通过几个代码就可以知道每一天手臂肌肉的数据。
Mindwave
这个是一个记录脑波的数据,它可以简单地记录出你一天的注意力的值,当然可能学过大脑神经的人知道各种波对人的精神状态是什么作用,它又做了一层,你可以知道这个人注意力多高,你有没有眨眼,你有没有很冷静。这个东西可以用来干嘛呢,我们后面会讲到。
NarrativeClip
这个NarrativeClip,这个是我戴在胸前的,它每隔几秒会拍一张照片,大家可能会说会不会侵犯隐私,如果数据分析师考虑隐私的话就没法做了。这个想象空间非常大,比如说前两天就是一个人记录了6个月的数据可以分析出这个人每一分钟在干什么。当然我戴这个也戴了一年半了,硬盘都堆了几个硬盘的数据,我也就是分析分析我每天接触什么东西。最后我分析的结果是我一天40%的时间都在看消息,我那一天只有5%的时间视角里有人。
EyeX
EyeX这个是放在笔记本上就可以看屏幕的区域,你什么时候在看哪,基本上每秒钟几十赫兹。
刚才那些设备都是市面上能买到的,你从中能拿到的数据,如果你自己做是基本上你要花几年,甚至十几年才可以做出的东西,这些Gadget给我们带来的好处就是我们可以站在它的肩膀上拿到很高级的数据,做深度的数据。
另外分享多去hackathon,我认为hackathon是一个线下同性交友社区,当然不一定同性。在hackathon一般大家花两天周末的时间一块去琢磨出一个小点子,然后把这个点子用两天的时间,有程序员,有设计师,能够实现出来,并且给大家展示出来。
比如说之前我们参加hackathon的时候,像MYO可以检测电流,后面紫色的灯也是可以通过API访问的,我们通过摆手的动作改变灯的颜色,我边摆手边听歌这个灯就可以变颜色,这个就是hackathon做的东西。
另外一个hackathon就是我们做了一个人到哪个屏幕旁边,内容就显示在那个屏幕旁边的一个简单的模式。我录了我写代码时候的脑波的情况,我注意力的值,我可以拿我注意力的值来评估我不同区域代码出BUG的几率,概率低的我就可以过去,高概率的地方我就仔细检查一下。
第三个分享就是多用API。
Mashup这个概念很早就提出来了,大家认为以后各种的技术都是堆占型的,大家都要基于别人的API做出自己的产品,其实现在已经这样了,你创业服务器肯定不用自己的,都用阿里云,都不用搭自己的后端服务,图象识别有,声音识别有迅飞,都有各种各样的服务。当时有一段时间很疏于技术,我花三十天时间去接触一些API,这些API都是我搜的最新的美国的创业项目他在用什么样的API做。
比如爬虫、图象识别、情绪识别,像刚才说的物体的其实都有在线的独立第三方提供API,如果你不知道这些API的话,你需要想我需要这样一个功能来实现我的想法的时候,你就不知道到底应该怎么做,难道图象识别、人脸识别我要重新做吗?那不可能的,去了解这些可以帮助你的API能够提升你效率和开拓眼界。我不知道大家在这里面能看到几个眼熟的东西。
最后一个分享就是多开脑洞。
因为记忆、情绪,大家现在越来越多地被证明是可以被机器替代的。我们就想到底人有什么可以不被机器替代的。谷歌有一个人说2020年可以实现人脑连入互联网,我觉得脑洞是人类残留的不可解的核心价值,我欢迎大家来我们私下组织的小团体搞了一个小节目,《说好的脑洞呢》,基于现在基础的技术,未来能够实现什么样很好的想法。比如说发光二维码,如果我们墓地放二维码,就可以看到死去的这些人的情况。这些都是脑洞,但是这些脑洞本身就代表着你思维的边界和你对现在技术的一些了解的体现。
精彩问答
我想问一下像这一类设备技术下一步会有哪些新的突破。
冯小平:这些设备肯定是越来越小型化,越来越接近人的穿戴,比如说脑波有人说拿脑波做环境的改善,比如说智能大厦会根据你身体的情况自动调节你所处的环境的温度、光照,更往前就是这些东西足够小型化,可以看到很多会越来越小,越来越让你感知不到它的存在,包括各种可穿戴设备也是这个趋势,就是不断地把你各种维度的数据以你舒适的方式收集下来,收集下来以后,就是他们怎么卖钱的问题了。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16