京公网安备 11010802034615号
经营许可证编号:京B2-20210330
12.12中关村大数据日暨CDA数据数据分析人才培养分论坛演讲嘉宾——SenzC创始人 冯小平
演讲实录如下:
大家好,各位领导、各位专家数据分析师们下午好。
这是我个人的简历,我叫冯小平,之前做信息安全,做一些工程、搜索,后来去了一家NGO,也是做技术,现在我们做的产品叫做情境感知技术,在国内是第一家,在国际上也差不多是两三年,即使在硅谷也是。
我请问大家有没有看过这个美剧,中文叫《疑犯追踪》,强烈推荐,不光是它评分特别高,它讲的就是大数据时代的社会的情况。我喜欢它的几点,我认为它真的是现实板的Matrix,我觉得这是非常现实,甚至有可能在当下发生的大数据故事。大家都说有些集表现上来说已经在日常生活中发生了,有人成立了POI教。它基本的故事是有一个AI通过收集大量的数据来控制整个社会发展,比如谁竞选、社会往哪边发展的故事。
里面有一句话讲,对于AI来说,人类社会最大的一个弱点就是人跟人之间的关系。这个趋势不可避免,大家想不到,我们先把自己炼化下来,看我能分析出什么,这是我当时的一个很小的想法,之后我创业的时候也是它的本源和初心就是这样。
刚才曹老师说Hadoop是这个数据的关键,我认为这都是工程师造出一堆堆的工具,反而不是数据分析师应该掌握的核心技能,数据分析师应该是用工具帮助你越来越高层地访问到这些数据、操作这些数据,不用管底层数据怎么存储、怎么扩展,所以你以后拿到的数据会越来越高层,你不知道从哪拿到,你输入一句话就可以拿到这样的数据了,我觉得数据分析师应该更多地了解工业界对数据分析的需求,就像刚才说造面包,数据分析师需要知道人类需要造什么,这些人需要买什么,除了面包之外,是不是我还要买起司、蛋挞之类的。我第一个方向的就是多玩Gadget,大家看到京东智能的一些小玩意,我觉得这是数据分析师的玩具。
这是我平时会随身携带收集数据用的东西,包括Kinect大家都很熟悉,Kinect windows你可以用的系统,包括iBeacon都是写几个代码就可以拿到数据;EyeX是一个民用级别的眼动移,这两个MotoX是我平时都会带的,录音记录,还有Nexus7是每天带在包里,你可以搜周围的信息。

Kinect for windows
比如说Kinect windows,这个是我摆在客厅、办公室里说这里什么时候有一个人在这边,这个东西持续记下来了,我们现在还不知道能分析什么,一旦有一天我们的算法更牛了,就可以算出来东西了。但是如果算法牛了,你没有这些数据就完了。
iBeacon
这是iBeacon,这个东西造价很便宜,如果你想知道你跟哪个东西距离多远,你就可以把这个贴到那个里面,你的手机如果接近这个东西,你就可以持续知道我离它1米、我离它3米,它是可以记录很多数据,比如你跟你的书包一天接触多久,当然你也可以做室内定位,比如说你在这个屋子里哪个位置待了多久。
MYO
MYO是一个绑在你手臂的机器,你通过几个代码就可以知道每一天手臂肌肉的数据。
Mindwave
这个是一个记录脑波的数据,它可以简单地记录出你一天的注意力的值,当然可能学过大脑神经的人知道各种波对人的精神状态是什么作用,它又做了一层,你可以知道这个人注意力多高,你有没有眨眼,你有没有很冷静。这个东西可以用来干嘛呢,我们后面会讲到。
NarrativeClip
这个NarrativeClip,这个是我戴在胸前的,它每隔几秒会拍一张照片,大家可能会说会不会侵犯隐私,如果数据分析师考虑隐私的话就没法做了。这个想象空间非常大,比如说前两天就是一个人记录了6个月的数据可以分析出这个人每一分钟在干什么。当然我戴这个也戴了一年半了,硬盘都堆了几个硬盘的数据,我也就是分析分析我每天接触什么东西。最后我分析的结果是我一天40%的时间都在看消息,我那一天只有5%的时间视角里有人。
EyeX
EyeX这个是放在笔记本上就可以看屏幕的区域,你什么时候在看哪,基本上每秒钟几十赫兹。
刚才那些设备都是市面上能买到的,你从中能拿到的数据,如果你自己做是基本上你要花几年,甚至十几年才可以做出的东西,这些Gadget给我们带来的好处就是我们可以站在它的肩膀上拿到很高级的数据,做深度的数据。
另外分享多去hackathon,我认为hackathon是一个线下同性交友社区,当然不一定同性。在hackathon一般大家花两天周末的时间一块去琢磨出一个小点子,然后把这个点子用两天的时间,有程序员,有设计师,能够实现出来,并且给大家展示出来。
比如说之前我们参加hackathon的时候,像MYO可以检测电流,后面紫色的灯也是可以通过API访问的,我们通过摆手的动作改变灯的颜色,我边摆手边听歌这个灯就可以变颜色,这个就是hackathon做的东西。
另外一个hackathon就是我们做了一个人到哪个屏幕旁边,内容就显示在那个屏幕旁边的一个简单的模式。我录了我写代码时候的脑波的情况,我注意力的值,我可以拿我注意力的值来评估我不同区域代码出BUG的几率,概率低的我就可以过去,高概率的地方我就仔细检查一下。
第三个分享就是多用API。
Mashup这个概念很早就提出来了,大家认为以后各种的技术都是堆占型的,大家都要基于别人的API做出自己的产品,其实现在已经这样了,你创业服务器肯定不用自己的,都用阿里云,都不用搭自己的后端服务,图象识别有,声音识别有迅飞,都有各种各样的服务。当时有一段时间很疏于技术,我花三十天时间去接触一些API,这些API都是我搜的最新的美国的创业项目他在用什么样的API做。
比如爬虫、图象识别、情绪识别,像刚才说的物体的其实都有在线的独立第三方提供API,如果你不知道这些API的话,你需要想我需要这样一个功能来实现我的想法的时候,你就不知道到底应该怎么做,难道图象识别、人脸识别我要重新做吗?那不可能的,去了解这些可以帮助你的API能够提升你效率和开拓眼界。我不知道大家在这里面能看到几个眼熟的东西。
最后一个分享就是多开脑洞。
因为记忆、情绪,大家现在越来越多地被证明是可以被机器替代的。我们就想到底人有什么可以不被机器替代的。谷歌有一个人说2020年可以实现人脑连入互联网,我觉得脑洞是人类残留的不可解的核心价值,我欢迎大家来我们私下组织的小团体搞了一个小节目,《说好的脑洞呢》,基于现在基础的技术,未来能够实现什么样很好的想法。比如说发光二维码,如果我们墓地放二维码,就可以看到死去的这些人的情况。这些都是脑洞,但是这些脑洞本身就代表着你思维的边界和你对现在技术的一些了解的体现。
精彩问答
我想问一下像这一类设备技术下一步会有哪些新的突破。
冯小平:这些设备肯定是越来越小型化,越来越接近人的穿戴,比如说脑波有人说拿脑波做环境的改善,比如说智能大厦会根据你身体的情况自动调节你所处的环境的温度、光照,更往前就是这些东西足够小型化,可以看到很多会越来越小,越来越让你感知不到它的存在,包括各种可穿戴设备也是这个趋势,就是不断地把你各种维度的数据以你舒适的方式收集下来,收集下来以后,就是他们怎么卖钱的问题了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02