
12.12中关村大数据日暨CDA数据数据分析人才培养分论坛演讲嘉宾——SenzC创始人 冯小平
演讲实录如下:
大家好,各位领导、各位专家数据分析师们下午好。
这是我个人的简历,我叫冯小平,之前做信息安全,做一些工程、搜索,后来去了一家NGO,也是做技术,现在我们做的产品叫做情境感知技术,在国内是第一家,在国际上也差不多是两三年,即使在硅谷也是。
我请问大家有没有看过这个美剧,中文叫《疑犯追踪》,强烈推荐,不光是它评分特别高,它讲的就是大数据时代的社会的情况。我喜欢它的几点,我认为它真的是现实板的Matrix,我觉得这是非常现实,甚至有可能在当下发生的大数据故事。大家都说有些集表现上来说已经在日常生活中发生了,有人成立了POI教。它基本的故事是有一个AI通过收集大量的数据来控制整个社会发展,比如谁竞选、社会往哪边发展的故事。
里面有一句话讲,对于AI来说,人类社会最大的一个弱点就是人跟人之间的关系。这个趋势不可避免,大家想不到,我们先把自己炼化下来,看我能分析出什么,这是我当时的一个很小的想法,之后我创业的时候也是它的本源和初心就是这样。
刚才曹老师说Hadoop是这个数据的关键,我认为这都是工程师造出一堆堆的工具,反而不是数据分析师应该掌握的核心技能,数据分析师应该是用工具帮助你越来越高层地访问到这些数据、操作这些数据,不用管底层数据怎么存储、怎么扩展,所以你以后拿到的数据会越来越高层,你不知道从哪拿到,你输入一句话就可以拿到这样的数据了,我觉得数据分析师应该更多地了解工业界对数据分析的需求,就像刚才说造面包,数据分析师需要知道人类需要造什么,这些人需要买什么,除了面包之外,是不是我还要买起司、蛋挞之类的。我第一个方向的就是多玩Gadget,大家看到京东智能的一些小玩意,我觉得这是数据分析师的玩具。
这是我平时会随身携带收集数据用的东西,包括Kinect大家都很熟悉,Kinect windows你可以用的系统,包括iBeacon都是写几个代码就可以拿到数据;EyeX是一个民用级别的眼动移,这两个MotoX是我平时都会带的,录音记录,还有Nexus7是每天带在包里,你可以搜周围的信息。
Kinect for windows
比如说Kinect windows,这个是我摆在客厅、办公室里说这里什么时候有一个人在这边,这个东西持续记下来了,我们现在还不知道能分析什么,一旦有一天我们的算法更牛了,就可以算出来东西了。但是如果算法牛了,你没有这些数据就完了。
iBeacon
这是iBeacon,这个东西造价很便宜,如果你想知道你跟哪个东西距离多远,你就可以把这个贴到那个里面,你的手机如果接近这个东西,你就可以持续知道我离它1米、我离它3米,它是可以记录很多数据,比如你跟你的书包一天接触多久,当然你也可以做室内定位,比如说你在这个屋子里哪个位置待了多久。
MYO
MYO是一个绑在你手臂的机器,你通过几个代码就可以知道每一天手臂肌肉的数据。
Mindwave
这个是一个记录脑波的数据,它可以简单地记录出你一天的注意力的值,当然可能学过大脑神经的人知道各种波对人的精神状态是什么作用,它又做了一层,你可以知道这个人注意力多高,你有没有眨眼,你有没有很冷静。这个东西可以用来干嘛呢,我们后面会讲到。
NarrativeClip
这个NarrativeClip,这个是我戴在胸前的,它每隔几秒会拍一张照片,大家可能会说会不会侵犯隐私,如果数据分析师考虑隐私的话就没法做了。这个想象空间非常大,比如说前两天就是一个人记录了6个月的数据可以分析出这个人每一分钟在干什么。当然我戴这个也戴了一年半了,硬盘都堆了几个硬盘的数据,我也就是分析分析我每天接触什么东西。最后我分析的结果是我一天40%的时间都在看消息,我那一天只有5%的时间视角里有人。
EyeX
EyeX这个是放在笔记本上就可以看屏幕的区域,你什么时候在看哪,基本上每秒钟几十赫兹。
刚才那些设备都是市面上能买到的,你从中能拿到的数据,如果你自己做是基本上你要花几年,甚至十几年才可以做出的东西,这些Gadget给我们带来的好处就是我们可以站在它的肩膀上拿到很高级的数据,做深度的数据。
另外分享多去hackathon,我认为hackathon是一个线下同性交友社区,当然不一定同性。在hackathon一般大家花两天周末的时间一块去琢磨出一个小点子,然后把这个点子用两天的时间,有程序员,有设计师,能够实现出来,并且给大家展示出来。
比如说之前我们参加hackathon的时候,像MYO可以检测电流,后面紫色的灯也是可以通过API访问的,我们通过摆手的动作改变灯的颜色,我边摆手边听歌这个灯就可以变颜色,这个就是hackathon做的东西。
另外一个hackathon就是我们做了一个人到哪个屏幕旁边,内容就显示在那个屏幕旁边的一个简单的模式。我录了我写代码时候的脑波的情况,我注意力的值,我可以拿我注意力的值来评估我不同区域代码出BUG的几率,概率低的我就可以过去,高概率的地方我就仔细检查一下。
第三个分享就是多用API。
Mashup这个概念很早就提出来了,大家认为以后各种的技术都是堆占型的,大家都要基于别人的API做出自己的产品,其实现在已经这样了,你创业服务器肯定不用自己的,都用阿里云,都不用搭自己的后端服务,图象识别有,声音识别有迅飞,都有各种各样的服务。当时有一段时间很疏于技术,我花三十天时间去接触一些API,这些API都是我搜的最新的美国的创业项目他在用什么样的API做。
比如爬虫、图象识别、情绪识别,像刚才说的物体的其实都有在线的独立第三方提供API,如果你不知道这些API的话,你需要想我需要这样一个功能来实现我的想法的时候,你就不知道到底应该怎么做,难道图象识别、人脸识别我要重新做吗?那不可能的,去了解这些可以帮助你的API能够提升你效率和开拓眼界。我不知道大家在这里面能看到几个眼熟的东西。
最后一个分享就是多开脑洞。
因为记忆、情绪,大家现在越来越多地被证明是可以被机器替代的。我们就想到底人有什么可以不被机器替代的。谷歌有一个人说2020年可以实现人脑连入互联网,我觉得脑洞是人类残留的不可解的核心价值,我欢迎大家来我们私下组织的小团体搞了一个小节目,《说好的脑洞呢》,基于现在基础的技术,未来能够实现什么样很好的想法。比如说发光二维码,如果我们墓地放二维码,就可以看到死去的这些人的情况。这些都是脑洞,但是这些脑洞本身就代表着你思维的边界和你对现在技术的一些了解的体现。
精彩问答
我想问一下像这一类设备技术下一步会有哪些新的突破。
冯小平:这些设备肯定是越来越小型化,越来越接近人的穿戴,比如说脑波有人说拿脑波做环境的改善,比如说智能大厦会根据你身体的情况自动调节你所处的环境的温度、光照,更往前就是这些东西足够小型化,可以看到很多会越来越小,越来越让你感知不到它的存在,包括各种可穿戴设备也是这个趋势,就是不断地把你各种维度的数据以你舒适的方式收集下来,收集下来以后,就是他们怎么卖钱的问题了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
本次活动市场价2000元,现面向会员免费开放,会员朋友更可以邀请一位非会员免费参加。 【活动目标】 本课程 ...
2025-07-28CDA 数据分析师必备技能全解析 在数据驱动决策的时代,CDA 数据分析师作为连接数据与业务价值的桥梁,需要具备多元化的技能体系 ...
2025-07-28PowerBI 添加索引列全攻略 在使用 PowerBI 进行数据处理与分析时,添加索引列是一项极为实用的操作技巧。索引列能为数据表中的每 ...
2025-07-28t 检验与 Wilcoxon 检验:数据差异分析的两大核心方法 在数据分析的广阔领域中,判断两组或多组数据之间是否存在显著差异是一项 ...
2025-07-28PyTorch 核心机制:损失函数与反向传播如何驱动模型进化 在深度学习的世界里,模型从 “一无所知” 到 “精准预测” 的蜕变,离 ...
2025-07-252025 年 CDA 数据分析师考纲焕新,引领行业人才新标准 在数字化浪潮奔涌向前的当下,数据已成为驱动各行业发展的核心要素。作为 ...
2025-07-25从数据到决策:CDA 数据分析师如何重塑职场竞争力与行业价值 在数字经济席卷全球的今天,数据已从 “辅助工具” 升级为 “核心资 ...
2025-07-25用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-24解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-24CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-24从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-23用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-23鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-23解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-22解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-22CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-22左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-22你是不是也经常刷到别人涨粉百万、带货千万,心里痒痒的,想着“我也试试”,结果三个月过去,粉丝不到1000,播放量惨不忍睹? ...
2025-07-21我是陈辉,一个创业十多年的企业主,前半段人生和“文字”紧紧绑在一起。从广告公司文案到品牌策划,再到自己开策划机构,我靠 ...
2025-07-21CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-21