京公网安备 11010802034615号
经营许可证编号:京B2-20210330
开放与安全 大数据的“尴尬”博弈
手握大数据,你能做什么?
消费者,可以通过售后服务和投诉率等指标货比三家;商家,可以借助信息的公开透明和谐相处、良性竞争;投资者,可以分析数据准确找到自己想投资的项目……
有人说,数据就是生产力,在信息社会,它将成为核心资源;有人说,虽然它还没有被列入企业的资产负债表,但只是一个时间问题……
大数据,已然成为时下最火热的IT行业热搜词,随着数据仓库、数据安全、数据分析、数据挖掘等围绕大数据商业价值的被利用,其逐渐成为行业人士争相追捧的利润焦点。
只是,自古“忠孝两难全”,凡事皆难两全其美。当央视315晚会大力度曝光Cookie采集用户信息时,当人们因个人隐私被泄露而只能一声叹息时,“风光无限”的大数据遭遇了当头棒喝。福音还是灾难?一夜间,关于大数据的讨论多了些许忧心的成分,如何挖掘和使用数据?企业的道德底线瞬间被推上了审判的至高点……
大数据开放才是硬道理
“大数据时代,是三个和尚在一起才有水喝。”对于这一形容,阿里集团数据委员会的会长车品觉非常认同,在他看来,大数据行业本身非常考验技术和商业的同时,也需要很多其他的东西结合起来之后才能用在数据上, 亦即利用数据拿到更多数据,互惠互利。
为了更好地理解这一概念,在阿里媒体开放日上,车品觉和我们分享了一个典型的故事。
一个海员,因为意外要把他派到一个地方去收集一些航海工具。当时,他发现这个地方有很多航海日志,可以提炼出不少数据化的航海背景,于是,他收集这些东西放在航海地图上,以帮助将来出海的人做一些决策,而航海的人根据此地图行动后也必须要收集一些数据继续完善,不断反馈和纠正,在实践中提炼数据的敏捷性,这本诞生于100年前的航海地图就是我们今天追寻的大数据,它具有数据体量巨大、数据类型繁多、商业价值高和处理速度快等特点。
收集数据、应用数据,然后出现质量问题,层层反馈回去以建立更清楚的数据源。对于大数据而言,开放似乎才是硬道理;对于很多企业来说,大数据管理其实是补10年前管理理念上的课。眼下,移动互联网与社交网络的兴起更是将其带上了新的征程,但车品觉却表现出了谨慎保守的态度。
“孤立的部分不能构成整体,但处理开放最大的难题就是数据安全,开放是硬道理但安全也是重要的保障,在安全还没搞清楚之前,开放还需要等待。”在大数据行业践行多年的车品觉再三强调现在谈数据的开放还为时尚早。毕竟,数据越大,问题越大,数据安全问题亦自云计算概念普及之时已被频繁提上议程。
个人隐私遭泄露:数据开放的另一头是安全
网购时,包括家庭住址、电话等个人信息被商家一览无余之时也被不法企业廉价贩卖;安装手机APP,通话记录、短信记录、通讯录成了隐私信息泄露的三个高危地带……于是,各种陌生、欺诈电话应接不暇;个性生活、消费习惯更是被相关利益方了如指掌。小米科技CEO雷军更是发出“手机丢了,比电脑丢了还恐怖”的感慨,如是说,越来越开放的大数据已失去了重心?如何守住正义的最后这道防线成了商家必修的课题。
对于淘宝和阿里系,车品觉介绍称,从内部的情况来讲,个人很重要的信息我们称之为敏感信息,从敏感信息来讲,从收藏库到仓库是隐蔽的,你是工程师或者在内部开过店有你个人的隐私,内部安全把敏感数据隐蔽,不能让一般人看见这个数据,有些我们称之为机密性的数据就更严重一点,在仓库里面都看不见这些数据,这是隐秘性的。从应用来讲,要应用这个数据需要遵守PRD原则,经过内部的评审,看有没有侵犯到个人隐私,所以,从内部来讲对个人隐私方面还是相对保护比较多。
事实上,当前大数据面前有三座大山,一是数据质量作为底线:如果原材料不可靠,将无法加以利用;第二,平衡数据安全与开放,开放是硬道理,但开放最大的难题是数据安全。第三,落实数据化运营,只有当大量的员工懂数据,用数据来决策业务,才能说明这家公司开始启动数据化运营。
不可否认,数据开放本身会产生力量,适当的开放也会产生更多的想法,但如车品觉所言,开放不一定是获取数据,可能是创新想法的交换,这比获取数据更重要。
当前,挖掘用户的行为习惯和喜好、 帮企业做内部数据挖掘或优化、帮企业更精准找到用户,降低营销成本,提高企业销售率,增加利润……可以看出,虽然大数据目前在国内还处于初级阶段,但是商业价值已显现出来,诞生了新的商业模式的同时亦仿佛站在金矿上。
如何让它有可参考性?“伴有主观情绪在里面的数据需要清楚的告诉别人主观判断在哪里,比如我们看一些访谈,它会说,这个访谈是经过调查两千人后得到的结果,这种就是参考数据。”车品觉表示。
值得一提的是,无论如何,在隐私泄露这件事情上,消费者是需要被保护的弱势群体,商业也好,企业也罢,需要在开放与安全中把握好一个“度”,可以说,这是一个良心的判断。
阿里大数据还在路上
让数据获取、使用、分享、协同、连接、组合变得超级简单,这是大数据时代背景下我们的终极理想。只是,需要努力的是,我们暂未找到一个很好的盈利模式,包括走在前面的阿里。
“今天很多大数据公司还在投资,我们还看不清他的赢利点到底在哪里,最简单的是用数据去做一些数据产品,比如以前的数据魔方,或者今天的阿里金融,就是用数据生产一套新的东西出来,我相信这是今天比较容易能看见的。”车品觉说。
此前,阿里集团董事局主席马云提出了“平台、金融、数据”三步走的战略,继阿里集团架构调整、组建小微金融服务集团后,再次传出阿里金融让银行紧张的说法。
据介绍,阿里金融是针对中小企业在这个时代的融资需求应运而生,这个方案贯彻了透明、开放、责任与分享,它的第一职责不是帮助金融机构,帮助客户、帮助无数淘宝卖家才是阿里金融的责任所在。
“金融行业不紧张,我们的小微企业就很紧张,所以我觉得假如阿里巴巴集团能够让现有金融体系紧张一下,也是互联网企业对社会进步的重要贡献。”马云说。在他看来,任何一个领导者对企业成功的定义都不是挑战了谁,而是创造了谁,否则终有一天会倒下。
事实上,从酝酿到曝光,在不为人知的背后,阿里金融走了很多年,在数据安全的基础上,怎么体现出数据的价值?开放似乎也还只是一个构想。
“我们今天所走的路是很新的路,参照系的东西并不多,从国外的公司来讲,有我们这个数据量的公司也并不多,我们确实是要小心地一步一步去走这条路,我们都很相信,它会有非常大的价值,但是这个价值将来到底怎么体现出来,就要看后来这条路,我也没办法今天去判断它绝对的价值是怎么产生的,每一个做数据的人肯定都非常相信它的价值,包括我自己在内。”关于大数据的未来,车品觉总结道。
大数据的话题虽然很热,但真正的脚步离我们还很远;而阿里大数据,亦尚在路上。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23在CDA(Certified Data Analyst)数据分析师的日常工作与认证考核中,分类变量的关联分析是高频核心场景。用户性别是否影响商品 ...
2026-03-23在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13