京公网安备 11010802034615号
经营许可证编号:京B2-20210330
开放与安全 大数据的“尴尬”博弈
手握大数据,你能做什么?
消费者,可以通过售后服务和投诉率等指标货比三家;商家,可以借助信息的公开透明和谐相处、良性竞争;投资者,可以分析数据准确找到自己想投资的项目……
有人说,数据就是生产力,在信息社会,它将成为核心资源;有人说,虽然它还没有被列入企业的资产负债表,但只是一个时间问题……
大数据,已然成为时下最火热的IT行业热搜词,随着数据仓库、数据安全、数据分析、数据挖掘等围绕大数据商业价值的被利用,其逐渐成为行业人士争相追捧的利润焦点。
只是,自古“忠孝两难全”,凡事皆难两全其美。当央视315晚会大力度曝光Cookie采集用户信息时,当人们因个人隐私被泄露而只能一声叹息时,“风光无限”的大数据遭遇了当头棒喝。福音还是灾难?一夜间,关于大数据的讨论多了些许忧心的成分,如何挖掘和使用数据?企业的道德底线瞬间被推上了审判的至高点……
大数据开放才是硬道理
“大数据时代,是三个和尚在一起才有水喝。”对于这一形容,阿里集团数据委员会的会长车品觉非常认同,在他看来,大数据行业本身非常考验技术和商业的同时,也需要很多其他的东西结合起来之后才能用在数据上, 亦即利用数据拿到更多数据,互惠互利。
为了更好地理解这一概念,在阿里媒体开放日上,车品觉和我们分享了一个典型的故事。
一个海员,因为意外要把他派到一个地方去收集一些航海工具。当时,他发现这个地方有很多航海日志,可以提炼出不少数据化的航海背景,于是,他收集这些东西放在航海地图上,以帮助将来出海的人做一些决策,而航海的人根据此地图行动后也必须要收集一些数据继续完善,不断反馈和纠正,在实践中提炼数据的敏捷性,这本诞生于100年前的航海地图就是我们今天追寻的大数据,它具有数据体量巨大、数据类型繁多、商业价值高和处理速度快等特点。
收集数据、应用数据,然后出现质量问题,层层反馈回去以建立更清楚的数据源。对于大数据而言,开放似乎才是硬道理;对于很多企业来说,大数据管理其实是补10年前管理理念上的课。眼下,移动互联网与社交网络的兴起更是将其带上了新的征程,但车品觉却表现出了谨慎保守的态度。
“孤立的部分不能构成整体,但处理开放最大的难题就是数据安全,开放是硬道理但安全也是重要的保障,在安全还没搞清楚之前,开放还需要等待。”在大数据行业践行多年的车品觉再三强调现在谈数据的开放还为时尚早。毕竟,数据越大,问题越大,数据安全问题亦自云计算概念普及之时已被频繁提上议程。
个人隐私遭泄露:数据开放的另一头是安全
网购时,包括家庭住址、电话等个人信息被商家一览无余之时也被不法企业廉价贩卖;安装手机APP,通话记录、短信记录、通讯录成了隐私信息泄露的三个高危地带……于是,各种陌生、欺诈电话应接不暇;个性生活、消费习惯更是被相关利益方了如指掌。小米科技CEO雷军更是发出“手机丢了,比电脑丢了还恐怖”的感慨,如是说,越来越开放的大数据已失去了重心?如何守住正义的最后这道防线成了商家必修的课题。
对于淘宝和阿里系,车品觉介绍称,从内部的情况来讲,个人很重要的信息我们称之为敏感信息,从敏感信息来讲,从收藏库到仓库是隐蔽的,你是工程师或者在内部开过店有你个人的隐私,内部安全把敏感数据隐蔽,不能让一般人看见这个数据,有些我们称之为机密性的数据就更严重一点,在仓库里面都看不见这些数据,这是隐秘性的。从应用来讲,要应用这个数据需要遵守PRD原则,经过内部的评审,看有没有侵犯到个人隐私,所以,从内部来讲对个人隐私方面还是相对保护比较多。
事实上,当前大数据面前有三座大山,一是数据质量作为底线:如果原材料不可靠,将无法加以利用;第二,平衡数据安全与开放,开放是硬道理,但开放最大的难题是数据安全。第三,落实数据化运营,只有当大量的员工懂数据,用数据来决策业务,才能说明这家公司开始启动数据化运营。
不可否认,数据开放本身会产生力量,适当的开放也会产生更多的想法,但如车品觉所言,开放不一定是获取数据,可能是创新想法的交换,这比获取数据更重要。
当前,挖掘用户的行为习惯和喜好、 帮企业做内部数据挖掘或优化、帮企业更精准找到用户,降低营销成本,提高企业销售率,增加利润……可以看出,虽然大数据目前在国内还处于初级阶段,但是商业价值已显现出来,诞生了新的商业模式的同时亦仿佛站在金矿上。
如何让它有可参考性?“伴有主观情绪在里面的数据需要清楚的告诉别人主观判断在哪里,比如我们看一些访谈,它会说,这个访谈是经过调查两千人后得到的结果,这种就是参考数据。”车品觉表示。
值得一提的是,无论如何,在隐私泄露这件事情上,消费者是需要被保护的弱势群体,商业也好,企业也罢,需要在开放与安全中把握好一个“度”,可以说,这是一个良心的判断。
阿里大数据还在路上
让数据获取、使用、分享、协同、连接、组合变得超级简单,这是大数据时代背景下我们的终极理想。只是,需要努力的是,我们暂未找到一个很好的盈利模式,包括走在前面的阿里。
“今天很多大数据公司还在投资,我们还看不清他的赢利点到底在哪里,最简单的是用数据去做一些数据产品,比如以前的数据魔方,或者今天的阿里金融,就是用数据生产一套新的东西出来,我相信这是今天比较容易能看见的。”车品觉说。
此前,阿里集团董事局主席马云提出了“平台、金融、数据”三步走的战略,继阿里集团架构调整、组建小微金融服务集团后,再次传出阿里金融让银行紧张的说法。
据介绍,阿里金融是针对中小企业在这个时代的融资需求应运而生,这个方案贯彻了透明、开放、责任与分享,它的第一职责不是帮助金融机构,帮助客户、帮助无数淘宝卖家才是阿里金融的责任所在。
“金融行业不紧张,我们的小微企业就很紧张,所以我觉得假如阿里巴巴集团能够让现有金融体系紧张一下,也是互联网企业对社会进步的重要贡献。”马云说。在他看来,任何一个领导者对企业成功的定义都不是挑战了谁,而是创造了谁,否则终有一天会倒下。
事实上,从酝酿到曝光,在不为人知的背后,阿里金融走了很多年,在数据安全的基础上,怎么体现出数据的价值?开放似乎也还只是一个构想。
“我们今天所走的路是很新的路,参照系的东西并不多,从国外的公司来讲,有我们这个数据量的公司也并不多,我们确实是要小心地一步一步去走这条路,我们都很相信,它会有非常大的价值,但是这个价值将来到底怎么体现出来,就要看后来这条路,我也没办法今天去判断它绝对的价值是怎么产生的,每一个做数据的人肯定都非常相信它的价值,包括我自己在内。”关于大数据的未来,车品觉总结道。
大数据的话题虽然很热,但真正的脚步离我们还很远;而阿里大数据,亦尚在路上。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21