
大数据的秘密 社会化媒体的开放之路_数据分析师
大数据可以说是近来年最火热的一个话题。微博等社交化媒体因其独特的开放性特征,也成为大数据利用最令人关注的领域。
而这两年,随着微博、微信等社交平台商业化尝试的深入,及其结果的不尽如人意,大数据的利用成为了一个能否实现商业化实质突破的关键点。而这个点的关键又在于社交平台是否能做到对大数据的真正开放。
对于社交平台大数据开放,行业关注点现在主要在集中在两方面:其一是社交平台大数据究竟价值几何?其二,是基于这一大数据,平台方能给出怎样的的全面开放政策,以及这类政策的持续和稳定性又如何。
社交平台的数据价值
要了解社交平台大数据的价值,首先要搞清楚的是,开放平台合作伙伴们是如何利用这一大数据的。
化繁为简,我们将其概括为三步:首先是对平台所产生的庞大数据进行分析;然后,通过分析获得数据背后的用户诉求;最后,针对用户诉求进行个性化、精确化和智能化的信息推送和服务推广,并最终实现吸引用户点击、消费的目标。
举个简单例子,比如有用户在微博分享地理位置、景点等信息时,其广告模块就会快速精准的为其推荐相关的机票、酒店等信息。
而实现这一所有流程的起始点,就在于用户在社交网络上的生活化分享。而这也正是社交网络大数据的价值所在。
此外,企业通过社交大数据的分析和处理,还可以低成本的进行舆论监控,极大降低了企业品牌危机产生和扩散的可能。
社交平台的数据价值不言而喻。近日,新浪CTO许良杰在接受采访时就着重谈了大数据,并称“新浪微博作为社会化平台,最大的价值在于大数据”。
超5亿的用户群及每天产生各种信息便是新浪微博有价值的大数据。目前,其正基于此做多种商业化的尝试,但对这些尝试,业界评价似乎不是太高。
比如,包括粉丝通、Pagerank、淘宝广告等在内的基于大数据的产品尝试,皆一定程度上影响了用户体验,在利用数据的同时,产生了诸多垃圾数据,更降低了用户活跃度,对平台价值进行着侵蚀。
要知道,社交平台的数据价值指的并不单纯是用户数及用户信息等,而是基于其动态数据的挖掘、分析和以API接口的输出,及再利用。这需要诸多环节的协同与努力,而非平台方一家力所能及。
正如Facebook的工程总监Parikh所说:“大数据的意义在于真正对你的生意有内在的洞见。如果你不能好好利用自己收集到的数据,那你只是空有一堆数据而已,不叫大数据。”
开放尺度定成败
大数据的价值只是基础,要实现智能营销,一个重要层面还在于第三方能从多大程度上利用到这一数据进行挖掘。
而这也包含了两个层面,首先是API开放多样性,其次是数据的完整性。
在API开放方面,一直以来行业对开放平台期待最多的公司要数新浪。新浪初期也的确不负众望,给予了第三方开发者近百个API接口,可谓相当丰富。在2012年前后,通过这些接口,也密集涌现出了很多基于新浪微博大数据的创业公司,盛况空前。
然而这种基于开放而联姻的蜜月期还没来得及令人回味,新浪对于API开放的态度却在近期发生了转变。如在去年,新浪微博便关闭了其开放平台的私信接口,今年更是对开放平台接口做了进一步收紧(对当前授权应用只能读取授权该应用的当前用户微博,不能获取其他用户微博;同时,当前授权应用只能读取授权该应用的当前用户的关系,不能读取其他用户的关系。)。
而这种收窄的姿态,在阿里巴巴入股新浪微博之后,愈趋明显。
众多开发者表示,其多款应用的数据已被清空或者api接口被停用。现在新浪开放平台的每次更新也是删的多,增的少,而增加的功能也大多都是可有可无的。
开发作为当下互联网的一个趋势(百度、阿里巴巴、腾讯【简称BAT】三巨头都在谈开放),新浪微博反其道而行之,当然,新浪对API开放性的收缩,我们要承认其一些深层次的因素考量。比如之前私信端口的开放,就造成大量垃圾信息对用户的骚扰;以及与阿里联姻后,来自阿里方面的诉求和压力等。
与此相比,一直以来不声不响的腾讯微博倒在开放平台上做出了不少动静。比如,国内唱吧、啪啪,国外cooliris都选择了腾讯微博,甚至IOS7系统也首次开放IOS-SDK给腾讯微博。
其次说到开放的完整性,所谓数据完整性就是当开发者请求某种数据时,开放平台是否对返回数据的数量有所限制。这点也最能反映出一个平台的真实开放程度。
以最基本的获取一个用户的”粉丝列表“为例,新浪,对于一般授权用户,最多只能获得5000个最新粉丝信息,而腾讯则没有任何的限制。
腾讯副总裁刘炽平曾在其内部讲话中曾提到:“关键路径要有用户价值,如果没有用户价值,这里放一个流量,那里放一个流量,价值不大。” 而这句话也正点明了大数据开放的本质应该是什么。
行业皆知,只有数据挖掘精准度在85%以上时,才具备实现精准营销的条件。如数据挖掘不够精准,就会直接影响到广告营销的投放效果。而数据不完整,数据挖掘的精准度只是空谈而已。
而数据完整开放的重要性,还不仅仅限于第三方开放者,对于社交平台本身,在提升用户体验方面也息息相关。
比如腾讯微博最近上线的微圈、微热点、微频道、微博管家等产品,就是通过数据挖掘技术,抽取用户阅读时间线中来自游戏、活动、第三方应用等营销和广告微博,并将其过滤,从而进一步减轻垃圾信息对于微博用户的骚扰,从而使用户更高效的获取优质微博信息,最终实现用户阅读体验的提升。
这种将大数据挖掘产品化的路子,应该说值得借鉴。因为一方面,它能比较充分的满足第三方开发者需求;更重要的是,这并不以影响用户端的产品体验为代价,实施得好的话,可形成一个良性闭环模式.
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28PCU:游戏运营的 “实时晴雨表”—— 从数据监控到运营决策的落地指南 在游戏行业,DAU(日活跃用户)、MAU(月活跃用户)是衡量 ...
2025-08-28Excel 聚类分析:零代码实现数据分群,赋能中小团队业务决策 在数字化转型中,“数据分群” 是企业理解用户、优化运营的核心手段 ...
2025-08-28CDA 数据分析师:数字化时代数据思维的践行者与价值推动者 当数字经济成为全球经济增长的核心引擎,数据已从 “辅助性信息” 跃 ...
2025-08-28