京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据的秘密社会化媒体的开放之路_数据分析师
大数据可以说是近来年最火热的一个话题。微博等社交化媒体因其独特的开放性特征,也成为大数据利用最令人关注的领域。
而这两年,随着微博、微信等社交平台商业化尝试的深入,及其结果的不尽如人意,大数据的利用成为了一个能否实现商业化实质突破的关键点。而这个点的关键又在于社交平台是否能做到对大数据的真正开放。
对于社交平台大数据开放,行业关注点现在主要在集中在两方面:其一是社交平台大数据究竟价值几何?其二,是基于这一大数据,平台方能给出怎样的的全面开放政策,以及这类政策的持续和稳定性又如何。
社交平台的数据价值
要了解社交平台大数据的价值,首先要搞清楚的是,开放平台合作伙伴们是如何利用这一大数据的。
化繁为简,我们将其概括为三步:首先是对平台所产生的庞大数据进行分析;然后,通过分析获得数据背后的用户诉求;最后,针对用户诉求进行个性化、精确化和智能化的信息推送和服务推广,并最终实现吸引用户点击、消费的目标。
举个简单例子,比如有用户在微博分享地理位置、景点等信息时,其广告模块就会快速精准的为其推荐相关的机票、酒店等信息。
而实现这一所有流程的起始点,就在于用户在社交网络上的生活化分享。而这也正是社交网络大数据的价值所在。
此外,企业通过社交大数据的分析和处理,还可以低成本的进行舆论监控,极大降低了企业品牌危机产生和扩散的可能。
社交平台的数据价值不言而喻。近日,新浪CTO许良杰在接受采访时就着重谈了大数据,并称“新浪微博作为社会化平台,最大的价值在于大数据”。
超5亿的用户群及每天产生各种信息便是新浪微博有价值的大数据。目前,其正基于此做多种商业化的尝试,但对这些尝试,业界评价似乎不是太高。
比如,包括粉丝通、Pagerank、淘宝广告等在内的基于大数据的产品尝试,皆一定程度上影响了用户体验,在利用数据的同时,产生了诸多垃圾数据,更降低了用户活跃度,对平台价值进行着侵蚀。
要知道,社交平台的数据价值指的并不单纯是用户数及用户信息等,而是基于其动态数据的挖掘、分析和以API接口的输出,及再利用。这需要诸多环节的协同与努力,而非平台方一家力所能及。
正如Facebook的工程总监Parikh所说:“大数据的意义在于真正对你的生意有内在的洞见。如果你不能好好利用自己收集到的数据,那你只是空有一堆数据而已,不叫大数据。”
开放尺度定成败
大数据的价值只是基础,要实现智能营销,一个重要层面还在于第三方能从多大程度上利用到这一数据进行挖掘。
而这也包含了两个层面,首先是API开放多样性,其次是数据的完整性。
在API开放方面,一直以来行业对开放平台期待最多的公司要数新浪。新浪初期也的确不负众望,给予了第三方开发者近百个API接口,可谓相当丰富。在2012年前后,通过这些接口,也密集涌现出了很多基于新浪微博大数据的创业公司,盛况空前。
然而这种基于开放而联姻的蜜月期还没来得及令人回味,新浪对于API开放的态度却在近期发生了转变。如在去年,新浪微博便关闭了其开放平台的私信接口,今年更是对开放平台接口做了进一步收紧(对当前授权应用只能读取授权该应用的当前用户微博,不能获取其他用户微博;同时,当前授权应用只能读取授权该应用的当前用户的关系,不能读取其他用户的关系。)。
而这种收窄的姿态,在阿里巴巴入股新浪微博之后,愈趋明显。
众多开发者表示,其多款应用的数据已被清空或者api接口被停用。现在新浪开放平台的每次更新也是删的多,增的少,而增加的功能也大多都是可有可无的。
开发作为当下互联网的一个趋势(百度、阿里巴巴、腾讯【简称BAT】三巨头都在谈开放),新浪微博反其道而行之,当然,新浪对API开放性的收缩,我们要承认其一些深层次的因素考量。比如之前私信端口的开放,就造成大量垃圾信息对用户的骚扰;以及与阿里联姻后,来自阿里方面的诉求和压力等。
与此相比,一直以来不声不响的腾讯微博倒在开放平台上做出了不少动静。比如,国内唱吧、啪啪,国外cooliris都选择了腾讯微博,甚至IOS7系统也首次开放IOS-SDK给腾讯微博。
其次说到开放的完整性,所谓数据完整性就是当开发者请求某种数据时,开放平台是否对返回数据的数量有所限制。这点也最能反映出一个平台的真实开放程度。
以最基本的获取一个用户的”粉丝列表“为例,新浪,对于一般授权用户,最多只能获得5000个最新粉丝信息,而腾讯则没有任何的限制。
腾讯副总裁刘炽平曾在其内部讲话中曾提到:“关键路径要有用户价值,如果没有用户价值,这里放一个流量,那里放一个流量,价值不大。” 而这句话也正点明了大数据开放的本质应该是什么。
行业皆知,只有数据挖掘精准度在85%以上时,才具备实现精准营销的条件。如数据挖掘不够精准,就会直接影响到广告营销的投放效果。而数据不完整,数据挖掘的精准度只是空谈而已。
而数据完整开放的重要性,还不仅仅限于第三方开放者,对于社交平台本身,在提升用户体验方面也息息相关。
比如腾讯微博最近上线的微圈、微热点、微频道、微博管家等产品,就是通过数据挖掘技术,抽取用户阅读时间线中来自游戏、活动、第三方应用等营销和广告微博,并将其过滤,从而进一步减轻垃圾信息对于微博用户的骚扰,从而使用户更高效的获取优质微博信息,最终实现用户阅读体验的提升。
这种将大数据挖掘产品化的路子,应该说值得借鉴。因为一方面,它能比较充分的满足第三方开发者需求;更重要的是,这并不以影响用户端的产品体验为代价,实施得好的话,可形成一个良性闭环模式
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15