京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据的秘密社会化媒体的开放之路_数据分析师
大数据可以说是近来年最火热的一个话题。微博等社交化媒体因其独特的开放性特征,也成为大数据利用最令人关注的领域。
而这两年,随着微博、微信等社交平台商业化尝试的深入,及其结果的不尽如人意,大数据的利用成为了一个能否实现商业化实质突破的关键点。而这个点的关键又在于社交平台是否能做到对大数据的真正开放。
对于社交平台大数据开放,行业关注点现在主要在集中在两方面:其一是社交平台大数据究竟价值几何?其二,是基于这一大数据,平台方能给出怎样的的全面开放政策,以及这类政策的持续和稳定性又如何。
社交平台的数据价值
要了解社交平台大数据的价值,首先要搞清楚的是,开放平台合作伙伴们是如何利用这一大数据的。
化繁为简,我们将其概括为三步:首先是对平台所产生的庞大数据进行分析;然后,通过分析获得数据背后的用户诉求;最后,针对用户诉求进行个性化、精确化和智能化的信息推送和服务推广,并最终实现吸引用户点击、消费的目标。
举个简单例子,比如有用户在微博分享地理位置、景点等信息时,其广告模块就会快速精准的为其推荐相关的机票、酒店等信息。
而实现这一所有流程的起始点,就在于用户在社交网络上的生活化分享。而这也正是社交网络大数据的价值所在。
此外,企业通过社交大数据的分析和处理,还可以低成本的进行舆论监控,极大降低了企业品牌危机产生和扩散的可能。
社交平台的数据价值不言而喻。近日,新浪CTO许良杰在接受采访时就着重谈了大数据,并称“新浪微博作为社会化平台,最大的价值在于大数据”。
超5亿的用户群及每天产生各种信息便是新浪微博有价值的大数据。目前,其正基于此做多种商业化的尝试,但对这些尝试,业界评价似乎不是太高。
比如,包括粉丝通、Pagerank、淘宝广告等在内的基于大数据的产品尝试,皆一定程度上影响了用户体验,在利用数据的同时,产生了诸多垃圾数据,更降低了用户活跃度,对平台价值进行着侵蚀。
要知道,社交平台的数据价值指的并不单纯是用户数及用户信息等,而是基于其动态数据的挖掘、分析和以API接口的输出,及再利用。这需要诸多环节的协同与努力,而非平台方一家力所能及。
正如Facebook的工程总监Parikh所说:“大数据的意义在于真正对你的生意有内在的洞见。如果你不能好好利用自己收集到的数据,那你只是空有一堆数据而已,不叫大数据。”
开放尺度定成败
大数据的价值只是基础,要实现智能营销,一个重要层面还在于第三方能从多大程度上利用到这一数据进行挖掘。
而这也包含了两个层面,首先是API开放多样性,其次是数据的完整性。
在API开放方面,一直以来行业对开放平台期待最多的公司要数新浪。新浪初期也的确不负众望,给予了第三方开发者近百个API接口,可谓相当丰富。在2012年前后,通过这些接口,也密集涌现出了很多基于新浪微博大数据的创业公司,盛况空前。
然而这种基于开放而联姻的蜜月期还没来得及令人回味,新浪对于API开放的态度却在近期发生了转变。如在去年,新浪微博便关闭了其开放平台的私信接口,今年更是对开放平台接口做了进一步收紧(对当前授权应用只能读取授权该应用的当前用户微博,不能获取其他用户微博;同时,当前授权应用只能读取授权该应用的当前用户的关系,不能读取其他用户的关系。)。
而这种收窄的姿态,在阿里巴巴入股新浪微博之后,愈趋明显。
众多开发者表示,其多款应用的数据已被清空或者api接口被停用。现在新浪开放平台的每次更新也是删的多,增的少,而增加的功能也大多都是可有可无的。
开发作为当下互联网的一个趋势(百度、阿里巴巴、腾讯【简称BAT】三巨头都在谈开放),新浪微博反其道而行之,当然,新浪对API开放性的收缩,我们要承认其一些深层次的因素考量。比如之前私信端口的开放,就造成大量垃圾信息对用户的骚扰;以及与阿里联姻后,来自阿里方面的诉求和压力等。
与此相比,一直以来不声不响的腾讯微博倒在开放平台上做出了不少动静。比如,国内唱吧、啪啪,国外cooliris都选择了腾讯微博,甚至IOS7系统也首次开放IOS-SDK给腾讯微博。
其次说到开放的完整性,所谓数据完整性就是当开发者请求某种数据时,开放平台是否对返回数据的数量有所限制。这点也最能反映出一个平台的真实开放程度。
以最基本的获取一个用户的”粉丝列表“为例,新浪,对于一般授权用户,最多只能获得5000个最新粉丝信息,而腾讯则没有任何的限制。
腾讯副总裁刘炽平曾在其内部讲话中曾提到:“关键路径要有用户价值,如果没有用户价值,这里放一个流量,那里放一个流量,价值不大。” 而这句话也正点明了大数据开放的本质应该是什么。
行业皆知,只有数据挖掘精准度在85%以上时,才具备实现精准营销的条件。如数据挖掘不够精准,就会直接影响到广告营销的投放效果。而数据不完整,数据挖掘的精准度只是空谈而已。
而数据完整开放的重要性,还不仅仅限于第三方开放者,对于社交平台本身,在提升用户体验方面也息息相关。
比如腾讯微博最近上线的微圈、微热点、微频道、微博管家等产品,就是通过数据挖掘技术,抽取用户阅读时间线中来自游戏、活动、第三方应用等营销和广告微博,并将其过滤,从而进一步减轻垃圾信息对于微博用户的骚扰,从而使用户更高效的获取优质微博信息,最终实现用户阅读体验的提升。
这种将大数据挖掘产品化的路子,应该说值得借鉴。因为一方面,它能比较充分的满足第三方开发者需求;更重要的是,这并不以影响用户端的产品体验为代价,实施得好的话,可形成一个良性闭环模式
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30在CDA(Certified Data Analyst)数据分析师的日常工作中,“无监督分组、挖掘数据内在聚类规律”是高频核心需求——电商场景中 ...
2026-03-30机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23