京公网安备 11010802034615号
经营许可证编号:京B2-20210330
Yahoo的大数据分析的个人化应用_数据分析师培训
大数据(Big Data)近年来已成为市场关注焦点,为了能够发掘大数据的商业价值,在基础建设已经渐渐完备,数据搜集及储存能力已然成熟的环境下,大数据应用的探索焦点,已逐渐从数据技术与系统的讨论,逐渐转移到数据的分析与各领域的深化应用。
如目前的入口网站早已是许多人日常生活不可或缺的服务提供者,透过使用者在使用入口网站服务的行为分析,业者不但可以更进一步地提供个人化推荐服务,还可能为相关业者找到更多的商机。
但并非所有的数据都能产生价值,必须透过很多生态系统搭配组合,才能产生用户所需要的资讯。
大数据已成市场关注焦点。数据的确需要去开采,也需要技术及工具,但技术及工具也可能会用错或浪费资源,所以技术人员不能只看技术,而是要去理解数据真正的价值所在。
如健康照护服务及定位数据如果加以混搭,虽然可以提供更进一步的价值,但如何说动使用者开放或分享,其实需要更细致的说服过程。此外,大数据分析所呈现的世界,客户需求会更加清晰,但市场区隔也会变小,产品及服务必须要更加客制化。
随着无线网路、行动装置及物联网的时代来临,人与物的连结将变得更加多样化,也创造出更多各类型的数据,如何管理、维护及分析这些数据,并将正确分析的结果即时传给正确的使用者,创造更多的商业价值,势必将成为企业未来非常重要的竞争力,大数据分析的价值,值得加以重视。
大数据分析的个人化应用
网际网路基础建设渐趋成熟,加上行动装置的便利性及普及,让许多人的日常生活行为,已经离不开网路,其中又以入口网站接触到的使用者最多,也成为大数据的最主要来源。
如Yahoo提供的诸多服务,如电子信箱、购物、新闻、理财等,都可以追踪到消费者的足迹,加上使用者其他的网路使用行为如点击广告等,以及全球每月可收集超过16亿只智慧型手机及平板电脑上的使用者行为,如何进一步分析这些个人化应用,已成为重要议题。资讯及选择太多,其实也是大数据分析所遭遇的一大难题,以Yahoo所能追踪的消费者使用足迹为例,就会发现其实跟一般官网可以追踪的足迹不太一样,由此也可知,大数据与一般数据其实仍有差别,不能用同样的思考或方法来分析。
大数据具有5大特性,包括数据量(volume)、速度(velocity)、多样性(variety)、易变性(variability)及真实性(veracity)。其中数据量、速度及多样性这3项是一般较常用来评估大数据的标准。
由于使用者平日在网路的应用习惯,举凡使用搜寻引擎、即时通讯、看影音节目、气象、听音乐、购物、社群活动、上传相片、电邮及阅读新闻,Yahoo都有提供对应的服务,其中光是使用者接触到的媒体内容、电子商务及数位行销广告的使用行为分析,就可以产生非常大的商业价值。在分析大数据时,Yahoo一定会做好个人隐私保护,只有行为数据才是真正可以分析的行为。例如,光是早餐的麦片种类就超过70种,往往会造成消费者选择的困扰,但如果透过适当的使用者经验分析,就能提升使用者的正面体验。
以一个小资女班族的日常生活为例,早上在搭捷运上班途中,打开手机看新闻,透过大数据分析,就会优先提供这位使用者平常阅读的影剧新闻、近期因为想要旅游而常关注的旅游文章,以及最近热门浏览的财经新闻。
透过大数据分析使用者行为,也能让使用者得到更多相关资讯。如使用者在点击购物中心84折运动的资讯时,网站就会提示使用者之前看过的那些商品,其实也适用此活动。
甚至在使用者因为点选了广告推荐的日本秋季赏枫行程,个人化推荐模组就会显示超级商城的冬季新装长大衣,或是日本零食、美妆等商品资讯。而且当使用者下班后经过药妆店时,超级商城App也会提供有限定商品折扣的讯息,而且凭App产生的条码,到店购买就可享有第二件7折优惠。
Yahoo首页每天分析超过1亿个以上的网路使用行为,才能提供使用者最感兴趣的互动,而且使用者的网路使用行为愈多,Yahoo提供的资讯也会愈精准。
而对厂商而言,精准行销广告本来就会有提高广告投资效益的效果,如果能根据使用者行为,在首页出现相关的广告,或提示相关的行销活动,抓到使用者的需求,销售将会成倍数成长,尤其是个人化模组的促销量,效果又会比网站推荐模组的效果更好。
针对电子商务,Yahoo台湾团队自主研发演算法与归纳消费者行为模式进行分群,透过数百群产品推荐模组,提供更优质的个人化服务,让购物中心来自个人化推荐模组的业绩显着增加。电子商务方向的大数据分析经验,发现使用者对于即时性的要求很高,也就是说,使用者的任何行为,要在10几分钟后就能完成分析,提供进一步的建议。
要做到前述的使用者行为分析,其实需要各种数据分析技术支援,如分析消费者各类行为与需求的预测模型,也要有能力即时侦测互动事件,并回馈产生最佳的个人化服务内容,而具备一个能够从互动产生的大数据中,快速地搜集、储存、撷取、汇整与计算的大数据分析平台,更是其中的关键要素。
大数据分析平台的运作过程,必须先要有数据来源,然后透过Hadoop、Shark及SQL等技术,很快地完成数据分析处理,最后再将结果储存并展示在使用者的面前。此外,大数据要做到个人化分析应用,科学建模(Science Modeling)的重要性不言可喻,科学建模依据的数学或科学理论,透过雅虎的实际工程(Practical Engineering)及适应学习(Adaptive Learning)能力,可以具体实践出成果。大数据分析要做到个人化应用,批次讯号及即时讯号的分析技术,两者无法相互替代,必须相辅相成,再透过分群数据技术及个人化引擎,最后才能提供为使用者个人量身订做的专属建议。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10