京公网安备 11010802034615号
经营许可证编号:京B2-20210330
财务信息化:大数据小时代
数十年来,人们对所谓的“信息技术”的关注一直偏重于其中的“技术”部分。首席信息官(CIO)的职责就是购买和管理服务器、存储设备和网络。而如今,信息以及对信息的分析、存储和预测的能力,正成为一种竞争优势。大数据时代,企业信息化诞生了新的岗位:CDO——首席数据官。与CIO职责不同的是,CDO的贡献在于知道获取哪些数据,以及用什么方法和手段对数据进行分析。
在数据高速增长的环境下,每个企业都需要一个大数据路线图,至少企业应该为获取数据制订一种战略,获取范围应从内部系统的常规机器日志一直延展到线上的用户交互记录。即使企业当时并不知道这些数据有什么用,他们也要这样做,或许随后他们会突然发现这些数据的作用。正如罗杰斯所言,“数据所创造的价值远远高于最初的预期——千万不要随便将它们抛弃。”
问题在于,来自于全球各大IT厂商的大数据调门已经高得不能再高,而对于谨言慎行的CFO们而言,能触摸到的真实案例才是可以借鉴的。为此,《首席财务官》杂志在喧嚣的大数据口号浪潮里努力寻找那些更具体的小战略、小应用和小变革,我们相信这些“小时代”的点滴进步,才是拥抱大数据时代的务实脚步。
大卫·芬雷布:必须要有一种巧妙的方法及时将数据可视化,而不用花费几天或几周时间
大卫·芬雷布作为“大数据商业应用的引路人”,与同伴共同创建的Big Data Group公司,旨在为科技买家和供应商提供咨询服务。同时,大卫·芬雷布也是一位着名的风险投资人,曾在莫尔达维多风险投资公司任职,掌管20亿美元资产。
工作之余,大卫·芬雷布喜欢铁人三项运动,并将爬过的每座山、跑过的每段路,以及在冰冷的水中游过的所有里程全部记录下来,并上传到网络上,然后对数据进行可视化处理及分析,以提高自己的成绩。后来大卫·芬雷布意识到,自己早已在不经意间步入了大数据时代。芬雷布介绍,铁人三项赛由3.8公里的游泳、180公里的自行车和紧随其后的42.195公里的全程马拉松组成。要完成整个比赛,运动员需要集中精神、持之以恒并训练有素,同时还要求参赛者具备惊人的体力。参赛者在比赛中会消耗8000~10000卡路里的能量,而一般人平均每日消耗2000~2500卡路里。营养补给通常被视为铁人三项的第四项,它能决定一个运动员能否完成比赛。因此,不管是准备参赛还是完成这项运动本身都必须对数据给予高度重视。没锻炼到一定公里数的运动员就会在比赛当天耐力不足;即便是训练有素的运动员,如果营养和水分补给不足,也迈不过终点线。
为了让更多的人了解大数据,芬雷布与同伴共同创建了Big Data
Group公司,为科技买家和供应商提供咨询服务。在芬雷布看来,数据要具有实时性价值,必须满足以下三个条件:数据本身必须要有价值;必须有足有的存储空间和计算机处理能力来存储和分析数据;必须要有一种巧妙的方法及时将数据可视化,而不用花费几天或几周的时间。
搜索引擎巨头谷歌就是大数据的缩影。除了存储搜索结果中出现的网站链接外,谷歌还能存储人们的所有搜索行为,这些对数据的洞察力意味着谷歌可以优化其广告,使之从网络流量中获益。另外,谷歌不仅可以追踪人的行为,还可以预测人们接下来会采取怎样的行动。换句话说,在你行动之前,谷歌就已经知道你在寻找什么了。芬雷布强调,“这种对大量的人机数据进行捕捉、存储和分析,并根据这些数据做出预测的能力就是我们所说的大数据。”
在体育赛事中,云计算和大数据分析的最佳综合应用莫过于四大满贯之一的温布尔顿网球公开赛。IBM不仅是温网的赞助商,还拥有官方技术顾问的头衔。如今,温网已经是公认的全球最智能的专业网球锦标赛。IBM对于温布尔顿官网设计煞费苦心,球迷不但可以浏览基本的赛程和积分信息,还可了解每位球员的详细数据。为了向网球发烧友、职业球员、教练、体育节目评论员等不同类别的观众创造独一无二的数据体验,球赛每一场、每一盘、每一局、每一分的数据都被网站收集进来,每个得分都会产生几种不同的记录:包括发球速度、网前次数、发球犯规次数、反手还是正手拍回球等。官方实时收集和显示这些数据,电视台体育频道主播可以立刻用来点评球赛,球员和教练可以分析选手的表现以实时调整对战策略,世界各地的球迷则可以通过电脑或智能手机的应用程序追踪选手表现。除了收录赛事实时数据,IBM还整理了过去数年四大满贯的历史数据,将海量数据汇入数据仓库内,再运用统计分析工具预测每个球员需要达到什么技术指标,包括接发球胜率、每盘破发成功率、网前得分率等,才能提高赢球率。将球员现场的表现与这些历史指标交叉对比,不但增加比赛的可看性,也可以加深球迷对网球运动的了解。
让我们把话题回归到大数据对商业的影响。
最近“大数据”的火热程度堪比“世界杯”,如0DSP
Rocketfuel(全球第一家DSP上市公司)、BAT(百度、阿里和腾讯)等全球和国内互联网巨头已将触角延伸至大数据各个产业。几乎所有世界级的互联网企业,都已将业务触角延伸至大数据产业。新浪微博用户每天发博量超过1亿条,百度大约要处理数十亿次搜索请求,淘宝2013“双十一”的交易则达到1.7亿笔……2013年美国棱镜门通过大数据监测其他国家,更是将大数据上升到国家战略层面。从技术创新、商业变革到大数据思维,大数据正在带来翻天覆地的变化。尤其是在大数据营销运用上——基于大数据积累基础上的按受众购买的方式(DSP)和RTB技术(实时竞价)正改写网络广告生存法则,随着媒体碎片化时代来临,流量开始分散,流量背后的受众也随之分散在上述各种流量平台上,而大数据精准技术的必要性就凸显出来。从泛电商到传统品牌企业都开始试图求变与破局,想通过基于大数据的精准营销来进行营销变革,以求降低成本和提升ROI。
在亿玛总裁柯细兴看来,“当初,靠资源、好的广告位进行广告投放的商业模式将要彻底改变,基于大数据的按受众购买的方式(DSP)和RTB(实时竞价)技术已经改变网络广告生态格局:即使是一个最不起眼的长尾媒体流量,通过精准的人群画像和实时竞价交易,也能为客户创造出巨大价值,为媒体本身带来甚至超越主流媒体广告位的价格。”
在国内,亿玛是中国效果整合营销领导者。根据易观国际数据,从2010年至2012年亿玛连续三年在独立第三方CPS联盟市场位列第一,是效果营销联盟的领头羊。在大数据时代全面来临和互联网广告RTB技术不断进步的背景下,除自身效果联盟和精准广告网络及综合导购门户外,亿玛先后布局移动营销和大数据营销,尤其在大数据精准营销上,率先提出按效果付费DSP的模式,是中国大数据精准营销付费模式的一种创新和变革。柯细兴表示,从效果营销战略升级到大数据精准营销,亿玛希望通过举办每年一届的“亿玛智慧峰会”携手泛电商、品牌企业和第三方研究机构,全力打造健康可持续发展的大数据产业生态链。
柯细兴透露,亿玛目前拥有超过30万媒体数量的网购用户商品浏览行为数据,并与中国目前TOP500电商有长期合作关系,拥有过亿的网购用户行为数据,通过大数据精准营销技术(人群估值技术、定向技术等),可以对积累的海量网民网购行为数据进行即时的分析与处理,精准判断出网民的性别、年龄、兴趣爱好、购买偏向等(不需要网民的主动搜索),实时找到广告主想要精准匹配的人。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21