京公网安备 11010802034615号
经营许可证编号:京B2-20210330
2015年对于大数据来说,是个值得纪念的一年,大数据在这一年得到了认可。同时,这一年中也经历了很多发展的低潮,这就像是一次次的警 告,或许某一天大数据就不再具有改变世界的力量了。因此让我们一起来回顾一下今年最重要或者最具价值的相关新闻,一起回味这一年大数据发展所经历的起起落 落。
一月
2015 年,全球通过手机或移动装置接入互联网的用户超过了通过电脑或者笔记本接入电脑的用户。其实移动网络的用户在 2014 年后期就超过了通过台式电脑访问网络的用户,而这种用户习惯的改变对于 App 设计人员、公司甚至政府如何收集数据都会产生巨大的影响。2015 年伊始,就有 Microsoft 购买 Revolution Analytics 公司。开源程序语言将会成为统计计算和预测分析领域最流行的语言。大规模数据泄露(其规模和频率在过去十年间以指数形式增长)并没有减弱的趋势。美国政府 在今年年初就宣布,400 万政府雇员的信息被人通过人事管理局窃取。
二月
白宫发布的一份关于“大数据创造的机会和危机”的报告总结了虽然当今技术为大数据的发展和改变提供了无法估量的潜力,但是仍然有很多 与隐私和数据保护相关的问题亟待解决。该报告还提到,《消费者隐私权利法案》(也称为“请勿追踪”的法规)的持续发展更为重要。这意味着法律赋予了个人这 样的权利——你可以拒绝另一个人或者组织来追踪以及记录你的个人信息。
三月
IBM 宣布将会在接下来的四年中向物联网技术投资 30 亿美元。所有设备可以对话、在线分享信息、并且可以互动,从而使得我们的生活更加轻松的概念在 2015 年仍然非常重要,IBM 将会致力于在实时分析领域取得新突破。
四月
期待已久的 Apple Watch 终于问世了,并且迅速成为了全球首款人人“必备”的物联网装 置。自从上市以来,尽管人们知道在上市当天的 6 小时内有 100 万的订单(大致相当于 iPad 一个月的销量,iPhone 两个月的销量。),但是 Apple 一直对 Apple Watch 的销量守口如瓶。大数据这个“池塘”的“几条大鱼”推出了新的服务或者对原服务进行了扩展,其中亚马逊网页服务(AWS)宣布其客户将很快可以通过亚马逊 机器学习体验到机器学习的优势,与之相对的具有机器学习产品的公司包括微软小冰和 IBM 的沃森,以及 Google。
五月
Computing Research (计算研究) 发布了“2015 大数据市场评论”,该评论发现在过去的一年中,没有将大数据和大数据分析集成到其运营过程的企业的比例从 33% 降到了 16%。在对 400 位各行各业的决策者(包括政府、零售商、金融服务、科技和教育领域)的调查中,76% 的人认为他们的组织分析更多集中于内部运营数据而不是外部数据。
六月
德国总理默克尔提醒德国国内民众不需要担心公共数据的收集,以及在全球大数据淘金热中德国被落下的风险。在柏林的一次会议中,默克尔说道,“无论谁将数据视为威胁,或者认为每一份数据都可能意味着一份破坏,这样的人将永远无法利用数字化所潜藏的巨大优势。”
七月
继 2014 年企业数据丢失和被盗案件频繁发生之后,2015 年再次成为大规模数据泄露事件频发的一年。今年 7 月交友网站 Ashley Maddison 遭到大规模攻击。使得该事件如此受关注的原因是由于该网站的天性造成的,因为这有可能与人们对家庭的忠诚联系起来。这些被盗数据潜在的色情内容使得这成为 了一个大事件,同时手机零售商 Carphone Warehouse、集资网站 Patreon、电信运营商 T-Mobile、医疗服务提供商 Anthem 和信贷资料服务机构等也有数百万顾客成为受害者。
八月
中国零售商和网络服务商阿里巴巴推出阿里云,这也是阿里巴巴自己的云分析系统,该系统允许企业可以在自己的硬件上以机器学习为技术基 础进行数据分析。这也是向西方科技巨头看齐的一步,因为西方科技巨头已经全部推出了自己的大数据服务系统。阿里巴巴将阿里云视为“中国第一个人工智能平 台”,并称其可以在 6 小时内处理 100PB 的数据,相当于 1 亿部高清电影。
九月
欧洲隐私保护活动家在本月庆祝了一项胜利——欧盟法院宣布所谓的“安全港”的协议无效。在奥地利隐私保护倡导者 Max Schrem 起诉 Facebook 的案例中,鉴于斯诺登案件的启示,美国公司关于保护欧洲公民数据隐私的承诺并没有保障。此案对于任何美国和欧洲之间基于数据传输的业务都有深远意义。
十月
史上最大的科技交易发生在本月。硬件制造商戴尔宣布其将斥资 670 亿美元收购数据存储、云计算和分析供应商 EMC 及其子公司——虚拟化技术专家 VMWare。
十一月
英国金融行为监管局(FCA)宣布将调查保险公司对于大数据的使用行为。FCA 将深入调查客户数据(通过大规模收集和分析获得)的日益增加的使用行为,尤其是作为保险费收费标准的参考方面的用途。将要解决的问题包括以大数据为基础的 保险费收费标准是否会导致保险公司会根据投保人采取歧视性做法。
十二月
欧洲在政府和公司应该如何对待个人数据方面迈出了重要步伐。《通用数据保护条例》(GDPR)草案获得通过,接下来的三年是进一步讨 论和研究。该法案将会对个人数据的使用设置更为严厉的规则。更重要的是,该草案(有望在 2017 年成为法律)强调公司在收集个人数据时,必须获得数据所有者的允许,并且只能将数据用于已经被允许的方面。任何诱导用户对数据授权的做法(例如进行某些操 作就意味着同意等的做法)将会被取缔,而违反相关规定的公司将要缴纳其全球收入的 4% 作为罚款。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11