京公网安备 11010802034615号
经营许可证编号:京B2-20210330
接地气的大数据来了:如何预报雾霾_数据分析师培训
以主题为“主导这一刻”的IBM Insight 2015大数据分析峰会在京隆重举行。来自各界的数据分析领先实践者们与IBM领导团队、技术专家一道共同探讨如何更好的利用数据资源支持中国新一代信息产业与传统产业深度融合。与会者围绕大数据在工业4.0、城市规划、环境保护、交通治理、等诸如雾霾预报和应对,套牌车辆识别,饮食健康、儿童娱乐等大众民生关注领域的发展进行了深入交流和探讨。
今年的政府工作报告中提到“互联网+”,引发社会热议。大家普遍相信,中国新一代信息产业与传统产业深度融合、相互促进创新的局面即将掀开新的篇章。工业是我国经济的立足之本,“工业 4.0”是这场创新大潮当中的亮点。中国是数据矿藏量巨大的国家,有超过6亿的互联网人口,繁荣的互联网经济,方兴未艾的政府和企业IT系统,有望迎来爆发增长的物联网和工业互联网。如何用好中国的大数据资源,对中国的“互联网+”,以及工业 4.0 的发展意义重大。
IBM大中华区首席执行总裁钱大群先生表示:“去年是 IBM 中国公司成立三十周年,IBM 在中国启动了中国的新战略,那就是“与中国同创”,从made for China 到made with China。大数据是中国走向工业 4.0 强有力的引擎,IBM仍将与各位前瞻者同行、与中国同创新的辉煌”

▲IBM大中华区首席执行总裁钱大群
开放与协作,Made With China
2014年是IBM大举向大数据、云计算、移动社交转型。IBM与Twitter、腾讯,等新兴创新企业开展合作。在中国,IBM以全新的开放联合创新的姿态面对新环境发展,在大数据领域,先后与宝信科技、华胜天成、浪潮、用友、数慧科技、南大通用、正通汇智等本土合作伙伴展开合作,并拥有了包括鲁能集团、万得数据、上海虹桥机场、乐友孕婴童、飞鹤乳业、驴妈妈、民生银行、深圳儿童医院等各行业大数据客户。IBM还推出了U100计划,向100所中国高校捐赠价值1亿美元的大数据及分析软件。刚刚又宣布与香港中文大学市场学系对外贸易大学国际商学院、西南交大经济管理学院等联合推出“百企大数据『A100』”计划,免费为100所拥有B2C数据的企业提供大数据分析服务。IBM与慧科科技合作在“开课吧”网站上提供免费的MOOC项目。IBM在大数据努力和成就得到业界的广泛认可,2014年,在20多个来自Gartner,Forrester和IDC的数据/分析软件和服务测评中,IBM都居于领导地位。据最近发布的IBM 2014年财报,IBM在云计算、大数据、移动、社交、安全等领域整体增长了近16%,达250亿美金,占IBM整体营收的27%。其中,作为IBM转型的核心战略,大数据业务增长了7%,营收达170亿美元。
在过去的一年,IBM通过授权软硬件技术和工具,正在帮助中国开发出自主创新的处理器芯片、服务器系统、数据库产品、中间产品和操作系统,技术开放战略获得了工信部、江苏省、北京市等政府的支持。
IBM大中华区数据与分析事业部总经理钟泽敏先生表示:“IBM将继续践行‘Made With China’的承诺,通过全新的开放协作的模式,与各界合作伙伴一道,通过IBM大数据能力支持行业实现转型升级,与合作伙伴共建中国大数据发展健康生态。”

▲IBM大中华区数据与分析事业部总经理钟泽敏
聚焦城市发展热点:雾霾预报,识别套牌车、
去年,IBM启动科技合作伙伴计划以来,以技术共享、联合创新中心等多种合作模式,利用IBM的全球化视野、专业研发人才、行业洞察等,帮助本土合作伙伴突破创新束缚,以协作创新赋能行业创新。尤其在环保、交通、城镇化等民生领域,取得了卓越成就。
为了助力解决可持续发展的三大难题——大气污染防治、可再生能源高效利用和企业节能减排,IBM推出了一个长达十年的计划——“绿色地平线”(Green Horizon) ,利用IBM的大数据分析和认知计算科技来进行北京地区的雾霾预报和应对建议。目前这个项目已经将雾霾的预报时间从之前的24小时提升到72小时,精度从之前的100平方公里提升到1平方公里,将能够为首都地区最终应对雾霾挑战提供重要支持。同样的科技,在行业和智慧城市建设当中都具有广阔的应用前景。
交通是城市发展的命脉,在各地智慧城市建设过程中,智慧交通都处于非常重要的位置。管好交通,需要同时管好车和路。利用车联网技术打通车辆制造、销售、服务、管理每个单元,达到对车辆的有效管理;通过智能交通技术,特别是大数据与分析优化来管理套牌车辆监察、疏通拥堵,提升车辆通行效率,这些是我们共同关心的话题。
车联网和智能交通都呈现数据量巨大尤其是非结构化数据大且数据分布广的特点, 传统解决方案对诸如地理位置数据、图像数据都无法有效快速的支持。宝信与IBM正在合力应对这些交通发展难题,打造智能交通与优化的车联网方案。宝信软件研发部总经理董文生先生表示:“ IBM拥有非常多业界顶尖的大数据分析工具和模型,比如Cloudant可以实时分析多类型复杂数据,通过它可以实现诸如套牌车辆识别等艰巨的任务。相信我们的合作一定会在不久的将来为智慧城市建设做出贡献。”
城乡规划对于中国的城镇化建设发展至关重要。城镇变迁所积累的历史文献、影像资料等海量信息,以及多部门协调所造成的复杂流程是当前城乡规划行业面临的两大挑战。数慧科技董事长元哲起先生表示:“数慧与IBM正在携手,利用大数据与分析构建新一代城乡规划业务处理系统,帮助相关部门应对复杂数据、简化流程提升协作,推进城市的可持续性发展。”
作为认知计算的引领者,四年前,IBM沃森在《危险边缘》(Jeopardy!)节目的一场特殊竞赛中彻底击败两名极为聪明的真人选手,2014年,IBM投资10亿美元成立Watson集团。此后IBM一直不懈地努力将沃森集成到企业的应用中。在2014年,IBM公司举行了沃森应用开发人员竞赛一名优胜者利用沃森制作了一只恐龙智能玩具,沃森的认知计算能力可以了解与其互动的每个孩子,并按照孩子的年龄和兴趣定制互动内容。此外,被戏称为“大厨”的Watson不仅能通过学习了35000多种经典食谱,分析海量食材配搭,结合化学、营养学等方面数据,根据现场食客提出的需求为食客定制食谱。更在金融、零售、医疗领域有所应用,并对行业产生深远影响。
大投入大成就,认知计算占先机
IBM大数据与分析业务取得的成功,源于IBM多年来对这一领域的持续不断的投入。目前为止,IBM已在分析领域投入250亿美金,先后发起了包括Cognos, SPSS、ILOG、Algo、i2等30多起收购,其中,2007年IBM斥资50亿美金收购加拿大商业智能软件商Cognos是迄今为止IBM单笔交易最大的收购。IBM全球共有15,000个分析顾问和超过400位数学科学家,在三大洲共拥有9个分析解决方案中心,其中,中国西安实验室着力分析领域的研发,以SPSS为核心发展为全球分析软件实验室。IBM每年都会新产生500多个与分析预测相关的专利。位于中国的IBM中国开发中心和IBM中国研究院为IBM与中国企业和合作伙伴的合作提供重要的支持。
除了Watson的前瞻性,IBM大数据与分析的优势还体现在:引领行业认知计算,自然语言理解、机器学习能力,领先的数据安全、保护、风险管理和反欺诈能力,业界最完善的大数据与分析解决方案组合以及对行业业务深入的了解。在IBM整体转型的背景下,处于战略核心的大数据将不断与云计算、社交、移动不断整合,为企业提供综合能力。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel数据透视表进行数据分析时,我们常需要在透视表旁添加备注列,用于标注数据背景、异常说明、业务解读等关键信息。但 ...
2025-12-22在MySQL数据库的性能优化体系中,索引是提升查询效率的“核心武器”——一个合理的索引能将百万级数据的查询耗时从秒级压缩至毫 ...
2025-12-22在数据量爆炸式增长的数字化时代,企业数据呈现“来源杂、格式多、价值不均”的特点,不少CDA(Certified Data Analyst)数据分 ...
2025-12-22在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12