京公网安备 11010802034615号
经营许可证编号:京B2-20210330
探访IBM美国沃森研究中心:用大数据“思考”
如果说Facebook和Google代表了美国西岸硅谷科技公司的年轻、活力,那么位于美国东岸纽约市以北约克敦海茨的IBM沃森(Watson)研究中心则体现了老牌IT企业的低调、务实。
如果说Facebook和Google代表了美国西岸硅谷科技公司的年轻、活力,那么位于美国东岸纽约市以北约克敦海茨的IBM沃森(Watson)研究中心则体现了老牌IT企业的低调、务实。
和寸土寸金的纽约市中心不一样,从纽约市中心向北,在不堵车的情况下,车程1小时左右,就会来到这个有些像“郊区”的地方,环境优美、地广人稀。IBM沃森研究中心就坐落在这个有着大片的空旷场地和连片树木的区域。
“这里低房价和高质量的空气,也是我们吸引全球人才的优势。”IBM沃森研究中心吴澄博士笑言。当然,吸引全球人才聚集这里的原因远不止这么简单。
IBM沃森研究中心正在研制中的由500 种应用程序构成的“星系图”。
“由重转轻”,成为信息服务商
近年来,IBM致力于“由重转轻”:从一个传统的硬件制造商,转变为一个信息服务商。
沃森研究中心是IBM研究院的总部,是全球业界最大的研究机构之一,负责管理全球13个实验室。IBM研究院顾问John.D.Mackay在IBM实验室向人民日报社代表团展示了他们正在做的星系图,由500多个工具构成的信息平台旨在增加不同实验室、13个研究中心之间的互动性,同时也是客户和研究人员交流的平台。IBM所有的研究成果和进程都可以在这个平台上看到并共享。
Mackay介绍,IBM的研究方式已经发生变化,传统的研究方式是研究人员走进实验室做研究,发明出一个新东西之后,研究工作就结束了。但是如今,研究人员必须要走出门到真实的世界中做研究,或者说“现在的世界已经变成了一个大实验室”,这就需要IBM和业务合作伙伴一起协作。比如说,当IBM需要在医疗方面做进一步研究时,就要走进医院;当IBM需要对水资源管理进行研究的时候,就要与水资源管理部门打交道;在研究电力管理的时候,可能要与国家电网这样的部门进行协作。只有与业务合作伙伴进行协作,才能实现既定的愿景目标。
2014年,IBM软件和数据服务业务营收为250亿美元,占到IBM营收的27%。在2015年2月IBM的投资者大会上,IBM宣布,希望到2018年公司可从“战略紧迫性”业务,即CAMSS(Cloud、Analytics、Mobile、Social、 Security)中获取400亿美元的营收。该目标凸显了IBM“从重到轻”、从硬件和服务器业务向新兴的高利润率业务转移的战略。
IBM副总裁James Sciales告诉人民日报社代表团,IBM研究中心对于下一代认知计算机投入了很大的精力,如果过去的计算机主要是计算、计数的话,那么发展到现在,有了认知能力的计算机可以自己去学习,这就是人工智能。
会思考的“沃森”
据James Sciales介绍,人工智能的代表IBM的超级计算机“沃森”,不仅可以识别文字、地理位置,甚至还可以部分感知人的情感,感知高兴、悲伤,未来还要试图读懂人类的语言,学会思考,要看到东西、明白图像。
沃森由90台IBM服务器、360个计算机芯片驱动组成,拥有2880个处理器核心,约有10台普通冰箱那么大,内装超2亿页新闻图书等资料,能听懂英语,与人对话。
沃森最早进入公众视线,一战成名于2011年那场著名的人机大战。2011年2月,IBM超级计算机沃森作为选手参加了美国电视智力答题节目《危险边缘》,并以绝对优势击败了该节目历史上最成功的两位人类冠军,赢得最后的胜利。这不仅表明了沃森具有强大的数据和自然语言的处理能力,也表明了它正在朝着可以“思考”的近人类思维的方式迈进。
经过4年多的继续研发,沃森展现了超强的学习能力,并且它已经开始在医学领域崭露头角。
吴澄告诉人民日报社代表团,作为一台具备学习能力的超级计算机,沃森可以根据医学资料和期刊信息来分析某种癌症并给出治疗方案。如果人工操作,对于一些比较罕见的癌症治疗方案大概需要4个月的时间去分析,而沃森只需要4分钟。
根据美联社的报道,2012年3月,斯隆凯特林癌症纪念中心的科学家们拿出了60万份医疗证据,150万份病人记录和200万页文字内容的医疗日志,以及1500个肺癌病例给沃森用来“充实自己”。
将这些资料和数据集成在一起,沃森就能从数据库中找出内在的联系和一些人类无法总结出的趋势。未来,沃森的应用程序可以在电脑或平板上运行,它能将一个病人的资料和病史与自己的数据库做对比,之后应用程序返回的数据会被作为医生作出诊断和制定方案的参考。例如,有位癌症病人,她向医生提出请求能不能设计不要掉头发的疗程,因为她的小孩子很小,她不希望孩子看到母亲头发掉光。医生将需求输入沃森,沃森基于已经了解学习的大量医学知识和病例,结合患者体质特征,真的设计出了不掉头发的治疗方案。
不仅如此,沃森借助大数据和人工智能还将服务领域成功扩展至天气预警领域。IBM研究院顾问John.D.Mackay向人民日报社代表团介绍了沃森在精准天气预报方面的应用。
Mackay表示,这个项目已经进入实际应用阶段,是IBM和墨西哥一家公司合作的成果,主要应用功能为提前对极端天气做出预测,根据大数据分析,沃森可以对哪里可能出现断电和断电面积、范围等做出预测,有助于墨西哥的这家公司提前将抢修人员派到前线。
“和一般的气象局提供的信息不同,IBM为公司定制的精准天气预报可以精细到2公里内,并将预报时间缩短为每10分钟播报一次。” Mackay说。
除此之外,沃森也会在未来参与到农业的无人机运作和监控食品安全整个过程等多项实际应用领域。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29