京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代 广州超算能否成为创新“新引擎”
2014年底,全球超级计算机TOP500组织在美国正式发布了全球超级计算机500强最新排行榜,广州超算中心“天河二号”超级计算机,以每秒33.86千万亿次的浮点运算速度,第四次摘得全球运行速度最快的超级计算机桂冠。2015年底,“天河二号”将提供每秒11亿亿次高性能计算机系统。
大数据时代,广州超算能否成为创新“新引擎”?近日,笔者采访了国家超级计算广州中心(以下简称广州超算中心)“天河二号”研究团队及相关人员,以探寻国之重器“天河二号”背后的故事。
依靠大数据提升原始创新能力
在位于中山大学东校区的国家超级计算广州中心。笔者看到占地约800平方米,由170个机柜组成的“天河二号”。
“如果把普通计算机的运算速度比做成人走路,那么超级计算机就达到了火箭的速度。在极高的运算速度下,人们可以通过数值模拟来预测和解释以前无法实验的自然现象。就拿‘天河二号’来说,13亿人用计算器算1000年才能达到‘天河二号’1小时的计算量。”广州超级计算中心常务副主任卢泽新说。
国家超级计算广州中心于2013年11月由国家科技部正式授牌,总投资超过25亿元人民币,是国家“十二五”“863计划”重大科技项目,由广东省政府、广州市政府、国防科学技术大学、中山大学四方共同建设。
卢泽新自豪地说:“‘天河二号’是当今世界上运算速度最快的超级计算机,综合技术处于国际领先水平。它有五大特点:一是高性能,峰值速度和持续速度都创造了新的世界纪录。二是低能耗,能效比为每瓦特19亿次,达到了世界先进水平。三是应用广,主打科学工程计算,兼顾了云计算。四是易使用,创新发展了异构融合体系结构,提高了软件兼容性和易编程性。五是性价比高。”
近年来,广东加快珠三角大科学工程创新体系建设步伐,积极争取国家重大科技基础设施建设项目落户广东,通过推进重大科技基础设施建设应用,加快提升原始创新能力。
在卢泽新看来,强大的计算能力将更好的支撑大科学问题的研究。近5年来,获得Gor-don Bell奖的超算应用所需要的计算资源都超过了1P,2013年获得Gordon Bell奖的超算应用甚至实现了14P的计算峰值,占用了红杉(位于美国劳伦斯利弗莫国家实验室的超级计算机,目前计算能力排名世界第三)约73%的计算资源。由此可见,大科学问题的研究对计算能力提出了更高的要求,只有“天河二号”这样具有强大计算能力的超级计算机,才能更好的支撑大科学问题研究的计算需求,“大数据时代的到来,超级计算机的作用将会凸显”。
卢泽新介绍,广州超算中心“天河二号”主机系统的设计计算能力为110P,目前一期系统已经达到54.9P,远远超过天津(4.7P)、深圳(1.3P)、长沙(1.4P)和济南(1.1P)等超算中心主机系统的计算能力。超级计算机可广泛应用于高新产业和现代服务业、数字城市建设及科研等多种领域,成为融高性能计算、海量数据处理、信息管理服务于一体的世界一流的超级计算中心,为广州、广东乃至华南地区的经济社会发展提供强大引擎。
运用超算中心为产业升级服务
然而无论是中国还是欧美、日本等超算大国,在超算中心商业化的问题上都遇到了困难,几乎所有的超算中心都需要政府的财政支持。对于“天河二号”这样庞大的系统来说,如何让它为产业升级服务而实现商业化?
广州超级计算中心主任袁学锋认为,目前世界上都在酝酿着所谓的第三次产业革命,其核心的内容就是如何把信息技术的大数据向制造业、实体经济辐射。所以如何利用大数据将信息技术转化为生产力,是广州超算中心在应用方面的核心内容,这也是衡量一个国家创新型经济竞争能力的核心内容。
以当下热门的3D打印为例,就是通过材料实现了对制造业的颠覆性创新,从这一点来说广州超算中心可以提供在材料和制造方面的高性能计算能力。
让袁学锋格外得意的是,目前广州超算中心已经与世界领先的基因公司华大基因展开基于基因科学的合作内容,将医疗与基因工程集成化、个性化。“这其中牵扯大数据、高性能计算的东西,还有云计算技术等多项内容,广州超算中心则负责所有数据的汇总与分析。”
另外,中国商飞(中国商用飞机有限责任公司)已经在天河二号上实现了C919的运行模拟,这是一款与波音737类似的中型客机。
除此之外,广州超算中心还负责广东省的政务云系统,包括电子政务、电子教育、电子医疗、电子环境、电子灾害预报等内容都将在“天河二号”上实现。
“天河二号”作为广州超算中心的主机,如今它的运用已渗入广州多个产业。卢泽新介绍,广汽研究院也是“天河二号”的用户,以该院汽车设计为例,在超级计算机的帮助下,原来需要两至三年的新车型设计,缩短到5个月完成,并可模拟实现优化设计、防撞性能测试,大大节约了成本。
“智慧城市的建设也可以用到‘超算’。广州有20万个摄像头,过去处于有事才找视频的状态,现在有关部门正与超算中心合作对这些信息进行管理、控制,进行数据分析后再加以利用,这将对城市建设产生很大帮助。”卢泽新表示。
随着软件技术开发的国际化,“天河二号”云服务应用收获积极成效。截至目前,云平台共有用户约20家。部分机柜与应用单位通过专线连接,为用户提供了高安全等级资源服务。主要服务领域包括:电子政务应用——已适配完成了广州市政府网站群、电子政务数据交换平台等应用,目前正在支持中山市电子政务应用,同时作为省级教育数据中心主要资源池,广州超算中心将为各类教育管理系统提供所需计算和存储资源;动漫渲染应用——为动漫产业提供海量的计算资源,目前正在支持华强、奥飞、酷卡等多个用户的渲染业务。
卢泽新表示,广州在“天河二号”的开发过程中,还将在番禺南沙等地,建立超算分中心,利用光纤与位于大学城的主中心连接,更贴近的满足企业实时运算需求。
呼吁政府补助中小企业上机费用
卢泽新认为,数据开放可充分利用蕴藏着的社会能量,调动大众的智慧。数据是知识生产和创新的资源,通过互联网开放数据,就是将原来由部分社会精英垄断的知识和创新资源,开放给大众,进一步调动大众智慧,推动大众创新。每个人贡献一点点,大数据就可能还原事件的真相,或者推动某种创新。例如,开源项目、开源社区、开放性创新联盟组织的兴起,有效降低了产业技术的壁垒,推动更多的创业者介入。因此大数据时代“国之重器”应该大展身手。
然而自2013年以来,大数据应用基本上还是自发状,并没有形成燎原之势。大数据现有技术水平的主要受益产业仍然主要是云计算的科研。用卢泽新的话来说,超级计算机可以“算天”“算地”“算人”,但最为迫切的是把它运用到为经济服务上。在产业升级方面,大数据的市场发展前景是非常广阔的。珠三角以及港澳地区,均有大量的数据运算需求。以广州地区为例,共有规模以上医药企业86家,产值近180亿元,均拥有极高的药理试验性数据运算需求。
笔者在调查中了解到,虽然“天河二号”的资源是完全向社会开放的,包括中小微企业等用户,如果有超算的需要,未来都可在国家超算广州中心的网页上进行申请,提交课题。但因为费用门槛,中小企业申请者寥寥。
缺乏核心技术、产品附加值低是广州实施创新驱动的短板。如今广州在大数据领域拥有了“天河二号”,将迎来了突破核心技术短板的机会。未来的工业发展模式是信息技术与工业技术的高度融合,是网络、计算机、数据信息、软件与自动化技术的深度交织。广州制造业基于过去30年发展已积累了一定的技术基础和研发能力,抓住大数据这一机遇,完全有可能实现战略性的重点突破、重点跨越,在制造业上实现创新驱动发展。
袁学锋希望,政府对有需要的中小企业提供上机费用补助。“只有当超级计算机的能力为社会广泛应用时,人人可以公平自由参与、竞争合作、创造分享,大数据时代才能发挥它应有的作用。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21