京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据助天文学研究风光无限
战国时期,一本记载着800多颗恒星名字和位置的《石氏星经》,是祖辈们探索宇宙的秘笈,被誉为最古老的天文数据库。
2400年后,美国天文学家发现了一颗超高速星。有趣的是,这个发现并非由天文观测获得,而是利用中国虚拟天文台公布的数据“算”出来的。
事实上,除了科学家,普通百姓也能借助大数据、云计算等高科技来实现“天文突破”。此前,安徽合肥一名年仅10岁的小学生廖家铭,在没有任何观测设备的前提下,通过中国虚拟天文台的数据发现了一颗超新星,是迄今为止全球年龄最小的超新星发现者。
“打电脑”的天文学家
“由于我们观测的是宇宙中比较遥远的星体,到达地球的信号很弱,很容易淹没在城市的灯光里,因此天文望远镜一般都建在大山深处。”从北京市区驱车前往位于河北省的观测站,是中科院国家天文台郭守敬望远镜运行和发展中心常务副主任赵永恒的工作常态。
然而,从2017年4月份起,赵永恒把更多时间花在了另一项工作上:“打电脑”,因为他加入了一支特殊的“尖兵部队”—— 由国台联合阿里云成立的科技指导委员会,成了首批受聘专家之一。
毕业于河北师大的赵永恒,走出校园后就进入了中科院国家天文台工作,成为一名“追星人”,除了观星星,还有一大爱好就是玩电脑。
十几年前,作为国台最懂电脑的研究员,赵永恒用一台从中关村市场淘来的旧电脑鼓捣出了一个网站,这就是中国虚拟天文台的雏形。“我们的想法很简单,把国内外天文望远镜的观测数据放到这个平台上。”
广袤的宇宙意味着海量的数据,这也是天文学不同于其他学科的重要特征。
以赵永恒负责的LAMOST郭守敬望远镜为例,它可以同时观测四千个天体,相当于同时启动四千台天文望远镜。到目前为止,已经观测了将近3000个天区,收集了超过600万条光谱数据。
“天文学已经进入大数据时代,两年数据就翻一番。一个团队或者一个国家,不可能及时地把所有数据都分析完,所以数据开放程度越高,被研究的机会就越多,产生的科学成果就会越多。”赵永恒说。
开放共享的天文数据
正是基于这样的思考,2016年,中科院国家天文台与阿里云达成了战略合作,引入最前沿的云计算、大数据技术,实现天文数据开放共享。
“今天不懂互联网几乎是寸步难行。”每次跟阿里云的技术团队开会,赵永恒都感觉收获良多,“15年前,我们只有一个简单的网站,如今中国虚拟天文台主节点迁移到云端后,成为一个集成超过500TB的科学数据、1.5PB的存储能力、700多Tflops计算能力和100多种软件的超级平台。”
赵永恒希望,未来的虚拟天文台能够成为全世界天文学者和爱好者获取天文数据、开展天文研究、进行科普教育的综合基地。
“科学离不开技术,技术也离不开科学。”正如赵永恒理解的,国家天文台联合阿里云成立的跨界“尖兵部队”,由最懂天文的技术专家和最懂技术的天文学家组成。
“我们从哪里来?时间有没有起点?宇宙是怎样诞生和演化的?要想回答这些终极问题,需要建立更加庞大的天文数据库,而技术则是通往未来的钥匙。”赵永恒表示。
将天文科普进行到底
为了给国内的天文爱好者提供一个稳定地展示自己才华和交流的平台,在中科院国家天文台—阿里云天文大数据联合研究中心主任崔辰州等的多方努力下,国家天文台LAMOST大科学工程设立了一台专门无偿为天文爱好者和业余天文组织提供主页空间的服务器——“宇宙驿站”,并于2002年3月12日对外开放。
2005年中国互联网协会大会上,“宇宙驿站”荣获组委会特别提名奖,理由是“走出了一条独特的网络科普道路”。
“宇宙驿站”是国内目前唯一一台专为天文科普服务的网络服务器。服务器在天文爱好者心中的地位日渐升高,国内许多爱好者和组织把自己的主页建立或迁移到这台服务器上。
2017年1月,“国家天文台—阿里云天文大数据联合研究中心”成立。前不久,中国虚拟天文台主节点和郭守敬望远镜巡天数据成功上云,“宇宙驿站”天文科普网站群100多个天文科普网站同时上云,更好地服务广大天文爱好者。
崔辰州认为:“天文学是名副其实的‘大数据’科学,每天由天文观测设备捕捉到的海量天文数据,不仅是科学研究的必需品,也是宝贵的科学普及和教育资源。”
“过去由于技术限制,这些数据无法得到充分的利用和分享,而在互联网+时代,云计算和大数据技术的成熟,加速了学科发展和大众科普。”崔辰州表示,“因此,天文科普教育工作必须由数据、由新技术来驱动,通过互联网把国际、国内的专家以及广大公众连接起来。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25在数字化时代,数据已成为企业核心资产,而“数据存储有序化、数据分析专业化、数据价值可落地”,则是企业实现数据驱动的三大核 ...
2026-02-25在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16