京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据是领域相关的,如今大数据在各个领域都有着卓越的表现。比如,政府、企业与医疗等机构的数据涉及到安全、利益与隐私问题,要开放与共享是有难度的。但是如果研究大数据的处理技术,而不是去挖掘具有商业价值的大数据,不妨换个思路,用不涉及安全、利益与隐私问题的大数据作为数据源。
被誉为“大数据时代的预言家”维克托•迈尔•舍恩伯格的国外大数据系统研究的先河之作《大数据时代:生活、工作与思维的大变革》书里“大数据先锋”一节中写到:“天文学,信息爆炸的起源“。
只有考虑到社会各个方面的变化趋势,我们才能真正意识到信息爆炸已经到来。我们的数字世界一直在扩张。以天文学为例,2000年斯隆数字巡天(Sloan Digital Sky Survey)项目启动的时候,位于新墨西哥州的望远镜在短短几周内收集到的数据,已经比天文学历史上总共收集的数据还要多。到了2010年,信息档案已经高达1.4×242字节。不过,预计2016年在智利投入使用的大型视场全景巡天望远镜(Large SynopticSurvey Telescope,LSST)能在五天之内就获得同样多的信息。天文学领域的变化在各个领域都在发生。”
从上可知,天文学是最早迎接大数据挑战的领域。随着天文观测技术的发展,天文学已经进入了一个信息丰富的大数据时代,天文数据正在以TB级甚至PB量级的速度不断增长。目前国际上已有多个国家进行了大规模的巡天项目,除SDSS(Sloan Digital Sky Survey)外,还有Pan-STARRS1(The Panoramic Survey Telescope and Rapid Response System)、WISE (Wide-field Infrared Survey Explorer)、 2MASS (Two Micron All Sky Survey)、Gaia 、UKIDSS (UKIRT Infrared Deep Sky Survey)、NVSS(The NRAO VLA Sky Survey)、FIRST(Faint Images of the Radio Sky at Twenty-cm)、 2df (Two-degree-Field Galaxy Redshift Survey)、LAMOST(The Large Sky Area Multi-ObjectFiber Spectroscopic Telescope –郭守敬望远镜)等等,这些巡天项目每天都在产生着海量的天文数据。目前,业界对大数据的看法不尽相同,但大数据应具备的4V特征已达成共识,即:Volume(大量)、Velocity(高速)、Variety(多样)、Veracity(精确)或 Value (价值)。天文数据具备4V特征,因此天文数据是大数据。在难以获取其他大数据时,不妨考虑根据天文学领域的需求,结合计算机科学、模式识别、系统科学等相关学科领域的理论与方法,研究与发展天文大数据的处理技术。
不同于其他具有商业价值的大数据应用领域,研究天文大数据是面向基础自然科学研究领域的应用。相信可以推动对大数据研究的的发展,在研究技术上形成百花齐放的局面。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25在数字化时代,数据已成为企业核心资产,而“数据存储有序化、数据分析专业化、数据价值可落地”,则是企业实现数据驱动的三大核 ...
2026-02-25在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12