京公网安备 11010802034615号
经营许可证编号:京B2-20210330
让科学大数据“跑”起来
相对于商业大数据,科学数据领域更容易形成“烟囱林立”的局面。“这和科学数据的特殊性有关。”叶玉江在接受科技日报记者采访时说,科学数据主要依靠观测、实验、分析等科研活动产生,可谓“取之科研,用之科研”。“一方面,这些数据属于科研成果的一部分;另一方面,很多人也不愿将自己辛苦得来的基础数据拿出来共享,让别人取得突破。”叶玉江坦言,近年来,在公共财政支持下,科技创新形成了海量科学数据,但在开放共享方面进展仍较缓慢,“做数据开放的积极性不高,关键的自己掌握,不重要的交出来”,这样的情况一直存在。
叶玉江认为,解决这个问题的核心难点在于扭转观念,“要让科研人员意识到,国家公共财政支持下的科学研究取得的科学数据,不完全属于个人和单位,而是属于国家的。”
扭转观念,并非一朝一夕之功可竟。叶玉江提出,尽快出台相关政策机制,加快建设国家级科学数据中心,以及科研单位通过具体措施推动,保障数据工作者的权益,建立起开放共享的氛围,这些手段同样重要。“要同步进行,多管齐下,在过程中实现科研人员观念的转变。”
2015年9月,国务院印发《促进大数据发展行动纲要》,是中国大数据发展战略的首个顶层设计,明确提出要推动政府信息系统和公共数据互联共享,消除信息孤岛。叶玉江告诉记者,在此基础上,平台中心正在加快推动出台国家《科学数据共享管理条例》,明确相关部门、项目课题组和科研人员的责任和义务,为科学数据共享过程中存在的知识产权保护、利益分配机制、资源信息化等问题提供政策依据,作为推动科学数据开放共享的制度保障。“要调动科研人员做数据共享的积极性,就要通过制定政策建立完善相应的考评机制,体现他们这部分的价值贡献。”
“政府支持,权威科研机构搭台,构建国家级的科学大数据中心,也是推动由国家公共财政支持的公益性科研活动获取和产生的科学数据逐步开放共享的有效手段。”叶玉江表示,在科技部国家科技基础条件平台的支持下,国家地球系统科学数据共享平台、国家生态系统观测研究网络、人口与健康科学数据共享服务平台等大数据平台整合了领域内多家单位的数据资源,在科技基础资源开放与共享方面率先走出了一步。
“这些具有世界影响力的国家级科学数据中心,连点成面,可以实现一加一大于二的作用。”叶玉江告诉记者,下一步,平台中心将以已有的6个共享服务平台为基础,通过整合、重组、调整、优化等方式,打造一批资源量大、运行机制完善、开放程度更高、服务能力更强的国家级科学数据中心。“这是个永无止境的过程,我们永远在路上。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28