
从互联网时代走向大数据时代
随着信息革命的深入推进,数据已经成为国家基础性战略资源。同时,数据安全常常超出传统的安全范畴,上升到维护国家主权的高度。掌控数据主权,实现数据驱动发展,是个复杂的系统工程。在这方面,战略科学家钱学森同志,以其远远超前于时代的科学思想,为我们指明了应对之策。上世纪70到80年代,钱学森用系统工程的基本理论,提出了“从定性到定量的综合集成研讨厅体系”,并探索应用于海量数据的存储、传输、分析,实现“数据—信息—知识—智能—智慧”的综合提升。这套思想方法为互联网时代到大数据时代迈进提供了至关重要的理论奠基。钱学森30多年前萌发的“以系统工程为核心、以综合集成为手段”的数据思想,仍旧闪耀着真理光辉,在新的历史时期,焕发出勃勃生机和强大生命力。
钱学森超前谋划的“数据治权”
钱学森的数据思想,源自于他领导国防科技情报和信息工作的长期实践,就是用系统工程的方法,实现数据“活化”,真正发挥数据资源在国家和社会治理中的作用,掌握“数据治权”。
着眼长远的战略性。1963年钱学森指出:科学技术情报资料的积聚是非常迅速的,用汗牛充栋来形容它是远远不够的,必须从收集、研究、建立检索系统、提供情报服务等各方面统筹考虑,建立一个体系。虽然当时尚未提出“大数据”的概念,但钱老已敏锐地察觉到数据迅猛增长的趋势和价值,并强调从国家层面统筹规划。
引领时代的前瞻性。早在1978年,钱学森就预言:“沟通全世界,形成全球性的情报体系是大势所趋”,“恐怕不久的将来,全世界总是要建立情报资料网,这个网络与全球的计算机网络、卫星系统、资料库、通信线路、用户终端等设施都要互联互通”。钱学森所说的这个沟通全球的数据基础设施,在今天已经成为了现实。
化知为智的创新性。钱学森开创性地将系统科学、思维科学的方法引入到数据的分析和应用中,为大数据向智慧层次发展提供了一整套有效管用的方法论支撑。
用钱学森智慧掌控“数据主权”
从国家层面看,数据主权应包括:国家对本国管辖地域范围内,任何个人和组织收集或产生的数据,以及这些数据的存储、处理、传输、利用的运营主体、设施设备等进行独立管辖,并采取措施使其免受他国侵害的权力。没有数据安全、丧失数据主权,就是把国家命运交到别人手里,大数据产业就只是看上去很美的空中楼阁,发展越快越危险。因此,需采取有效手段,在实现数据治理的同时,以网络安全法为统领,加快数据主权立法、突破关键核心技术、构建“天空地一体”的数据基础设施,把数据发展的主导权牢牢掌握在自己手中。
系统工程引领,“大数据”聚变“大智慧”。构建从定性到定量的综合集成研讨厅体系,打造“人机结合、人网结合、以人为主”的智慧化系统,可实现跨层级、跨地域、跨系统、跨部门、跨行业的综合集成,推动工程系统、政策系统、社会系统“从不满意状态到满意状态”的综合提升,实现“数据到决策、数据到研发、数据到生产”的颠覆性创新。
天空地海联通,“大数据”需要“大融合”。在经济社会发展方面,国家已经把“天空地海一体化”作为大数据战略的内在要求。在国防和军事方面,“数据流牵引指挥流”的未来战争形态,根本上依赖天基系统的信息支援。可以说,没有天空地海联通,就不可能在大数据这一战略资源的争夺中掌握主动。
数据主权保障,“大数据”呼唤“大安全”。我国大数据的关键基础设施、核心技术、重要产品尚未实现自主可控,数据主权面临着潜在隐患和挑战,具体表现在以下几方面:一是数据“心脏中枢”受制于人。目前互联网13台根服务器中,唯一的主根服务器在美国,12台辅根服务器中有9台在美国。所有的互联网域名解析工作,由美国商务部控制的互联网域名与地址监管机构(ICANN)来完成,导致了全球数据对美国单向透明。二是数据“骨干枢纽”尚难自主。国外的路由器、交换机设备制造商,在我国骨干网核心节点,特别是在一些关键领域和行业当中,占有极高的市场份额。三是数据“末梢神经”广被渗透。外资企业占据了大数据终端设备的庞大市场份额,使数据安全面临极大风险。这些企业有时会迫于压力与美国情报部门合作,运用其产品和服务的便利条件,获取政府、企业和个人的敏感数据。四是数据跨境监管制度滞后。我国互联网行业几大巨头均为外资控股,容易受国外势力影响,造成联网用户海量数据在无监管情况下出境。
“聪者听于无声,明者见于未形”,需在法律层面明确“国家数据主权”,为数据全生命周期监管提供法律依据。需实行数据分等级保护,明确规定相应的安全责任主体。需加强对数据跨境监管,对国内数据出境严格管控,规范外资和外资控股企业数据中心建设,在我国境内开展业务的企业,必须将其业务数据存储于我国境内的数据库或数据中心,必须接受政府监管。需加快大数据领域核心关键技术国产化替代步伐,特别是在数据传输关键技术和装备、数据终端产品、关键芯片、密码技术等方面,培育能够与“八大金刚”并驾齐驱的大企业,让数据基础设施牢牢掌握在自己手中,筑牢数据主权的坚固藩篱。
发挥航天优势重塑数据产业
2016年,中国航天系统科学与工程研究院,即中国航天科技集团公司第十二院(简称十二院)重组成立。该院肩负着“建设钱学森智库;支撑航天、服务国家;成为军民融合产业平台建设抓总单位”三大使命,是中国航天的智库总体、情报总体、数据总体、网络与信息化总体、军民融合产业化推进总体。
十二院有着极不平凡的历史。钱学森在其前身之一航天710所,开办并长期主持“系统学讨论班”,打造了一整套智库基础设施和方法工具体系,使这里成为系统工程学科的发源地、钱学森智库的第一践行者。该院是中国是载人航天的原始创新单位之一,论证提出“从飞船起步”的方案,获得中央采纳;是第一个建立“钱学森综合集成研讨厅”的单位,是航天四大发射基地测发控系统的研制单位之一,为载人航天、探月工程以及各型卫星发射等重大任务提供了全方位的测发控和通信保障。
十二院具备的核心能力,能够为掌控数据主权、重塑大数据业态发展发挥重要支撑作用。实现了钱学森提出的“从定性到定量的综合集成研讨厅体系”,打造了钱学森智库的“六大体系、两个平台”,为解决开放的复杂巨系统问题,提供了科学管用的方法支撑和工具支持。该院具备了“空天地海”一体化信息集成能力,以及卫星导航、遥感、通信综合应用能力,并积极推进智慧城市、智慧园区、智慧工厂等智慧系列专项的建设,面向宁夏、安徽、内蒙古等地的需求,推动了安监、水利、应急等多领域治理模式创新。
十二院作为中国网信军民融合促进会、国家两化融合创新推进联盟、中国卫星全球服务联盟、国防科技情报信息中心、战略性新兴产业知识中心、航天信息中心的依托单位,积累了从中央到地方的丰富的数据资源,形成了人机结合、人网结合、以人为主的数据推进一体化平台,形成了国防军工和经济社会领域数据应用的领先地位。该院将举全院之力,为国家建设天空地海一体、政产学研联合、军民融合的大数据平台提供全方位支撑,着力打造以“数据推进为核心、数据主权为保障”的大数据应用新模式,为各领域、各行业提供全方位的数据服务。
“得数据者得天下”。我们坚信,有钱学森系统工程思想的指导,有航天事业俯瞰全球、联通全域的高度,我们一定能站在信息化的潮头,发时代之先声、开智慧之先河,为国家掌控数据主权、引领大数据产业发展变革,发挥不可替代的关键作用,不断作出新的更大贡献,以优异的成绩,迎接党的十九大胜利召开。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10