
大数据畅通需打破壁垒早立法_数据分析师培训
大数据时代,人人都是大数据的使用者,人人也是大数据的制造者,人人离不开大数据。但是,大数据从哪获取?大数据是否安全?使用这些数据是否涉嫌侵害隐私?大数据是否有效?等等,上述系列问题,已经成为我国迈入大数据时代绕不过去的坎。挑战伴随着机遇,携手来临。
打破壁垒提上日程
谁拥有大数据,谁就拥有了未来。因此,含金量越来越高的大数据,受到市场各方尤其是金融业的高度关注。
证券业有中证登,银行业有银联,保险业早在2014年成立了中国保信。目的是为了加强行业公共基础设施建设,全面提升保险经营管理的信息化水平。大数据时代,保险试水信息航母平台建设。
中国保信公司常务副总裁罗胜在月谈上表示,如果要利用大数据,一定要有消除社会上的数据门槛和数据障碍,打破数据壁垒。但在这方面做的确实不好。
基金公司在量化管理上,数据的应用非常广泛。但在国寿安保基金经理李康看来,目前大数据的应用只是刚起步,因为有很多数据,金融机构是难以得到的。
与会者认为,由于数据本身的封闭、数据的不开放,当然,也不排除在数据应用本身、技术提取方式方法上的问题,使得目前我国数据的共享程度不够。
在目前环境下,要解决数据间壁垒问题,确实没有太好的办法。中科院金融科技中心首席科学家兼副主任刘世平的方式比较实用。他透露,“我们在每个地方基本上都是找地方一把手,否则的话,目前很难打破壁垒”。
优股网创始人卢常福说的很干脆,“就是要开放和降低行政门槛,目前,像金融业是比较严格的。”火热的资本市场,越来越庞大的数据体系,对于证券数据的分析者而言,迫切需要放开数据的最终出口。当然,这可能涉及牌照管理等系列监管问题。
其实,行政管制现在比较严格的地方,在行业的商业模式以及发展空间,都会受制于原有管制。需要大量的新生力量进入,带来新的活力。因此,一个行业要健康发展,一定是流动的、开放的。
人们对于新崛起的大数据,爱戴之余,如何商业化,商业化到什么程度,心里都没谱。正如罗胜所言,数据的使用和应用,商业化肯定是一个趋势。但要把商业化和过渡商业化、商业化应用和非商业化应用区别开。
应为大数据立法做准备
新三板上市公司北京精耕天下董事长姚世忠举例称,因为税务的数据和银行的数据存在一定差距,能否分别获取相关数据,通过大数据公司,精准服务客户。
实际上,姚世忠提出了一个很敏感的问题。即,在哪种情况下哪种数据是可用的?一家做某地税务数据的公司,并不表示这家公司拥有数据本身和数据的使用权。这涉及数据的安全性、数据的隐私性、数据的可得性问题,以及数据的可用性问题。
“哪些数据是可用的,哪些数据是可得的?获取数据的方式方法是不是合理、合法、合规,这个是大数据时代一个非常重要的议题”,刘世平点评说。
显然,大数据这么重要的领域,立法是肯定刻不容缓的。
罗胜也认为,现在国家强调依法治国,在大数据领域制定相关法律,用法律维护数据的严肃。
除了要从根子上解决立法问题外,还需要走出目前认识上的误区。即大不等于多,大数据时代,应该更加强调数据的有效性。也就是说,不要为了迎合大数据而过度滥用大数据,规避进入大数据的误区。
积木盒子风险控制副总裁谢群认为,如何权衡在有限的资源、数据和时间里,得到一个最有效的决策,这是大数据时代带来的一些挑战,而公司目前已经迈出了非常有益的第一步。
李康也因为,数据本身的有效性是值得思考的。大数据时代,不在于数据的多少,因为这是相对概念。关键问题是数据本身能不能对这个事物本身进行准确的描述,且能描述其他内在本质。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23