
数据素养
“素养”可以看作是素质和修养,是人的思维方式、能力和价值观。现在社会人与物、人与人的交互愈加密切,人的素养就成为现在社会一个非常重要的关注点,信息技术和“数据”的社会价值越来越高,当然对现代社会的人的“数据”素养提到一个新的高度。
“数据素养”包括对数据的敏感性,数据收集、处理、分析、判断和利用的能力,尊重数据伦理、保证数据准确、安全和隐私的修养。
“数据素养”不再限于对信息从业人员的要求,而变成了一种对全民、尤其是年轻一代的要求,显然没有人可以游离在信息社会之外。非常有意思的观察是:给幼儿智能手机类似的物品,多数幼儿都会模仿大人,用手指在屏幕上划来划去,好像他们的家长小时候更多是拿笔会画一样,这是认知规律使然,从一个侧面证明了数据素养是从很小年龄就可以开始训练和培养的。仍然存在的城乡差异、地区差异、职业差异、教育程度差异等并没有影响大众一起接受智能手机、网络电视、电商或“微信”,几乎每个公民都有提高自身“数据素养”的需求。当然这并不是要求非专业人员具备和专业人员同样的技能,不同人群的“数据”技能是不同层次的,但是价值观、伦理规范是同样的,要判断数据的真伪、要保证数据的准确、要关注数据的安全、要尊重他人的数据隐私等。
《科学》期刊2014年11月刊发费雷德 凯特的文章,其中一个重要观点是:随着现代社会越来越“数据化”,如果我们依然完全依靠现在保护隐私的工具软件,我们的隐私只会处于前所未有的危险中。各种信息泄露。
《福布斯》期刊2015年1月5日报道,摩根士丹利发现其大约900名财富管理客户的账户名称和账户号码被泄露在公开网站上,尽管客户账户密码和社会安全号码未被泄露,当时也还没有证据显示任何客户因此遭受经济损失,但是足以引起社会的高度关注。《路透社》2015年5月13日报道,“Uber(优步打车)”大约5万名司机的信息被未知第三方获取,是一次大规模的信息泄露,该公司2014年9月在自身系统中发现一个漏洞,可让外人在未经授权情况下获取部分司机的姓名和驾照号码。虽然优步未收到任何有关这些数据“已遭滥用的报告”,但是对于这样敏感数据的大规模泄露还是暴露出快速发展的互联网公司数据安全方面的风险。
《科学》期刊2014年3月14日发表大卫 拉泽的文章,作者认为:大数据集的分析是很复杂的,但是由于大数据的收集不一定有传统小数据的收集过程那样的缜密,难免出现失准的情况,作者用谷歌流感趋势(GFT)失准作例子,指出了“大数据傲慢”是问题的根源,是大家应该思考的问题。
谷歌认为用户搜索关键词可以用来预测流感疫情的现状,据此开发了谷歌流感趋势(GFT),不过其结果与美国疾病预防控制中心的监测报告相比对,2013年2月,GFT预测的流感样病例门诊数超过了CDC根据全美各实验室监测报告得出的预测结果的两倍,显然失准。
在数据公开、数据交换、数据共享和数据利用成为大势所趋时,不论是政府机构、企业还是个人,都在创造数据、管理数据和使用数据,每个公民在这样的过程中遵守法律和尊重伦理是最必不可少的素养。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23CDA 数据分析师:以指标为钥,解锁数据驱动价值 在数字化转型的浪潮中,“用数据说话” 已成为企业决策的共识。但数据本身是零散 ...
2025-09-23当 “算法” 成为数据科学、人工智能、业务决策领域的高频词时,一种隐形的认知误区正悄然蔓延 —— 有人将分析结果不佳归咎于 ...
2025-09-22在数据分析、金融计算、工程评估等领域,“平均数” 是描述数据集中趋势最常用的工具之一。但多数人提及 “平均数” 时,默认指 ...
2025-09-22