京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据素养
“素养”可以看作是素质和修养,是人的思维方式、能力和价值观。现在社会人与物、人与人的交互愈加密切,人的素养就成为现在社会一个非常重要的关注点,信息技术和“数据”的社会价值越来越高,当然对现代社会的人的“数据”素养提到一个新的高度。
“数据素养”包括对数据的敏感性,数据收集、处理、分析、判断和利用的能力,尊重数据伦理、保证数据准确、安全和隐私的修养。
“数据素养”不再限于对信息从业人员的要求,而变成了一种对全民、尤其是年轻一代的要求,显然没有人可以游离在信息社会之外。非常有意思的观察是:给幼儿智能手机类似的物品,多数幼儿都会模仿大人,用手指在屏幕上划来划去,好像他们的家长小时候更多是拿笔会画一样,这是认知规律使然,从一个侧面证明了数据素养是从很小年龄就可以开始训练和培养的。仍然存在的城乡差异、地区差异、职业差异、教育程度差异等并没有影响大众一起接受智能手机、网络电视、电商或“微信”,几乎每个公民都有提高自身“数据素养”的需求。当然这并不是要求非专业人员具备和专业人员同样的技能,不同人群的“数据”技能是不同层次的,但是价值观、伦理规范是同样的,要判断数据的真伪、要保证数据的准确、要关注数据的安全、要尊重他人的数据隐私等。
《科学》期刊2014年11月刊发费雷德 凯特的文章,其中一个重要观点是:随着现代社会越来越“数据化”,如果我们依然完全依靠现在保护隐私的工具软件,我们的隐私只会处于前所未有的危险中。各种信息泄露。
《福布斯》期刊2015年1月5日报道,摩根士丹利发现其大约900名财富管理客户的账户名称和账户号码被泄露在公开网站上,尽管客户账户密码和社会安全号码未被泄露,当时也还没有证据显示任何客户因此遭受经济损失,但是足以引起社会的高度关注。《路透社》2015年5月13日报道,“Uber(优步打车)”大约5万名司机的信息被未知第三方获取,是一次大规模的信息泄露,该公司2014年9月在自身系统中发现一个漏洞,可让外人在未经授权情况下获取部分司机的姓名和驾照号码。虽然优步未收到任何有关这些数据“已遭滥用的报告”,但是对于这样敏感数据的大规模泄露还是暴露出快速发展的互联网公司数据安全方面的风险。
《科学》期刊2014年3月14日发表大卫 拉泽的文章,作者认为:大数据集的分析是很复杂的,但是由于大数据的收集不一定有传统小数据的收集过程那样的缜密,难免出现失准的情况,作者用谷歌流感趋势(GFT)失准作例子,指出了“大数据傲慢”是问题的根源,是大家应该思考的问题。
谷歌认为用户搜索关键词可以用来预测流感疫情的现状,据此开发了谷歌流感趋势(GFT),不过其结果与美国疾病预防控制中心的监测报告相比对,2013年2月,GFT预测的流感样病例门诊数超过了CDC根据全美各实验室监测报告得出的预测结果的两倍,显然失准。
在数据公开、数据交换、数据共享和数据利用成为大势所趋时,不论是政府机构、企业还是个人,都在创造数据、管理数据和使用数据,每个公民在这样的过程中遵守法律和尊重伦理是最必不可少的素养。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06