京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据活力要靠规则保障_数据分析师培训
通过云计算,大数据在全球医疗、卫生、保险等领域得到广泛运用,它像土地、矿产一样,成为一种能够创造价值的资源。但因为是基于对人的信息的采集,大数据的利用也陷入了个人隐私的困境。如何在利用其价值的同时,规避信息安全的风险,专家认为,最重要的是要制定法律,让那些拥有大量数据的人,不去滥用数据。
“很多医院医疗水平很高,但没有数据库,导致很多患者错过最佳治疗时间”
英国邓迪大学医学院院长安德鲁·莫里斯每天都要浏览自己建立的苏格兰糖尿病研究网。这个网站的登记用户为来自苏格兰的23.9万名糖尿病患者。通过浏览网站上的信息,莫里斯跟踪患者病情,及时在患者病情加重前就拿出救治方案。经过7年的努力,这个网站建立的数据库已经使苏格兰糖尿病患者的截肢率降低了40%。
莫里斯还给每位患者配了一个随身携带的微型电子设备,以随时采集患者的身体变化数据,患者也可以24小时不间断地观察病情,这些设备被患者们亲切地称为“衣袋里的智能医生”。
莫里斯说,在大数据时代,医生的职责正在从过去的“给病人看病”转为“预测和预防病情”。“很多医院的医疗水平很高,但由于没有建立数据库,导致很多患者错过了最佳治疗时间。”
国际商业机器公司(IBM)中国开发中心首席技术官毛新生在接受本报记者采访时表示,大数据在医学领域可以比较便捷地获得,比如,可穿戴设备测量血压、心跳、血糖、血脂等指标,实时了解人体的运行情况;而手机应用程序可以收集饮食、作息等方面的数据,汇集到云端。
日本广岛县吴市是日本少子老龄化的典型,该市65岁以上人口占比高达28%,导致地方财政的70%用于支付医疗费用。为了削减医疗费用,吴市于2008年引进了“健康管理促进体系”,将医院和药房提交给医保部门的处方、医疗费用报销单据等扫描输入电脑后生成数据,筛选出就诊次数频繁、医疗费用异常的案例,医保部门再对其进行重点干预。比如,一位70岁老太太因为膝盖疼痛在一个月内去了15次医院,医保部门就派出护士对病人进行上门指导,帮助她改变生活方式,并改用疗效相同的低价药品。通过鼓励使用低价药品等手段,2011年,该市节省医疗费用约1.5亿日元(1元人民币约合16.4日元)。
目前,日本政府已经决定在全国推广“吴市模式”,通过对医疗数据的大规模分析,确定合理的药品和单病种诊疗价格,抑制过度医疗,控制医疗费用。
“大数据就像一个上帝,无所不知,所有数据都可以加以利用”
大数据应用的实质是,通过云计算强大的计算和存储能力,把所有数据都吸收进来,分析现象之间的关联度,寻找到重复性的规律。这也是为什么当你打开淘宝、京东商城等网站,经常会看到“浏览了该商品的用户还购买了这些商品”的推荐,百度也会在同一页面向不同用户精准地投放不同的广告。毛新生解释说,“这是利用大数据进行的交叉销售,即一件事情发生,另一件事情也很可能发生。交叉销售有助于减少信息不对称,用户可以减少无关广告的打扰,商家也可以降低广告成本。”
“大数据就像一个上帝,无所不知,所有数据都可以加以利用。”毛新生说, “做一个大胆假设:未来,如果你在微信上谈情说爱,微信在分析了你们的聊天内容后,就可能向你推荐一些适合情人的旅游胜地、餐厅、电影和音乐会,甚至会向你推荐一些情歌和少女约会服饰等。”
毛新生还举了大数据在生活中得到应用的一个实例: “可以在京津冀地区大量铺设用于监测空气质量的传感器,实时采集空气数据进行分析,就可以知道京津冀地区的空气粉尘的传播路径。比如,北京的雾霾是输入性的还是输出性的?如果是前者,是由哪个地区输入?在那个地区,钢铁厂、石灰厂还是造纸厂是雾霾的原生制造者?”
毛新生认为,大数据也正在重塑新闻行业的商业模式。他举例说,“有网络服务商以个性化信息推荐的方式推送新闻,提高了推荐精确度,比传统媒体更善于利用目标客户的价值。以此类推,传统媒体也可以利用大数据找出读者最感兴趣的新闻事件,然后马上派出记者就此新闻采写文章,并对热点新闻稿件的转载征收更高的费用。”
在美国斯坦福大学助理教授贾斯廷看来,随着大数据的应用范围日趋广泛,许多研究领域正在一个个变成“数据密集型学科”,其中包括政治学。像贾斯廷这样的政治学者,其日常工作模式已经转变为:对互联网上的新闻报道、受众留言、博客文章、政客演说等海量信息进行搜集、统计、分析,从而预判一段时期的政治风向和温度。
“衡量大数据的成效,不是看创造了多少数据,而在于创造了多少价值”
“正如火被发明后,既能用来煮食、照明、取暖,也可以用来纵火。大数据技术的应用可以促进经济增长与社会发展,但也可能适得其反。”中国信息安全测评中心顾问俞晓秋对本报记者说。
在大数据各种“先天缺陷”中,隐私泄漏是最令人担心的。“在社交网络上,任何人都可以看到你的国籍、婚姻状况、毕业学校、邮箱等个人信息,甚至可以翻看你发布的照片和生活感悟等。在陌生人面前你变得毫无隐私,这非常可怕。”巴西智库瓦加斯基金会技术与社会中心研究员玛里莉娅对本报记者感叹说。
“您现在是不是正考虑买车辆保险?”“我们向您介绍一款理财产品”……每天,巴西人何塞都会收到好几通这样莫名其妙的推销电话,他的邮箱里也经常堆满了各类促销邮件。
对大数据的精确分析,也可以使黑客更加精准地进行攻击,或通过仿冒社交网站域名进行病毒传播等。南非人亚伯拉罕经常在社交网站“脸谱”上炒股。最近,除了一个炒股账户以外,他的其它账户突然都拒绝访问了。“后来我才发现,原来有人盗用了我的身份,已经侵入我的账户长达两周时间,他一直盯着我的账户呢!”
在大数据时代,关乎国计民生的国家重要信息数据系统同样面临着网络恐怖主义的威胁。斯诺登揭露的美国“棱镜门”项目就体现出“数据挖掘”技术在情报领域的应用。
在毛新生看来,所有安全事故的根本原因主要在于人们自身对安全问题缺乏足够重视,有意或无意地泄露了一些入口信息。“人们需要培养保障个人数据安全的意识,包括不在邮件里写用户名和密码等个人信息。最重要的是制定法律,让那些拥有大量数据的人,不能滥用数据。”
咨询机构毕马威硅谷分部高级分析师维贾·佳卓对本报记者说,互联网公司应当建立共同的隐私标准,赋予用户更多控制个人网上信息的权利。比如,科技企业在搜集、储存用户信息时应当充分尊重用户知情权,明确告知搜集了哪些信息、如何贮存以及如何利用这些信息,此外,还应当对企业和机构可以采集的个人数据类型,作出明确、合理的限制。
中国社科院信息化研究中心秘书长姜奇平对本报记者表示,“大数据”作用的发挥,不仅有赖于数据收集、数据提纯等多重技术要素,更关键的是,大数据的应用要与人以及解决人的问题联系起来。衡量大数据的成效,不是看创造了多少数据,而应是利用这些数据,在满足人们需求方面创造了多少价值。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04