京公网安备 11010802034615号
经营许可证编号:京B2-20210330
如何拥抱大数据时代(2)_数据分析师
大数据应用是把双刃利剑
记者:大数据在商业以及城市安全防范等领域已经有很多应用的成功案例,大数据将会给教育领域带来怎样的变革?
袁卫:大数据将对教育产生非常深远的影响。目前可以预见的,我想主要有两个方面:一是通过大数据,分析学生成长环境、兴趣爱好、能力特长等,有利于教育者对学生加深了解,有利于因材施教,使得根据学生个人兴趣、特长、能力进行个性化教育成为可能;二是带来教学内容、教学方式方法上的改变,立体化教学、案例教学、互动教学等方式的运用使得教学更加生动,MOOCs(慕课)就是大数据时代教学变革的一个例子。大数据可以促进全世界优质教育资源共享,发挥每个教师的优势特长。大数据将对教育产生一系列的深远影响,不可低估。
记者:但是,大数据的广泛应用,可能会导致侵犯他人隐私的情况发生,对此您怎么看?
袁卫:在大数据时代,个人的相关数据信息轻易可得,个人隐私越来越不安全。其实不仅仅是个人隐私,包括国家安全和企业的商业机密,也受到很大的威胁。怎么办?我认为对于国家而言,一方面要积极推进数据对外开放,凡是不涉及个人隐私、国家安全和商业机密的数据,都应该公开,这样才能避免形成数据孤岛,充分发掘和利用数据资源;另一方面,在开放数据的同时要加强相关立法,这两个方面是互相补充的,只有这样,才能赶上时代发展的步伐,充分发挥我们这个人口大国、经济大国的数据资源优势。
从个人的角度讲,要加强个人信息防护意识,在上网发布相关信息时,要了解哪些是可以发的,哪些是不能发的,以免给自己带来困扰。
两个“交叉”探索人才培养之道
记者:据了解,中国人民大学、北京大学、中国科学院大学、中央财经大学和首都经贸大学5所高校组建了一个协同创新平台,以“应用统计专业硕士”为载体培养大数据分析方面的人才。为何要采取这种多校合作的培养模式?
袁卫:之所以采用这种协同创新、5校合作的培养模式,完全是由大数据人才的特点决定的。第一个特点,大数据人才是多学科交叉型人才,不是某一个学科可以单独培养的。大家知道,现在进行数据分析,要有数据库和软件等计算机方面的知识,还要有数学和统计方面的知识和能力。这就涉及到中国学科体系中“统计学”和“计算机科学与技术”两个一级学科。培养出的毕业生到了单位,可能还需要财经、新闻、生物医学和管理等方面的知识。所以,大数据人才的培养,也需要计算机、统计学、数学等多学科共同参与。
第二个特点,这是一类应用型人才,必须重视实践环节。他们毕业后不是去做研究,而是投身业界,要能很快上手。这样的人才培养,不是仅在学校、在实验室、研究室里就能够培养出来的,而是要到实践中去,解决实际问题。因此,这个协同创新平台,不仅有5所高校参与,还有人民日报、新华社、中央电视台等十余家媒体,中国移动、中国电信、中国联通、百度、阿里巴巴、腾讯等大数据公司和用人单位,包括云计算的一些基地共同参与,是一个“政、企、产、学、研”一体的人才培养平台,也就是说,人才培养环节是交叉的。
还有一点需要指出,为什么把人才培养的层次定位于硕士?目前全国有200多所本科院校开设统计学专业,75所高校设有统计学博士点,78所高校开办“应用统计硕士”专业学位。在大数据时代,我们改革最急需的人才是硕士层次的,正好我们有“应用统计专业硕士”这样一个新的专业学位,利用这样一个协同创新平台来培养大数据人才,也与专业学位的改革精神相一致。
记者:这个大数据人才的培养方案,如何体现出“两个交叉”?
袁卫:5所学校参与培养,就是出于学科交叉的考虑。中国人民大学统计学院的学科、专业设置是综合的、应用的,理论和应用兼而有之,应用领域涉及卫生、健康、经济、社会、管理等,总体实力较强。而北京大学和中国科学院大学,大家都知道,他们在计算机、数学和统计理论研究方面相当强,掌握大数据分析技术的前沿。中央财经大学和首都经贸大学是财经类为主的院校,这两所学校侧重于应用人才的培养,特别是面向经济、管理、社会这样的领域。他们和很多行业企业、金融机构有着密切联系。这5所高校分别属于教育部直属高校、中国科学院的高校和地方高校3种类型,各有特色,优势互补,能够建成一个很好的、学科交叉的人才培养协同体。
培养环节的交叉,主要体现在企业、用人单位的参与上。上面提到,有这么多的大数据企业、媒体单位参与合作。他们把实际工作中遇到的问题带来,大家一起研究解决;他们把企业运作过程中产生的大数据拿过来,学生直接用这些真实的数据进行训练和研究。
记者:据了解,对这批大数据人才的培养,将采取团队教学的方式?
袁卫:我们经过多次研讨,并参考了美国顶尖的20所大学大数据人才培养的方案和课程,确定了“大数据分析计算机基础”、“大数据分析统计基础”、“大数据分布式计算”、“大数据挖掘与机器学习”、“非结构化大数据分析”和“大数据建模案例研究”6门必修核心课程。每门课程不是由一位老师来上,而是一个教学团队,5所学校各选一名最优秀的教师,然后5位老师一起研究一门课程、同上一门课程,而且还有大数据企业的专家参与。初步估计,每门课程的教学团队会在10个人左右。教学方式也有别于传统的课堂讲授,会采取案例教学和讨论班的方式,也可能是一个团队共同完成一个项目。我们还采取双导师制,两位导师一位来自大学,一位来自企业界,50名学生,就有100名导师。在这个协同创新机制里,还有一个特点,就是采取个性化的教学方式,从生源来看,首批学生主要来源于计算机和统计两个学科,计算机专业背景的本科生进来以后,将重点加强统计分析能力的培养,而统计、数学、物理等专业背景的本科生进来后,将重点加强计算机、大数据软件等方面的学习。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27