京公网安备 11010802034615号
经营许可证编号:京B2-20210330
CDA&中国工商银行股份有限公司数据挖掘内训圆满成功
2017年9月18-20日,CDA数据分析研究院在中国工商银行股份有限公司数据中心(上海)进行了一场以“Python语言数据挖掘应用”为主题的内训。培训班在嘉定园区开课,西三旗园区、外高桥园区和上海分行信息科技部远程视频参加,中心各部门员工报名积极,共有95名员工参加了集中培训。老师和数据分析部门的相关同事进行积极地交流学习,最后都收获了不少学习成果。
内训企业介绍
中国工商银行股份有限公司数据中心(上海)
中国工商银行股份有限公司数据中心(上海)[以下简称数据中心(上海)]为总行直属机构,于2000年11月10日正式挂牌成立。数据中心(上海)承担全行信息系统生产运行及灾备管理的职能,建立了全球领先的核心生产环境,形成了基于ITIL理念的生产运维体系,为工商银行境内外机构提供数据服务,并与500多家第三方机构相连接。
满足更高标准的业务连续性运作和系统可用性要求,工商银行在国内同业率先启动“两地三中心”工程建设。数据中心(上海)在上海外高桥、嘉定,以及北京西三旗三个园区建成两个并行运行、快速接管的同城数据中心和一个异地灾备中心,实现了最高等级的灾备部署,保证信息系统全年365天,全天24小时不间断运行。
十多年的奋勇开拓,不仅铸造了数据中心(上海)强大稳定的信息系统,更锤炼出一支锐意进取、追求卓越的人才团队。我们汇聚人才,更执于培养人才。我们引领改变,更擅于掌控改变。我们开拓视野,更乐于分享视野。我们追寻梦想,更敢于触动梦想。
内训内容简介
整场内训气氛和谐,参加内训的学员都表示收获颇多。
第一阶段:Python 基础学习
1. 语法初步
2. 列表、字符串和元组
3. 集合与字典
4. 条件和循环语句
5. 若干重要内置函数应用
6. 文件操作
7. 函数及其应用
8. 正则表达式
9. 数据库和 Python
10. 排序算法、 动态规划算法、递归算法等算法
1. 整理数据(切片、产生随机数、复制、广播、排序等)
2. 数据索引和选择的各种方法
3. 数据的分组、分割、合并、变形
5. 时间序列数据处理、建模和预测(ARIMA)
6. 含中文数据的处理
7. 数据去重、去离群值
8. R语言和Python(pandas)数据整理和建模的比较
9. 描述统计和推论统计分析
1.Logistic 回归模型对文本的分类
2.图片结构和分析(图片的K-means聚类分析)
3.图片的识别和分类:PCA建模
4.二维手写数字识别(KNN方法)
6.数据可视化的各种情形
7.新闻的文本分类(TF-IDF准则、旅游新闻个性化推荐)
8.手写识别
9.朴素贝叶斯(Naïve Bayes)决策
10.酒的品质分类预测
11.机器学习的格点搜索和参数寻优
12.惩罚线性回归分类器
13.使用支持向量机识别和分类
14.金融时间序列预测(非ARIMA方法)
15.机器集成学习算法
16.随机模拟、用户流失预警、量化投资实战
学员评价
老师通过数据分析工作中遇到的典型数据分析和挖掘案例进行深刻地分析,即使是初学者也能快速掌握Python 数据分析和数据挖掘(含机器学习)的思想和方法,形成科学有效的知识和能力结构体系框架。
企业领导评价
本次培训内容丰富,基本涵盖机器学习常用算法和方法。通过集中培训和学习,学员们纷纷表示受益匪浅,对机器学习有了更深入了解,并且提升了动手实践能力。后续在数据分析实践中,结合我行业务和运维场景需要,使用所学的只是和方法更好的解决问题。同时希望后期与CDA数据分析师在专题类课程多交流,CDA认证、项目咨询等多方面达成更深入合作。
内训咨询
手机/微信:13121318867
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27