京公网安备 11010802034615号
经营许可证编号:京B2-20210330
CDA&中国工商银行股份有限公司数据挖掘内训圆满成功
2017年9月18-20日,CDA数据分析研究院在中国工商银行股份有限公司数据中心(上海)进行了一场以“Python语言数据挖掘应用”为主题的内训。培训班在嘉定园区开课,西三旗园区、外高桥园区和上海分行信息科技部远程视频参加,中心各部门员工报名积极,共有95名员工参加了集中培训。老师和数据分析部门的相关同事进行积极地交流学习,最后都收获了不少学习成果。
内训企业介绍
中国工商银行股份有限公司数据中心(上海)
中国工商银行股份有限公司数据中心(上海)[以下简称数据中心(上海)]为总行直属机构,于2000年11月10日正式挂牌成立。数据中心(上海)承担全行信息系统生产运行及灾备管理的职能,建立了全球领先的核心生产环境,形成了基于ITIL理念的生产运维体系,为工商银行境内外机构提供数据服务,并与500多家第三方机构相连接。
满足更高标准的业务连续性运作和系统可用性要求,工商银行在国内同业率先启动“两地三中心”工程建设。数据中心(上海)在上海外高桥、嘉定,以及北京西三旗三个园区建成两个并行运行、快速接管的同城数据中心和一个异地灾备中心,实现了最高等级的灾备部署,保证信息系统全年365天,全天24小时不间断运行。
十多年的奋勇开拓,不仅铸造了数据中心(上海)强大稳定的信息系统,更锤炼出一支锐意进取、追求卓越的人才团队。我们汇聚人才,更执于培养人才。我们引领改变,更擅于掌控改变。我们开拓视野,更乐于分享视野。我们追寻梦想,更敢于触动梦想。
内训内容简介
整场内训气氛和谐,参加内训的学员都表示收获颇多。
第一阶段:Python 基础学习
1. 语法初步
2. 列表、字符串和元组
3. 集合与字典
4. 条件和循环语句
5. 若干重要内置函数应用
6. 文件操作
7. 函数及其应用
8. 正则表达式
9. 数据库和 Python
10. 排序算法、 动态规划算法、递归算法等算法
1. 整理数据(切片、产生随机数、复制、广播、排序等)
2. 数据索引和选择的各种方法
3. 数据的分组、分割、合并、变形
5. 时间序列数据处理、建模和预测(ARIMA)
6. 含中文数据的处理
7. 数据去重、去离群值
8. R语言和Python(pandas)数据整理和建模的比较
9. 描述统计和推论统计分析
1.Logistic 回归模型对文本的分类
2.图片结构和分析(图片的K-means聚类分析)
3.图片的识别和分类:PCA建模
4.二维手写数字识别(KNN方法)
6.数据可视化的各种情形
7.新闻的文本分类(TF-IDF准则、旅游新闻个性化推荐)
8.手写识别
9.朴素贝叶斯(Naïve Bayes)决策
10.酒的品质分类预测
11.机器学习的格点搜索和参数寻优
12.惩罚线性回归分类器
13.使用支持向量机识别和分类
14.金融时间序列预测(非ARIMA方法)
15.机器集成学习算法
16.随机模拟、用户流失预警、量化投资实战
学员评价
老师通过数据分析工作中遇到的典型数据分析和挖掘案例进行深刻地分析,即使是初学者也能快速掌握Python 数据分析和数据挖掘(含机器学习)的思想和方法,形成科学有效的知识和能力结构体系框架。
企业领导评价
本次培训内容丰富,基本涵盖机器学习常用算法和方法。通过集中培训和学习,学员们纷纷表示受益匪浅,对机器学习有了更深入了解,并且提升了动手实践能力。后续在数据分析实践中,结合我行业务和运维场景需要,使用所学的只是和方法更好的解决问题。同时希望后期与CDA数据分析师在专题类课程多交流,CDA认证、项目咨询等多方面达成更深入合作。
内训咨询
手机/微信:13121318867
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14