京公网安备 11010802034615号
经营许可证编号:京B2-20210330
CDA&中国工商银行股份有限公司数据挖掘内训圆满成功
2017年9月18-20日,CDA数据分析研究院在中国工商银行股份有限公司数据中心(上海)进行了一场以“Python语言数据挖掘应用”为主题的内训。培训班在嘉定园区开课,西三旗园区、外高桥园区和上海分行信息科技部远程视频参加,中心各部门员工报名积极,共有95名员工参加了集中培训。老师和数据分析部门的相关同事进行积极地交流学习,最后都收获了不少学习成果。
内训企业介绍
中国工商银行股份有限公司数据中心(上海)
中国工商银行股份有限公司数据中心(上海)[以下简称数据中心(上海)]为总行直属机构,于2000年11月10日正式挂牌成立。数据中心(上海)承担全行信息系统生产运行及灾备管理的职能,建立了全球领先的核心生产环境,形成了基于ITIL理念的生产运维体系,为工商银行境内外机构提供数据服务,并与500多家第三方机构相连接。
满足更高标准的业务连续性运作和系统可用性要求,工商银行在国内同业率先启动“两地三中心”工程建设。数据中心(上海)在上海外高桥、嘉定,以及北京西三旗三个园区建成两个并行运行、快速接管的同城数据中心和一个异地灾备中心,实现了最高等级的灾备部署,保证信息系统全年365天,全天24小时不间断运行。
十多年的奋勇开拓,不仅铸造了数据中心(上海)强大稳定的信息系统,更锤炼出一支锐意进取、追求卓越的人才团队。我们汇聚人才,更执于培养人才。我们引领改变,更擅于掌控改变。我们开拓视野,更乐于分享视野。我们追寻梦想,更敢于触动梦想。
内训内容简介
整场内训气氛和谐,参加内训的学员都表示收获颇多。
第一阶段:Python 基础学习
1. 语法初步
2. 列表、字符串和元组
3. 集合与字典
4. 条件和循环语句
5. 若干重要内置函数应用
6. 文件操作
7. 函数及其应用
8. 正则表达式
9. 数据库和 Python
10. 排序算法、 动态规划算法、递归算法等算法
1. 整理数据(切片、产生随机数、复制、广播、排序等)
2. 数据索引和选择的各种方法
3. 数据的分组、分割、合并、变形
5. 时间序列数据处理、建模和预测(ARIMA)
6. 含中文数据的处理
7. 数据去重、去离群值
8. R语言和Python(pandas)数据整理和建模的比较
9. 描述统计和推论统计分析
1.Logistic 回归模型对文本的分类
2.图片结构和分析(图片的K-means聚类分析)
3.图片的识别和分类:PCA建模
4.二维手写数字识别(KNN方法)
6.数据可视化的各种情形
7.新闻的文本分类(TF-IDF准则、旅游新闻个性化推荐)
8.手写识别
9.朴素贝叶斯(Naïve Bayes)决策
10.酒的品质分类预测
11.机器学习的格点搜索和参数寻优
12.惩罚线性回归分类器
13.使用支持向量机识别和分类
14.金融时间序列预测(非ARIMA方法)
15.机器集成学习算法
16.随机模拟、用户流失预警、量化投资实战
学员评价
老师通过数据分析工作中遇到的典型数据分析和挖掘案例进行深刻地分析,即使是初学者也能快速掌握Python 数据分析和数据挖掘(含机器学习)的思想和方法,形成科学有效的知识和能力结构体系框架。
企业领导评价
本次培训内容丰富,基本涵盖机器学习常用算法和方法。通过集中培训和学习,学员们纷纷表示受益匪浅,对机器学习有了更深入了解,并且提升了动手实践能力。后续在数据分析实践中,结合我行业务和运维场景需要,使用所学的只是和方法更好的解决问题。同时希望后期与CDA数据分析师在专题类课程多交流,CDA认证、项目咨询等多方面达成更深入合作。
内训咨询
手机/微信:13121318867
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31