京公网安备 11010802034615号
经营许可证编号:京B2-20210330
在大家的眼中,科学家的形象可能是一位表情严肃、着装单一、不修边幅、戴着一副厚重眼镜且天庭饱满,发际线无限上移的中老年理共男。但实际上,他们正式体面,幽默无比,可谓是集涵养和趣味于一身的真正撩妹达人!
那么现实中,你是否有见过真正的数据科学家呢?
数据科学家,一个大数据时代的新兴称号,被《哈佛商业评论》中被誉为“21世纪最性感的职业”,2015年,美国白宫首次设立数据科学家的岗位。
他们可能不发表学术论文,没有科研项目,也没有得过学术大奖,但在商业帝国里扮演着至关重要的角色。他们是技术驱动,没日没夜与数据打交道的匠人;他们是创意源泉,为业务出谋划策的参谋者;他们是幕后之王,未雨绸缪粮草先行。
在国内,CDA以寻找数据科学家活动,汇聚了一批真正称得上大佬的实战派先锋,无论是在商业领域摸爬滚打,还是在学术界科研探索,都硕果累累,名副其实。所谓前人栽树后人乘凉,他们为数据科学做出了模范般的躬先表率。CDA也授予其“荣誉数据科学家”称号。
荣誉数据科学家
九屠

曾就职于阿里巴巴·饿了么,集团首席数据架构师、P10科学家。负责饿了么、百度外卖的大数据技术统筹。
2014年加入百度,先后带团队建设为百度地图6大Place场景做数据分析,后专注于百度外卖大数据生态从0开始孵化并最终完善。自主研发涉及到数据采集3大平台、开放式ETL4件套、OLAP分析平台、Adhoc、大数据分布式调度、数据集市、数据仓库等,另外技术驱动数十个辅助业务分析角色的分析挖掘平台。为大数据研发打造离线、实时数据整套解决方案,目前构建并推广AI学习平台系统;在AI和大数据技术创新层面,作为发明型专利第一发明人拥有44项发明。
李御玺
国立台湾大学资讯工程博士,铭传大学资讯工程学系教授,铭传大学大数据研究中心主任,中华数据挖掘协会理事,中国人民大学数据挖掘中心顾问,IBM SPSS-China顾问,SAS-Taiwan顾问,CDA命题组负责人。在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。
服务过的客户包括:中国工商局、中信银行、台新银行、联邦银行、新光银行、 第一银行、永丰银行、远东银行、美商大都会人寿、嘉义基督教医院、台湾微软、航空公司如东方航空公司、中华航空公司、汽车行业如福特(Ford)汽车公司;政府行业如国税局等。
赵卫东
东南大学博士,复旦大学博士后,主要负责本科生和各类研究生大数据核心技术和商务数据分析等课程的教学。商务智能被评为上海市精品课程,获得2013年高等教育上海市教学成果奖二等奖。目前主要研究方向包括商务数据分析和大数据分析等。主持2项国家自然科学基金以及上海市浦江人才、企业合作课题等20多项项目。已在Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers等国内外刊物和学术会议发表论文90多篇。
出版著作《智能化的流程管理》、《数据挖掘实用案例分析》以及教材《商务智能(第四版)》、《机器学习》、译作《商务智能 数据分析的管理视角(第四版)》、《人机共生——洞察和规避数据分析中的机遇与误区》等10多部。获得上海市2015年上海市科技进步二等奖。
付波
博士,电子科技大学副教授,2009年获电子科技大学工学博士学位,2007-2008加拿大Univ. of Guelph的ARIS实验室访问学者。
多年从事模式识别、信号处理和机器学习相关工作,曾先后主持/参与国家自然科学基金、国家863及省市各项课题20余项。在包括IEEE Trans. IFS, SPL, Int. Jour. of PR, PRAI等国内外权威期刊、重要国际会议上发表论文30余篇,其中SCI检索20余篇。合作参与编写专著3部。获国家授权发明专利7项,省市科技进步奖2项。曾担任国家自然基金及多个期刊或会议的评审人和特约审稿人。目前,主要关注医疗健康大数据分析和产业化运用,近几年主持或合作医疗及人工智能相关科研项目400余万,并参与创办了2家科技公司。
阎志涛
Talkingdata,研发副总裁,负责企业数据治理,数据平台及客户精准营销等实务。
王学武
首席数据官。毕业于华中科技大学计算机专业。PRINCE2,PMP,CMMI评审员,IBM电子商务架构师,工信部项目管理工程师,工信部软件设计师。
具有12年的项目管理与技术研发经验,曾参与实施某航企多个核心的商业智能、数据仓库项目;曾作为该企业工程过程管理组的Lead,负责推进CMMI L3评审工作。目前专注于大数据、机器学习、自然语言处理、人工智能等创新技术的研究和在行业的应用。
薛松
美国佛罗里达大学管理学与经济学硕士,曾于美国微策略公司等多家企业担任数据科学家,现任某初创公司数据科学总监。
设计并主持多项大数据与人工智能项目,项目内容涵盖多源异构数据自动化采集、社交媒体舆情分析、多语言自然语言处理、图数据库集成与图算法应用等领域。长期为全球500强客户提供数据产品咨询,搭建企业级大数据平台与应用,在安全、交通、金融、媒体等行业的大数据项目管理方面有丰富经验。
教学案例
以上的实战派数据科学大佬们,也正式成为了CDA数据分析研究院荣誉科学家成员,共同参与制定CDA LEVEL 3数据科学家人才标准大纲及数据科学家精英培训,将自身在大数据发展这几年的实战成果,以教学案例的形式倾囊相授。案例包括:
案例一
大数据指标模型治理与实践
案例介绍:
大数据对业务数据ETL处理后,面临在数据仓库层面对业务词库定义、指标建模、元数据统一等问题;后期对外数据通过产品化和AdHoc方式交付数据,存在指标定义相同,但是语义理解存在较大偏差,如何进行指标模型的多口径计算逻辑统一,避免繁琐的人工维护和迭代,是本议题主张的部分;通过一处定义数据指标,多处交付统一的模型抽象、定义、训练和交付整体实践。
技能涉及:
元数据、大数据计算、ETL、数据建模、计算口径、血缘关系、语义理解、统一模型。
案例二:
用户画像在O2O互联网场景的实践
案例介绍:
在外卖的物流场景下的调度是一个时空最优解的模型评估,模型的演进的过程中,都有重要的特征支持着变革,边界非常清晰。模型演进对于画像部分,是开始在配送服务精细化运营的落地步骤;画像是为了满足个体的真实差异而对个性化的支撑方式。分享围绕互联网企业在智能调度系统方向上从的逐步演进,画像贯穿在整个生态当中,在大刀阔斧的业务版本演进同时,能够细致入微的解决落地场景的实践。
技能涉及:
案例三
文本挖掘实战
案例介绍:
文本分析(Text analysis)是文本挖掘、信息检索的一个基本问题。它将文本中抽取出的特征词进行量化,进而表示其文本信息。由于文本是由特定的人进行编撰的,文本的语义结构不可避免地会反映人的特定立场、观点、价值和利益。通过大量数据的支撑,并结合文本内容的分析,可以推断出文本编撰者的意图和目的,以进行各种不同场景应用。
技能涉及:
分词、词性标注、命名实体标订、情绪标订、词关联分析、文件分类、文件摘要、文件聚类、文字云
案例四
生鲜智能补货
案例介绍:
生鲜补货在特定行业模式下的特点与面临的问题,商业模式与智能补货相结合中用到的智能算法,相关架构与业务效果,以及在系统的整个构建过程,生鲜智能补货是一个跟、供应链、仓储、物流、人员配送、促销、商品展现、推荐、广告、渠道运营等多系统协同的复杂系统,尤其生鲜类商品,保质期短,口味、消费者人群、地域分布等都与传统电商商品具有很大的差异。目前生鲜电商面临的最大问题就是运营成本难以下降,传统电商运营生鲜面临着保质期太短,对新鲜度的极高要求,冷链问题解,配送耗材损耗居高不下等问题。面对这样的问题,可以从供给侧通过智能补货系统对商品进行预测控制,降低损耗,降低周转期,提高库容利用率。
更多业界成熟案例都会融入到CDA LEVEL 3数据科学家精英培训中!
Lesson周期:
三个月,线上约20课时,线下50+课时(周末面授)
Lesson目标:
将数据分析师、数据工程师打造为数据科学家
2019年2月23日开学,限额30人哟,机不可失——https://www.cda.cn/kecheng/53.html
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17