技术提取智慧领衔大数据时代-CDA数据分析师官网

热线电话：13121318867

技术提取智慧领衔大数据时代

2017-03-16

技术提取智慧领衔大数据时代

人工智能的终极目标是让机器能够像人一样思考和做事。但是如果机器不能够理解人的语言，那么就不可能实现人机交互，更不可能自主学习。毫无疑问，有关自然语言处理的研究对于解放人类大脑，是继工业革命解放了人类的身体之后的又一次解放。自然语言处理的诱人前景正使得它越来越成为研究的热点。

孜孜爱国情

李辰专注于人工智能领域的自然语言处理新算法及其在生物文本挖掘领域的应用的研究由来已久。2005年李辰加入位于英国剑桥的全球著名的生物信息研究所—欧洲生物信息研究所(EMBL-EBI)以来，一直从事生物医学数据挖掘的研究、开发工作，尤其是基于自然语言处理自动从文本中提取生物医学知识。2010年，他从众多候选者中脱颖而出，被英国剑桥大学授予海外Fellowship。同年，他通过了EMBL-EBI的严格审核，科研项目被采纳在EMBL-EBI进行，成为一位来自非欧盟国家的入选者。在获得剑桥大学博士学位后，他受邀加入麻省理工学院计算机与人工智能实验室，在实验室前任主任、美国工程院院士Victor Zue的团队任博士后研究员，继续专注于基于自然语言处理的文本数据的深度理解研究。在EMBL-EBI积累的生物学科研经历使得李辰对基于自然语言处理的生物文本挖掘这一跨学科领域具有独到的见解。

“树高千尺，不忘根本”。走得越远，对故乡的怀念却越深。这些年，他在外求学做研究的同时，也从未停止过对祖国的关注。“只要心存对事业和对祖国的热爱，什么都不能阻挡我前进的步伐。”决定回国前，排在世界五百强企业前列的UnitedHealth邀请他担任高级管理人员，报酬待遇非常优渥。李辰婉拒了。他还是很希望为国效力。2016年，李辰获得中组部“千人计划”青年人才和西安交通大学“青年拔尖人才计划”，回到了心心念念的祖国，任职于西北这片广袤的土地上，开始了新的科研旅程。

◆ ◆ ◆

大数据的核心——数据挖掘

大数据是一种内容庞大而又多样化的信息资源，被认为是等同于人力资源和物质资源的国家重要战略资源。大数据的价值，不仅仅在于拥有海量的数据信息，更重要的是在于对这些含有意义的数据进行专业化处理，提取最具价值的信息，挖掘找到人们所需要的有价值的东西。人工分析这样大量的数据显然是不现实的，必须要有高效的方法。

数据挖掘是近年来新兴的一种科学计算技术与数据分析方法，它能够有效地从大量数据中提取潜在的信息与知识。在生物信息领域，一系列挖掘算法和挖掘模式的研究提出，并应用于生物数据，取得了传统生物计算技术无可比拟的效果。

在当前大数据时代，重视生物信息学的发展极为重要，也更加需要计算机技术的支持。计算机辅助计算将是生物大数据分析的必由之路，也必将成为生物研究中的中流砥柱。对这一点，李辰坚信不疑。他所带领的生物医学文本挖掘研究组专注于研发数据驱动的机器学习模型和算法，来深度理解文本数据。并积极将科研成果转化为应用。在生物信息领域，这些成功应用对于解决生命学科的重大问题具有深远的意义。

◆ ◆ ◆

把“不可能”变成“可能”

“在科研领域里，意识到一种天才的研究方法，其价值并不在发现本身之下。”在计算机语言方面，李辰研究网络的思维方法无疑是领先一步的。如何能让计算机智能地帮我们理解这些文献，从中自动提取出有价值的知识呢?海量的生物网络反应能够被计算机理解是第一步。李辰支持研发了BioModels数据标准及分析系统，创新性地构建了一个集智能存储、搜索和模拟生化反应网络数学模型的开放平台。这一标准填补了生物信息学领域的网络模型的数据标准空白，成为生化网络模型的标准数据库之一，目前已经存有近十五万生物模型。BioModels也被评为系统生物学领域最重要的数据资源，并且得到多家权威国际学术出版机构的超过200种期刊的推荐。2014年，欧盟在其提出的欧洲生物信息架构计划(ISBE)的详细方案书中阐述了关于建立一个泛欧洲系统生物架构的迫切需要。BioModels被欧盟作为一个成功案例在欧洲生物信息架构计划(ISBE)的方案书中进行了分析。2014年，自然出版社对该系统进行了专访。

在设计数据标准将大量的生化网络数据进行整合后，李辰团队将新的语言模型引入生物文本挖掘领域。研发的多个基于机器学习监督算法的生物文本挖掘模型在领域公认的数据集上进行测试，所得结果证明这些模型的性能均达到国际领先水平。2016年，在生物医学文本挖掘的国际比赛BioNLP上，李辰团队研发的LitWay系统获得了SeeDev任务的第一名。在产学研应用方面，他们研发的新的生物网络提取架构使文本挖掘结果更加符合生物学科研究需求，从而拉近了生物文本挖掘科研与应用的距离。基于分析，进一步提出了结合篇章分析和生物信息学的从反应提取向网络生成的发展方向，得到了业内科研人员的认可。

没有超越现状的睿智和锐气，就没有人类的发展;没有强烈的创新意识，就没有人类的进步。看到李辰和他的团队，看到那股热烈的科研精神，我们也仿佛看到了这一新兴学科的无限可能和美好未来。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

文本挖掘大数据数据挖掘人工智能机器学习数据分析 NLP

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

技术提取智慧领衔大数据时代

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：杨旭谈数据产品经理的工作实践与核 ...

【CDA干货】Python变量定义与类实例化：核心原理、 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】联合索引与覆盖索引：本质区别、实战场 ...

【CDA干货】维度表与事实表：数据仓库建模的核心逻 ...

从“指标堆砌”到“体系落地”：CDA数据分析师视角 ...

【CDA干货】SQL计算列值趋势的全场景实现方法与实战 ...

【CDA干货】用户决策链路全解析：从认知到复购的增 ...

CDA 三级《敏捷数据挖掘》教材知识体系全面解读 ...

【CDA干货】付费玩家流失的核心原因与游戏行业长效 ...

CDA持证人专访：蒋少涵谈传统制造业与互联网行业数 ...

学完商业数据分析，开启 CDA 量化策略：从业务思维 ...

CDA持证人专访：赵森淼谈药企数据分析从业体验与转 ...

【CDA干货】卡方检验与T检验结果的标准化解读方法及 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

【CDA干货】MySQL查询不包含指定列的实现方法、实操 ...

【CDA干货】Python中content属性的核心特性、实操应 ...

从零基础到数据科学家：CDA三本官方教材全解读 ...

【CDA干货】资金财务领域本体模型与业务领域模型的 ...

【CDA干货】数字经济下企业数据战略的落地实践与案 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

技术提取智慧 领衔大数据时代

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：杨旭谈数据产品经理的工作实践与核 ...

【CDA干货】Python变量定义与类实例化：核心原理、 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】联合索引与覆盖索引：本质区别、实战场 ...

【CDA干货】维度表与事实表：数据仓库建模的核心逻 ...

从“指标堆砌”到“体系落地”：CDA数据分析师视角 ...

【CDA干货】SQL计算列值趋势的全场景实现方法与实战 ...

【CDA干货】用户决策链路全解析：从认知到复购的增 ...

CDA 三级《敏捷数据挖掘》教材知识体系全面解读 ...

【CDA干货】付费玩家流失的核心原因与游戏行业长效 ...

CDA持证人专访：蒋少涵谈传统制造业与互联网行业数 ...

学完商业数据分析，开启 CDA 量化策略：从业务思维 ...

CDA持证人专访：赵森淼谈药企数据分析从业体验与转 ...

【CDA干货】卡方检验与T检验结果的标准化解读方法及 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

【CDA干货】MySQL查询不包含指定列的实现方法、实操 ...

【CDA干货】Python中content属性的核心特性、实操应 ...

从零基础到数据科学家：CDA三本官方教材全解读 ...

【CDA干货】资金财务领域本体模型与业务领域模型的 ...

【CDA干货】数字经济下企业数据战略的落地实践与案 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

技术提取智慧领衔大数据时代