利用机器大脑挖掘数据金矿，从大数据到大行动-CDA数据分析师官网

热线电话：13121318867

利用机器大脑挖掘数据金矿，从大数据到大行动

2015-01-02

利用机器大脑挖掘数据金矿，从大数据到大行动

人工智能的发展是否会让机器大量取代人类的思考和工作，现在难以定论是非，但目前我们至少可以利用人工智能来帮助我们挖掘数据的金矿，让我们通过数据理解自我和世界。这也和TED创始人、被誉为“信息架构之父的” 理查德•沃曼(Richard Saul Wurman)曾表达的观点不谋而合。

日前，在百度德尔塔俱乐部组织的交流活动中，针对如何洞察数据和世界、如何利用科技增进人类相互了解等问题，百度研究院副院长余凯博士和理查德•沃曼展开了一次智慧交锋。余凯表示，“数据给了我们很多机遇，尤其是人工智能在过去10年的发展中，让我们意识到数据可以在许多领域产生新的玩法。”

余凯之所以会对数据有此洞见，是出于多年来在机器学习和数据挖掘等人工智能领域的钻研。他曾受邀在美国斯坦福大学主讲人工智能课程，一直从事深度学习等领域的核心技术研发和团队管理。他曾带领百度多媒体部大力推进公司在图像和语音技术方面的研发。他所领导的百度深度学习研究院(IDL - Institute of Deep Learning)于2013年成立，成为与IBM、谷歌、微软所设研究机构齐名的全球著名研究机构之一。值得一提的是，他所领导的项目团队在短短两年里已经三次问鼎百度最高奖。

如今在百度，深度学习已经被成功用于凤巢广告系统，网页搜索，语音识别，图片搜索等方方面面。百度语音识别的准确率已达到94%，图片搜索的准确率也达到80%，均处于业界领先水平;在人工智能领域，百度大脑拥有200亿个参数，超越谷歌大脑，构造起世界上最大的深度神经网络。

沃曼认为，对大数据的分析利用应该进一步准确定义为“大理解”。在他看来，尽管今天很多人提到“信息爆炸”，但事实上人类在很多领域对数据的理解并不够深入，如在城市信息化、金融、医疗等领域，数据可以帮助我们把复杂的事情变得简单。

一直在深度学习领域钻研的余凯深有感触，但余凯也提到，“虽然数据是真实的，但是它会具有偏向性，不同的分析方式，会有不同的解读，所以它可能不会是完全客观的。要审慎的用正确方法处理数据，才能获得正确的信息。”

深度学习领域的探索依赖于足够大体量的数据和聪明的工程师。一方面，百度在过去多年发展中，在“数据采集”和“数据加工”领域积累了丰厚的家底，并且移动互联网的广泛普及使得百度能从更多维度去获取数据，如移动搜索方面的用户搜索习惯，百度地图上的LBS数据，智能硬件方面的人体健康数据等。另一方面，百度在深度学习领域的投入也包括吸引一大批世界级科技精英加盟，包括“谷歌大脑”之父吴恩达教授，前Facebook资深科学家徐伟、美国新泽西州立大学统计系教授张潼、前AMD异构系统首席软件架构师吴韧等，使其成为业界推动“大数据驱动的人工智能”的领导者之一，位列深度学习研究的第一阵营。

对话中，沃曼不止一次提到自己的“好奇心”，称正是好奇心驱动他创办了TED，以及后来备受推崇的“用思想的力量来改变世界”的TED大会。如今年近八旬的沃曼仍然保持着探索未知的热情。沃曼说，当前，全球人口的50%在城市里生存。未来这一数字将达到70%。云和大数据是我们理解数据的方式之一。我们希望为城市设计这样一种语言，使得大家可以互相交流、理解。

对此，余凯表示，百度研究院不仅致力于深度理解大数据，更在逐步将大数据转变为“大行动”，只有行动，科技才真正改变世界。例如自去年春节期间推出“百度迁徙”之后，百度大数据部联合大数据实验室陆续推出了景点城市预测、疾病预测、高考预测、世界杯预测、经济预测、百发100指数等多款大数据产品，内容涉及出行、体育、宏观经济、股市行情的多个领域，成为全球范围内大数据落地产品最多的一家互联网巨头。甚至有人将其和IBM、谷歌共同列为全球大数据三巨头，并称“BIG”。而在今年的世界杯预测中，百度更以58.33%的小组赛预测准确率和93.75%的淘汰赛预测准确率，领先其他两家巨头。

余凯看好技术对世界的改变。随着百度深度学习团队在深度学习领域的耕耘，他们所开发技术广泛应用于百度的凤巢系统，网页搜索，手机百度，图片搜索，百度翻译、涂书笔记，百度魔图、百度识图等产品，在改变人们的思想和行为，增进人们对世界的了解。近期百度深度学习研究院更是陆续曝出开发无人驾驶自行车和汽车的消息，为人们未来的自由沟通、自在出行打造更大的想象空间。余凯谈到未来团队的使命时表示，“我们希望通过百度的服务和产品，让用户每天的生活充满意义，不仅如此，我们想要用技术让每一个人普通人更有创造力，更伟大。”

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；