
百度高级副总裁王劲: 一朵花的大数据之旅_数据分析师
百度正在传统的搜索技术之外,利用“大数据+云计算”打造另一个驱动公司发展的新引擎——百度高级副总裁王劲接受21世纪经济报道记者采访时如是说。
百度大脑是“云计算+大数据”的载体:其由硬件和软件两部分组成,硬件部分是由云计算中心和服务器组成,软件部分是由大数据和人工智能算法组成。无论百度推荐引擎、BaiduEye,还是百度面对商家的直达号,均依赖百度大脑作为技术基础,是一切前端应用的backoffice。
王劲认为,百度的核心竞争力在于人工智能和大数据的结合。可能的场景是:用手机拍一朵花的照片,上传给百度,百度大脑把它转化成“0101”的数字流,然后输入到深度神经网络里,经过层层的分析、复杂的学习算法和大数据比对,最后还原并识别出它是一朵花,并告诉用户这朵花的名字,随后在百度百科里找到花的属性。
如何获得大数据?在百度看来,与第三方伙伴合作是较快获取大规模数据的方式之一。此前百度曾和中科院花卉研究所对接,获得花卉种类等近二十万条的数据。在电商领域,国内京东、当当、蘑菇街等电商平台伙伴向百度提供消费数据,同时获得百度入口的流量。当然,目前百度尚没有阿里巴巴系统的数据。
《大数据时代》作者舍恩伯格的判断是,目前正处在大数据时代的早期。对于百度来说,其通过搜索引擎积累了大量的数据“金矿”,人工智能则给予百度“挖矿”的能力。
百度做大数据,更是通过搜索引擎在为人工智能铺路。但并非所有的数据金矿都在百度手中,微信、微博等社交数据是一个例子,阿里巴巴手中的电商数据是另一个例子。
“百度在革自己的命”
《21世纪》:百度大脑研究现在进展如何?目前人工智能的研究方面在国际上处于什么位置?
王劲:人工智能一直到2010年都没有什么突破,当它的准确率不高的时候,它就无法应用。一直到这两年有了深度学习的新算法,这个新算法才被用到人工智能上,突破了以前很多瓶颈。在这个方面,百度是做得最早的,百度在全球都是在这方面进行投入的最早公司之一,我们跟国际最领先的公司在同一个起跑线上。
《21世纪》:人工智能从70年代、80年代末初就开始做了,为什么一直就没做起来?
王劲:在那个时候确实面临技术的瓶颈。人工智能在我读书的时候是规则制定阶段,人工智能要制定很多规则。深度学习以及机器学习的好处是,只要把模型建起来以后,就可让计算机自主学习、拼命去迭代。
百度现在拥有10亿规模的连接,人最多只能用几百个参数,我们没办法做人工的判断。百度就把大数据,把规则制定好,数学模型和算法做好,得出结果,人不需要知道为什么是这个结果。人工智能好就好在不需要程序员是每行每业的专家。这是为什么人工智能在这两年有一个飞速的发展。
另一个原因则是语音识别技术的飞速发展,过去两年,语音识别率从70%提高到了95%。今天两个自然人在讲话,其识别准确率差不多是98%。去年百度才刚刚到90%,现在就可以达到95%以上,接近自然人对话。
《21世纪》:推荐引擎的功能,现在的搜索引擎是不是也能做到?
王劲:搜索引擎也可以看成是一种推荐引擎,过去的搜索引擎给用户提供很多的结果。那时候搜索引擎都认为,搜得的结果越多越好。推荐引擎跟它做的正相反,最好只给用户一个最相关的结果。推荐引擎需要在人工智能再上一个台阶以后才可以做到。只有对用户有了更多了解,如时间、地点、人物的更多数据,才可以真正实现个性化推荐,成为真正的推荐引擎。
你可以看到这是新一代的技术,也可以看到百度是在革自己的命。
越开放会越强
《21世纪》:百度如何和线下的商场合作?也就是说,百度的大数据怎样考虑应用场景?
王劲:拿银泰和百度的合作来说,戴上Baidu Eye到银泰的人,年龄、性别、在哪一些货架停留的时间最长,商品有多少人买了,有多少人不买,这些银泰需要的数据,百度就可以帮它拿到并做出分析。
百度投资了一家室内定位的公司。通过室内定位,知道消费者在这个商场里面的走动轨迹,上述数据也都能够用百度大脑算出来。银泰可以通过数据进行商业决策,比如说,该怎么安排消费者在商场的路线,怎么导航能够让这个商场最优化,再把到商场里面的购买行为全部打通,未来购物体验会非常不一样。
大数据、百度大脑、推荐引擎是环环相扣的,最根本的是你要有基础架构,软硬件能力都要很强,数据要足够多,还有关键的是人才。大数据+百度大脑+推荐引擎,这三件要素加起来,百度就能够和传统产业合在一起,打开一个局面。
《21世纪》:很多公司对人工智能前景的描绘都非常好,以后它服务于企业还要克服哪些困难?
王劲:例如数据安全和用户隐私,这些是我们跟传统企业要一起来努力的。百度希望把技术和平台都开放出来,各行各业可以把他们的服务跟百度对接,形成共赢。
百度大数据可以变得越来越大,人工智能和大数据引擎是越用越好用。计算机里叫深度学习,通过数据把它训练得越来越准。我们希望越来越多的人能用人工智能,这是我们这些大数据引擎开放出来的一个重要的原因。另外,越开放它也会越强。
《21世纪》:百度将如何跟政府机构进行合作?
王劲:百度有很多的机会跟政府机构合作,包括和全球的机构。在公益事业上,如医疗,百度能够政府降低疾病的发生率,减少污染,找到污染源,对流行病,以及其他各样疾病的防控等等。再有中小企业景气指数预测,找出它的规律来,这可以帮助我们政府调整政策。
百度刚刚与联合国在一些绿色产业方面进行了大数据方面的合作。
人工智能刚刚起步
《21世纪》:你怎么看待百度在PC时代的数据优势,以及在移动互联时代面临的挑战?
王劲:我们认为移动互联网是一个机会。有一个证据,百度今天在移动端获得的收益超过30%,在中国互联网企业当中这是相当高的。我们有非常多的数据,这些数据加起来我们能够做精准的推荐,这种推荐就是不搜即得。这方面,百度的技术有优势。
移动互联网在生产非常大量的数据,百度数据处理能力和人工智能能力很强,这对我们又是一个很好的机会,这个时代才刚刚开始,这对大家来说既是挑战,也是机会。
百度依托在人工智能、大数据技术上的优势,打造核心竞争力,即人工智能与大数据的结合。
《21世纪》:目前来看,深度学习技术如何改善百度的用户体验和客户的投资回报率?
王劲:百度今天的盈利建立在推广技术上,绝大部分的收入也是从这上面来的。它有一个指标是点击率,如何做到推广的东西人们更需要,推荐的东西更靠谱,非常大比例的是由我们百度大脑实现的。
《21世纪》:人工智能最大的发展障碍是安全和隐私?
王劲:这不一定是最大的障碍,技术能力也需要不断提升。百度有一个通用的技术平台,还需要跟每一个传统行业学习。比如说我们跟海底捞合作,他是行业专家,我们给他一个数据,这个数据对他来说很有价值,而我只知道这是数据。
今天很多东西刚刚开始,它像滚雪球一样越滚越大,越早跟百度合作会越好,百度如果把这个技术越早完善,快速迭代,这其实也是一个机会。
人工智能还在刚刚起步的阶段,但是它有一个美好的未来。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-06-052025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27