第三屆世界互聯(lián)網(wǎng)大會繼續(xù)在烏鎮(zhèn)舉行。在上午的移動互聯(lián)網(wǎng)論壇上,百度公司總裁張亞勤發(fā)表主題演講,他認(rèn)為人工智能在誕生60年之后,目前進(jìn)入第三季,正是爆發(fā)的時機(jī)。百度希望與各個行業(yè)共享人工智能平臺。
張亞勤在演講一開始講了兩句話:“人工智能很了不起,人工智能沒那么神秘。”過去一年間發(fā)生了兩件事:第一,人工智能先驅(qū)馬文·明斯基(Marvin Minsky)去世;第二,AlphaGo戰(zhàn)勝了人類棋手李世石。張亞勤回顧,這60年間人工智能有高潮有低谷,目前進(jìn)入了第三季,是爆發(fā)的時機(jī)。人工智能真正爆發(fā)是在過去10年,特別是過去5年,人工智能在語音識別、圖像識別等方面有很大突破,很多人才從研究界走入企業(yè),企業(yè)有大量的數(shù)據(jù)、有很強(qiáng)的計(jì)算能力,這是人工智能真正用到服務(wù)和產(chǎn)品的主要原因。
張亞勤談到,人工智能需要超強(qiáng)計(jì)算、海量數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)。百度有多種模型和算法、萬億級參數(shù)和全球最大的神經(jīng)網(wǎng)絡(luò)。百度在語音和圖像識別方面取得了很多成果,目前已經(jīng)開始應(yīng)用在醫(yī)療、駕駛等方面。希望把百度的平臺與行業(yè)共享,一起推動中國人工智能和全球人工智能的發(fā)展。(溫泉)
以下是演講全文
大家早上好,謝謝小川,今天這場很火,看到大家對人工智能特別關(guān)注,最近我去的所有會議或者是論壇,不管是大型的還是私下的聚會,基本上都在談人工智能。我想講兩句話,首先,人工智能是很了不起的。第二,人工智能沒有那么神秘。
今年是人工智能六十周年,有兩個標(biāo)志性的事件:一個是六十年前人工智能主要的提出者去世了,另外一個就是AlphaGO在圍棋比賽當(dāng)中贏了人類,贏了李世石。如果看一下這六十年,人工智能經(jīng)過了很多波折,有很繁榮的時候,也有它的冬天,現(xiàn)在可以說進(jìn)入了第三季。我認(rèn)為第三季應(yīng)該是爆發(fā)的時機(jī)。
如果我們看一下的話,最早的時候一開始大家想的很簡單,我們對人的大腦更了解之后提出一些規(guī)則,還有一些符號,然后把它們用到人工智能系統(tǒng)里面,后來發(fā)現(xiàn)這個不奏效,又產(chǎn)生了專家系統(tǒng),數(shù)據(jù)多了一些,規(guī)則更詳細(xì)一些,發(fā)現(xiàn)還是不夠有效。真正的人工智能工作應(yīng)該是二十年前,這個時候用統(tǒng)計(jì)的方式,用機(jī)器學(xué)習(xí)的方式,還沒有深度學(xué)習(xí),用各種各樣的算法,遺傳算法、各種算法,其實(shí)已經(jīng)廣泛的用到了這個行業(yè),小川他們做搜索的,搜索其實(shí)是用人工智能時間最長的,包括一些做推薦廣告,用了很長的時間。
真正爆發(fā)的話應(yīng)該是過去的十年,這是快速發(fā)展的十年,就是深度學(xué)習(xí)的算法,在第一篇深度學(xué)習(xí)文章以后,就發(fā)現(xiàn)深度學(xué)習(xí)用神經(jīng)網(wǎng)絡(luò)是一個很有前景的道路。這幾年特別是過去的五年,在云識別、圖像識別、語言理解都有重大的突破。還有就是很多人才,人才原來從學(xué)術(shù)界走入企業(yè)。走入企業(yè)之后有一個很重要的特點(diǎn),就是企業(yè)里面有大量的數(shù)據(jù),然后有很強(qiáng)的計(jì)算能力,這也是為什么人工智能現(xiàn)在開始成為真正的成為主流,真正應(yīng)用到服務(wù)、應(yīng)用到產(chǎn)品上的重要原因。
PPT上寫了幾個公司,百度、谷歌、Facebook、微軟,這是最近《財(cái)富雜志》評的四個AI公司。其實(shí)現(xiàn)在很多公司AI做的很好,剛才聯(lián)想的元慶講的把智能設(shè)備用到云里面,小川做搜索也相當(dāng)好,IBM也是我們學(xué)習(xí)的一個很好的模式。
我剛才提到了三個方面,一、是更先進(jìn)的算法,二是超計(jì)算能力,三是海量的數(shù)據(jù)。百度公司這三個方面也都有不少的進(jìn)展,我們的算法現(xiàn)在有許許多多各種各樣的模式,有萬億級的參數(shù),有全球最大的深度神經(jīng)網(wǎng)絡(luò),有千億級的特征訓(xùn)練、千億級的樣本,規(guī)模相當(dāng)大。
10:59[張亞勤]第二點(diǎn)我們的計(jì)算能夠很強(qiáng),我們有幾十臺服務(wù)器,而且有很多CPU,有很多CPU集群,這樣的一個計(jì)算,其實(shí)加速了神經(jīng)網(wǎng)絡(luò)的收斂,很多數(shù)據(jù)需要快速的收斂,現(xiàn)在我們可以搭建一百多層的深度神經(jīng)網(wǎng)絡(luò)。我記得十幾年前我們做神經(jīng)網(wǎng)絡(luò)做到三層不得了了,現(xiàn)在一百多層都比較容易了。
另外就是數(shù)據(jù),百度有很多很多數(shù)據(jù),有很多網(wǎng)頁的數(shù)據(jù),有很多搜索的數(shù)據(jù)、定位的數(shù)據(jù)、交易數(shù)據(jù)、行為數(shù)據(jù)。通過這些數(shù)據(jù)可以很容易地打造獨(dú)特的知識圖譜,打造用戶畫像以及商業(yè)邏輯。這些東西我們把它叫做百度大腦,百度大腦就是有計(jì)算有服務(wù)器,有許許多多的數(shù)據(jù),然后由先進(jìn)算法組成。這里面有很多模塊和能力。
現(xiàn)在相對比較成熟的是四個方面,一是語音識別,也是深度學(xué)習(xí)用的第一個成功的例子。語音識別目前的準(zhǔn)確率已經(jīng)可以達(dá)到在安靜環(huán)境下達(dá)到97%,在方言、速度語速快了以后,比人類還要準(zhǔn)確一些。在比較雜音的環(huán)境下,在車載環(huán)境下可以達(dá)到92%—93%左右,最近把一些新的算法用圖像訓(xùn)練的方式用在語音識別里面,發(fā)現(xiàn)又可以提高10%—15%左右,語音識別現(xiàn)在已經(jīng)非常實(shí)用。
二是圖像識別,語音方面已經(jīng)達(dá)到了很高的準(zhǔn)確度。我們在語音方面也有很多產(chǎn)品,比如說用手機(jī)百度現(xiàn)在可以用語音搜索,你可以聽到語音的合成。我們最近有一個產(chǎn)品“度秘”可以用到音響上,也可以用到車?yán)锩妫@不僅僅是一個自然對話的軟件,其實(shí)它是一個連接服務(wù)的一個載體,所以用“度秘”你可以訂餐、訂票、管理日程,也可以聊天,也可以幫你做體育解說,也可以唱歌,也可以作詩,后面連接了很多數(shù)據(jù)和服務(wù)。另外在圖像和視頻方面,剛才Facebook的石峰講過,很多方面由于有大量的圖像和視頻,這個時候需要找到一個模式,人臉識別相當(dāng)成熟,目前已經(jīng)到99.7%的準(zhǔn)確率,比人眼更準(zhǔn)確了。在圖像視頻的自動描述方面,也越來越精確了,比如說根據(jù)視頻可以知道這是一個小狗在玩水,這邊知道是一個火車沿著森林馳過。
所以說AI真正會帶來一些新的變革,可以用到每個方面,可以說醫(yī)療、教育、金融、交通,也可以用到無人車上,再舉一個簡單的例子,比如說醫(yī)療方面,醫(yī)療方面我們最近有一個百度醫(yī)生的產(chǎn)品,其實(shí)就是用一個像醫(yī)療的機(jī)器人,可以閱讀大量的醫(yī)療文獻(xiàn)、資料、病人的病例,模擬人和醫(yī)生自然的交流、問診的流程,然后可以把這些信息告訴醫(yī)生,也可以把這個信息告訴病人,這對于現(xiàn)在目前我們中國醫(yī)患緊張問題有很大幫助,現(xiàn)在有很多好醫(yī)生,但也有很多病人,醫(yī)生和病人之間的溝通還是有很多的問題。這個可以幫助基層醫(yī)生提高診斷率,也可以幫忙專家醫(yī)生,讓他們減少問診的時間,這個系統(tǒng)已經(jīng)開始使用了,數(shù)據(jù)越多會越準(zhǔn)確,因?yàn)檫@是一個自我學(xué)習(xí)、自我提升的一個過程。
舉一個例子,目前用百度手機(jī)醫(yī)生馬上可以實(shí)現(xiàn),我們叫“智能小e”機(jī)器人,醫(yī)生很多時候需要花很多精力了解病人問診,用“智能小e”就可以省去很多過程。另外一方面就是出行,今天下午我會多講一下,在智能駕駛方面取得的進(jìn)展。剛才我覺得杰瑞·卡普蘭講了一個很有趣的例子,人工智能有些方面比較聰明,有些方面比較笨拙,我們經(jīng)常開玩笑說機(jī)器人可以開車,結(jié)果打不開車門,所以在智能駕駛方面,目前確實(shí)取得進(jìn)展比我們想象的要快很多,百度有兩個路徑,一個路徑是L3,是一個比較漸進(jìn)的,在有限的條件下進(jìn)行自動駕駛、智能駕駛,根據(jù)現(xiàn)在的高精地圖、精準(zhǔn)定位、計(jì)算機(jī)視覺然后和廠商進(jìn)行合作,包括車聯(lián)網(wǎng)、操作系統(tǒng)這種比較現(xiàn)成的技術(shù)。
還有一個L4,完全無人駕駛,這對整個環(huán)境、技術(shù)要求相對比較嚴(yán)格。L3和L4有很多共同之處,大部分的平臺數(shù)據(jù),包括機(jī)器學(xué)習(xí)的算法都是可以共享的,但是整個假設(shè)的環(huán)境是完全不一樣的。L3我就不細(xì)講了。L4,大家已經(jīng)體驗(yàn)了,百度去年差不多這個時候,第一次完成了路測,在北京的五環(huán)完成的,這一年取得了很大的進(jìn)展,我不知道大家有沒有機(jī)會試一下我們的無人車。在烏鎮(zhèn),現(xiàn)在我們有十八輛車,相對去年取得了很多進(jìn)展,比如說更復(fù)雜的路況、像下雨天有霧霾的天氣情況下都可以使用,有更多的傳感器,有更強(qiáng)的學(xué)習(xí)能力。這個方面我們收集了很多數(shù)據(jù),把數(shù)據(jù)放在云端進(jìn)行學(xué)習(xí),最后再傳到汽車上,但是大部分決策是在汽車上,這樣即使不聯(lián)線,還是可以自動駕駛。
我也提到了人工智能可以用到各個方面,我們也希望把我們的平臺和整個行業(yè)共享,所以我們今年九月份開放了兩個平臺。一個是機(jī)器深度學(xué)習(xí)的平臺,叫PaddlePaddle。另外一個是百度大腦,我們把這些能力語音、圖像、自然語言、用戶畫像開放給大家,希望大家一起推動中國人工智能以及全球人工智能行業(yè)的發(fā)展。蠻有意思的,我記得三十年前比爾·蓋茨講希望有一天機(jī)器能像人一樣聽去看去寫,用自然語言交流,今天他提的目標(biāo)在很大程度上已經(jīng)達(dá)到了,人工智能很有意思,我做計(jì)算機(jī)研究,最早的時候我們學(xué)機(jī)器語言,學(xué)編程。后來是機(jī)器來學(xué)人的語言。未來一方面機(jī)器要向人學(xué)習(xí),人也要向機(jī)器學(xué)習(xí)。
這次AlphaGO擊敗李世石之后,我說當(dāng)然AlphaGO有各種大數(shù)據(jù),有對抗的算法,有增強(qiáng)的算法,但是向人類學(xué)習(xí)很多東西,學(xué)習(xí)人類的棋譜。我們?nèi)祟惸阌袥]有向機(jī)器人學(xué)習(xí),給你什么啟示。其實(shí)圍棋界很多人看AlphaGO的走法,里面有一些走法確實(shí)和專家的常規(guī)完全不一樣,小川做的解說非常精彩,小川不下棋,他之前預(yù)測AlphaGO會贏,我也做計(jì)算機(jī)研究,我也下棋,之前我認(rèn)為計(jì)算機(jī)會贏,但是不是今年。不過今年我覺得還是有特別令激動人心的事,就是人工智能的發(fā)展。再次感謝大家!
2024-12-21 09:15
2024-12-20 08:53
2024-12-20 08:50
2024-12-19 09:23
2024-12-17 09:51
2024-12-17 09:35
2024-12-15 09:06
2024-12-12 10:16
2024-12-12 10:01