您的位置:首頁(yè) > 資訊 > 行業(yè)動(dòng)態(tài) > 正文

優(yōu)必選CEO:人形機(jī)器人是AI最終載體,智能音箱只是過(guò)渡產(chǎn)品

2017-06-11 07:19 性質(zhì):轉(zhuǎn)載 作者:量子位 來(lái)源:量子位
免責(zé)聲明:中叉網(wǎng)(m.m21363.cn)尊重合法版權(quán),反對(duì)侵權(quán)盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識(shí)產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀點(diǎn),與本網(wǎng)無(wú)關(guān)。如有需要?jiǎng)h除,敬請(qǐng)來(lái)電商榷!)
“人最容易犯的一個(gè)錯(cuò)誤,就是用現(xiàn)在的眼光去看未來(lái)的人。”在談及未來(lái)人形機(jī)器人的陪伴是否會(huì)讓人更孤獨(dú)的問(wèn)題時(shí),優(yōu)必選創(chuàng)始人、...

  “人最容易犯的一個(gè)錯(cuò)誤,就是用現(xiàn)在的眼光去看未來(lái)的人?!?BR>  在談及未來(lái)人形機(jī)器人的陪伴是否會(huì)讓人更孤獨(dú)的問(wèn)題時(shí),優(yōu)必選創(chuàng)始人、CEO周劍如是回答。他說(shuō),隨著時(shí)間的推移,人類的倫理、道德、情感都會(huì)發(fā)生變化,他不知道未來(lái)人是否會(huì)變得更加“孤獨(dú)”,甚至很難想象30年后我們的孩子們會(huì)是什么樣子。
  也許他們已經(jīng)在體內(nèi)植入了芯片,或是戴上了某些增強(qiáng)力量的裝置……
  但周劍仍然對(duì)自己在做、要做的事情充滿信心。他相信人形機(jī)器人代表著未來(lái)?! ?/P>

  按照維基百科的定義,人形機(jī)器人(humanoid robot)是一種“旨在模仿人類外觀和行為的機(jī)器人,或者合成生物體、人工生命體”。


  其實(shí),這個(gè)定義在“或者”前后出現(xiàn)了一定程度的割裂——制造一個(gè)有大腦、有智慧的“生命體”,與單純地開(kāi)發(fā)一個(gè)外觀和動(dòng)作像人的機(jī)器相比,二者在難度上存在本質(zhì)差異。因?yàn)橹圃祀y度以及成本的高昂,前者基本無(wú)法有效地實(shí)現(xiàn)商業(yè)化。
  而近幾年被深度學(xué)習(xí)與大數(shù)據(jù)所帶動(dòng)的人工智能復(fù)興,則有望讓人形機(jī)器人受益于相對(duì)更為成熟的語(yǔ)音交互和計(jì)算機(jī)視覺(jué)技術(shù),成為家庭場(chǎng)景下的新一代智能硬件接口。
  這或許是一個(gè)風(fēng)口。近幾年,亞馬遜、谷歌、蘋(píng)果這些巨頭公司紛紛推出自己的智能音箱產(chǎn)品,試圖借由一種成本更低的智能交互方式來(lái)收割用戶。目前來(lái)看,搭載了語(yǔ)音助手的智能人形機(jī)器人與同樣搭載了語(yǔ)音助手的智能音箱相比,二者在產(chǎn)品形態(tài)上本質(zhì)上似乎區(qū)別不大。
  但周劍堅(jiān)信自己走在正確的道路上。
  “將AI技術(shù)放在一個(gè)音箱上面,這可能是一種趨勢(shì),一種交互方式上的變化?!痹趯⒅悄苋诵螜C(jī)器人與智能音箱進(jìn)行對(duì)比時(shí),周劍說(shuō),“記得之前我們和騰訊做過(guò)一個(gè)聯(lián)合調(diào)查,在北美的一些家庭用上Echo后,他們?cè)诩依锸褂檬謾C(jī)的頻率降低了30%到40%。
  數(shù)據(jù)不一定準(zhǔn)確,但在語(yǔ)音識(shí)別這些技術(shù)發(fā)展到一定程度后,它代表了一種方向?!?BR>  “但我始終認(rèn)為這只是一個(gè)過(guò)渡性的產(chǎn)品。目前,一些驅(qū)動(dòng)、運(yùn)動(dòng)方面的機(jī)器人技術(shù)還不是很完善,商業(yè)化成本還沒(méi)有真正降下來(lái)。
  但如果有一天,小型的機(jī)器人也能夠完成Echo的任務(wù),對(duì)于人類來(lái)講,與機(jī)器人之間的互動(dòng)、交流一定更有樂(lè)趣。拋開(kāi)成本、拋開(kāi)價(jià)格,從長(zhǎng)遠(yuǎn)上看,桌面或者是大型機(jī)器人是未來(lái)發(fā)展的方向。”
  采訪當(dāng)天,量子位現(xiàn)場(chǎng)體驗(yàn)智能人形機(jī)器人Alpha 2。與同系列的第一代產(chǎn)品相比,搭載了攝像頭和科大訊飛語(yǔ)音操作平臺(tái)的Alpha 2能夠通過(guò)語(yǔ)音和圖像實(shí)現(xiàn)同用戶的互動(dòng),在體驗(yàn)中,Alpha 2正確地給出了如“深圳今天天氣如何”、“美國(guó)總統(tǒng)是誰(shuí)”這類問(wèn)題的答案,也能跟從指令打開(kāi)或關(guān)掉頂燈,最后甚至還仰面來(lái)了個(gè)周星馳的大笑。
  周劍說(shuō),他們未來(lái)的目標(biāo)是打造服務(wù)機(jī)器人——可以端茶倒水、做菜做飯,甚至能在人不方便的時(shí)候幫助解決所有的事情。他認(rèn)為,這種服務(wù)機(jī)器人是一種同之前所有產(chǎn)品都完全不同的品類,它不是一個(gè)單純的交互設(shè)備,而是能給人以陪伴的朋友。
  他表示,要做一個(gè)能在家庭場(chǎng)景下完成簡(jiǎn)單陪伴、教育等任務(wù)的人形機(jī)器人,讓它以一個(gè)大眾相對(duì)可接受的售價(jià)實(shí)現(xiàn)商業(yè)化,可能需要六到八年,而要實(shí)現(xiàn)“服務(wù)”,可能會(huì)需要更長(zhǎng)時(shí)間。
  讓人形機(jī)器人智能化需要解決哪些問(wèn)題?
  拋開(kāi)伺服電機(jī)、液壓、氣壓這類外部機(jī)械控制技術(shù),我們只談機(jī)器人的內(nèi)部操作平臺(tái)。
  去年年底,悉尼大學(xué)計(jì)算機(jī)科學(xué)教授陶大程加盟優(yōu)必選擔(dān)任人工智能首席科學(xué)家,負(fù)責(zé)人形機(jī)器人智能控制系統(tǒng)的開(kāi)發(fā)。
  據(jù)陶大程介紹,目前自己團(tuán)隊(duì)的工作主要在以下三個(gè)方面:
  人臉識(shí)別:家庭場(chǎng)景下的人形機(jī)器人需要能夠識(shí)別家庭中的成員。
  物體檢測(cè):對(duì)家庭場(chǎng)景中的常見(jiàn)物品進(jìn)行識(shí)別、檢測(cè)。
  人體姿態(tài)估計(jì):作為人機(jī)交互的接口,機(jī)器人要理解人的動(dòng)作、行為,首先要完成對(duì)于人體的姿態(tài)估計(jì)。
  陶的主要工作集中于計(jì)算機(jī)視覺(jué)層面。相對(duì)醫(yī)療、工業(yè)場(chǎng)景,家庭場(chǎng)景的環(huán)境要更為復(fù)雜(受光線、油煙、物品擺放等因素影響),機(jī)器人的圖像識(shí)別能力也需要和場(chǎng)景直接相關(guān),因此一些通用型的物體識(shí)別算法可能并不適用。
  同時(shí),機(jī)器人搭載的攝像頭在成像上也有一定的局限性,目前的成像質(zhì)量還比較一般,需要通過(guò)更先進(jìn)的傳感器以及一些類似圖像超分辨率分析的算法來(lái)解決;此外,還要考慮運(yùn)動(dòng)攝像時(shí)如何消除的運(yùn)動(dòng)模糊問(wèn)題。
  除了計(jì)算機(jī)視覺(jué),要形成有效的人機(jī)交互,能夠?qū)θ祟愖匀徽Z(yǔ)言形成理解和反饋的語(yǔ)音系統(tǒng)其實(shí)是更關(guān)鍵的部分。自然語(yǔ)言處理也一直是AI領(lǐng)域一個(gè)難于克服、進(jìn)展緩慢的難點(diǎn)。
  在這一部分,優(yōu)必選將語(yǔ)音識(shí)別、自然語(yǔ)言理解、自然語(yǔ)言處理這類更為主要的技術(shù)工作交給了自己的投資者及合作方科大訊飛;此外,優(yōu)必選也曾在自己與亞馬遜合作的機(jī)器人Lynx上搭載Alexa語(yǔ)音平臺(tái)。
  
  △優(yōu)必選與亞馬遜合作的機(jī)器人Lynx
  據(jù)周劍透露,優(yōu)必選也在嘗試打造自己的智能操作系統(tǒng),并通過(guò)希望通過(guò)開(kāi)發(fā)者社區(qū)形成自己的智能機(jī)器人產(chǎn)品生態(tài)。
  行業(yè)還有多大空間?
  今年年初,優(yōu)必選入圍了CB Insights評(píng)選出的AI 100榜單,此前在B輪融資中估值已經(jīng)超過(guò)10億美金的優(yōu)必選也成為了榜單上智能人形機(jī)器人領(lǐng)域的唯一一家獨(dú)角獸。
  作為行業(yè)中的佼佼者,周劍認(rèn)為目前國(guó)內(nèi)無(wú)論是人工智能還是機(jī)器人行業(yè),泡沫都非常大。比如,對(duì)于家庭場(chǎng)景下的服務(wù)機(jī)器人,能做的可能只有三點(diǎn):教育、陪伴和娛樂(lè),但很多人都在往風(fēng)口上沖,其實(shí)是自己根本沒(méi)想好自己能做什么。
  周劍還認(rèn)為,蘋(píng)果、谷歌這類巨頭進(jìn)入智能機(jī)器人領(lǐng)域的可能性不大。
  “其實(shí)我和蘋(píng)果、BAT都接觸過(guò)。第一,每家公司有自己的基因,有自己的主業(yè)。我們現(xiàn)在全力以赴在做的東西它們應(yīng)該不會(huì)去做;第二,沒(méi)有硬件的操作系統(tǒng)并不是一個(gè)完整的操作系統(tǒng),這跟簡(jiǎn)單地將一個(gè)開(kāi)發(fā)好的Alexa平臺(tái)放在不同的硬件上,是完全不同的兩碼事情?!?BR>  周劍說(shuō),自己一直在做幾乎沒(méi)別人在做的事情,也許未來(lái)的機(jī)器人操作系統(tǒng)會(huì)有好幾種,但在人形機(jī)器人這樣一種載體上,優(yōu)必選在未來(lái)完全有機(jī)會(huì)脫穎而出。他還表示中國(guó)的強(qiáng)大智能制造業(yè)實(shí)力有機(jī)會(huì)將這一行業(yè)的邊界拓展到更遠(yuǎn)。
未來(lái)
  未來(lái),人形機(jī)器人是否會(huì)是通用人工智能的最終載體?
  周劍說(shuō),就他個(gè)人而言,更偏愛(ài)人形機(jī)器人這種形態(tài),也希望它能夠成為這樣一種載體,特別是在家庭領(lǐng)域——不管它需要十年、三十年還是一百年來(lái)實(shí)現(xiàn)。他仍然相信,在未來(lái)無(wú)論家中的硬件如何智能,人仍然會(huì)感到孤獨(dú),會(huì)需要陪伴,而他希望人形機(jī)器人能扮演這種角色。
  而陶大程則給出了一個(gè)更為客觀的回答:“我覺(jué)得人形機(jī)器人主要是用來(lái)完成和人之間的交互,但在一個(gè)工廠中,真的一定需要人形機(jī)器人來(lái)完成工作嗎?并不是所有場(chǎng)景都需要人形機(jī)器人的參與?!?BR>陶大程表示,人工智能已經(jīng)遍及生活的各個(gè)角落,其表現(xiàn)形式可以是多種多樣的。但對(duì)于人與機(jī)器人之間的交互而言,人形機(jī)器人在未來(lái)應(yīng)該會(huì)是AI的主要載體。
  “就像我們誰(shuí)也不愿意對(duì)著一個(gè)智能音箱說(shuō)話——但如果是和一個(gè)人形機(jī)器人說(shuō)話,感覺(jué)到理解和陪伴,你可能會(huì)覺(jué)得更為自然。”陶大程說(shuō)。
One More Thing
  附送一個(gè)視頻。畫(huà)面中正在行走的是優(yōu)必選正在開(kāi)發(fā)的雙足機(jī)器人Walker(目前還只是一個(gè)骨架),研發(fā)團(tuán)隊(duì)目前正在對(duì)其進(jìn)行測(cè)試,最早有望在明年的CES大會(huì)上亮相。
  周劍透露,Walker的預(yù)估研發(fā)成本在3到5億人民幣之間。
  
  P.S.就在昨天,Google將全球最知名的機(jī)器人公司波士頓動(dòng)力出售給軟銀。優(yōu)必選相關(guān)負(fù)責(zé)人應(yīng)量子位之約,從他們的角度解讀這一事件:
  波士頓動(dòng)力在機(jī)器人行業(yè)是一家令人尊敬的公司。
  在此之前,波士頓動(dòng)力曾經(jīng)對(duì)外表示過(guò),公司以前是、現(xiàn)在是、且將長(zhǎng)期是一個(gè)燒錢(qián)的公司。不難看出,成本問(wèn)題制約著機(jī)器人商業(yè)化的步伐,尤其人形機(jī)器人,目前代表全球最高水平的本田ASIMO和波士頓動(dòng)力的Atlas機(jī)器人,造價(jià)百萬(wàn)美元級(jí),但都處于實(shí)驗(yàn)室階段。作為產(chǎn)品推向市場(chǎng),其性能是否穩(wěn)定、成本是否可控成為關(guān)鍵因素。全世界目前還沒(méi)有任何一家公司能夠?qū)㈦p足機(jī)器人商業(yè)化推向市場(chǎng),歐美、日韓都沒(méi)做到。
  而優(yōu)必選從誕生之初,就非常明確要做可商業(yè)化的人形服務(wù)機(jī)器人,我們一直是“兩條腿走路”,即左腿商業(yè)化,右腿為前沿技術(shù)布局。能夠?qū)⒀芯砍晒杆俎D(zhuǎn)化成產(chǎn)品進(jìn)行市場(chǎng)化驗(yàn)證,收集來(lái)自用戶的行為反饋,從而為接下來(lái)的技術(shù)研發(fā)提供最有價(jià)值的數(shù)據(jù)參考。
  以Alpha系列為例,它是一款仿人形機(jī)器人,機(jī)器人分為仿人形、類人形和真人機(jī)器人。人形機(jī)器人是最為人類接受以及最適應(yīng)人類生活及情感的形態(tài),而人形機(jī)器人是家庭服務(wù)機(jī)器人的最終目標(biāo),真人機(jī)器人至少需要30年才能真正實(shí)現(xiàn)商業(yè)化,但是從短期內(nèi)來(lái)看,5到10年里我們某種程度上的一些仿人形的機(jī)器人可能有機(jī)會(huì)進(jìn)入家庭,適應(yīng)人類生活環(huán)境,成為主動(dòng)式交互中心。
  被日本軟銀收購(gòu)之后,希望看到波士頓動(dòng)力在機(jī)器人商業(yè)化方面加速進(jìn)程,有更多的產(chǎn)品創(chuàng)新和技術(shù)突破,對(duì)全球機(jī)器人行業(yè)以及未來(lái)人工智能的發(fā)展創(chuàng)造革命性的價(jià)值。

網(wǎng)友評(píng)論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關(guān)資訊

關(guān)注官方微信

手機(jī)掃碼看新聞