網(wǎng)易科技開物沙龍第四季“智能語音與聊天機(jī)器人專場”今日下午在北京舉行,海知智能CEO謝殿俠在現(xiàn)場分享了他對聊天機(jī)器人的理解。他認(rèn)為聊天機(jī)器人可能不亞于當(dāng)年的蒸汽機(jī),當(dāng)時(shí)間推至2年、20年之后,這個(gè)世界很多方面會(huì)超出我們的預(yù)期,而2020年,人人事事物物都將有自己的bot(注:機(jī)器人)。
以下為謝殿俠現(xiàn)場分享觀點(diǎn)整理:
微軟的小娜、小冰等等,是大公司非常宏大的產(chǎn)品,做得非常棒。我們只是做其中一塊,語義API,我們是在做一個(gè)語義平臺,當(dāng)然業(yè)提供了一系列小工具,可以幫助大家更快生成自己個(gè)性化的聊天機(jī)器人。
200年前以蒸汽機(jī)為代表的工業(yè)革命讓我們整個(gè)世界和過去5000年都很不一樣,今年我一直認(rèn)為聊天機(jī)器人可能不亞于當(dāng)年的蒸汽機(jī)。反過來我們想一下,不想200年,我們想2年、20年之后,這個(gè)世界會(huì)怎么樣,我覺得很多方面會(huì)超出我們的預(yù)期。
這就是前面講的,鍵盤鼠標(biāo),PC時(shí)代;觸摸屏,手機(jī)時(shí)代;今天智能時(shí)代核心的標(biāo)志是什么呢?就是聊天機(jī)器人,或者說智能助理。
我們做語義API,做任何一件事都要解決一個(gè)問題,我們要解決兩點(diǎn):1、用戶的痛點(diǎn),前面講了很多,最后落地到具體產(chǎn)品,你說的話機(jī)器人能懂嗎?能懂多少,到今天為止這還是很大的問題。2、你懂了,理解準(zhǔn)確不準(zhǔn)確?3、用戶有多少?就像最初iPhone一代出來的時(shí)候,它有很驚艷的地方,也有不爽的地方,但今天的手機(jī)和當(dāng)時(shí)有了多大區(qū)別?
同樣,不管是我們做實(shí)體機(jī)器人還是虛擬機(jī)器人,都面臨這個(gè)問題,對我們來講,我們可能會(huì)選擇從特定場景、特定用戶、特定領(lǐng)域來做有限的服務(wù),希望能在特定場景、特定領(lǐng)域和特定用戶的情況下幫助機(jī)器理解用戶的語言。
我的服務(wù)對象是開發(fā)者,不管是做機(jī)器人,還是做各種各樣應(yīng)用的,實(shí)際上我們前面講了,從鍵盤、鼠標(biāo)到觸摸屏、再到語音交互或者說自然語言交互,這實(shí)際上是三個(gè)時(shí)代的變革,反過來是不是意味著任何過去通過鍵盤鼠標(biāo)進(jìn)行操作、通過觸摸屏操作的都可以通過對話的方式來進(jìn)行?一種,大家可以自己去做,實(shí)際上自己做也可以,需要有非常雄厚的實(shí)力,否則鏈條太寬泛了。還有一個(gè)是API,這會(huì)有很多選擇,我們只是希望把其中一部分做得比較深入。
我們的特點(diǎn)有三部分:
1、專注于語義,希望針對剛才說的“三個(gè)特定”理解得更準(zhǔn);
2、理解的同時(shí),比如來了一個(gè)非洲的同伴,他學(xué)了中文,說得特別棒,但我相信深入聊天還是很難,因?yàn)樗鄙俸芏啾尘爸R,所以知識投入這塊是我們花力氣更大的地方,所以一方面我們可以自建,一些基礎(chǔ)的,時(shí)間、地點(diǎn)、人物、機(jī)構(gòu)、天氣、百科,第二,我們希望開放標(biāo)準(zhǔn),和任何一個(gè)領(lǐng)域你擁有知識、擁有經(jīng)驗(yàn)、擁有資源的一塊兒來建;另外一個(gè)比較宏大的目標(biāo),我們希望讓機(jī)器來學(xué),這個(gè)可能有一個(gè)過程;
3、開放接口,對接生態(tài)系統(tǒng),交互的邊界是有限的,再用鍵盤鼠標(biāo),不可能把所有領(lǐng)域、所有東西都集中在有限的界面里,但一旦我們開口說話,這會(huì)帶來巨大的挑戰(zhàn),你可能會(huì)說任何問題,可能會(huì)了解任何領(lǐng)域、任何方面的東西,為什么這塊,大大小小的公司到今天為止都很難讓用戶特別爽,因?yàn)橛脩粝胫赖念I(lǐng)域太多了,如果覆蓋我們?nèi)粘I罟ぷ骺赡苄枰?000個(gè)或30000個(gè)領(lǐng)域,至少到今天為止地球上沒有哪個(gè)公司能說他提供的服務(wù)能覆蓋這么多。這意味著什么?意味著這塊更加去中心化,需要把地球上各種各樣的文明、各種各樣的資源表現(xiàn)為機(jī)器可以理解的知識,這塊如何串起來。
所以我們是“個(gè)性化&開放式”,我們希望融入到生態(tài)里。
體系,做開發(fā)者自己的“領(lǐng)域虛擬大腦”,云識別語音合成我們做,不管是自然語言理解還是自然語言生成,語義搜索、機(jī)器學(xué)習(xí)和知識圖騰,現(xiàn)在很多人說“人工智能有多少人工就有多少智能,或者說有多少智能就有多少人工”,但很多時(shí)候還是基于各種各樣的規(guī)則,但它能解決問題,對我們來講,我們是一個(gè)混合的結(jié)果,哪個(gè)手段能解決,我們就用哪個(gè)手段解決。
但我們也有所謂的深度問答,我們有個(gè)說法叫“懂、知、行”,懂用戶的意圖,知道答案在哪兒,然后去執(zhí)行。但人工智能有可能不懂你的意圖而直接給你答案。
我們已經(jīng)覆蓋的一些領(lǐng)域,在有聲資源和音樂上,目前算是國內(nèi)規(guī)模和體量比較大的,第一,我們希望幫助大家讓機(jī)器懂人的話;第二,我們直接關(guān)聯(lián)了一些語義資源,但我們只做“地圖”,很多資源都在版權(quán)方那邊,這些數(shù)字都不是通過技術(shù)手段拿過來的,我們是通過和版權(quán)方合作產(chǎn)生的。
“特定場景、特定用戶、特定服務(wù)”,這是我們目前做的一些方面,語義這塊很寬,我們也沒有覆蓋到太多領(lǐng)域。
這是很早之前的一張圖,那時(shí)候的夢想、理想,實(shí)際上今天很多時(shí)候就是正在發(fā)生的未來,我特別喜歡這句話,不管是醫(yī)療、教育、出行、運(yùn)動(dòng)、社交,實(shí)際上每一個(gè)環(huán)節(jié)都會(huì)有智能助理機(jī)器人的參與,還有克隆人,我不覺得這是未來,我覺得這就是很快的現(xiàn)實(shí),當(dāng)然克隆人是另外一個(gè)話題。以后不管是打仗的也好還是服務(wù)也好,以后地球上Bot的數(shù)量肯定會(huì)遠(yuǎn)遠(yuǎn)超過人類的數(shù)量。
我們講未來、我們講能力,更重要的怎樣讓落地、怎樣讓未來在今天發(fā)生,這是我們拿微信后臺接入舉的一些例子,比如你隨便問天氣,理論上來講,中國各地郊縣以上的,還有全世界幾萬個(gè)城市,這里都有,隨便你怎么問。
比如“如意聽聽”這個(gè)功能,如果有人說我想聽羅輯思維講互聯(lián)網(wǎng),我這里返回了喜馬拉雅的有聲資源,發(fā)出指令“我想聽羅胖講互聯(lián)網(wǎng)”,這里有兩個(gè)難點(diǎn),首先要判斷“有聲資源”,其次還要判斷“羅胖”是誰,關(guān)鍵詞“互聯(lián)網(wǎng)”,究竟是羅永浩還是羅振宇,看哪個(gè)相關(guān)性更強(qiáng),最后得出了這個(gè)結(jié)果,選擇羅振宇。
前幾天我們做了一個(gè)測試,讓實(shí)習(xí)生和機(jī)器人訂酒店,用對話的方式,用鍵盤鼠標(biāo)和觸摸屏的方式,大家干了兩個(gè)小時(shí),用對話的方式,可能有單間,可能有套餐,只是使用我們的后臺就可以了。
這里面有聲音、有圖片,可能還有一些圖文文章之類的,這時(shí)候會(huì)變成從理解聊天到對接國內(nèi)的產(chǎn)品。我們也用這個(gè)工具做了關(guān)于大會(huì)報(bào)名咨詢的服務(wù),怎么打車、怎么坐地鐵、嘉賓簡介什么的,基本也都是用這個(gè)工具完成,用對話的方式。
所以2020年人人事事物物都有自己的bot,我們也會(huì)像皇帝一樣,有”三宮六院七十二妃“,只要你喜歡。
2024-11-16 10:25
2024-11-16 10:23
2024-11-02 08:58
2024-09-01 08:07
2022-09-13 10:13
2021-10-12 10:11
2021-08-28 10:43
2021-08-28 10:40
2021-08-28 10:33
2021-08-28 08:54