給記者一個(gè)時(shí)髦的詞,讓他對此進(jìn)行寫作,記者們可能需要花上一天的時(shí)間;若給記者一個(gè)未曾了解的選題,讓記者們進(jìn)行深度寫作,這可能需要記者們花更多的時(shí)間來對整個(gè)行業(yè)進(jìn)行深入了解和探索。人工智能便是如此。
這段時(shí)間來,我們總是收到各種關(guān)于人工智能威脅論的警告,尤為典型的是,馬斯克多番強(qiáng)調(diào)人工智能不僅會造成大面積的失業(yè),威脅人類的發(fā)展,甚至還會引發(fā)第三次世界大戰(zhàn)。隨著IBM重金加持沃森機(jī)器人、富士康立下全機(jī)器人組裝目標(biāo)并裁員后,人們對人工智能發(fā)展的質(zhì)疑聲音逐步升高。但有影響力的人工智能研究報(bào)告并不多,也很少有主流媒體引用,似乎專家學(xué)者們都認(rèn)為目前的人工智能發(fā)展程度還很低,還有許多技術(shù)上的問題需要突破。在20世紀(jì)50年代至80年代之間,也出現(xiàn)過幾波人工智能的浪潮,但這次或許不同于前幾次。
聊天機(jī)器人的bug鬧劇
在2017年6月14日,TechCrunch曾報(bào)道了一篇文章:《Facebook最新研究:我們訓(xùn)練機(jī)器人討價(jià)還價(jià),沒想到AI還自己學(xué)會了“使詐”,大意是,F(xiàn)acebook研發(fā)了具備談判能力的機(jī)器人,而后,F(xiàn)acebook 人工智能研究所(FAIR)繼續(xù)用機(jī)器學(xué)習(xí)對兩個(gè)聊天機(jī)器人進(jìn)行對話策略升級,結(jié)果發(fā)現(xiàn)它們自行發(fā)展出了人類無法理解的獨(dú)特語言。
2017年6月15日,《大西洋月刊》公布了Facebook研發(fā)的AI機(jī)器人Bob和Alice的一段“對話”記錄,并稱“機(jī)器人創(chuàng)造了人類無法理解的語言”,引起了大家的恐慌。
而后,F(xiàn)acebook 研究院宣布暫停整改這一項(xiàng)目,根據(jù)某家海外媒體的說法,原因是“擔(dān)心失去對這些AI的控制”。這本來只是作者的玩笑話,卻不料上了各大科技媒體頭條,引發(fā)了一波三折的”失控“大戲。
之所以會發(fā)生這樣的鬧劇,是因?yàn)镕acebook科研團(tuán)隊(duì)在開發(fā)前期沒有為機(jī)器人設(shè)置正確的“獎勵(lì)”,鼓勵(lì)他們說人話。說白了,這其實(shí)就是一個(gè)bug問題。這樣的問題在語言模型初學(xué)者的嘗試中十分常見,只不過這次出現(xiàn)在了Facebook這樣的大公司上,才會被各大媒體爭相報(bào)道,并被誤解為機(jī)器人的“早慧”。
今天的機(jī)器人仍處于起步階段,但AI被應(yīng)用到各大行業(yè)領(lǐng)域,并給各大行業(yè)帶來了新變革。
在一個(gè)干凈的房間里,我?guī)缀蹩梢钥吹酱┲着鄣难芯咳藛T在檢查毒氣閥門是否關(guān)掉,并且他們就人工智能對人類的意義展開了一系列辯論。也許,這只是我的幻想,但許多類似終結(jié)者的形象已紛紛呈現(xiàn)在我們的面前。
在機(jī)器學(xué)習(xí)系統(tǒng)上,有一個(gè)亟需解決的問題,即調(diào)試問題,來自谷歌的Peter Norvig強(qiáng)調(diào)。一旦系統(tǒng)中出現(xiàn)了一個(gè)問題,那么這個(gè)問題便會被復(fù)制到整個(gè)系統(tǒng)中。雖然可以重新培訓(xùn)機(jī)器學(xué)習(xí)系統(tǒng),但是問題無法單獨(dú)解決。
在Facebook的談判機(jī)器人中,我們不能確定無法正確解析語言造成的的信號退化問題將有多嚴(yán)重,事實(shí)上,我們甚至不知道機(jī)器人語言的含義,也許,我們認(rèn)為機(jī)器人語法和人類語法是一致的。
聊天機(jī)器人的真正語言是什么?
在聊天機(jī)器人的背后,其實(shí)是一套復(fù)雜的系統(tǒng),主要包括5個(gè)功能模塊:語音識別模塊、自然語言理解模塊、對話管理模塊、自然語言生成模塊、語音合成模塊。
首先,語音識別模塊負(fù)責(zé)接收用戶輸入的語音并將其轉(zhuǎn)換成文字形式。
然后,自然語言理解模塊在理解了用戶輸入的語義之后將特定的語義表達(dá)式輸入到對話管理模塊中。
接著,對話管理模塊負(fù)責(zé)協(xié)調(diào)各個(gè)模塊的調(diào)用及維護(hù)當(dāng)前對話狀態(tài),選擇特定的回復(fù)方式并交由自然語言生成模塊進(jìn)行處理。
最后,自然語言生成模塊生成回復(fù)文本輸入給語音合成模塊將文字轉(zhuǎn)換成語音輸出給用戶。
通常來說,聊天機(jī)器人系統(tǒng)中的自然語言理解功能包括用戶意圖識別、用戶情感識別、指代消解、省略恢復(fù)、回復(fù)確認(rèn)及拒識判斷等技術(shù)。
對話管理功能主要協(xié)調(diào)聊天機(jī)器人的各個(gè)部分,并維護(hù)對話的結(jié)構(gòu)和狀態(tài)。對話管理功能中涉及到的關(guān)鍵技術(shù)主要有對話行為識別、對話狀態(tài)識別、對話策略學(xué)習(xí)及對話獎勵(lì)等。
自然語言生成通常根據(jù)對話管理部分產(chǎn)生的非語言信息,自動生成面向用戶的自然語言反饋
現(xiàn)在的聊天機(jī)器人還存在著諸多的問題,聊天機(jī)器人無法根據(jù)對話背景給出恰當(dāng)回答,對于某些深入的課題也無法做到真正意義上的理解與交流,在回答正確率、任務(wù)完成率、對話是否及時(shí)響應(yīng)等方面也有待提高。至于聊天機(jī)器人是否會開啟自己的智慧,形成自己的語言,我想,這大概還很遙遠(yuǎn),畢竟,目前的聊天機(jī)器人很多時(shí)候還聽不懂人話呢。
2024-10-16 11:29
2024-10-14 09:19
2024-10-13 12:05
2024-10-11 11:57
2024-10-10 10:00
2024-10-09 10:05
2024-10-08 11:01
2024-10-08 09:55
2024-09-29 10:07