配件商：

代理商：

制造商：

您的位置：首頁(yè) > 資訊 > 行業(yè)動(dòng)態(tài) > 正文

“小會(huì)話(huà)，大學(xué)問(wèn)”：如何讓聊天機(jī)器人讀懂對(duì)話(huà)歷史？

2017-06-28 06:34 性質(zhì)：轉(zhuǎn)載作者：36氪來(lái)源：36氪

免責(zé)聲明：中叉網(wǎng)（m.m21363.cn)尊重合法版權(quán)，反對(duì)侵權(quán)盜版。（凡是我網(wǎng)所轉(zhuǎn)載之文章，文中所有文字內(nèi)容和圖片視頻之知識(shí)產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀(guān)點(diǎn)，與本網(wǎng)無(wú)關(guān)。如有需要?jiǎng)h除，敬請(qǐng)來(lái)電商榷?。?/div>

人工智能現(xiàn)在的火熱程度大家有目共睹，凱文凱利在《必然》中預(yù)測(cè)未來(lái)時(shí)代的人工智能可能會(huì)重新定義人類(lèi)的意義，但時(shí)下的人工智能發(fā)展水...

　　人工智能現(xiàn)在的火熱程度大家有目共睹，凱文凱利在《必然》中預(yù)測(cè)未來(lái)時(shí)代的人工智能可能會(huì)重新定義人類(lèi)的意義，但時(shí)下的人工智能發(fā)展水平顯然還沒(méi)有大家想象得那么美好，仍然需要我們不斷地探索。目前眾多研究人員正深耕其中，作為其中代表的聊天機(jī)器人（Chatbot），已然成為科研界研究的熱點(diǎn)。

　　通常來(lái)說(shuō)聊天機(jī)器人實(shí)現(xiàn)方式有兩種：一種是基于生成式，即機(jī)器人“自己說(shuō)話(huà)”，一個(gè)字一個(gè)字創(chuàng)作出回復(fù)語(yǔ)句來(lái)。另外一種是基于檢索式，即機(jī)器人“轉(zhuǎn)發(fā)”別人的話(huà)。從互聯(lián)網(wǎng)大家的話(huà)語(yǔ)中尋找到合適的回答予以轉(zhuǎn)發(fā)。

　　現(xiàn)有的生成結(jié)果由于技術(shù)所限，或多或少都存在語(yǔ)句不流暢的問(wèn)題，但能夠做到“有問(wèn)必答”偶爾還能蹦出“彩蛋”。檢索的模型一般流暢性方面無(wú)須擔(dān)心，不過(guò)隨著目前網(wǎng)絡(luò)資源的日益豐富，語(yǔ)料規(guī)模也越來(lái)越大，如何從眾多語(yǔ)句中選擇合適的句子作為回復(fù)是檢索式聊天機(jī)器人的核心問(wèn)題。

　　雖然目前市場(chǎng)上的聊天機(jī)器人眾多，但我們見(jiàn)到的那些貌似都不是那么聰明。最直觀(guān)的一個(gè)體現(xiàn)就是前后不連貫，上下難銜接，因此在進(jìn)行檢索的時(shí)候考慮歷史信息則顯得尤為重要。那么如何讓機(jī)器人理解對(duì)話(huà)歷史信息從而聰明地進(jìn)行回復(fù)呢？微軟亞洲研究院的研究員們提出了一個(gè)模型 Sequential Matching Network（SMN）。相關(guān)論文的作者吳俁談到“SMN 模型可以讓聊天機(jī)器人準(zhǔn)確的理解當(dāng)前和用戶(hù)的對(duì)話(huà)歷史，并根據(jù)歷史給出最相關(guān)的回復(fù)，與用戶(hù)進(jìn)行交流，達(dá)到人機(jī)對(duì)話(huà)的目的?！?/P>

　　但這在實(shí)現(xiàn)的過(guò)程中也遇到不少難點(diǎn)，“精準(zhǔn)計(jì)算聊天歷史和候選回復(fù)的語(yǔ)義相似度十分困難，主要的挑戰(zhàn)有兩個(gè)方面：（1）由于聊天歷史信息繁多，如何將歷史中重要的詞語(yǔ)、短語(yǔ)以及句子選擇出來(lái)，并通過(guò)這些重要部分刻畫(huà)聊天歷史，是一個(gè)亟待解決的問(wèn)題；（2）如何對(duì)聊天歷史中的各輪對(duì)話(huà)進(jìn)行建模，如何判斷對(duì)話(huà)歷史中的跳轉(zhuǎn)，順承等關(guān)系，也是一個(gè)棘手的問(wèn)題?！?那么論文作者提出的 SMN 模型又是如何解決這兩個(gè)問(wèn)題的呢，接下來(lái)我們將為您解讀。

　　SMN 模型一共分為三層。第一層為信息匹配層，對(duì)之前的歷史信息和待回復(fù)的句子進(jìn)行匹配度計(jì)算：同時(shí)進(jìn)行詞語(yǔ)（embedding 向量）和短語(yǔ)級(jí)別（GRU 表示）的相似度計(jì)算。然后再把這兩個(gè)矩陣分別作為卷積神經(jīng)網(wǎng)絡(luò)的一個(gè) channel，利用 CNN 的 max-pooling 進(jìn)行特征抽象，形成一個(gè)匹配向量。第二層為匹配積累層，利用一個(gè) GRU 神經(jīng)網(wǎng)絡(luò)，將每一句話(huà)和回復(fù)所計(jì)算出的匹配信息進(jìn)一步融合。第三層為匹配結(jié)果預(yù)測(cè)層，利用融合的匹配信息計(jì)算最終的匹配得分，在預(yù)測(cè)時(shí)他們使用三種策略，分別是只利用 GRU2 最后一個(gè)隱藏層（SMN_last），靜態(tài)加權(quán)隱藏層（SMN_static），和動(dòng)態(tài)加權(quán)隱藏層（SMN_dynamic）。在進(jìn)行檢索的時(shí)候，他們將最后一句的信息結(jié)合上文歷史信息中的 5 個(gè)關(guān)鍵詞（歷史信息中用 tf-idf 進(jìn)行篩選，選擇 Top 5 關(guān)鍵詞）在系統(tǒng)中進(jìn)行檢索，然后用上述 SMN 網(wǎng)絡(luò)對(duì)候選結(jié)果打分從而選出回復(fù)句。

　　作者分別在 Ubuntu 語(yǔ)料（大型公開(kāi)計(jì)算機(jī)相關(guān)求助與解答語(yǔ)料）和豆瓣語(yǔ)料（作者從豆瓣小組的公開(kāi)信息中爬取并在論文中公布）上進(jìn)行了實(shí)驗(yàn)，分別以 Rn@K 和 MAP、MRR、P@1 為評(píng)價(jià)指標(biāo)，取得的結(jié)果均為目前最好。

　　作者表示“SMN不同以往的模型，第一步不進(jìn)行上下文的建模學(xué)習(xí)，而是讓每句話(huà)和回復(fù)進(jìn)行匹配度計(jì)算，這樣可以盡可能多的保留上下文的信息，以避免重要信息在學(xué)習(xí)上下文的向量表示時(shí)丟失。而且 SMN 在對(duì)上下文句子關(guān)系建模時(shí)，考慮了當(dāng)前回復(fù)的影響，使得回復(fù)成為一個(gè)監(jiān)督信號(hào)，這樣可以更準(zhǔn)確的對(duì)上下文歷史進(jìn)行建模?！辈⑶覅莻R向我們透露“據(jù)我們所知，我們公布的豆瓣語(yǔ)料是第一個(gè)人工標(biāo)注的中文多輪對(duì)話(huà)語(yǔ)料?！?/P>

　　在談及目前的方法還有哪些不足之處時(shí)，作者表示“目前我們的檢索方式有時(shí)找不到正確的候選句，所以第一步的檢索方法還有待改善，另外雖然我們的模型可以建模當(dāng)前回復(fù)和歷史信息的關(guān)系，但還是無(wú)法避免一些邏輯上的問(wèn)題，不過(guò)這也是我們未來(lái)工作的重點(diǎn)，我們將繼續(xù)提高候選回復(fù)在邏輯上的連貫性”，讓我們共同期待他們的未來(lái)工作。

0贊 0踩

下一篇李克強(qiáng)：新業(yè)態(tài)所創(chuàng)造的崗位，遠(yuǎn)大于被機(jī)器人代替的工作

上一篇乂學(xué)教育崔煒：人工智能在教學(xué)機(jī)器人中的應(yīng)用實(shí)踐

網(wǎng)友評(píng)論
文明上網(wǎng)，理性發(fā)言，拒絕廣告
0條評(píng)論

相關(guān)資訊
更多>>

盤(pán)點(diǎn)2024年中國(guó)工業(yè)車(chē)輛企業(yè)推出的部分新產(chǎn)品（一）

技術(shù)創(chuàng)新是行業(yè)持續(xù)發(fā)展的關(guān)鍵所在，它不僅對(duì)企業(yè)自身有益，也能推動(dòng)整個(gè)行業(yè)的進(jìn)步和發(fā)展。通過(guò)技術(shù)創(chuàng)新，可提高競(jìng)爭(zhēng)力、創(chuàng)造差異化、探索新市場(chǎng)機(jī)會(huì)、提升效率...

2024-12-17 09:51
《工業(yè)車(chē)輛叉車(chē)貨叉在使用中的檢查和修復(fù)》等三項(xiàng)國(guó)家標(biāo)準(zhǔn)（送審稿）專(zhuān)家審定會(huì)在浙江省寧?？h成功召開(kāi)

2024年12月16日，全國(guó)工業(yè)車(chē)輛標(biāo)準(zhǔn)化技術(shù)委員會(huì)（以下簡(jiǎn)稱(chēng)“工業(yè)車(chē)輛標(biāo)委會(huì)”）在浙江省寧海縣組織召開(kāi)了《工業(yè)車(chē)輛叉車(chē)貨叉在使用中的檢查和修復(fù)》等三項(xiàng)國(guó)家...

2024-12-17 09:35
本周工業(yè)車(chē)輛行業(yè)熱點(diǎn)回顧（2024.12.8-12.14）

孫子兵法與企業(yè)管理?！秾O子兵法》行軍篇第九：令素行以教其民，則民服；令不素行以教其民，則民不服。令素行者，與眾相得也。令素行以教其民，則民服；令不素行...

2024-12-15 09:06
行業(yè)標(biāo)準(zhǔn)《工業(yè)車(chē)輛無(wú)人駕駛控制系統(tǒng)》和《工業(yè)車(chē)輛無(wú)人駕駛導(dǎo)航系統(tǒng)》（初稿）討論會(huì)在浙江杭州成功召開(kāi)

2024年12月10日至12日，全國(guó)工業(yè)車(chē)輛標(biāo)準(zhǔn)化技術(shù)委員會(huì)（以下簡(jiǎn)稱(chēng)“工業(yè)車(chē)輛標(biāo)委會(huì)”）在浙江省杭州市組織召開(kāi)了《工業(yè)車(chē)輛無(wú)人駕駛控制系統(tǒng)》和《工業(yè)車(chē)輛無(wú)人...

2024-12-12 10:16
外媒：全球移動(dòng)機(jī)器人市場(chǎng)的增長(zhǎng)預(yù)期下調(diào)了18%

全球知名市場(chǎng)研究機(jī)構(gòu)英國(guó)Interact Analysis近日發(fā)布報(bào)告，將其對(duì)全球移動(dòng)機(jī)器人市場(chǎng)的增長(zhǎng)預(yù)期下調(diào)了18%。這一消息在行業(yè)內(nèi)引發(fā)了廣泛討論。報(bào)告揭示了當(dāng)前經(jīng)...

2024-12-12 10:01
關(guān)于對(duì)行業(yè)標(biāo)準(zhǔn)《工業(yè)車(chē)輛轉(zhuǎn)向橋》和《叉車(chē)屬具輪胎夾》（征求意見(jiàn)稿）征求意見(jiàn)的通知

2024-12-11 09:22
本周工業(yè)車(chē)輛行業(yè)熱點(diǎn)回顧（2024.12.1-12.7）

很喜歡秋微的這句話(huà)：總不能因?yàn)檫@世上有人跟你“道不同”你就不好好走自己的路。歡迎大家一起關(guān)注工業(yè)車(chē)輛行業(yè)熱點(diǎn)，過(guò)去的一周，行業(yè)發(fā)生了些什么，隨小編聚焦...

2024-12-08 08:25
Vecow ：嵌入式工作站推動(dòng)智能無(wú)人叉車(chē)的發(fā)展

叉車(chē)，已經(jīng)存在了大約 100 年，最早出現(xiàn)在第一次世界大戰(zhàn)期間。在 20 世紀(jì) 50 年代和 60 年代，隨著戰(zhàn)后經(jīng)濟(jì)繁榮推動(dòng)對(duì)高效物料搬運(yùn)的需求，叉車(chē)技術(shù)迅速發(fā)展。液壓升降機(jī)構(gòu)成為標(biāo)準(zhǔn)配置，...

2024-12-06 10:54
亞馬遜宣布推出全自主移動(dòng)機(jī)器人以提高倉(cāng)庫(kù)搬運(yùn)效率

近日，亞馬遜宣布推出一款“全自主移動(dòng)機(jī)器人”（Fully Autonomous Mobile Robot），該機(jī)器人能夠在倉(cāng)庫(kù)內(nèi)自主移動(dòng)，自動(dòng)搬運(yùn)貨物，進(jìn)一步提升倉(cāng)儲(chǔ)效率和減少人工干預(yù)。這一技術(shù)創(chuàng)新不僅標(biāo)志著...

2024-12-06 10:48
新興技術(shù)正在重塑歐洲制造業(yè)

近年來(lái)，歐洲制造業(yè)新興技術(shù)正經(jīng)歷一場(chǎng)深刻變革。從人工智能（AI）和物聯(lián)網(wǎng)（IoT）到增材制造和機(jī)器人技術(shù)，這些創(chuàng)新正在重塑生產(chǎn)流程，提高效率，推動(dòng)可持續(xù)發(fā)展。然而，歐洲在技術(shù)領(lǐng)域，特別是人...

2024-12-05 09:54