配件商：

代理商：

制造商：

您的位置：首頁(yè) > 資訊 > 行業(yè)動(dòng)態(tài) > 正文

Facebook最新研究：我們訓(xùn)練機(jī)器人討價(jià)還價(jià)，沒(méi)想到AI還自己學(xué)會(huì)了“使詐”（附論文）

2017-06-21 05:47 性質(zhì)：轉(zhuǎn)載作者：物聯(lián)網(wǎng)智庫(kù) 來(lái)源：物聯(lián)網(wǎng)智庫(kù)

免責(zé)聲明：中叉網(wǎng)（m.m21363.cn)尊重合法版權(quán)，反對(duì)侵權(quán)盜版。（凡是我網(wǎng)所轉(zhuǎn)載之文章，文中所有文字內(nèi)容和圖片視頻之知識(shí)產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀點(diǎn)，與本網(wǎng)無(wú)關(guān)。如有需要?jiǎng)h除，敬請(qǐng)來(lái)電商榷?。?/div>

【導(dǎo)讀】就是該有這樣的操作~~你跟女票說(shuō)：“今晚的球賽特別重要，但是為了陪你我勉強(qiáng)放棄不看！”實(shí)際上今晚比賽的球隊(duì)你根本不感興...

【導(dǎo)讀】就是該有這樣的操作~~

　　你跟女票說(shuō)：“今晚的球賽特別重要，但是為了陪你我勉強(qiáng)放棄不看！”實(shí)際上今晚比賽的球隊(duì)你根本不感興趣，這樣做只是讓女票同意你明天和哥們喝酒的談判“小伎倆”。

　　這個(gè)“使詐”的技能是不是很熟悉？而這次，學(xué)會(huì)這個(gè)技能的是Facebook的討價(jià)還價(jià)機(jī)器人，而且，這還是人家AI自己獨(dú)立學(xué)會(huì)的技能。

　　近日，F(xiàn)acebook發(fā)布最新研究，稱他們訓(xùn)練的機(jī)器人已經(jīng)get了談判技能。而且，有些情況下，機(jī)器人最初假裝對(duì)無(wú)價(jià)值項(xiàng)目感興趣，只有通過(guò)放棄它才能“妥協(xié)” - 這是人們經(jīng)常使用的有效談判策略。這個(gè)行為并不是由研究人員編寫(xiě)的，而是由機(jī)器人發(fā)現(xiàn)的，作為試圖實(shí)現(xiàn)目標(biāo)的方法。

下面才是正文啦。

　　每天，從我們醒來(lái)的那一刻開(kāi)始，我們的生活就是不斷地與人談判：從討論看什么電視頻道，到說(shuō)服你的孩子吃蔬菜或試圖買菜時(shí)獲得更好的價(jià)格。所有這些都是共通的，它們需要復(fù)雜的交流和推理技能，這是計(jì)算機(jī)所沒(méi)有的屬性。

　　迄今為止，現(xiàn)有的chatbots（聊天機(jī)器人）上的工作已經(jīng)導(dǎo)致系統(tǒng)可以進(jìn)行短暫的對(duì)話，并執(zhí)行簡(jiǎn)單的任務(wù)，如預(yù)訂餐廳等。但是，與人們進(jìn)行有意義的對(duì)話的機(jī)器人還是很具有挑戰(zhàn)性的，因?yàn)樗枰獧C(jī)器人將其對(duì)話的理解與其對(duì)世界的知識(shí)相結(jié)合，然后產(chǎn)生一個(gè)新句子來(lái)幫助實(shí)現(xiàn)其目標(biāo)。

　　Facebook人工智能研究（FAIR）的研究人員已經(jīng)開(kāi)放源代碼，并發(fā)表論文，介紹機(jī)器人具有的新功能 - 談判能力。

　　類似于人們有不同的需求，遇到?jīng)_突，然后談判達(dá)成一個(gè)商定的妥協(xié)，研究人員已經(jīng)表明，對(duì)于具有不同目標(biāo)的對(duì)話機(jī)器人（實(shí)現(xiàn)為端對(duì)端訓(xùn)練的神經(jīng)網(wǎng)絡(luò)）在達(dá)成共同決定或結(jié)果的同時(shí)，與其他機(jī)器人或人員可以進(jìn)行從開(kāi)始到結(jié)束的談判。

任務(wù)：多議題討價(jià)還價(jià)

　　FAIR研究人員研究了多議題談判任務(wù)。對(duì)兩個(gè)機(jī)器人都顯示了相同的項(xiàng)目集合（比如說(shuō)兩本書(shū)，一個(gè)帽子，三個(gè)球），并且被指示他們通過(guò)談判把這些物品分配給彼此。

　　每個(gè)機(jī)器人都提供自己的價(jià)值函數(shù)，它表示對(duì)每個(gè)類型的項(xiàng)目關(guān)心多少（比如對(duì)于機(jī)器人1，每個(gè)球值得3分）。在生活中，兩個(gè)機(jī)器人都不知道其他機(jī)器人的價(jià)值函數(shù)，必須從對(duì)話中推斷出（如果你說(shuō)你想要球，那你應(yīng)該很重視球）。

　　FAIR研究人員創(chuàng)造了許多這樣的談判方案，始終確保兩位機(jī)器人商不可能同時(shí)獲得最佳交易。此外，如果談判進(jìn)行不下去（或者不經(jīng)過(guò)10次對(duì)話之后的協(xié)議），那這兩個(gè)人都只得0分。簡(jiǎn)單地說(shuō)，談判是至關(guān)重要的，良好的談判導(dǎo)致更好的表現(xiàn)。

對(duì)話框部署

　　談判同時(shí)是語(yǔ)言和推理問(wèn)題，其中必須制定意圖，然后口頭實(shí)現(xiàn)。這樣的對(duì)話包含合作和對(duì)抗的要素，要求機(jī)器人了解和制定長(zhǎng)期計(jì)劃并產(chǎn)生話語(yǔ)以實(shí)現(xiàn)其目標(biāo)。

　　FAIR研究人員在構(gòu)建這樣的長(zhǎng)期規(guī)劃對(duì)話機(jī)器方面的關(guān)鍵技術(shù)創(chuàng)新是一種稱為對(duì)話部署的概念。

　　當(dāng)聊天人可以建立對(duì)方（對(duì)話者）的心理模型，提前思考或預(yù)測(cè)未來(lái)談話的方向時(shí)，他們可以選擇避開(kāi)沒(méi)意義的，混亂的或令人沮喪的交流，從而走向成功的談判。

　　具體來(lái)說(shuō)，F(xiàn)AIR已經(jīng)開(kāi)發(fā)了對(duì)話部署，作為一種新技術(shù)，其中機(jī)器通過(guò)將對(duì)話模型推出到對(duì)話結(jié)束來(lái)模擬未來(lái)的對(duì)話，從而可以選擇具有最大預(yù)期未來(lái)獎(jiǎng)勵(lì)的話語(yǔ)。

　　類似的想法已被用于游戲環(huán)境規(guī)劃中，但從未被應(yīng)用于語(yǔ)言上，因?yàn)檎Z(yǔ)言可能的動(dòng)作數(shù)量要高得多。為了提高效率，研究人員首先產(chǎn)生了一組較小的候選語(yǔ)言來(lái)表達(dá)，然后對(duì)于每個(gè)候選語(yǔ)言，他們反復(fù)模擬對(duì)話的完整未來(lái)，以估計(jì)它們的成功程度。該模型的預(yù)測(cè)精度足夠高，使得該技術(shù)在以下幾個(gè)方面大大提高了談判策略：

　　談判更加努力：新的機(jī)器人與人類進(jìn)行了長(zhǎng)時(shí)間的對(duì)話，反過(guò)來(lái)也會(huì)很快接受交易，這個(gè)模型會(huì)一直談判直到交易成功。

　　智能機(jī)動(dòng)：有些情況下，機(jī)器人最初假裝對(duì)無(wú)價(jià)值項(xiàng)目感興趣，最后只有通過(guò)放棄它才能“妥協(xié)” - 這是人們經(jīng)常使用的有效談判策略。這個(gè)行為并不是由研究人員編寫(xiě)的，而是由機(jī)器人發(fā)現(xiàn)的，作為試圖實(shí)現(xiàn)目標(biāo)的方法。

　　創(chuàng)造語(yǔ)句：雖然神經(jīng)模型很容易從訓(xùn)練數(shù)據(jù)中重復(fù)句子，但這項(xiàng)工作表明，模型能夠在必要時(shí)進(jìn)行泛化。

建立和評(píng)估談判數(shù)據(jù)集

　　為了訓(xùn)練協(xié)商機(jī)器人和進(jìn)行大規(guī)模的定量評(píng)估，F(xiàn)AIR團(tuán)隊(duì)協(xié)作收集了一系列人與人之間的談判記錄。這些人被展示了一組物品和每個(gè)物品的價(jià)值，每?jī)蓚€(gè)人要討論決定，要怎么劃分這些物品。然后研究人員訓(xùn)練一個(gè)遞歸的神經(jīng)網(wǎng)絡(luò)，通過(guò)教它模仿人們的行為來(lái)進(jìn)行談判。在對(duì)話框中的任何點(diǎn)，模型都試圖猜測(cè)人類在這種情況下會(huì)說(shuō)什么。

　　不同于先前針對(duì)目標(biāo)對(duì)話框的工作，這些模型被訓(xùn)練成“端到端”，完全是由人類所做的語(yǔ)言和決定所決定的，這意味著這種方法可以很容易地適應(yīng)其他任務(wù)。

　　為了超越簡(jiǎn)單地模仿人們，F(xiàn)AIR研究人員允許模型來(lái)實(shí)現(xiàn)談判的目標(biāo)。為了訓(xùn)練模型實(shí)現(xiàn)其目標(biāo)，研究人員讓模型進(jìn)行了數(shù)千次的自我談判，并使用強(qiáng)化學(xué)習(xí)算法，當(dāng)它取得好的結(jié)果時(shí)給予獎(jiǎng)勵(lì)。為了防止算法開(kāi)發(fā)自己的語(yǔ)言，它也同時(shí)訓(xùn)練模型產(chǎn)生人類語(yǔ)言。

　　為了評(píng)估談判機(jī)器人，F(xiàn)AIR團(tuán)隊(duì)測(cè)試他們?cè)诰W(wǎng)上與人交談。大多數(shù)以前的工作避免與真實(shí)的人對(duì)話或在較不具挑戰(zhàn)性的領(lǐng)域工作，因?yàn)閷W(xué)習(xí)模型要響應(yīng)人們所說(shuō)的各種語(yǔ)言非常困難。

　　有趣的是，在FAIR團(tuán)隊(duì)的實(shí)驗(yàn)中，大多數(shù)人沒(méi)有意識(shí)到他們是在與機(jī)器人交談，而不是與另一個(gè)人交談，這表明機(jī)器人已經(jīng)學(xué)會(huì)在這個(gè)領(lǐng)域用英語(yǔ)進(jìn)行流利的對(duì)話。FAIR團(tuán)隊(duì)最好的談判機(jī)器人，使用強(qiáng)化學(xué)習(xí)和對(duì)話的推出，其性能已經(jīng)可以和人類談判相媲美。它取得了更好的交易的頻率，等同于更糟的交易的頻率，表明FAIR的機(jī)器人不僅可以說(shuō)英語(yǔ)，也可以聰明地決定想說(shuō)什么。

強(qiáng)化學(xué)習(xí)用于對(duì)話機(jī)器人

　　監(jiān)督學(xué)習(xí)的目的是模仿人類用戶的行為，但它并沒(méi)有明確地試圖實(shí)現(xiàn)機(jī)器人的目標(biāo)。FAIR團(tuán)隊(duì)采用另一種方法，嘗試預(yù)訓(xùn)練再加監(jiān)督學(xué)習(xí)，然后基于評(píng)估指標(biāo)，利用強(qiáng)化學(xué)習(xí)對(duì)模型進(jìn)行微調(diào)。實(shí)際上，他們使用監(jiān)督學(xué)習(xí)來(lái)在語(yǔ)言和意義之間進(jìn)行映射，但是使用強(qiáng)化學(xué)習(xí)來(lái)幫助決定說(shuō)什么。

　　在強(qiáng)化學(xué)習(xí)過(guò)程中，一個(gè)機(jī)器人試圖從與另一個(gè)機(jī)器的對(duì)話中改進(jìn)其參數(shù)。而另一個(gè)機(jī)器可能是一個(gè)人，F(xiàn)AIR團(tuán)隊(duì)使用一個(gè)固定的監(jiān)督模型，訓(xùn)練模仿人類。第二個(gè)模型是固定的，因?yàn)檠芯咳藛T發(fā)現(xiàn)，隨著機(jī)器開(kāi)發(fā)自己的語(yǔ)言進(jìn)行談判，更新兩個(gè)機(jī)器模型的參數(shù)導(dǎo)致了模型不收斂。在每一個(gè)對(duì)話結(jié)束時(shí)，根據(jù)最后達(dá)成的協(xié)議給予獎(jiǎng)勵(lì)。然后，使用策略梯度，這個(gè)獎(jiǎng)勵(lì)通過(guò)輸出的每一個(gè)字被回傳網(wǎng)絡(luò)，從而增加導(dǎo)致高回報(bào)的行動(dòng)的概率。

下一步

　　這一突破對(duì)于研究社區(qū)和BOT開(kāi)發(fā)商是重大的一步，可以創(chuàng)造聊天機(jī)器人推理，交流，洽談的能力，對(duì)于建立個(gè)性化的數(shù)字助理至關(guān)重要。與社區(qū)合作使我們有機(jī)會(huì)分享我們的工作和我們要解決的挑戰(zhàn)，并鼓勵(lì)有才華的人貢獻(xiàn)他們的想法和努力，推動(dòng)這個(gè)領(lǐng)域向前發(fā)展。

0贊 0踩

下一篇聚焦內(nèi)部物流解決方案——LogiMAT China 2017（南京）今日開(kāi)幕

上一篇工信部將制定餐飲機(jī)器人標(biāo)準(zhǔn)規(guī)范

網(wǎng)友評(píng)論
文明上網(wǎng)，理性發(fā)言，拒絕廣告
0條評(píng)論

相關(guān)資訊
更多>>

關(guān)于召開(kāi)第七屆工程機(jī)械行業(yè)標(biāo)準(zhǔn)化工作會(huì)議暨協(xié)會(huì)2024年標(biāo)準(zhǔn)化工作委員會(huì)年會(huì)的預(yù)通知

各相關(guān)單位：擬定于2024年11月4—8日期間擇日在山東青島召開(kāi)“第七屆工程機(jī)械行業(yè)標(biāo)準(zhǔn)化工作會(huì)議暨協(xié)會(huì)2024年標(biāo)準(zhǔn)化工作委員會(huì)年會(huì)”。具體事項(xiàng)預(yù)通知如下：一、...

2024-09-29 10:07
2024年1至8月工程機(jī)械產(chǎn)品進(jìn)出口快報(bào)

據(jù)海關(guān)數(shù)據(jù)整理，2024年8月我國(guó)工程機(jī)械進(jìn)出口貿(mào)易額為46.55億美元，同比增長(zhǎng)9.02%，其中：進(jìn)口額2.24億美元，同比增長(zhǎng)5.54%；出口額44.32億美元，同比增長(zhǎng)9.2%...

2024-09-29 09:59
中國(guó)國(guó)際工業(yè)博覽會(huì)開(kāi)幕，AGV與智能搬運(yùn)技術(shù)引領(lǐng)未來(lái)物流變革

2024年9月24日，第二十四屆中國(guó)國(guó)際工業(yè)博覽會(huì)（工博會(huì)）在上海盛大開(kāi)幕。本屆工博會(huì)以“工業(yè)聚能新質(zhì)領(lǐng)航”為主題，展覽總面積達(dá)28萬(wàn)平方米，吸引了來(lái)自28個(gè)...

2024-09-25 09:38
本周工業(yè)車輛行業(yè)熱點(diǎn)回顧（2024.9.15－9.21）

心理學(xué)上的“情緒自由”是指他人的情緒與自己無(wú)關(guān)，自己的情緒也不受他人影響。一個(gè)人成熟的標(biāo)志，就是逐漸學(xué)會(huì)屏蔽他人的情緒，沉浸式做自己。歡迎大家一起關(guān)注...

2024-09-23 08:27
叉車市場(chǎng)動(dòng)態(tài)：2024年8月銷售數(shù)據(jù)分析

2024年8月，中國(guó)叉車市場(chǎng)銷售各類叉車98883臺(tái)，同比增長(zhǎng)1.26%。據(jù)中國(guó)工程機(jī)械工業(yè)協(xié)會(huì)最新統(tǒng)計(jì)數(shù)據(jù)，2024年8月，我國(guó)叉車銷售總體表現(xiàn)平穩(wěn)，銷售各類叉車98883...

2024-09-23 08:23
中國(guó)工程機(jī)械工業(yè)協(xié)會(huì)工業(yè)車輛分會(huì)第八屆四次會(huì)員代表大會(huì)暨2024年年會(huì)在西安隆重召開(kāi)

中國(guó)叉車網(wǎng)(m.m21363.cn)新聞中心2024年9月20日消息，由中國(guó)工程機(jī)械工業(yè)協(xié)會(huì)指導(dǎo)，中國(guó)工程機(jī)械工業(yè)協(xié)會(huì)工業(yè)車輛分會(huì)主辦，安徽合力股份有限公司協(xié)辦...

2024-09-23 08:17
中秋祝福：愿工業(yè)車輛行業(yè)闊步前行，共迎輝煌未來(lái)

值此中秋佳節(jié)之際，中國(guó)叉車網(wǎng)（m.m21363.cn）向整個(gè)工業(yè)車輛行業(yè)的所有從業(yè)者致以最誠(chéng)摯的祝福。中秋節(jié)象征團(tuán)圓與豐收，正如我們?cè)诠I(yè)車輛行業(yè)中所...

2024-09-18 09:16
國(guó)家標(biāo)準(zhǔn)《叉車屬具設(shè)計(jì)規(guī)范》（初稿）討論會(huì)在安慶召開(kāi)

國(guó)家標(biāo)準(zhǔn)《叉車屬具設(shè)計(jì)規(guī)范》（初稿）討論會(huì)于9月11日至13日在安慶召開(kāi)，來(lái)自標(biāo)準(zhǔn)起草工作組、工業(yè)車輛標(biāo)準(zhǔn)化技術(shù)委員會(huì)以及行業(yè)內(nèi)的專家共計(jì)19個(gè)單位的23名...

2024-09-15 09:32
本周工業(yè)車輛行業(yè)熱點(diǎn)回顧（2024.9.8－9.14）

隨著中秋佳節(jié)的臨近，我們不僅迎來(lái)了團(tuán)圓的喜悅，也看到了工業(yè)車輛行業(yè)的持續(xù)進(jìn)步。希望大家在享受節(jié)日的同時(shí)，繼續(xù)以飽滿的熱情投入工作，迎接新一周的挑戰(zhàn)。祝...

2024-09-15 09:29
國(guó)家標(biāo)準(zhǔn)《叉車屬具設(shè)計(jì)規(guī)范》（初稿）討論會(huì)在安徽省安慶市成功召開(kāi)

2024年9月11日至13日，全國(guó)工業(yè)車輛標(biāo)準(zhǔn)化技術(shù)委員會(huì)（以下簡(jiǎn)稱“工業(yè)車輛標(biāo)委會(huì)”）在安徽省安慶市組織召開(kāi)了國(guó)家標(biāo)準(zhǔn)《叉車屬具設(shè)計(jì)規(guī)范》（初稿）討論會(huì)，...

2024-09-14 08:54