在執(zhí)行聯(lián)合任務(wù)時(shí),機(jī)器人之間可以保持著不間斷的通訊,比如“我通過(guò)了一扇門,正向右轉(zhuǎn)90度”,“前進(jìn)兩英尺,我遇到一堵墻,正右轉(zhuǎn)90度”,“前進(jìn)4英尺,我遇到一堵墻”……這樣它們能同時(shí)掌握事件的最新進(jìn)展。當(dāng)然,計(jì)算機(jī)能毫無(wú)困難地把大量信息歸檔存儲(chǔ),需要時(shí)立即調(diào)出來(lái),判斷出當(dāng)下情況,但對(duì)人類來(lái)說(shuō),這樣連串密集的數(shù)據(jù)會(huì)讓人瘋掉。
在前不久召開(kāi)的美國(guó)人工智能發(fā)展協(xié)會(huì)年會(huì)上,麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(csail)研究人員提出了一種模擬機(jī)器人合作的新方法,能使所需的通訊量減少60%。新模型讓設(shè)計(jì)人與機(jī)器人合作系統(tǒng)變得更容易,比如打造出一支人機(jī)合作的應(yīng)急救援隊(duì)伍。
降低多智能體系統(tǒng)通訊成本
在計(jì)算機(jī)術(shù)語(yǔ)中,多智能體系統(tǒng)(multiagentsystem)是自主智能體(電子的或非電子的)之間能實(shí)現(xiàn)任意協(xié)作的系統(tǒng)。每個(gè)主體既要能運(yùn)行一個(gè)反映它所認(rèn)知的世界當(dāng)前狀態(tài)的模型,即機(jī)器人世界觀,還要能運(yùn)行其他任何一個(gè)機(jī)器人的世界觀模型。在模型精確性概率中,機(jī)器人本身也是需要考慮的因素,它們必須以這些概率為基礎(chǔ),決定是否改變自己的行為。
模擬多智能體系統(tǒng)的方法稱為dec-pomdp(分布式部分可觀測(cè)馬爾可夫決策過(guò)程)。dec-pomdp系統(tǒng)包括多種不確定性,要考慮隊(duì)伍中某一個(gè)機(jī)器人的世界觀是否正確,它對(duì)伙伴世界觀的判斷是否正確,還要考慮它采取的任何一項(xiàng)行動(dòng)能否成功。比如,機(jī)器人原計(jì)劃向前移動(dòng)20英尺,卻發(fā)現(xiàn)橫向吹來(lái)的風(fēng)把自己吹得偏移了路線。如果一個(gè)機(jī)器人決定發(fā)布一條新信息,會(huì)迫使同伴也更新自己的模型,在整體中攪起新一輪的不確定性。如果這一信息并非必要的,就只會(huì)造成嚴(yán)重滯緩而達(dá)不到任何目的。
一般情況下,dec-pomdp系統(tǒng)會(huì)對(duì)環(huán)境情況做一些先驗(yàn)假設(shè),讓機(jī)器人在這些假設(shè)的基礎(chǔ)上行動(dòng)。但緊急反應(yīng)系統(tǒng)不能先做假設(shè),因?yàn)榫仍?duì)通常要進(jìn)入不熟悉的環(huán)境,最好的先驗(yàn)知識(shí)也不管用。而且緊急救援要對(duì)環(huán)境有全局性掌握,算出一套多機(jī)器人方案極為耗時(shí)。研究人員的設(shè)計(jì)是,讓系統(tǒng)忽略行動(dòng)效果的不確定性,假設(shè)無(wú)論一個(gè)機(jī)器人打算做什么,它都會(huì)去做。
協(xié)調(diào)個(gè)體行動(dòng)使整體最優(yōu)化
當(dāng)機(jī)器人接到一條新信息,比如某建筑物內(nèi)一條通道被封閉了,它有3個(gè)選擇:一是忽視這條信息;二是采納它但不發(fā)布出去;三是采納并發(fā)布該信息——每個(gè)選擇都有優(yōu)點(diǎn)和相應(yīng)的通訊成本。如果機(jī)器人把新信息納入自己的世界觀模型但不發(fā)出去,也會(huì)產(chǎn)生成本,即對(duì)同伴來(lái)說(shuō),要判斷它的世界觀會(huì)更困難。對(duì)于每個(gè)機(jī)器人獲得的每條新信息,新系統(tǒng)會(huì)根據(jù)它們的世界模型、它們對(duì)伙伴行為的預(yù)期、更有效地完成共同目標(biāo)的可能性等,進(jìn)行成本—效益分析。
研究人員在300多個(gè)計(jì)算機(jī)上測(cè)試了他們的系統(tǒng),模擬在不熟悉的環(huán)境中完成救援任務(wù)。這套系統(tǒng)有多個(gè)版本,其中一個(gè)允許進(jìn)行廣泛通訊以完成任務(wù)。他們發(fā)現(xiàn),這一版本的速度比其他版本要高2%—10%,通訊量減少了60%。
研究人員指出,在多智能體系統(tǒng)中,可能有60%的通訊是不必要的。在這次實(shí)驗(yàn)中,所有智能體都是計(jì)算機(jī)模擬的,而沒(méi)有人類參與。論文合著者、航空與航天學(xué)副教授朱莉·沙哈說(shuō):“我們還沒(méi)有在人類—機(jī)器人團(tuán)隊(duì)中實(shí)施這一系統(tǒng),但前景令人興奮??梢栽O(shè)想一下,你能將通訊量減少60%,或許對(duì)于人類完成自己在團(tuán)隊(duì)中的任務(wù)而言,這些通訊并非真正必要?!?/P>
設(shè)計(jì)人機(jī)合作應(yīng)急救援系統(tǒng)
澳大利亞墨爾本大學(xué)計(jì)算與信息系統(tǒng)副教授蒂姆·米勒說(shuō):“在人類團(tuán)隊(duì)中,如果某個(gè)隊(duì)員一接到新信息就將其發(fā)布給所有隊(duì)員,通常不是個(gè)好做法,尤其在通訊成本較高的情況下。這很容易理解。這項(xiàng)研究不止用于多智能體系統(tǒng),還能用于人類與智能體交互領(lǐng)域,這一領(lǐng)域的通訊成本很高。更重要的是,如果接受太多信息的話,人類隊(duì)員很快會(huì)不堪重負(fù)。”
在另一個(gè)項(xiàng)目中,研究人員讓人類志愿者團(tuán)隊(duì)執(zhí)行了與機(jī)器人系統(tǒng)相同的虛擬救援任務(wù),并通過(guò)機(jī)器學(xué)習(xí)算法,對(duì)人類的通訊模式進(jìn)行了統(tǒng)計(jì)分析,將分析結(jié)果納入新模型,讓系統(tǒng)能更明確地協(xié)調(diào)人機(jī)混合團(tuán)隊(duì)。
沙哈說(shuō),他們必須先在人類志愿者團(tuán)隊(duì)中進(jìn)行實(shí)驗(yàn),才能把這套系統(tǒng)用在人類與機(jī)器人混合團(tuán)隊(duì)中,如果系統(tǒng)總是告訴人們不真實(shí)的信息,人—機(jī)團(tuán)隊(duì)必然失敗。
2024-10-22 09:23
2024-10-22 09:22
2024-10-22 09:22
2024-10-22 09:20
2024-10-22 09:18
2024-10-22 09:17
2024-10-22 09:16
2024-10-21 08:53
2024-10-21 08:52
2024-10-21 08:51