機(jī)器人早已在工業(yè)流水線尤其是制造業(yè)上得到了廣泛的應(yīng)用,比如手機(jī)制造、汽車組裝等。在最初的應(yīng)用中,機(jī)器人的設(shè)計被固定在某一項任務(wù)當(dāng)中,打眼就是打眼,安螺絲就是安螺絲。在這個時期,工業(yè)機(jī)器人實質(zhì)上是替代了簡單的組裝工作,并且只適應(yīng)設(shè)計好的特定環(huán)節(jié),基本沒有任何延展性。
而在人工智能時代,加入了機(jī)器視覺之后,機(jī)器人的應(yīng)用范圍逐漸一下子被擴(kuò)大了許多。更多的行業(yè)被涉足并發(fā)生了質(zhì)的革新,比如物流的智能分揀。
目前來說,對機(jī)器人進(jìn)行視覺訓(xùn)練,應(yīng)用在工業(yè)當(dāng)中的基本任務(wù)就是:認(rèn)識某物。也就是說,通過對機(jī)器的訓(xùn)練,使其能夠分辨出哪一樣是自己的工作對象。而這也是機(jī)器視覺學(xué)習(xí)的最簡單而有效的應(yīng)用。
但工業(yè)應(yīng)用場景并不僅僅只有識別。比如對倉儲物品的抓取和分類,或者很多并不是固定物品的應(yīng)用場景,這就會導(dǎo)致機(jī)器既有的學(xué)習(xí)內(nèi)容用不上。那么,不認(rèn)識這個東西,機(jī)器就不知道該如何處理,在做一些抓取搬運工作的時候就難免會出岔子。
從這個角度上來說,以后對工業(yè)機(jī)器人的要求,將不滿足于局限于既有的學(xué)習(xí)內(nèi)容,同樣還要有自主的學(xué)習(xí)能力。也就是說,在機(jī)器人碰到陌生的物體的時候,能夠自主地判斷該怎么去處理。
AI繪制三維圖形,判斷最佳抓取姿勢
有人覺得,培養(yǎng)機(jī)器人的遷移學(xué)習(xí)能力不就好了嗎?比如記住一些物體的具體特征,人工智能既然能分辨出什么是人、什么是大猩猩、什么是貓狗,那么只要訓(xùn)練到位,機(jī)器人同樣也能對其他陌生的物體做出分辨。
但很可惜這樣想可能有點不切實際。比如讓機(jī)器人去把倉庫里亂七八糟的東西給歸置整齊了,里面可能有大電視機(jī),也可能有小面包機(jī),它怎么分類?它該怎么拿?所以,很顯然用認(rèn)識同一類物體的方法是不適用于這樣的場景當(dāng)中的。
那么,為了讓機(jī)器人什么都能拿,麻省理工的研究人員們動了點心思。
研究人員設(shè)計了這樣一個系統(tǒng):面對自己不熟悉的物體,機(jī)器人能夠快速地對其進(jìn)行估算,然后做出最適合的抓取和細(xì)節(jié)處理決策。該系統(tǒng)被稱為DON(Dense Object Nets,密集物體聯(lián)網(wǎng)),通過神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),機(jī)器人可以產(chǎn)生一個視覺路線圖,對物體進(jìn)行一個約莫20分鐘的視覺檢查。
在此基礎(chǔ)上,機(jī)器人會從多個角度來確定物體的點,然后把所有的點形成一個整體坐標(biāo)系統(tǒng)。把這些點聯(lián)系到一起之后,就可以繪制出物體的三維立體圖。值得注意的是,在繪制三維立體圖的過程中,機(jī)器完全不需要人的干預(yù),因此這種學(xué)習(xí)方式又被稱為自我監(jiān)督式學(xué)習(xí)。
這樣的學(xué)習(xí)過程其實是和人類有很大的相似之處。我們看到暖瓶知道要握把才能提起,該系統(tǒng)的目的也是訓(xùn)練機(jī)器人的這種能力。只不過在目前的實驗中,三維立體圖形繪制出來之后,還需要研究人員在電腦上給出指定的位置,以告訴機(jī)器人從哪里下手。
在實驗中,機(jī)器人成功抓起了一只鞋子和杯子。
其實對機(jī)器人進(jìn)行不同環(huán)境、物體的抓取訓(xùn)練思路,麻省理工并不是第一個。2016國內(nèi)一家科技公司就研發(fā)出了首套基于3D視覺定位系統(tǒng)的機(jī)器人,可以達(dá)到每秒1200萬點的快速掃描,從而建立一個物體的3D模型。再經(jīng)過一系列的智能分析,可以判斷出物體當(dāng)時的擺放姿態(tài),從而完成一套抓取動作。
可以預(yù)見的是,今后也將有越來越多的關(guān)于基于3D立體判斷的工業(yè)機(jī)器人解決方案出現(xiàn)。讓機(jī)器人從簡單的識別固定唯一的物體到自如地適應(yīng)不同物體抓取,也將成為工業(yè)機(jī)器人領(lǐng)域中不可忽視的重要技術(shù)。
抓得穩(wěn)又抓得準(zhǔn),人類的雙手該歇歇了
目前來說,該技術(shù)的最大問題在于建模所需的時間還比較長,遠(yuǎn)遠(yuǎn)無法滿足即時的工業(yè)應(yīng)用需求。
上文介紹的麻省理工的研究,其要實現(xiàn)對物體的三維圖像描繪需要大概二十分鐘的時間。但在做個搬運工的時候,比如說清理房間,很可能會遇到非常多的不認(rèn)識的物品。對這種機(jī)器人來說,每個物品都需要重新認(rèn)識一遍。認(rèn)識一個花二十分鐘,搬運一下一分鐘,那得了,整個時間就都消耗在這上面了。
而工業(yè)最講究的就是效率,如果能通過提升芯片計算速度、優(yōu)化算法的方法令機(jī)器人快速建模并實現(xiàn)實時自主抓取,無疑是最成熟。當(dāng)然,這對機(jī)器而言存在的困難還是很大。畢竟人類的神經(jīng)元有1000億個,其形成的人類大腦反應(yīng)恐怕機(jī)器在很長的一段時間內(nèi)都很難企及。
如果機(jī)器人能實現(xiàn)抓取的即時反應(yīng)、利用視覺判斷物體材料和表面光滑度控制好抓取力度等,其在無論是工業(yè)場景、消費場景還是其他場景等都將充滿廣闊的想象力。
搬家機(jī)器人。以前搬家,打幾個包袱弄輛推車,找?guī)讉€鄰居幫忙就可以搞定。而現(xiàn)在隨著家居用品的日益增加,搬家成為了一件巨麻煩的事情。很多人都會叫搬家公司來幫忙。實質(zhì)上這就是在購買勞動。搬家貴,主要就是人力成本太高。當(dāng)機(jī)器人搬運東西的時候可以做到舉重若輕,搬家工人或許將逐漸被取代。干活快、不發(fā)牢騷、不用發(fā)工資、購買一次可以長期重復(fù)使用,對搬家公司而言,利用搬家機(jī)器人可謂一勞永逸。成本降低之后,相應(yīng)地搬家公司的收益會提高,而分?jǐn)偟较M者身上的成本也會大大降低。
優(yōu)化機(jī)器人無序抓取。在工業(yè)場景下,尤其是物流領(lǐng)域,很多物品的擺放都是散亂而無序的。傳統(tǒng)的機(jī)器人只是分揀符合自身程序設(shè)定標(biāo)準(zhǔn)的物件,最終仍然需要人工來對這些貨物進(jìn)行碼垛等操作。當(dāng)機(jī)器人可以實現(xiàn)對物品的三維掃描繪制,就可以將抓取過程更加智能化,以前由兩個機(jī)器人做的事情現(xiàn)在一個就可以完成;以前由人工操作的碼垛任務(wù),最終也可以由機(jī)器完成。減少機(jī)器人配置和節(jié)省人力這兩方面,都將會得到優(yōu)化。
清理事故現(xiàn)場和救災(zāi)。嚴(yán)重的交通事故、工廠的意外爆炸、自然災(zāi)害或者其他會產(chǎn)生大量分解物體的事故現(xiàn)場,清理是一件非常麻煩的事情。尤其是在一些危險隱患尚未解除的時候,靈巧的機(jī)器人雙手可以代替人類作許多事情。而在地震等自然災(zāi)害之后,機(jī)器人可以代替人類深入現(xiàn)場做一些危險情況排除工作,甚至可以直接參與救人行動。
機(jī)器人抓取一直都是機(jī)器人研究領(lǐng)域的一個熱點問題,這也正從一個側(cè)面了解決這個問題對整個機(jī)器人技術(shù)革新的重要意義。當(dāng)機(jī)器人在未來擁有了一雙和人類一樣靈巧的雙手的時候,可能也就意味著,人類的雙手將在更多的場景中得到徹底的解放。
而DON看起來,則很可能成為將在這場解放運動中發(fā)揮重要作用。
2024-09-14 08:54
2024-09-13 09:23
2024-09-12 09:22
2024-09-10 09:46
2024-09-09 08:09
2024-09-07 09:58
2024-09-06 09:12
2024-09-03 09:08
2024-09-01 08:20