視覺是大自然神奇的恩賜之一,它陪伴我們一起生活了幾億年。對(duì)人類來(lái)說(shuō),這也是一種關(guān)鍵的感覺,但我們常常認(rèn)為是理所當(dāng)然的:直到我們開始失去它,或者我們嘗試為機(jī)器人賦予視覺,發(fā)現(xiàn)其中的艱難與不易。
許多研究實(shí)驗(yàn)室?guī)资陙?lái)一直在對(duì)動(dòng)物和昆蟲中的視覺系統(tǒng)進(jìn)行建模。我們大量研究螞蟻、蜜蜂甚至嚙齒動(dòng)物。
為了模擬生物系統(tǒng)并使其對(duì)機(jī)器人有用,你通常需要了解該視覺系統(tǒng)的行為和神經(jīng)基礎(chǔ)。
行為組成部分是你觀察到動(dòng)物在做什么,以及當(dāng)你弄亂它可以看到的東西時(shí),該行為如何變化,例如通過(guò)嘗試不同的地標(biāo)配置。神經(jīng)元件是動(dòng)物大腦中用于任務(wù)的視覺學(xué)習(xí)的回路,例如導(dǎo)航。
識(shí)別面孔
識(shí)別是所有動(dòng)物和機(jī)器人的基本視覺過(guò)程。它能夠識(shí)別世界上熟悉的人、動(dòng)物、物體和地標(biāo)。
由于其重要性,面部識(shí)別部分地“融入”到嬰兒等自然系統(tǒng)。所以,我們很早就能識(shí)別出面孔。
沿著這些方向,一些人工人臉識(shí)別系統(tǒng)基于生物系統(tǒng)是如何起作用的。例如,研究人員創(chuàng)建了一組神經(jīng)網(wǎng)絡(luò),模仿靈長(zhǎng)類動(dòng)物視覺處理的不同層次結(jié)構(gòu),以創(chuàng)建一個(gè)能夠進(jìn)行人臉識(shí)別的系統(tǒng)。
識(shí)別位置
視覺位置識(shí)別是任何東西導(dǎo)航世界的重要過(guò)程。
地點(diǎn)識(shí)別是機(jī)器人或動(dòng)物觀察周圍世界的過(guò)程,并且能夠協(xié)調(diào)它當(dāng)前看到的與某個(gè)地方的過(guò)去記憶,或者以人類為例,對(duì)該地方的描述或期望。
在GPS導(dǎo)航出現(xiàn)之前,我們可能會(huì)收到一些指示,例如“直到你看到左邊的教堂然后右轉(zhuǎn)彎”。我們知道一個(gè)典型的教堂是什么樣的,因此當(dāng)我們看到它時(shí)可以認(rèn)出它。
這種地方識(shí)別可能聽起來(lái)像一個(gè)簡(jiǎn)單的任務(wù),直到遇到諸如外觀變化之類的挑戰(zhàn),例如由晝夜循環(huán)或惡劣天氣條件引起的外觀變化。
2視覺識(shí)別地點(diǎn)的另一個(gè)挑戰(zhàn)是視點(diǎn)變化:如果你從不同的角度查看場(chǎng)景,則會(huì)出現(xiàn)什么樣的變化。
在第一次沿著道路回溯路線時(shí)會(huì)遇到一個(gè)極端的例子 —— 你正在從相反的角度遇到環(huán)境中的所有事物。
3盡管存在這些挑戰(zhàn),但想要?jiǎng)?chuàng)建能夠識(shí)別地方的機(jī)器人系統(tǒng),就需要視覺系統(tǒng)更深入地了解周圍環(huán)境。
感應(yīng)能力
視覺傳感硬件在過(guò)去十年中迅速發(fā)展,部分原因在于智能手機(jī)中功能強(qiáng)大的攝像頭的激增。現(xiàn)代攝像頭如今甚至堪比或超越在更有能力的自然視覺系統(tǒng),至少在某些方面。
例如,消費(fèi)者相機(jī)現(xiàn)在可以在黑暗中看到調(diào)整后的人眼。
新的智能手機(jī)相機(jī)還可以每秒1000幀的速度錄制視頻,從而使機(jī)器人視覺系統(tǒng)的運(yùn)行頻率高于人類視覺系統(tǒng)。
諸如動(dòng)態(tài)視覺傳感器(DVS)之類的專業(yè)機(jī)器人視覺傳感甚至更快,但僅報(bào)告像素亮度的變化,而不是其絕對(duì)顏色。你可以在倫敦海德公園散步時(shí)看到不同之處:
并非所有機(jī)器人攝像機(jī)都必須像傳統(tǒng)攝像機(jī)一樣:機(jī)器人專家根據(jù)螞蟻等動(dòng)物如何看待世界而使用專業(yè)攝像機(jī)。
所需的分辨率?
所有基于視覺的機(jī)器人和動(dòng)物研究的基本問(wèn)題之一是“完成工作”需要視覺分辨率(或視敏度)。
對(duì)于許多昆蟲和動(dòng)物如嚙齒類動(dòng)物而言,它們可以獲得相對(duì)較低的視覺分辨率 —— 相當(dāng)于在許多情況下只有幾千像素的相機(jī)(相比之下,現(xiàn)代智能手機(jī)的分辨率從800萬(wàn)像素到4000萬(wàn)像素)。
1所需的分辨率根據(jù)任務(wù)的不同而有很大差異,對(duì)于某些導(dǎo)航任務(wù),螞蟻和蜜蜂等動(dòng)物以及機(jī)器人只需要幾個(gè)像素。
但是對(duì)于更復(fù)雜的任務(wù),例如自動(dòng)駕駛汽車, 可能需要更高的攝像頭分辨率。
如果汽車想要可靠地識(shí)別和預(yù)測(cè)人類行人正在做什么或打算做什么,那么可能需要高分辨率的視覺傳感系統(tǒng),以捕獲微妙的面部表情和身體運(yùn)動(dòng)。
生物啟發(fā)與實(shí)用主義之間的緊張關(guān)系
對(duì)于尋求自然靈感的機(jī)器人專家來(lái)說(shuō),模仿生物學(xué)和利用相機(jī)技術(shù)的不斷進(jìn)步之間存在著持續(xù)的緊張關(guān)系。
雖然生物視覺系統(tǒng)在過(guò)去明顯優(yōu)于相機(jī),但技術(shù)的不斷快速發(fā)展使得相機(jī)在許多情況下具有對(duì)自然系統(tǒng)的優(yōu)異感測(cè)能力。在追求創(chuàng)造高性能和安全機(jī)器人和自動(dòng)駕駛汽車時(shí),利用這些實(shí)用能力是明智的。
但是生物學(xué)仍將在激勵(lì)機(jī)器人專家方面發(fā)揮關(guān)鍵作用。 自然王國(guó)非常擅長(zhǎng)制造功能強(qiáng)大的視覺系統(tǒng),這些系統(tǒng)消耗的空間、計(jì)算能力和能量資源,而這是大多數(shù)機(jī)器人系統(tǒng)的主要挑戰(zhàn)。
本文圖片來(lái)源:The Conversation
2024-09-25 09:38
2024-09-23 08:27
2024-09-23 08:23
2024-09-23 08:17
2024-09-18 09:16
2024-09-15 09:32
2024-09-15 09:29
2024-09-14 08:54
2024-09-13 09:23
2024-09-12 09:22