視覺是大自然神奇的恩賜之一,它陪伴我們一起生活了幾億年。對人類來說,這也是一種關鍵的感覺,但我們常常認為是理所當然的:直到我們開始失去它,或者我們嘗試為機器人賦予視覺,發(fā)現(xiàn)其中的艱難與不易。
許多研究實驗室?guī)资陙硪恢痹趯游锖屠ハx中的視覺系統(tǒng)進行建模。我們大量研究螞蟻、蜜蜂甚至嚙齒動物。
為了模擬生物系統(tǒng)并使其對機器人有用,你通常需要了解該視覺系統(tǒng)的行為和神經(jīng)基礎。
行為組成部分是你觀察到動物在做什么,以及當你弄亂它可以看到的東西時,該行為如何變化,例如通過嘗試不同的地標配置。神經(jīng)元件是動物大腦中用于任務的視覺學習的回路,例如導航。
識別面孔
識別是所有動物和機器人的基本視覺過程。它能夠識別世界上熟悉的人、動物、物體和地標。
由于其重要性,面部識別部分地“融入”到嬰兒等自然系統(tǒng)。所以,我們很早就能識別出面孔。
沿著這些方向,一些人工人臉識別系統(tǒng)基于生物系統(tǒng)是如何起作用的。例如,研究人員創(chuàng)建了一組神經(jīng)網(wǎng)絡,模仿靈長類動物視覺處理的不同層次結(jié)構(gòu),以創(chuàng)建一個能夠進行人臉識別的系統(tǒng)。
識別位置
視覺位置識別是任何東西導航世界的重要過程。
地點識別是機器人或動物觀察周圍世界的過程,并且能夠協(xié)調(diào)它當前看到的與某個地方的過去記憶,或者以人類為例,對該地方的描述或期望。
在GPS導航出現(xiàn)之前,我們可能會收到一些指示,例如“直到你看到左邊的教堂然后右轉(zhuǎn)彎”。我們知道一個典型的教堂是什么樣的,因此當我們看到它時可以認出它。
這種地方識別可能聽起來像一個簡單的任務,直到遇到諸如外觀變化之類的挑戰(zhàn),例如由晝夜循環(huán)或惡劣天氣條件引起的外觀變化。
2視覺識別地點的另一個挑戰(zhàn)是視點變化:如果你從不同的角度查看場景,則會出現(xiàn)什么樣的變化。
在第一次沿著道路回溯路線時會遇到一個極端的例子 —— 你正在從相反的角度遇到環(huán)境中的所有事物。
3盡管存在這些挑戰(zhàn),但想要創(chuàng)建能夠識別地方的機器人系統(tǒng),就需要視覺系統(tǒng)更深入地了解周圍環(huán)境。
感應能力
視覺傳感硬件在過去十年中迅速發(fā)展,部分原因在于智能手機中功能強大的攝像頭的激增。現(xiàn)代攝像頭如今甚至堪比或超越在更有能力的自然視覺系統(tǒng),至少在某些方面。
例如,消費者相機現(xiàn)在可以在黑暗中看到調(diào)整后的人眼。
新的智能手機相機還可以每秒1000幀的速度錄制視頻,從而使機器人視覺系統(tǒng)的運行頻率高于人類視覺系統(tǒng)。
諸如動態(tài)視覺傳感器(DVS)之類的專業(yè)機器人視覺傳感甚至更快,但僅報告像素亮度的變化,而不是其絕對顏色。你可以在倫敦海德公園散步時看到不同之處:
并非所有機器人攝像機都必須像傳統(tǒng)攝像機一樣:機器人專家根據(jù)螞蟻等動物如何看待世界而使用專業(yè)攝像機。
所需的分辨率?
所有基于視覺的機器人和動物研究的基本問題之一是“完成工作”需要視覺分辨率(或視敏度)。
對于許多昆蟲和動物如嚙齒類動物而言,它們可以獲得相對較低的視覺分辨率 —— 相當于在許多情況下只有幾千像素的相機(相比之下,現(xiàn)代智能手機的分辨率從800萬像素到4000萬像素)。
1所需的分辨率根據(jù)任務的不同而有很大差異,對于某些導航任務,螞蟻和蜜蜂等動物以及機器人只需要幾個像素。
但是對于更復雜的任務,例如自動駕駛汽車, 可能需要更高的攝像頭分辨率。
如果汽車想要可靠地識別和預測人類行人正在做什么或打算做什么,那么可能需要高分辨率的視覺傳感系統(tǒng),以捕獲微妙的面部表情和身體運動。
生物啟發(fā)與實用主義之間的緊張關系
對于尋求自然靈感的機器人專家來說,模仿生物學和利用相機技術(shù)的不斷進步之間存在著持續(xù)的緊張關系。
雖然生物視覺系統(tǒng)在過去明顯優(yōu)于相機,但技術(shù)的不斷快速發(fā)展使得相機在許多情況下具有對自然系統(tǒng)的優(yōu)異感測能力。在追求創(chuàng)造高性能和安全機器人和自動駕駛汽車時,利用這些實用能力是明智的。
但是生物學仍將在激勵機器人專家方面發(fā)揮關鍵作用。 自然王國非常擅長制造功能強大的視覺系統(tǒng),這些系統(tǒng)消耗的空間、計算能力和能量資源,而這是大多數(shù)機器人系統(tǒng)的主要挑戰(zhàn)。
本文圖片來源:The Conversation
2025-03-08 11:38
2025-03-08 08:52
2025-03-07 10:19
2025-03-07 09:29
2025-03-06 14:03
2025-03-03 08:32
2025-03-02 08:21
2025-02-25 10:58
2025-02-25 10:58
2025-02-25 10:37