您的位置:首頁 > 資訊 > 行業(yè)動態(tài) > 正文

機器人想要“睜眼”看世界 還得向動物的視覺系統(tǒng)“取經(jīng)”

2018-07-21 07:47 性質(zhì):轉(zhuǎn)載 作者:前瞻網(wǎng) 來源:前瞻網(wǎng)
免責聲明:中叉網(wǎng)(m.m21363.cn)尊重合法版權(quán),反對侵權(quán)盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識產(chǎn)權(quán)均系原作者和機構(gòu)所有。文章內(nèi)容觀點,與本網(wǎng)無關。如有需要刪除,敬請來電商榷?。?/div>
視覺是大自然神奇的恩賜之一,它陪伴我們一起生活了幾億年。對人類來說,這也是一種關鍵的感覺,但我們常常認為是理所當然的:直到我們...

  視覺是大自然神奇的恩賜之一,它陪伴我們一起生活了幾億年。對人類來說,這也是一種關鍵的感覺,但我們常常認為是理所當然的:直到我們開始失去它,或者我們嘗試為機器人賦予視覺,發(fā)現(xiàn)其中的艱難與不易。

  許多研究實驗室?guī)资陙硪恢痹趯游锖屠ハx中的視覺系統(tǒng)進行建模。我們大量研究螞蟻、蜜蜂甚至嚙齒動物。

  為了模擬生物系統(tǒng)并使其對機器人有用,你通常需要了解該視覺系統(tǒng)的行為和神經(jīng)基礎。

  行為組成部分是你觀察到動物在做什么,以及當你弄亂它可以看到的東西時,該行為如何變化,例如通過嘗試不同的地標配置。神經(jīng)元件是動物大腦中用于任務的視覺學習的回路,例如導航。

識別面孔

  識別是所有動物和機器人的基本視覺過程。它能夠識別世界上熟悉的人、動物、物體和地標。

  由于其重要性,面部識別部分地“融入”到嬰兒等自然系統(tǒng)。所以,我們很早就能識別出面孔。

  沿著這些方向,一些人工人臉識別系統(tǒng)基于生物系統(tǒng)是如何起作用的。例如,研究人員創(chuàng)建了一組神經(jīng)網(wǎng)絡,模仿靈長類動物視覺處理的不同層次結(jié)構(gòu),以創(chuàng)建一個能夠進行人臉識別的系統(tǒng)。

識別位置

  視覺位置識別是任何東西導航世界的重要過程。

  地點識別是機器人或動物觀察周圍世界的過程,并且能夠協(xié)調(diào)它當前看到的與某個地方的過去記憶,或者以人類為例,對該地方的描述或期望。

  在GPS導航出現(xiàn)之前,我們可能會收到一些指示,例如“直到你看到左邊的教堂然后右轉(zhuǎn)彎”。我們知道一個典型的教堂是什么樣的,因此當我們看到它時可以認出它。

  這種地方識別可能聽起來像一個簡單的任務,直到遇到諸如外觀變化之類的挑戰(zhàn),例如由晝夜循環(huán)或惡劣天氣條件引起的外觀變化。

  2視覺識別地點的另一個挑戰(zhàn)是視點變化:如果你從不同的角度查看場景,則會出現(xiàn)什么樣的變化。

  在第一次沿著道路回溯路線時會遇到一個極端的例子 —— 你正在從相反的角度遇到環(huán)境中的所有事物。

  3盡管存在這些挑戰(zhàn),但想要創(chuàng)建能夠識別地方的機器人系統(tǒng),就需要視覺系統(tǒng)更深入地了解周圍環(huán)境。

感應能力

  視覺傳感硬件在過去十年中迅速發(fā)展,部分原因在于智能手機中功能強大的攝像頭的激增。現(xiàn)代攝像頭如今甚至堪比或超越在更有能力的自然視覺系統(tǒng),至少在某些方面。
  例如,消費者相機現(xiàn)在可以在黑暗中看到調(diào)整后的人眼。

  新的智能手機相機還可以每秒1000幀的速度錄制視頻,從而使機器人視覺系統(tǒng)的運行頻率高于人類視覺系統(tǒng)。

  諸如動​​態(tài)視覺傳感器(DVS)之類的專業(yè)機器人視覺傳感甚至更快,但僅報告像素亮度的變化,而不是其絕對顏色。你可以在倫敦海德公園散步時看到不同之處:

并非所有機器人攝像機都必須像傳統(tǒng)攝像機一樣:機器人專家根據(jù)螞蟻等動物如何看待世界而使用專業(yè)攝像機。

所需的分辨率?

  所有基于視覺的機器人和動物研究的基本問題之一是“完成工作”需要視覺分辨率(或視敏度)。

  對于許多昆蟲和動物如嚙齒類動物而言,它們可以獲得相對較低的視覺分辨率 —— 相當于在許多情況下只有幾千像素的相機(相比之下,現(xiàn)代智能手機的分辨率從800萬像素到4000萬像素)。

  1所需的分辨率根據(jù)任務的不同而有很大差異,對于某些導航任務,螞蟻和蜜蜂等動物以及機器人只需要幾個像素。

  但是對于更復雜的任務,例如自動駕駛汽車, 可能需要更高的攝像頭分辨率。

  如果汽車想要可靠地識別和預測人類行人正在做什么或打算做什么,那么可能需要高分辨率的視覺傳感系統(tǒng),以捕獲微妙的面部表情和身體運動。

生物啟發(fā)與實用主義之間的緊張關系

  對于尋求自然靈感的機器人專家來說,模仿生物學和利用相機技術(shù)的不斷進步之間存在著持續(xù)的緊張關系。

  雖然生物視覺系統(tǒng)在過去明顯優(yōu)于相機,但技術(shù)的不斷快速發(fā)展使得相機在許多情況下具有對自然系統(tǒng)的優(yōu)異感測能力。在追求創(chuàng)造高性能和安全機器人和自動駕駛汽車時,利用這些實用能力是明智的。

  但是生物學仍將在激勵機器人專家方面發(fā)揮關鍵作用。 自然王國非常擅長制造功能強大的視覺系統(tǒng),這些系統(tǒng)消耗的空間、計算能力和能量資源,而這是大多數(shù)機器人系統(tǒng)的主要挑戰(zhàn)。

本文圖片來源:The Conversation

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關資訊

關注官方微信

手機掃碼看新聞

扫码进手机版