機(jī)器視覺幫助機(jī)器人看到并識別周圍環(huán)境,以便它們可以執(zhí)行更復(fù)雜的任務(wù)。
就在過去的幾年里,機(jī)器視覺的進(jìn)步幫助許多機(jī)器人和自動駕駛汽車達(dá)到了幾乎類似人類的感知水平。使用無數(shù)的光學(xué)傳感器,如高分辨率的攝像頭,這些機(jī)器人和汽車,以它們自己的方式,終于能夠看到。
什么是機(jī)器視覺?機(jī)器視覺是一種允許基于計(jì)算機(jī)的硬件和機(jī)器(如機(jī)器人和自動駕駛汽車)使用相機(jī)和其他光學(xué)傳感器感知其環(huán)境的技術(shù)。
什么是機(jī)器視覺?
機(jī)器視覺是使機(jī)器人和其他機(jī)器(如自動駕駛車輛)能夠看到和識別周圍環(huán)境中的物體的技術(shù)。通過將光學(xué)傳感器與能夠分析和處理圖像數(shù)據(jù)的人工智能和機(jī)器學(xué)習(xí)工具配對,配備機(jī)器視覺系統(tǒng)的機(jī)器人和自主車輛能夠執(zhí)行更復(fù)雜的任務(wù),如在倉庫中拉動訂單或在市區(qū)交通中導(dǎo)航。
隨著相機(jī)價格的下降,計(jì)算能力的提高和算法的成熟,機(jī)器視覺已經(jīng)幫助機(jī)器人技術(shù)擺脫了Rapid Robotics公司技術(shù)副總裁Tom Hummel所說的靜態(tài)編程狀態(tài)。Hummel說,由于深度學(xué)習(xí)的最新進(jìn)展,使機(jī)器人能夠?qū)嶋H分析它們所看到的東西,機(jī)器人能夠完成曾經(jīng)看起來不可能或成本太高的任務(wù),比如從垃圾箱中挑選特定的物品。
機(jī)器視覺是如何工作的?
大多數(shù)機(jī)器視覺系統(tǒng)需要一個光源,要么直接安裝在機(jī)器人上,要么設(shè)置在機(jī)器人運(yùn)行的設(shè)施內(nèi),這樣,所使用的攝像機(jī)(或照相機(jī))可以清楚地捕捉到周圍的物體、人類、潛在的危險和其他特征。
一旦機(jī)器人捕捉到圖像,這些視覺數(shù)據(jù)就會被發(fā)送到處理器或機(jī)載計(jì)算機(jī),該計(jì)算機(jī)使用人工智能和機(jī)器學(xué)習(xí)算法對圖像進(jìn)行分析,通常還包括從其他傳感方式(如LiDAR、雷達(dá)和麥克風(fēng))收集的數(shù)據(jù)。
在對圖像和其他數(shù)據(jù)進(jìn)行處理后,這些信息被傳回給機(jī)器人或與它一起工作的其他機(jī)器。在那里,機(jī)器可以做出適當(dāng)?shù)臎Q定,無論是在人行橫道上停車,還是為訂單挑選合適的物品,從而提高效率和安全性。
機(jī)器視覺的類型
機(jī)器視覺主要分為三種類型:
一維視覺:一維視覺不會一次分析整個物體的圖像,而是一次讀取一行,通常使用線掃描相機(jī)。這種類型的機(jī)器視覺通常用于檢測過程,以發(fā)現(xiàn)在傳送帶上移動的產(chǎn)品中的缺陷。
二維視覺:二維視覺使用數(shù)碼相機(jī)收集圖像數(shù)據(jù),然后通過比較一幅圖像與另一幅圖像的對比度變化來處理這些數(shù)據(jù)。這種類型的機(jī)器視覺通常用于跟蹤物體,以及驗(yàn)證和檢查。
三維視覺:3D 視覺使用位于不同位置的多個數(shù)碼相機(jī)和其他傳感器來捕捉物體的數(shù)字模型,從而提供對其位置、大小和特征的準(zhǔn)確評估。這種類型的機(jī)器視覺通常用于幫助機(jī)器人在周圍環(huán)境中導(dǎo)航以及執(zhí)行與訂單履行相關(guān)的任務(wù),例如從箱子和容器中挑選產(chǎn)品。
機(jī)器視覺應(yīng)用
由于大多數(shù)人嚴(yán)重依賴視覺來工作和與世界互動,因此由于機(jī)器視覺,機(jī)器人也能做同樣的事情。機(jī)器人手臂用它來檢查從裝配線上下來的零件和產(chǎn)品,確定哪些符合質(zhì)量標(biāo)準(zhǔn)。自動駕駛出租車使用視覺系統(tǒng)幫助在行人過馬路之前讀取他們的細(xì)微提示,而人類司機(jī)似乎在這方面做得越來越差。在倉庫中,自主移動機(jī)器人使用機(jī)器視覺來幫助完成訂單。
機(jī)器視覺應(yīng)用
●用于裝配線以檢查零件以改進(jìn)質(zhì)量控制。
●幫助在倉庫中工作的機(jī)器人定位產(chǎn)品并在周圍環(huán)境中導(dǎo)航。
●允許自動駕駛汽車感知周圍的世界并識別潛在的危險。
制造業(yè)使用機(jī)器視覺進(jìn)行質(zhì)量控制
當(dāng)人們檢查從裝配線上下來的零件時,他們通常不會仔細(xì)檢查每個零件以尋找缺陷。Hummel 說,這將花費(fèi)太多時間、太多金錢,并且需要人類無法做到的專注程度。
但是配備機(jī)器視覺系統(tǒng)的機(jī)器人手臂,如 Rapid Robotics 的 Rapid Machine Operator,可以檢查每一個。Hummel 說:“相機(jī)不睡覺。相機(jī)不在乎。而且相機(jī)速度很快。所以你可以檢查從注塑機(jī)出來的每個零件,或者從任何過程中出來的,然后決定丟棄它。”
因此,Hummel 表示,工廠不太可能運(yùn)出不良零件,操作員也能更好地了解他們生產(chǎn)的產(chǎn)品的質(zhì)量。
機(jī)器視覺幫助自動駕駛出租車了解周圍環(huán)境
就在行人過馬路之前,他們通常甚至在腳踏入人行橫道之前就暗示他們要做什么。他們可能會從手機(jī)上抬起頭來,或者向左看,或者稍微舉起雙手。這些信號雖然微妙,但可以被自動駕駛汽車觀察到或感知到。
亞馬遜旗下機(jī)器人出租車公司Zoox的感知總監(jiān) RJ He 說:“當(dāng)你考慮行人、司機(jī)和車輛之間的互動時,這些線索非常重要。識別這些線索是機(jī)器視覺的優(yōu)勢之一,也是該技術(shù)的亮點(diǎn)。當(dāng)你對如何使用各個傳感模式以及它們?nèi)绾蜗嗷パa(bǔ)充進(jìn)行深思熟慮時,奇跡就會發(fā)生?!?/p>
Zoox 的電動自動駕駛汽車使用人工智能和機(jī)器學(xué)習(xí)算法以及攝像頭和其他傳感方式,例如測量和收集位置、速度和其他重要道路數(shù)據(jù)的 LiDAR、雷達(dá)和熱像儀,能夠看到周圍的世界并與之互動.這些汽車正在舊金山灣區(qū)、拉斯維加斯和西雅圖進(jìn)行測試,甚至可以預(yù)測附近的汽車、卡車、騎自行車的人和行人可能會或可能不會做什么,就像一個人踏入道路一樣。
他說:“當(dāng)你非常仔細(xì)地考慮如何使用單獨(dú)的傳感模式以及它們?nèi)绾蜗嗷パa(bǔ)充時,魔法就會發(fā)生。無論是在視野和覆蓋范圍等方面,但更重要的是,在算法方面?!?/p>
通過利用機(jī)器視覺的個人優(yōu)勢和所有這些不同的傳感器模式和算法,Zoox 能夠創(chuàng)建他們的汽車可以實(shí)時響應(yīng)的世界的準(zhǔn)確表示,而不會傷害他們的乘客或其他人和周圍的生物或給他們帶來不便他們。
在美國這樣的國家,近年來道路變得更加危險,這變得非常重要,這也是 Zoox 所做事情背后的動機(jī)之一。
“對于人類司機(jī)在分心等等 ,我們需要確保我們能夠?qū)λ羞@些不良行為做出反應(yīng)?!彼f。
機(jī)器視覺幫助機(jī)器人完成訂單
雖然許多從事物流行業(yè)的機(jī)器人公司都依賴 LiDAR (激光雷達(dá))來幫助他們的機(jī)器人在倉庫中導(dǎo)航和完成訂單,但專門從事倉庫自動化的機(jī)器人公司inVia Robotics卻依賴機(jī)器視覺。
據(jù) inVia 的首席執(zhí)行官兼聯(lián)合創(chuàng)始人 Lior Elazary 稱,該公司的機(jī)器人使用機(jī)器視覺在倉庫內(nèi)操作,通過掃描 AprilTags為電子商務(wù)訂單提取產(chǎn)品,Elazary 將其描述為貼在容器上的二維碼。機(jī)器人分析它捕獲的代碼,這使它能夠理解它在看什么。
機(jī)器視覺系統(tǒng)也在倉庫內(nèi)進(jìn)行訓(xùn)練,在那里它收集并捕獲周圍的特征,這些特征使用算法進(jìn)行分析,從而從本質(zhì)上形成 Elazary 所說的機(jī)器人在倉庫內(nèi)以及容器或箱子中所處位置的“假設(shè)”它需要從中拉出來。它使用視覺伺服控制機(jī)器人的運(yùn)動,并允許它像人類一樣抓取物體。
Elazary 說:“最終,我們會用眼睛去抓住東西——你看到它在哪里,然后你就會磨練。這就是我們的機(jī)器人所做的?!?/p>
從本質(zhì)上講,機(jī)器視覺讓機(jī)器人能夠適應(yīng),而不是讓彎曲的架子或放錯地方的盒子等小東西絆倒它——人類的小問題通常會給依賴激光雷達(dá)的機(jī)器人帶來問題,并可能導(dǎo)致更大的開支,比如更換貨架倉庫。
Elazary 說:“他指的是機(jī)器視覺系統(tǒng),這要難得多,但它的成本效益要高得多?!?/p>
機(jī)器視覺與計(jì)算機(jī)視覺
雖然機(jī)器視覺和計(jì)算機(jī)視覺這兩個術(shù)語經(jīng)常互換使用,但主要區(qū)別在于:
機(jī)器視覺系統(tǒng)需要相機(jī)來捕捉和提供圖像數(shù)據(jù),而計(jì)算機(jī)視覺系統(tǒng)可以從其他來源(比如互聯(lián)網(wǎng))獲取圖像。
計(jì)算機(jī)視覺系統(tǒng)是處理視覺數(shù)據(jù)的人工智能和機(jī)器學(xué)習(xí)算法所在的地方。
從本質(zhì)上講,機(jī)器視覺是眼睛,而計(jì)算機(jī)視覺是大腦。
2024-10-23 09:13
2024-10-21 14:35
2024-10-21 09:45
2024-10-21 08:27
2024-10-16 11:29
2024-10-14 09:19
2024-10-13 12:05
2024-10-11 11:57
2024-10-10 10:00