機器視覺幫助機器人看到并識別周圍環(huán)境,以便它們可以執(zhí)行更復(fù)雜的任務(wù)。
就在過去的幾年里,機器視覺的進步幫助許多機器人和自動駕駛汽車達到了幾乎類似人類的感知水平。使用無數(shù)的光學(xué)傳感器,如高分辨率的攝像頭,這些機器人和汽車,以它們自己的方式,終于能夠看到。
什么是機器視覺?機器視覺是一種允許基于計算機的硬件和機器(如機器人和自動駕駛汽車)使用相機和其他光學(xué)傳感器感知其環(huán)境的技術(shù)。
什么是機器視覺?
機器視覺是使機器人和其他機器(如自動駕駛車輛)能夠看到和識別周圍環(huán)境中的物體的技術(shù)。通過將光學(xué)傳感器與能夠分析和處理圖像數(shù)據(jù)的人工智能和機器學(xué)習工具配對,配備機器視覺系統(tǒng)的機器人和自主車輛能夠執(zhí)行更復(fù)雜的任務(wù),如在倉庫中拉動訂單或在市區(qū)交通中導(dǎo)航。
隨著相機價格的下降,計算能力的提高和算法的成熟,機器視覺已經(jīng)幫助機器人技術(shù)擺脫了Rapid Robotics公司技術(shù)副總裁Tom Hummel所說的靜態(tài)編程狀態(tài)。Hummel說,由于深度學(xué)習的最新進展,使機器人能夠?qū)嶋H分析它們所看到的東西,機器人能夠完成曾經(jīng)看起來不可能或成本太高的任務(wù),比如從垃圾箱中挑選特定的物品。
機器視覺是如何工作的?
大多數(shù)機器視覺系統(tǒng)需要一個光源,要么直接安裝在機器人上,要么設(shè)置在機器人運行的設(shè)施內(nèi),這樣,所使用的攝像機(或照相機)可以清楚地捕捉到周圍的物體、人類、潛在的危險和其他特征。
一旦機器人捕捉到圖像,這些視覺數(shù)據(jù)就會被發(fā)送到處理器或機載計算機,該計算機使用人工智能和機器學(xué)習算法對圖像進行分析,通常還包括從其他傳感方式(如LiDAR、雷達和麥克風)收集的數(shù)據(jù)。
在對圖像和其他數(shù)據(jù)進行處理后,這些信息被傳回給機器人或與它一起工作的其他機器。在那里,機器可以做出適當?shù)臎Q定,無論是在人行橫道上停車,還是為訂單挑選合適的物品,從而提高效率和安全性。
機器視覺的類型
機器視覺主要分為三種類型:
一維視覺:一維視覺不會一次分析整個物體的圖像,而是一次讀取一行,通常使用線掃描相機。這種類型的機器視覺通常用于檢測過程,以發(fā)現(xiàn)在傳送帶上移動的產(chǎn)品中的缺陷。
二維視覺:二維視覺使用數(shù)碼相機收集圖像數(shù)據(jù),然后通過比較一幅圖像與另一幅圖像的對比度變化來處理這些數(shù)據(jù)。這種類型的機器視覺通常用于跟蹤物體,以及驗證和檢查。
三維視覺:3D 視覺使用位于不同位置的多個數(shù)碼相機和其他傳感器來捕捉物體的數(shù)字模型,從而提供對其位置、大小和特征的準確評估。這種類型的機器視覺通常用于幫助機器人在周圍環(huán)境中導(dǎo)航以及執(zhí)行與訂單履行相關(guān)的任務(wù),例如從箱子和容器中挑選產(chǎn)品。
機器視覺應(yīng)用
由于大多數(shù)人嚴重依賴視覺來工作和與世界互動,因此由于機器視覺,機器人也能做同樣的事情。機器人手臂用它來檢查從裝配線上下來的零件和產(chǎn)品,確定哪些符合質(zhì)量標準。自動駕駛出租車使用視覺系統(tǒng)幫助在行人過馬路之前讀取他們的細微提示,而人類司機似乎在這方面做得越來越差。在倉庫中,自主移動機器人使用機器視覺來幫助完成訂單。
機器視覺應(yīng)用
●用于裝配線以檢查零件以改進質(zhì)量控制。
●幫助在倉庫中工作的機器人定位產(chǎn)品并在周圍環(huán)境中導(dǎo)航。
●允許自動駕駛汽車感知周圍的世界并識別潛在的危險。
制造業(yè)使用機器視覺進行質(zhì)量控制
當人們檢查從裝配線上下來的零件時,他們通常不會仔細檢查每個零件以尋找缺陷。Hummel 說,這將花費太多時間、太多金錢,并且需要人類無法做到的專注程度。
但是配備機器視覺系統(tǒng)的機器人手臂,如 Rapid Robotics 的 Rapid Machine Operator,可以檢查每一個。Hummel 說:“相機不睡覺。相機不在乎。而且相機速度很快。所以你可以檢查從注塑機出來的每個零件,或者從任何過程中出來的,然后決定丟棄它。”
因此,Hummel 表示,工廠不太可能運出不良零件,操作員也能更好地了解他們生產(chǎn)的產(chǎn)品的質(zhì)量。
機器視覺幫助自動駕駛出租車了解周圍環(huán)境
就在行人過馬路之前,他們通常甚至在腳踏入人行橫道之前就暗示他們要做什么。他們可能會從手機上抬起頭來,或者向左看,或者稍微舉起雙手。這些信號雖然微妙,但可以被自動駕駛汽車觀察到或感知到。
亞馬遜旗下機器人出租車公司Zoox的感知總監(jiān) RJ He 說:“當你考慮行人、司機和車輛之間的互動時,這些線索非常重要。識別這些線索是機器視覺的優(yōu)勢之一,也是該技術(shù)的亮點。當你對如何使用各個傳感模式以及它們?nèi)绾蜗嗷パa充進行深思熟慮時,奇跡就會發(fā)生?!?/p>
Zoox 的電動自動駕駛汽車使用人工智能和機器學(xué)習算法以及攝像頭和其他傳感方式,例如測量和收集位置、速度和其他重要道路數(shù)據(jù)的 LiDAR、雷達和熱像儀,能夠看到周圍的世界并與之互動.這些汽車正在舊金山灣區(qū)、拉斯維加斯和西雅圖進行測試,甚至可以預(yù)測附近的汽車、卡車、騎自行車的人和行人可能會或可能不會做什么,就像一個人踏入道路一樣。
他說:“當你非常仔細地考慮如何使用單獨的傳感模式以及它們?nèi)绾蜗嗷パa充時,魔法就會發(fā)生。無論是在視野和覆蓋范圍等方面,但更重要的是,在算法方面?!?/p>
通過利用機器視覺的個人優(yōu)勢和所有這些不同的傳感器模式和算法,Zoox 能夠創(chuàng)建他們的汽車可以實時響應(yīng)的世界的準確表示,而不會傷害他們的乘客或其他人和周圍的生物或給他們帶來不便他們。
在美國這樣的國家,近年來道路變得更加危險,這變得非常重要,這也是 Zoox 所做事情背后的動機之一。
“對于人類司機在分心等等 ,我們需要確保我們能夠?qū)λ羞@些不良行為做出反應(yīng)?!彼f。
機器視覺幫助機器人完成訂單
雖然許多從事物流行業(yè)的機器人公司都依賴 LiDAR (激光雷達)來幫助他們的機器人在倉庫中導(dǎo)航和完成訂單,但專門從事倉庫自動化的機器人公司inVia Robotics卻依賴機器視覺。
據(jù) inVia 的首席執(zhí)行官兼聯(lián)合創(chuàng)始人 Lior Elazary 稱,該公司的機器人使用機器視覺在倉庫內(nèi)操作,通過掃描 AprilTags為電子商務(wù)訂單提取產(chǎn)品,Elazary 將其描述為貼在容器上的二維碼。機器人分析它捕獲的代碼,這使它能夠理解它在看什么。
機器視覺系統(tǒng)也在倉庫內(nèi)進行訓(xùn)練,在那里它收集并捕獲周圍的特征,這些特征使用算法進行分析,從而從本質(zhì)上形成 Elazary 所說的機器人在倉庫內(nèi)以及容器或箱子中所處位置的“假設(shè)”它需要從中拉出來。它使用視覺伺服控制機器人的運動,并允許它像人類一樣抓取物體。
Elazary 說:“最終,我們會用眼睛去抓住東西——你看到它在哪里,然后你就會磨練。這就是我們的機器人所做的?!?/p>
從本質(zhì)上講,機器視覺讓機器人能夠適應(yīng),而不是讓彎曲的架子或放錯地方的盒子等小東西絆倒它——人類的小問題通常會給依賴激光雷達的機器人帶來問題,并可能導(dǎo)致更大的開支,比如更換貨架倉庫。
Elazary 說:“他指的是機器視覺系統(tǒng),這要難得多,但它的成本效益要高得多?!?/p>
機器視覺與計算機視覺
雖然機器視覺和計算機視覺這兩個術(shù)語經(jīng)常互換使用,但主要區(qū)別在于:
機器視覺系統(tǒng)需要相機來捕捉和提供圖像數(shù)據(jù),而計算機視覺系統(tǒng)可以從其他來源(比如互聯(lián)網(wǎng))獲取圖像。
計算機視覺系統(tǒng)是處理視覺數(shù)據(jù)的人工智能和機器學(xué)習算法所在的地方。
從本質(zhì)上講,機器視覺是眼睛,而計算機視覺是大腦。
2024-10-23 09:13
2024-10-21 14:35
2024-10-21 09:45
2024-10-21 08:27
2024-10-16 11:29
2024-10-14 09:19
2024-10-14 08:46
2024-10-13 12:05
2024-10-11 11:57
2024-10-10 10:00