我們從客戶那里聽到的一個問題是 "什么是4D視覺"?
畢竟,3D視覺系統(tǒng)已被廣泛使用并得到了很好的理解。四維視覺這個名字意味著超越三維技術(shù)的東西。三維視覺系統(tǒng)是很好的工具,如測量物體的尺寸。但我們從視覺專家那里得知,要使3D解決方案達到客戶的期望,需要硬件的復(fù)雜性和定制化。
什么是4D視覺技術(shù)?
Apera AI(加拿大阿帕拉人工智能公司)的目的是通過為機器人提供類似人類的視覺智能,使機器人自動化變得更容易??紤]到這個目標,我們的技術(shù)很容易以人類的視覺系統(tǒng)為基礎(chǔ)。
人類的視覺會關(guān)注邊緣、陰影、顏色和紋理,以便對雜亂的環(huán)境有所了解。三維視覺是你的大腦處理二維信息的一個副產(chǎn)品。
Apera AI的4D視覺也是基于同樣的原理工作。簡單地說,它是一個人工智能(AI)驅(qū)動的立體視覺系統(tǒng)。2D+2D=4D。
我們設(shè)計了一個復(fù)雜的神經(jīng)網(wǎng)絡(luò),可以接收來自兩個現(xiàn)成的 2D 相機的圖像。神經(jīng)網(wǎng)絡(luò)高速處理它們,以亞毫米精度檢測和定位物體。通過設(shè)計,我們確保它也可以可靠地被動推斷深度(或三維),而不需要結(jié)構(gòu)光相機使用的主動照明。
4D視覺在機器人引導(dǎo)方面的優(yōu)勢
更快的捕捉
4D視覺技術(shù)圖像捕獲過程是同時完成的兩個 2D 快照,在正常光照條件下大約需要 20 毫秒。這與 3D 結(jié)構(gòu)光相機完成的 10-12 連拍形成對比。
視覺和機器人循環(huán)之間更好的重疊
如上所述,4D視覺的捕獲過程非常短,之后機器人就可以進入場景。這允許每次拾取低至 1.5 秒的完整機器人循環(huán)。而在結(jié)構(gòu)光相機的情況下,捕獲需要更長的時間并增加機器人的循環(huán)時間。
更快的處理
深度感知、物體識別和姿態(tài)估計是4D視覺神經(jīng)網(wǎng)絡(luò)推理的組成部分。圖像處理發(fā)生得非???,并且隨著圖形處理單元 (GPU) 速度的增加而變得更快。目前,我們的系統(tǒng)可以達到0.3秒的全視覺循環(huán)速度。
照明,照明,照明
“使用視覺時你最頭疼的是什么?”的答案似乎總是在照明。4D視覺在環(huán)境光照變化方面非常穩(wěn)健。它使用二維成像,光線越多越好。任何外部光源都會混淆需要結(jié)構(gòu)光的相機。一個很好的例子是自然光在一天中的不同時間照射到工廠車間的工廠。
面對具有挑戰(zhàn)性的材料,性能始終如一
與結(jié)構(gòu)光相機相比,4D視覺可以處理更多種類的材料。它不依賴于結(jié)構(gòu)光模式以及它如何反射回相機。因此,它可以處理透明、半透明甚至鏡面狀的物體。
2024-10-14 09:00
2024-10-14 08:59
2024-10-14 08:51
2024-10-14 08:50
2024-10-14 08:48
2024-10-14 08:46
2024-10-14 08:01
2024-10-13 12:07
2024-10-13 12:06
2024-10-13 12:05