人工智能視覺,就像用人工智能進(jìn)行圖像處理一樣,是一個(gè)高度討論的話題。然而,這種復(fù)雜的新技術(shù)的潛力還沒有在某些領(lǐng)域找到應(yīng)用,如工業(yè)應(yīng)用;因此,長期的經(jīng)驗(yàn)值是有限的。
圖片來源:IDS Imaging Development Systems GmbH
盡管市場上有許多允許在工業(yè)環(huán)境中使用人工智能的嵌入式視覺系統(tǒng),但許多設(shè)施運(yùn)營商仍在猶豫是否要投資這些平臺之一并更新其應(yīng)用。然而,人工智能已經(jīng)展示了創(chuàng)新的可能性,在基于規(guī)則的圖像處理已經(jīng)沒有選擇,缺乏解決方案的地方。因此,問題是,是什么阻礙了這項(xiàng)新技術(shù)的廣泛采用。
阻礙技術(shù)的主要因素之一是被稱為 "用戶友好性 "的障礙。任何人都應(yīng)該能夠創(chuàng)建自己的基于人工智能的圖像處理應(yīng)用程序,即使他們?nèi)狈θ斯ぶ悄芎蛻?yīng)用程序編程方面的專業(yè)知識。雖然人工智能可以加快各種工作流程并減少錯(cuò)誤來源,但邊緣計(jì)算可以消除昂貴的工業(yè)計(jì)算機(jī)和高速圖像數(shù)據(jù)傳輸所需的復(fù)雜基礎(chǔ)設(shè)施。
新的和不同的
然而,人工智能或機(jī)器學(xué)習(xí)(ML)的運(yùn)作方式與傳統(tǒng)的、基于規(guī)則的圖像處理相當(dāng)不同。這對如何接近和處理圖像處理任務(wù)有影響。
結(jié)果的質(zhì)量不再像以前那樣由圖像處理專家手動生成的程序代碼控制,而是由采用足夠圖像數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程控制。
換句話說,必須檢查的物體特征不再由指令預(yù)先定義,而是必須通過訓(xùn)練過程教給人工智能。此外,訓(xùn)練數(shù)據(jù)越多樣化,人工智能/ML算法就越有可能識別出以后操作中特別相關(guān)的品質(zhì)。
有了足夠的知識和經(jīng)驗(yàn),看似簡單的事情也能達(dá)到預(yù)期的目標(biāo)。如果用戶對相關(guān)的圖像數(shù)據(jù)沒有經(jīng)過訓(xùn)練的眼睛,這個(gè)應(yīng)用就會出現(xiàn)錯(cuò)誤。這意味著使用機(jī)器學(xué)習(xí)方法所需的能力與基于規(guī)則的圖像處理所需的能力不同。
此外,不是每個(gè)人都有時(shí)間或資源來從底層潛入這個(gè)主題,并發(fā)展一套新的基本技能來處理機(jī)器學(xué)習(xí)方法。新技術(shù)的最大問題是透明度。如果它們能以較低的努力提供出色的結(jié)果,但卻不能輕易檢查,例如通過審查代碼,那么就很難相信和信任這樣的系統(tǒng)。
復(fù)雜且被誤解
邏輯思維表明,人們可能有興趣了解這種 AI 視覺是如何工作的。然而,如果沒有明確理解的可靠解釋,評估結(jié)果是困難的。獲得對新技術(shù)的信心通常建立在必須隨著時(shí)間的推移積累的技能和經(jīng)驗(yàn)之上,然后才能了解技術(shù)可以實(shí)現(xiàn)的全部潛力、它如何工作、如何應(yīng)用它以及如何適當(dāng)?shù)毓芾硭?/p>
讓事情變得更具挑戰(zhàn)性的是人工智能愿景正在與一個(gè)既定系統(tǒng)競爭的概念,近年來通過知識、培訓(xùn)、文檔、軟件、硬件和開發(fā)環(huán)境的實(shí)施,已經(jīng)為此創(chuàng)造了必要的環(huán)境條件。
缺乏對算法內(nèi)部工作原理的清晰洞察,以及難以理解的結(jié)果,是阻礙其擴(kuò)展的另一面。
(不是)黑匣子
神經(jīng)網(wǎng)絡(luò)有時(shí)會被誤解為一個(gè)無法理解判斷的黑匣子。
盡管 DL 模型無疑是復(fù)雜的,但它們并不是黑匣子。其實(shí),叫它們玻璃盒子更準(zhǔn)確,因?yàn)槲覀兛梢詮淖置嫔峡蠢锩妫纯疵總€(gè)部件在做什么。
機(jī)器學(xué)習(xí)中的黑匣子隱喻
神經(jīng)網(wǎng)絡(luò)推理決策不是基于一套傳統(tǒng)的規(guī)則,它們的人工神經(jīng)元之間的動態(tài)相互作用起初可能對人類來說具有挑戰(zhàn)性,但它們?nèi)匀皇菙?shù)學(xué)系統(tǒng)的明確結(jié)果,因此可重現(xiàn)且易于解釋。
目前缺乏的是促進(jìn)適當(dāng)評估的必要工具。人工智能的這個(gè)領(lǐng)域有很多進(jìn)步的機(jī)會。這也顯示了市場上可用的不同人工智能系統(tǒng)如何幫助用戶實(shí)現(xiàn)他們的目標(biāo)。
軟件讓人工智能變得可解釋
IDS Imaging Development GmbH 專注于開發(fā)這一領(lǐng)域。IDS NXT 推理相機(jī)系統(tǒng)就是這樣的成果之一。使用所謂的混淆矩陣進(jìn)行統(tǒng)計(jì)調(diào)查可以構(gòu)建和解釋經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)的整體質(zhì)量。
在訓(xùn)練過程之后,可以使用先前確定的一組具有已知結(jié)果的圖像來驗(yàn)證網(wǎng)絡(luò)。在表格中,比較了預(yù)期結(jié)果和通過推理獲得的實(shí)際結(jié)果。這解釋了測試對象被成功或錯(cuò)誤識別為每個(gè)訓(xùn)練對象類別的頻率。隨后可以根據(jù)生成的命中率提供經(jīng)過訓(xùn)練的算法的一般質(zhì)量。
此外,該矩陣清楚地說明了識別精度在哪些方面可能仍不足以滿足生產(chǎn)應(yīng)用。但是,它沒有對這一結(jié)果提供詳細(xì)的解釋。
圖 1.分類螺絲的混淆矩陣顯示了可以通過使用更多圖像進(jìn)行再訓(xùn)練來提高識別質(zhì)量的地方。圖片來源:IDS Imaging Development Systems GmbH
在這種情況下,注意力圖很有用,因?yàn)樗@示了一種熱圖,指示神經(jīng)網(wǎng)絡(luò)關(guān)注并用于指導(dǎo)決策的區(qū)域或圖像內(nèi)容。
這種可視化形式貫穿于 AI Vision Studio IDS NXT 燈塔的整個(gè)培訓(xùn)過程,與整個(gè)培訓(xùn)過程中建立的決策路徑相關(guān);這使網(wǎng)絡(luò)能夠在分析仍在進(jìn)行的同時(shí)從每個(gè)圖像構(gòu)建熱圖。
這表明人工智能的基本或無法解釋的行為更容易掌握,從而促進(jìn)工業(yè)環(huán)境中對神經(jīng)網(wǎng)絡(luò)的更大接受度。
它還可用于識別和消除數(shù)據(jù)偏差,這些偏差會導(dǎo)致神經(jīng)網(wǎng)絡(luò)在推理過程中做出錯(cuò)誤的決定(見圖“注意力圖”)。
糟糕的輸入導(dǎo)致糟糕的輸出。人工智能系統(tǒng)識別模式和估計(jì)結(jié)果的能力取決于獲取相關(guān)數(shù)據(jù),從中可以學(xué)習(xí)“正確的行為”。
如果 AI 在實(shí)驗(yàn)室中設(shè)計(jì)時(shí)使用的數(shù)據(jù)不是未來應(yīng)用的典型數(shù)據(jù),或者更糟的是,如果數(shù)據(jù)中的模式暗示存在偏差,則系統(tǒng)將獲取并應(yīng)用這些先入之見。
圖 2.此熱圖顯示了典型的數(shù)據(jù)偏差。熱圖顯示了對香蕉的 Chiquita 標(biāo)簽的高度關(guān)注,因此是數(shù)據(jù)偏差的一個(gè)很好的例子。通過香蕉的虛假或代表性不足的訓(xùn)練圖像,所使用的 CNN 顯然了解到這個(gè) Chiquita 標(biāo)簽總是暗示香蕉。圖片來源:IDS Imaging Development Systems GmbH
軟件工具允許用戶追蹤 AI 視覺的行為和結(jié)果,并將其直接關(guān)聯(lián)回訓(xùn)練數(shù)據(jù)集中的弱點(diǎn),并根據(jù)需要以有針對性的方式進(jìn)行調(diào)整。這使得每個(gè)人都更容易理解和解釋人工智能,因?yàn)樗举|(zhì)上只是統(tǒng)計(jì)和數(shù)學(xué)。
理解數(shù)學(xué)并在算法中理解它并不總是那么簡單,但是像混淆矩陣和熱圖這樣的工具可以使決策和對決策的解釋可見并因此易于理解。
這只是開始
人工智能視覺在有效使用時(shí)能夠增強(qiáng)各種視覺過程。然而,僅靠硬件和軟件不足以讓行業(yè)擁抱人工智能。制造商經(jīng)常被要求以用戶友好的軟件和指導(dǎo)個(gè)人的內(nèi)置程序的形式分享他們的知識。
人工智能要趕上基于規(guī)則的成像應(yīng)用領(lǐng)域的最佳實(shí)踐還有很長的路要走,這是多年努力和應(yīng)用的結(jié)果,通過廣泛的文檔、知識轉(zhuǎn)移和多種軟件建立忠實(shí)的客戶群工具。好消息是,此類人工智能系統(tǒng)和支持工具已經(jīng)在開發(fā)中。
目前還正在建立標(biāo)準(zhǔn)和認(rèn)證,以提高可接受性并使理解 AI 變得足夠簡單以呈現(xiàn)在大桌子上。IDS 正在為此提供協(xié)助。
借助 IDS NXT,任何用戶組都可以快速有效地將集成 AI 系統(tǒng)用作工業(yè)工具——即使沒有廣泛了解圖像處理、機(jī)器學(xué)習(xí)或應(yīng)用程序編程。
2024-11-05 12:30
2024-11-03 08:35
2024-11-02 08:58
2024-10-30 10:21
2024-10-30 10:14
2024-10-29 09:48
2024-10-28 08:36
2024-10-28 08:21
2024-10-26 11:08
2024-10-26 10:09