趨勢(shì) | 深度學(xué)習(xí)時(shí)代的機(jī)器視覺(jué) 正成為視覺(jué)AI的“新寵兒”！

2022-05-16 11:05 性質(zhì)：轉(zhuǎn)載作者：矩視智能來(lái)源：矩視智能

免責(zé)聲明：AGV網(wǎng)（m.wnmc.org.cn)尊重合法版權(quán)，反對(duì)侵權(quán)盜版。（凡是我網(wǎng)所轉(zhuǎn)載之文章，文中所有文字內(nèi)容和圖片視頻之知識(shí)產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀點(diǎn)，與本網(wǎng)無(wú)關(guān)。如有需要?jiǎng)h除，敬請(qǐng)來(lái)電商榷?。?/div>

近年來(lái)，人工智能領(lǐng)域廣泛活躍，除了對(duì)“機(jī)器崛起”的恐懼之外，不得不說(shuō)人工智能在很多方面都讓人們受益頗多。AI并沒(méi)有像人們擔(dān)心的那樣“接管”社會(huì)，隨著數(shù)據(jù)存儲(chǔ)和處理能力的提升，AI無(wú)處不在...

近年來(lái)，人工智能領(lǐng)域廣泛活躍，除了對(duì)“機(jī)器崛起”的恐懼之外，不得不說(shuō)人工智能在很多方面都讓人們受益頗多。AI并沒(méi)有像人們擔(dān)心的那樣“接管”社會(huì)，隨著數(shù)據(jù)存儲(chǔ)和處理能力的提升，AI無(wú)處不在，包括智慧工廠、智慧交通、智慧物流、智慧能源等。

人工智能技術(shù)的應(yīng)用將使機(jī)器視覺(jué)在很多場(chǎng)景下超越現(xiàn)有的解決方案，并能夠勝任更具挑戰(zhàn)性的應(yīng)用。其中，深度學(xué)習(xí)技術(shù)以其強(qiáng)大的影響力以及對(duì)視覺(jué)行業(yè)和AI領(lǐng)域的巨大影響，得到了眾多機(jī)器視覺(jué)專業(yè)人士的認(rèn)可。未來(lái)深度學(xué)習(xí)技術(shù)將在監(jiān)控、自動(dòng)駕駛、醫(yī)療診斷、智慧農(nóng)業(yè)等領(lǐng)域有更好的應(yīng)用。

深度學(xué)習(xí)

一種機(jī)器學(xué)習(xí)的技術(shù)

深度學(xué)習(xí)的概念對(duì)于機(jī)器視覺(jué)來(lái)說(shuō)相對(duì)較新，但對(duì)機(jī)器學(xué)習(xí)來(lái)說(shuō)絕對(duì)不是新概念。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種特殊類型，是人工智能的一種。

在短短幾年內(nèi)，深度學(xué)習(xí)已經(jīng)在很多領(lǐng)域比任何傳統(tǒng)算法可以更好地對(duì)圖像進(jìn)行分類處理，而且可能很快就可以超越人工檢查。

深度學(xué)習(xí)軟件使用多層神經(jīng)網(wǎng)絡(luò)，根據(jù)人類檢查員標(biāo)記的圖像來(lái)識(shí)別好圖像和壞圖像。這些數(shù)據(jù)集通常包含每個(gè)缺陷類型至少100個(gè)圖像，通過(guò)網(wǎng)絡(luò)訓(xùn)練，以創(chuàng)建一個(gè)模型，對(duì)每個(gè)輸入圖像中的對(duì)象進(jìn)行分類，并確保高水平的可預(yù)測(cè)性。

不得不說(shuō)，深度學(xué)習(xí)為傳統(tǒng)的機(jī)器視覺(jué)技術(shù)帶來(lái)了希望，因?yàn)樗c使用基于規(guī)則方法的傳統(tǒng)圖像處理算法不同。在傳統(tǒng)的機(jī)器視覺(jué)中，需要手動(dòng)設(shè)計(jì)特征。

隨著工業(yè)自動(dòng)化水平的不斷提高，傳統(tǒng)機(jī)器視覺(jué)邏輯簡(jiǎn)單的局限性，無(wú)法適用于隨機(jī)性強(qiáng)、特征復(fù)雜的工作任務(wù)。

無(wú)法預(yù)測(cè)模板中不存在的樣本

當(dāng)圖像模板不足以覆蓋可能出現(xiàn)的所有樣本時(shí)，缺陷特征就很難通過(guò)提前設(shè)定的方式實(shí)現(xiàn)。

無(wú)法分析不規(guī)則、無(wú)規(guī)律的圖像

當(dāng)圖像不規(guī)則、無(wú)規(guī)律時(shí)，很難按照經(jīng)驗(yàn)手動(dòng)設(shè)計(jì)特征，直接輸出映射關(guān)系。

然而，在深度學(xué)習(xí)中，我們的訓(xùn)練輸入不再是常規(guī)數(shù)據(jù)，它可能是語(yǔ)言、對(duì)話語(yǔ)料庫(kù)、圖像或視頻。因此，深度學(xué)習(xí)的核心任務(wù)是找到一個(gè)能把我們的輸入轉(zhuǎn)化為正確輸出的模型。

目前，機(jī)器視覺(jué)用戶已經(jīng)可以在市場(chǎng)上找到深度學(xué)習(xí)系統(tǒng)軟件。例如，第一款深度學(xué)習(xí)工業(yè)圖像分析平臺(tái)-矩視智能低代碼平臺(tái)，以人工智能技術(shù)為核心，為開發(fā)者提供圖像采集、圖像標(biāo)注、算法開發(fā)、算法封裝和應(yīng)用集成的一站式完整工具鏈。

相較于傳統(tǒng)機(jī)器視覺(jué)解決方案，深度學(xué)習(xí)的另一個(gè)優(yōu)點(diǎn)是可以減少開發(fā)機(jī)器視覺(jué)程序所需的時(shí)間。通常來(lái)說(shuō)，大多數(shù)機(jī)器視覺(jué)應(yīng)用程序需要60多天的軟件開發(fā)和可行性測(cè)試，而采用矩視智能低代碼平臺(tái)10分鐘內(nèi)就可以完成開發(fā)。

人工智能趨勢(shì)下深度學(xué)習(xí)如何拓展機(jī)器視覺(jué)AI在機(jī)器視覺(jué)中的適用性依賴于機(jī)器學(xué)習(xí)技術(shù)，更準(zhǔn)確的說(shuō)是深度學(xué)習(xí)能力。從最廣泛的層面上來(lái)說(shuō)，AI可以被定義為計(jì)算機(jī)模擬人類智能的能力。機(jī)器學(xué)習(xí)使計(jì)算機(jī)能夠在沒(méi)有明確編程的情況下進(jìn)行操作。而深度學(xué)習(xí)，是機(jī)器學(xué)習(xí)的一個(gè)子領(lǐng)域，使計(jì)算機(jī)能夠從經(jīng)驗(yàn)中不斷學(xué)習(xí)。

此前，傳統(tǒng)的機(jī)器視覺(jué)系統(tǒng)使用一致且制造精良的零件可靠地執(zhí)行，隨著異常和缺陷庫(kù)的增長(zhǎng)，應(yīng)用程序變得難以編程。對(duì)于需要人類視覺(jué)以及計(jì)算機(jī)速度和可靠性的復(fù)雜情況，深度學(xué)習(xí)將被證明是一個(gè)真正改變游戲規(guī)則的選擇。傳統(tǒng)的機(jī)器視覺(jué)系統(tǒng)依賴于放置在帶有特定光學(xué)元件的工業(yè)相機(jī)內(nèi)的數(shù)字傳感器獲取圖像，這些圖像被輸入PC，通過(guò)專門的軟件處理，分析，測(cè)量各種決策特征。機(jī)器視覺(jué)系統(tǒng)可靠、一致且保障制造精良的零件，但這些都需要通過(guò)逐步過(guò)濾和基于規(guī)則的算法運(yùn)行。一旦遇到檢測(cè)具有復(fù)雜表面紋理和外觀變化的視覺(jué)相似部件時(shí)，對(duì)于傳統(tǒng)機(jī)器視覺(jué)來(lái)說(shuō)卻是一個(gè)嚴(yán)峻的挑戰(zhàn)。由于難以分離的多個(gè)變量(光照、顏色變化、曲率或視野)，一些缺陷檢測(cè)難以用傳統(tǒng)的機(jī)器視覺(jué)系統(tǒng)編程來(lái)解決。在這里，深度學(xué)習(xí)帶來(lái)了更為合適的工具。

解決視覺(jué)應(yīng)用程序中傳統(tǒng)算法難以進(jìn)行編程的問(wèn)題。處理令人困惑的背景和零件外觀的變化。維護(hù)應(yīng)用程序并在工廠車間重新訓(xùn)練新的圖像數(shù)據(jù)。無(wú)需重新編程核心網(wǎng)絡(luò)即可適應(yīng)新的示例。

一個(gè)典型的工業(yè)例子：尋找電子設(shè)備屏幕上的劃痕。

這些缺陷在大小、范圍、位置或具有不同背景的屏幕之間都有所不同?？紤]到這些變化，深度學(xué)習(xí)將檢測(cè)出壞的部分。此外，在一個(gè)新的目標(biāo)上訓(xùn)練網(wǎng)絡(luò)就像拍攝一組新的參考圖片一樣簡(jiǎn)單。隨著制造商需要更智能，準(zhǔn)確和可重復(fù)的視覺(jué)系統(tǒng)，深度學(xué)習(xí)軟件越來(lái)越受歡迎，終端用戶最收益的軟件一般會(huì)具有這幾點(diǎn)特征：可以在幾分鐘內(nèi)自動(dòng)編程視覺(jué)系統(tǒng)、專為難以解決的應(yīng)用而設(shè)計(jì)、更易于配置、容忍變化。目前市面上基于人工智能技術(shù)的平臺(tái)并不是很多，矩視智能低代碼平臺(tái)是將傳統(tǒng)PC-Based的軟件形態(tài)，升級(jí)為云端SaaS形態(tài)，并在行業(yè)內(nèi)大范圍積累數(shù)據(jù)，并運(yùn)用數(shù)據(jù)讓產(chǎn)品更加“傻瓜化”，進(jìn)一步降低機(jī)器視覺(jué)的使用門檻，以此良性循環(huán)。

挑戰(zhàn)與未來(lái)

隨著AI在機(jī)器視覺(jué)方面的興起，該技術(shù)將適用于更多的檢測(cè)任務(wù)，最終超越工業(yè)自動(dòng)化領(lǐng)域。而深度學(xué)習(xí)在醫(yī)療、生命科學(xué)、食品、假冒檢驗(yàn)和木材分級(jí)等行業(yè)都將有很好的發(fā)展前景。許多機(jī)器視覺(jué)專業(yè)人士已經(jīng)認(rèn)識(shí)到AI和深度學(xué)習(xí)將對(duì)視覺(jué)行業(yè)帶來(lái)重要的影響，但他們認(rèn)為AI的全部潛力可能至少要在3到5年之后才會(huì)爆發(fā)。此外，AI也并不是解決所有傳統(tǒng)機(jī)器視覺(jué)和圖像處理問(wèn)題的唯一方法。AI系統(tǒng)的兩個(gè)主要缺點(diǎn)，首先，需要大量的培訓(xùn)，需要?jiǎng)?chuàng)建專家團(tuán)隊(duì)，成本較高，耗時(shí)較長(zhǎng)。其次，一旦被訓(xùn)練完，發(fā)現(xiàn)分類失敗，就很難解決這個(gè)問(wèn)題。所以，雖然人工智能在機(jī)器視覺(jué)中變得越來(lái)越普遍，但也應(yīng)該根據(jù)企業(yè)自身的情況有側(cè)重的發(fā)展。