

近年來(lái),人工智能領(lǐng)域廣泛活躍,除了對(duì)“機(jī)器崛起”的恐懼之外,不得不說(shuō)人工智能在很多方面都讓人們受益頗多。AI并沒(méi)有像人們擔(dān)心的那樣“接管”社會(huì),隨著數(shù)據(jù)存儲(chǔ)和處理能力的提升,AI無(wú)處不在,包括智慧工廠、智慧交通、智慧物流、智慧能源等。
人工智能技術(shù)的應(yīng)用將使機(jī)器視覺(jué)在很多場(chǎng)景下超越現(xiàn)有的解決方案,并能夠勝任更具挑戰(zhàn)性的應(yīng)用。其中,深度學(xué)習(xí)技術(shù)以其強(qiáng)大的影響力以及對(duì)視覺(jué)行業(yè)和AI領(lǐng)域的巨大影響,得到了眾多機(jī)器視覺(jué)專業(yè)人士的認(rèn)可。未來(lái)深度學(xué)習(xí)技術(shù)將在監(jiān)控、自動(dòng)駕駛、醫(yī)療診斷、智慧農(nóng)業(yè)等領(lǐng)域有更好的應(yīng)用。
深度學(xué)習(xí)
一種機(jī)器學(xué)習(xí)的技術(shù)
深度學(xué)習(xí)的概念對(duì)于機(jī)器視覺(jué)來(lái)說(shuō)相對(duì)較新,但對(duì)機(jī)器學(xué)習(xí)來(lái)說(shuō)絕對(duì)不是新概念。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種特殊類型,是人工智能的一種。
在短短幾年內(nèi),深度學(xué)習(xí)已經(jīng)在很多領(lǐng)域比任何傳統(tǒng)算法可以更好地對(duì)圖像進(jìn)行分類處理,而且可能很快就可以超越人工檢查。
深度學(xué)習(xí)軟件使用多層神經(jīng)網(wǎng)絡(luò),根據(jù)人類檢查員標(biāo)記的圖像來(lái)識(shí)別好圖像和壞圖像。這些數(shù)據(jù)集通常包含每個(gè)缺陷類型至少100個(gè)圖像,通過(guò)網(wǎng)絡(luò)訓(xùn)練,以創(chuàng)建一個(gè)模型,對(duì)每個(gè)輸入圖像中的對(duì)象進(jìn)行分類,并確保高水平的可預(yù)測(cè)性。
不得不說(shuō),深度學(xué)習(xí)為傳統(tǒng)的機(jī)器視覺(jué)技術(shù)帶來(lái)了希望,因?yàn)樗c使用基于規(guī)則方法的傳統(tǒng)圖像處理算法不同。在傳統(tǒng)的機(jī)器視覺(jué)中,需要手動(dòng)設(shè)計(jì)特征。
隨著工業(yè)自動(dòng)化水平的不斷提高, 傳統(tǒng)機(jī)器視覺(jué)邏輯簡(jiǎn)單的局限性,無(wú)法適用于隨機(jī)性強(qiáng)、特征復(fù)雜的工作任務(wù)。
無(wú)法預(yù)測(cè)模板中不存在的樣本
當(dāng)圖像模板不足以覆蓋可能出現(xiàn)的所有樣本時(shí),缺陷特征就很難通過(guò)提前設(shè)定的方式實(shí)現(xiàn)。
無(wú)法分析不規(guī)則、無(wú)規(guī)律的圖像
當(dāng)圖像不規(guī)則、無(wú)規(guī)律時(shí),很難按照經(jīng)驗(yàn)手動(dòng)設(shè)計(jì)特征,直接輸出映射關(guān)系。
然而,在深度學(xué)習(xí)中,我們的訓(xùn)練輸入不再是常規(guī)數(shù)據(jù),它可能是語(yǔ)言、對(duì)話語(yǔ)料庫(kù)、圖像或視頻。因此,深度學(xué)習(xí)的核心任務(wù)是找到一個(gè)能把我們的輸入轉(zhuǎn)化為正確輸出的模型。
目前,機(jī)器視覺(jué)用戶已經(jīng)可以在市場(chǎng)上找到深度學(xué)習(xí)系統(tǒng)軟件。例如,第一款深度學(xué)習(xí)工業(yè)圖像分析平臺(tái)-矩視智能低代碼平臺(tái),以人工智能技術(shù)為核心,為開(kāi)發(fā)者提供圖像采集、圖像標(biāo)注、算法開(kāi)發(fā)、算法封裝和應(yīng)用集成的一站式完整工具鏈。
相較于傳統(tǒng)機(jī)器視覺(jué)解決方案,深度學(xué)習(xí)的另一個(gè)優(yōu)點(diǎn)是可以減少開(kāi)發(fā)機(jī)器視覺(jué)程序所需的時(shí)間。通常來(lái)說(shuō),大多數(shù)機(jī)器視覺(jué)應(yīng)用程序需要60多天的軟件開(kāi)發(fā)和可行性測(cè)試,而采用矩視智能低代碼平臺(tái)10分鐘內(nèi)就可以完成開(kāi)發(fā)。
人工智能趨勢(shì)下深度學(xué)習(xí)如何拓展機(jī)器視覺(jué)AI在機(jī)器視覺(jué)中的適用性依賴于機(jī)器學(xué)習(xí)技術(shù),更準(zhǔn)確的說(shuō)是深度學(xué)習(xí)能力。從最廣泛的層面上來(lái)說(shuō),AI可以被定義為計(jì)算機(jī)模擬人類智能的能力。機(jī)器學(xué)習(xí)使計(jì)算機(jī)能夠在沒(méi)有明確編程的情況下進(jìn)行操作。而深度學(xué)習(xí),是機(jī)器學(xué)習(xí)的一個(gè)子領(lǐng)域,使計(jì)算機(jī)能夠從經(jīng)驗(yàn)中不斷學(xué)習(xí)。
此前,傳統(tǒng)的機(jī)器視覺(jué)系統(tǒng)使用一致且制造精良的零件可靠地執(zhí)行,隨著異常和缺陷庫(kù)的增長(zhǎng),應(yīng)用程序變得難以編程。對(duì)于需要人類視覺(jué)以及計(jì)算機(jī)速度和可靠性的復(fù)雜情況,深度學(xué)習(xí)將被證明是一個(gè)真正改變游戲規(guī)則的選擇。傳統(tǒng)的機(jī)器視覺(jué)系統(tǒng)依賴于放置在帶有特定光學(xué)元件的工業(yè)相機(jī)內(nèi)的數(shù)字傳感器獲取圖像,這些圖像被輸入PC,通過(guò)專門的軟件處理,分析,測(cè)量各種決策特征。機(jī)器視覺(jué)系統(tǒng)可靠、一致且保障制造精良的零件,但這些都需要通過(guò)逐步過(guò)濾和基于規(guī)則的算法運(yùn)行。一旦遇到檢測(cè)具有復(fù)雜表面紋理和外觀變化的視覺(jué)相似部件時(shí),對(duì)于傳統(tǒng)機(jī)器視覺(jué)來(lái)說(shuō)卻是一個(gè)嚴(yán)峻的挑戰(zhàn)。由于難以分離的多個(gè)變量(光照、顏色變化、曲率或視野),一些缺陷檢測(cè)難以用傳統(tǒng)的機(jī)器視覺(jué)系統(tǒng)編程來(lái)解決。在這里,深度學(xué)習(xí)帶來(lái)了更為合適的工具。
解決視覺(jué)應(yīng)用程序中傳統(tǒng)算法難以進(jìn)行編程的問(wèn)題。處理令人困惑的背景和零件外觀的變化。維護(hù)應(yīng)用程序并在工廠車間重新訓(xùn)練新的圖像數(shù)據(jù)。無(wú)需重新編程核心網(wǎng)絡(luò)即可適應(yīng)新的示例。
一個(gè)典型的工業(yè)例子:尋找電子設(shè)備屏幕上的劃痕。
這些缺陷在大小、范圍、位置或具有不同背景的屏幕之間都有所不同。考慮到這些變化,深度學(xué)習(xí)將檢測(cè)出壞的部分。此外,在一個(gè)新的目標(biāo)上訓(xùn)練網(wǎng)絡(luò)就像拍攝一組新的參考圖片一樣簡(jiǎn)單。隨著制造商需要更智能,準(zhǔn)確和可重復(fù)的視覺(jué)系統(tǒng),深度學(xué)習(xí)軟件越來(lái)越受歡迎,終端用戶最收益的軟件一般會(huì)具有這幾點(diǎn)特征:可以在幾分鐘內(nèi)自動(dòng)編程視覺(jué)系統(tǒng)、專為難以解決的應(yīng)用而設(shè)計(jì)、更易于配置、容忍變化。目前市面上基于人工智能技術(shù)的平臺(tái)并不是很多,矩視智能低代碼平臺(tái)是將傳統(tǒng)PC-Based的軟件形態(tài),升級(jí)為云端SaaS形態(tài),并在行業(yè)內(nèi)大范圍積累數(shù)據(jù),并運(yùn)用數(shù)據(jù)讓產(chǎn)品更加“傻瓜化”,進(jìn)一步降低機(jī)器視覺(jué)的使用門檻,以此良性循環(huán)。
隨著AI在機(jī)器視覺(jué)方面的興起,該技術(shù)將適用于更多的檢測(cè)任務(wù),最終超越工業(yè)自動(dòng)化領(lǐng)域。而深度學(xué)習(xí)在醫(yī)療、生命科學(xué)、食品、假冒檢驗(yàn)和木材分級(jí)等行業(yè)都將有很好的發(fā)展前景。許多機(jī)器視覺(jué)專業(yè)人士已經(jīng)認(rèn)識(shí)到AI和深度學(xué)習(xí)將對(duì)視覺(jué)行業(yè)帶來(lái)重要的影響,但他們認(rèn)為AI的全部潛力可能至少要在3到5年之后才會(huì)爆發(fā)。此外,AI也并不是解決所有傳統(tǒng)機(jī)器視覺(jué)和圖像處理問(wèn)題的唯一方法。AI系統(tǒng)的兩個(gè)主要缺點(diǎn),首先,需要大量的培訓(xùn),需要?jiǎng)?chuàng)建專家團(tuán)隊(duì),成本較高,耗時(shí)較長(zhǎng)。其次,一旦被訓(xùn)練完,發(fā)現(xiàn)分類失敗,就很難解決這個(gè)問(wèn)題。所以,雖然人工智能在機(jī)器視覺(jué)中變得越來(lái)越普遍,但也應(yīng)該根據(jù)企業(yè)自身的情況有側(cè)重的發(fā)展。

