工業(yè)自動化離不開感知技術和運動控制技術,就像人離不開眼睛和大腦,可想而知,視覺感知技術一定是工業(yè)自動化領域最重要的技術之一。而深度學習可謂是視覺感知技術中的“黑馬”,它的應用使機器視覺在很多場景下超越現(xiàn)有解決方案,并能夠勝任更具挑戰(zhàn)性的任務,因此近年來在工業(yè)視覺領域掀起應用熱潮。
工業(yè)自動化趨勢下的一匹“黑馬”
機器視覺作為一種基于2D或3D相機傳感器的工業(yè)自動化技術,在工業(yè)視覺領域具有廣泛而成熟的應用,如字符識別、質量檢測、產品測量等。而在眾多的應用場景中,機器視覺系統(tǒng)要完成任務必須對工業(yè)相機等硬件設備生成的待檢測產品的圖像進行分類。在深度學習還未在工業(yè)領域廣泛應用前,這一環(huán)節(jié)通常是由工程師編寫相應算法提取圖像特征來實現(xiàn),也就是常說的傳統(tǒng)計算機視覺技術。
在使用傳統(tǒng)視覺技術進行圖像分類時,需要用到特征提取步驟,特征即圖像中描述性或信息性的小圖像塊。要完成這一步,工程師需要運用多種算法,如邊緣檢測算法、角點檢測算法、閾值分割算法等等。從圖像中提取出足夠多的特征后,根據(jù)這些特征形成每個目標類別的定義,即“詞袋”。再與其它圖像中所提取的特征相對比,如果在一張圖像中找到了另一張圖像詞袋中的絕大多數(shù)特征,則該圖像包含同樣的目標。
這類算法時至今日的應用性依然很廣泛,但其硬傷在于必須選擇需要查找圖像中的哪些特征。而當圖像中存在很多個類別時,就會變得復雜難以分類,只有使用不同的特征才可以更好地描述不同類別的對象。但如果使用很多特征,就必須對大量的參數(shù)進行微調。這一繁復的工作需要消耗大量工時。因此,傳統(tǒng)機器視覺技術只適用于模型匹配、測量、字符識別等一些簡單的應用場景。
隨著工業(yè)自動化水平的要求不斷提高,傳統(tǒng)機器視覺已無法適用當下隨機性強、特征復雜的工業(yè)檢測任務。面對一些具有復雜特征的產品圖像檢測,如缺陷種類多、類別多樣、大小不一等,傳統(tǒng)機器視覺技術愛莫能助,但深度學習技術卻可以一展身手。
“深度學習以系統(tǒng)神經網(wǎng)絡為基礎,不再通過算法來搜索特定特征,而是訓練深度學習系統(tǒng)內的神經網(wǎng)絡,通過學習各零部件的形態(tài)特征,建立包含零部件特征的深度學習模型,能夠快速定位識別不同組件,具有可重復性和可擴展性?!睂W⒂跈C器視覺技術研發(fā)的浙江深眸科技有限公司的技術專家說道。
相較于傳統(tǒng)機器視覺解決方案,深度學習的又一大優(yōu)點在于可以縮短項目技術的研發(fā)時間。通常情況下,大多數(shù)機器視覺應用程序需要兩個月時間來進行軟件開發(fā)和可行性測試,而采用集合了多種深度學習算法的機器視覺軟件開發(fā)平臺則只需要十分鐘,如深眸科技自主研發(fā)的輕轍視覺引擎,以深度學習算法為核心,企業(yè)只需投入一位開發(fā)人員即可在短時間內完成項目部署。
運用深度學習算法,企業(yè)能夠大幅壓縮項目開發(fā)的時間成本和人工成本,加之適用于眾多使用場景,短短數(shù)年,深度學習已經在眾多領域擊敗傳統(tǒng)算法,成為工業(yè)領域主流應用的圖像分類處理方法。
深度學習如何解決復雜特征問題?
深度學習給計算機視覺和人工智能領域帶來了革命性突破,在圖像分析上,許多曾經對于傳統(tǒng)計算機視覺來說的棘手難題,現(xiàn)在深度學習可以解決的比人類識別效果還要優(yōu)秀。
究其原因,很大程度上是因為深度學習引入了“端到端學習”這一概念。簡而言之,就是讓機器在每個特定類別的對象中學習尋找最具描述性、最突出的特征,繼而讓神經網(wǎng)絡自己去發(fā)現(xiàn)各種類型圖像中的潛在模式?;诖耍こ處煵辉傩枰謩記Q定采用哪種傳統(tǒng)算法來描述特征,只需要“喂”給深度學習算法足夠多的圖像。
深眸科技的技術專家這樣解釋“如果你想教會一個深度神經網(wǎng)絡識別一只貓,你不必告訴它去尋找貓的眼睛、毛發(fā)、四肢等特征,只需要把成千上萬張貓的圖像展示給它,它自己就能解決。如果它總是把狐貍當成貓,也不需要重新編寫代碼,繼續(xù)進行訓練就行了?!?/p>
舉個例子,深眸科技在為一家大型家電生產商提供配件防錯漏檢測解決方案中。在檢測過程中,由于家電配件種類多,組合隨機性較大,且不同零件在結構、顏色、材質上有較大差異,還有可能存在遮擋、背景同色等干擾。這種情況,傳統(tǒng)計算機視覺算法難以應對自如,但深度學習算法經過大量訓練已經形成包含各配件特征的深度學習模型,可以輕松應對上述復雜情況,且識別準確率高達99.9%。
隨著我國制造業(yè)的不斷發(fā)展壯大,各大生產企業(yè)急需更智能、準確和可重復的視覺檢測系統(tǒng)。需求的驅動以及準確度高、應用場景廣泛等優(yōu)勢加持,可以預見,在醫(yī)療、食品、半導體等行業(yè),深度學習算法都將有光明的應用前景。需要注意的是,深度學習雖有眾多優(yōu)勢,但這并不意味著傳統(tǒng)計算機視覺算法的沒落,在不同應用領域,傳統(tǒng)算法和深度學習各有優(yōu)勢,強強聯(lián)手才能更好的賦能工業(yè)檢測。