工程機械廠家自動識別系統(tǒng)研究
時間:2022-09-25 11:30:17
導語:工程機械廠家自動識別系統(tǒng)研究一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:工程機械在施工的過程中,需要加強機械設(shè)備的統(tǒng)一管理,因而建立和健全機械設(shè)備的統(tǒng)計管理制度至關(guān)重要。對此,本文設(shè)計研究了一種用于工程機械廠家的圖像識別系統(tǒng),該系統(tǒng)使用matlab構(gòu)建alexnet遷移學習模型對工程機械廠家數(shù)據(jù)集進行訓練,通過對工程機械目標的外觀和標志為特征進行訓練,以達到提高施工現(xiàn)場機械設(shè)備調(diào)度效率的目的。
關(guān)鍵詞:深度學習;系統(tǒng)開發(fā);工程機械
工程機械行業(yè)的產(chǎn)業(yè)升級對國家基礎(chǔ)建設(shè)的發(fā)展至關(guān)重要。但是,現(xiàn)在存在的問題就是現(xiàn)在有的工程項目在施工時,當參與建設(shè)的施工設(shè)備過多時,就會產(chǎn)生設(shè)備調(diào)度和管理無序的情況。因此,設(shè)計一套用于工程機械廠家的圖像識別系統(tǒng),對于實現(xiàn)我國工程機械的施工統(tǒng)一管理具有重要的意義。對此,本文選定alexnet深度學習網(wǎng)絡(luò)進行訓練,通過不斷調(diào)試深度學習模型的層次、丟失層丟失率、學習率、訓練步數(shù)等參數(shù),探討不同深度的特征提取網(wǎng)絡(luò)對識別效果的影響。
1圖像識別網(wǎng)絡(luò)模型的選用
合適的識別網(wǎng)絡(luò)對于系統(tǒng)的構(gòu)建極為重要,由于本文所使用的工程機械的圖像數(shù)據(jù)集規(guī)模較小,所以要求網(wǎng)絡(luò)具有良好的特征學習能力。對此針對實驗的實際的情況和識別算法的可行性在經(jīng)過對現(xiàn)有主流的圖像分類方法分析后,發(fā)現(xiàn)Alexnet和vgg16網(wǎng)絡(luò)在訓練速度和精度方面都有著不俗的效果。本文主要以Alexnet作為實驗的基礎(chǔ)框架,并將其與層次較深的vgg16網(wǎng)絡(luò)進行了簡單對比。
2圖像樣本數(shù)據(jù)集建立
良好的圖像樣本數(shù)據(jù)庫對于圖像識別網(wǎng)絡(luò)的分析極為重要,在進行數(shù)據(jù)庫構(gòu)建時,其中主要有數(shù)據(jù)集的構(gòu)建、圖像數(shù)據(jù)集的標簽化處理、圖像數(shù)據(jù)集歸一化、圖像數(shù)據(jù)集擴充、圖像數(shù)據(jù)集的劃分。(1)數(shù)據(jù)集構(gòu)建。數(shù)據(jù)集共含有18家工程機械廠家,共計900張,基本涵蓋了目前市面上的常見主流工程機械廠家。為了保證識別的精度,每個圖像中僅有一或兩輛工程機械,并且圖像中的廠家特征沒有重疊或損壞。(2)圖像數(shù)據(jù)集的標簽化處理。由于深度學習算法需要采用有標簽的樣本圖片進行訓練,而本文采集的工程機械圖像是無標簽的,因此,需要對樣本圖像進行打標簽處理。使用matlab內(nèi)置的app“imagelabeler”對廠家圖像進行人工標定,將標定完的含有標簽信息的mat文件保存在特定的文件夾,隨后批量將mat文件導出為.jpg標簽圖片,保存訓練樣本圖片用于廠家識別網(wǎng)絡(luò)的訓練。(3)圖像數(shù)據(jù)集歸一化。在深度學習模型中的輸入樣本來自imagelabeler裁剪出來的圖像,因此,存在裁剪的圖像大小不一致的問題,而因為AlexNet模型要求圖像的輸入尺寸為227×227×3,VGG16的要求為224×224×3,所以需要進行歸一化處理,將數(shù)據(jù)集的圖像尺寸統(tǒng)一。(4)圖像數(shù)據(jù)集擴充。為了獲得更好的訓練效果,提高識別精度,應(yīng)使數(shù)據(jù)集的規(guī)模盡可能地大,這樣網(wǎng)絡(luò)能學習到更多的特征,訓練出的模型效果更好,因此,數(shù)據(jù)增強成為一種非常便捷的數(shù)據(jù)集擴充途徑。本文采取的數(shù)據(jù)增強途徑有旋轉(zhuǎn)、鏡像、添加噪聲,以此通過較小的人工采集工作量獲得大量的數(shù)據(jù)樣本。(5)圖像數(shù)據(jù)集的劃分。按照網(wǎng)絡(luò)的訓練步驟,在訓練開始前,需要將樣本數(shù)據(jù)集劃分為訓練集和測試集兩部分,由于樣本數(shù)據(jù)集較小,為了保證訓練效果將訓練集的比例增大,測試集的比例減小,將訓練集和測試集按照4:1的比例進行劃分,規(guī)定每種廠家的樣本圖片中4/5為訓練集,1/5為測試集。其中,訓練集作為網(wǎng)絡(luò)的訓練提供數(shù)據(jù)支持,測試集用于在訓練完成后對模型的識別精度進行檢測和自我評估。
3模型訓練以及數(shù)據(jù)對比
(1)模型的訓練結(jié)果。對模型的訓練選擇使用遷移學習,采用ImageNet數(shù)據(jù)集上進行過預訓練的AlexNet網(wǎng)絡(luò)模型,將自建的樣本數(shù)據(jù)集輸入網(wǎng)絡(luò)的最后三層,新模型預訓練后其收斂速度得到了極大提升。采用遷移學習方法訓練得到網(wǎng)絡(luò)模型的識別精度更高,訓練效果更好。通過對alexnet遷移學習后的網(wǎng)絡(luò)進行主要參數(shù)的不斷對比調(diào)試,得到了11組不同參數(shù)下的網(wǎng)絡(luò)模型,第一組為訓練網(wǎng)絡(luò)的最佳結(jié)果,準確率為87.89%。具體如表1所示。(2)使用不同網(wǎng)絡(luò)模型的對比實驗,本節(jié)中分別使用alexnet和vgg16模型進行訓練,為防止訓練參數(shù)變化以及不同數(shù)據(jù)集對訓練結(jié)果的影響,在對比實驗中,兩次的訓練學習使用了相同的參數(shù)和數(shù)據(jù)集,訓練結(jié)果如圖1所示。圖1由實驗結(jié)果可知,使用相同網(wǎng)絡(luò)和參數(shù)的情況下,使用alexnet模型訓練的網(wǎng)絡(luò)識別精度為87.89%,訓練時間為23min10s,使用vgg16模型訓練網(wǎng)絡(luò)的識別精度為86.11%,訓練時長為160min53s。alexnet模型的層數(shù)較少,訓練速度較快,且識別效果較好,vgg16模型的層數(shù)較多,訓練速度明顯減慢,且識別精度未有明顯提升。實驗結(jié)果表明,alexnet模型的訓練速度更快,且訓練效果與更深層次的vgg16相似,因此,本文選用alexnet模型進行訓練更加合適。(3)樣本集擴充效果對比實驗。本節(jié)中分別在原始數(shù)據(jù)集和擴充數(shù)據(jù)集上進行網(wǎng)絡(luò)的訓練,原始數(shù)據(jù)集為未經(jīng)過數(shù)據(jù)擴充的圖像,擴充數(shù)據(jù)集為經(jīng)過加噪聲、鏡像、翻轉(zhuǎn)處理后擴大五倍的樣本集,使用相同的測試集比例,驗證數(shù)據(jù)集擴充對網(wǎng)絡(luò)模型識別精度的影響。為防止訓練參數(shù)變化對訓練結(jié)果的影響,在對比實驗中,兩次的訓練學習使用了相同的參數(shù),由實驗結(jié)果可知,使用相同網(wǎng)絡(luò)和參數(shù)的情況下,使用擴充的數(shù)據(jù)集訓練網(wǎng)絡(luò)模型可以得到87.89%的識別精度,訓練時間為23min10s,使用未擴充的數(shù)據(jù)集訓練網(wǎng)絡(luò)得到的識別效果大打折扣,只有60.56%的準確率,訓練時長為2min31s。雖然數(shù)據(jù)集的擴充使得訓練時長有所增加,但是在分類較多而樣本數(shù)據(jù)集較小的情況下,使用數(shù)據(jù)集擴充的方法,可以極大地提高網(wǎng)絡(luò)的識別效果。實驗結(jié)果表明,數(shù)據(jù)集的擴充會增加訓練時長,但可以有效提高網(wǎng)絡(luò)準確率,彌補樣本數(shù)據(jù)集較小的不足。
4結(jié)語
本文主要介紹了工程機械識別系統(tǒng)建立的每個過程,從數(shù)據(jù)集的收集整理,到工程機械圖像數(shù)據(jù)集的擴充、打標簽處理,以及網(wǎng)絡(luò)模型的建立結(jié)果對比。詳細地闡述了基于alexnet網(wǎng)絡(luò)實現(xiàn)工程機械廠家識別任務(wù)的整個流程。從網(wǎng)絡(luò)對工程機械廠家的識別率和實時性來看,本算法能滿足實際工程生產(chǎn)時的準確率和實時性要求。
參考文獻:
[1]李新葉,朱婧,麻麗娜.基于深度學習的場景識別方法綜述[J/OL].計算機工程與應(yīng)用:1-14[2020-02-13].
[2].MathWorks2018b版本的MATLAB和Simulink中擴展深度學習功能[J].單片機與嵌入式系統(tǒng)應(yīng)用,2018,18(11):95.
[3]楚翔宇.基于深度學習的交通視頻檢測及車型分類研究[D].哈爾濱工業(yè)大學,2017.
[4]趙振興.基于深度學習的車牌識別技術(shù)研究[D].青島科技大學,2017.
作者:魏建昊 靳浩偉 王祥澳 傅雋翰 葉敏 單位:長安大學工程機械學院