計算機視覺技術(shù)原理范文

時間:2024-01-11 17:41:14

導(dǎo)語:如何才能寫好一篇計算機視覺技術(shù)原理,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

計算機視覺技術(shù)原理

篇1

關(guān)鍵詞: 旅游流調(diào)控; 時空分流導(dǎo)航; 決策支持系統(tǒng); 計算機推理技術(shù); 時空一體化

0 引言

隨著我國經(jīng)濟持續(xù)發(fā)展和居民收入穩(wěn)步增加,旅游休閑日益成為我國居民生活的重要內(nèi)容。近年來,中國旅游業(yè)增長的勢頭尤其迅猛,不少著名景區(qū)不得不面對大量游客入園而導(dǎo)致景區(qū)滿載的局面。景區(qū)一旦過度擁擠,就會對旅游業(yè)的可持續(xù)發(fā)展造成威脅。以主題公園為例,一方面,游客過多有可能對游樂設(shè)施造成破壞,甚至?xí)鸢踩鹿?;另一方面,游客在游玩過程中的長時間等待也嚴重影響游客的游憩質(zhì)量。因此,關(guān)注景區(qū)內(nèi)客流時空分布,并使景區(qū)內(nèi)各景點負載均衡便成為了保證旅游景區(qū)經(jīng)濟效益、社會效益和生態(tài)效益協(xié)調(diào)發(fā)展的核心。

時空分流,正是利用隨時間推移形成的相對“閑置”的空間對游客進行分散疏導(dǎo),使景區(qū)內(nèi)各景點負載均衡的一種解決方案。對此,目前國內(nèi)研究者主要從排隊論和導(dǎo)航管理技術(shù)兩個分支開展探討。排隊論是以運籌學(xué)作為基礎(chǔ)研究服務(wù)機構(gòu)中排隊問題的規(guī)律(Erlang,1909),在旅游學(xué)科領(lǐng)域的研究成果并不算多,主要包括:張凌云(1988)對旅游用餐行業(yè)的排隊隊長、逗留時間和等待時間的期望值進行了估計,并在服務(wù)員數(shù)量和顧客等待時間兩方面做了比較和權(quán)衡,用于指導(dǎo)餐廳(酒吧)在座位數(shù)量、服務(wù)人員安排和經(jīng)濟成本效益上綜合考慮;陳治佳等(2005)提出了一種基于概率的快速排隊優(yōu)化模型,以使大型游樂場的游樂設(shè)施達到最大使用程度,減少游客等待時間;王仁志和苗維亞(2012)對大型景區(qū)的平均隊長和平均等待時間進行了估計,并提出把順序單服務(wù)臺旅游模式改變?yōu)闊o序全服務(wù)臺旅游模式的思想。這些研究都是為了解決游客太多而導(dǎo)致某個服務(wù)機構(gòu)(餐廳、游樂設(shè)施或景點)需要長時間排隊而提出的,主要涉及排隊系統(tǒng)的性狀研究和最優(yōu)化配置兩大類,多采用M/M/n排隊理論建立數(shù)學(xué)模型并結(jié)合多目標(biāo)線性規(guī)劃來求解。

國內(nèi)的另外一個分支則是時空分流導(dǎo)航管理技術(shù),是任佩瑜團隊于2009年提出的一項新技術(shù)(馮剛,等,2009),旨在根據(jù)空間的相對靜態(tài)性和時間的動態(tài)性,借助最新的信息監(jiān)控技術(shù),設(shè)計出若干優(yōu)化的游覽路線,使游客在景區(qū)內(nèi)均衡分布、有序交換。自2009年以來,該團隊針對風(fēng)景名勝區(qū)(或自然保護區(qū))做出了不少貢獻,包括:邱厭慶等(2010a)提出了基于九寨溝景點負荷均衡的時空分流導(dǎo)航數(shù)學(xué)規(guī)劃模型,并從動態(tài)預(yù)測中得到車輛調(diào)度方案;馮剛等(2010)引入管理熵與RFID技術(shù),對邱厭慶提到的上述模型進行效果模擬;邱厭慶等(2010b)從復(fù)雜系統(tǒng)控制的角度構(gòu)建游客分流導(dǎo)航管理的耗散結(jié)構(gòu)體系,并分別對初態(tài)分流(邱厭慶,等,2010b)和穩(wěn)態(tài)分流(邱厭慶,等,2011)兩個階段的動態(tài)離散系統(tǒng)進行探索性分析;姜向陽和任佩瑜(2012)把Hamilton 回路和多旅行商的思想引入時空分流導(dǎo)航管理中,并給出了一般數(shù)學(xué)模型和精確求解方法;戈鵬等(2013)通過比較、分析和仿真,提出了在初始分流中采用平均分流的靜態(tài)調(diào)度策略,在穩(wěn)態(tài)分流中采用基于區(qū)域時空負荷率的動態(tài)調(diào)度策略的改進方案;肖雄輝等(2013)構(gòu)建了景區(qū)景點需求與調(diào)度資源的引力分流調(diào)度模型和算法,既能滿足需求景點的負荷均衡,同時也考慮了游客的滿意度;任競斐和鄭偉民(2013)通過建立綜合游客偏好、擁擠度、等待時間和行走時間等指標(biāo)的旅游效用函數(shù),并借助Logit模型,將游客分配到不同路線上,以減少旅游高峰期景區(qū)游客擁擠和等待的情況??梢钥闯?,除了肖雄輝(2013)和任競斐(2013)的研究外,任佩瑜團隊主要從景區(qū)管理的角度來開展時空分流導(dǎo)航分析,其重點在于考查景區(qū)內(nèi)客流的分布情況和超負荷景點,以景區(qū)內(nèi)各景點的負荷均衡為目標(biāo)建立數(shù)學(xué)模型并進行求解。此外,還有從游客服務(wù)或體驗的角度來展開研究的,例如鄭天翔(2012)以游客等待時間最短為目標(biāo)對主題公園游客導(dǎo)航分流問題構(gòu)建了動態(tài)調(diào)度算法的雛形。

在國外研究中,沒有專門用以表達時空分流的術(shù)語,與此相關(guān)的研究包括虛擬排隊服務(wù)和游線設(shè)計問題。虛擬排隊服務(wù),包括虛擬排隊系統(tǒng)(Lovejoy,et al.,2004;Lutz,2008)、排隊管理方法(Button,2006)和排隊區(qū)設(shè)計(Heger,et al.,2009)等,并在管理實踐中被廣泛應(yīng)用于主題公園的開發(fā)和運營中,其中,以Multi Motion主題公園管理系統(tǒng)(Universal City Studios INC,2002)和迪士尼的FASTPASSTM(Cope Iii,et al.,2008)排隊管理系統(tǒng)最具代表性,這類系統(tǒng)設(shè)計的方案是增加一條虛擬排隊隊列,能使游客花費相同的時間但多體驗一個項目。另一個研究領(lǐng)域是游線設(shè)計問題(Tourist Trip Design Problems)(Garcia,et al.,2010;Garcia,et al.,2013;Souffriau,et al.,2008;Sylejmani,et al.,2012;Vansteenwegen,et al.,2009b;Vansteenwegen,et al.,2009a;Vansteenwegen,Van Oudheusden,2007),這類研究延伸出一系列的分支,包括游客移動引導(dǎo)(Mobile Tourist Guides)(Souffriau,et al.,2008;Vansteenwegen,Van Oudheusden,2007)、電子游客引導(dǎo)(Electronic Tourist Guides)(Garcia,et al.,2009;Garcia,et al.,2013;Vansteenwegen,et al.,2009b;Vansteenwegen,et al.,2009a)、個人導(dǎo)航系統(tǒng)(Personal Navigation Systems for Tourism)(Akasaka,Onisawa,2008;Maruyama,et al.,2004;Shiraishi,et al.,2005)、個性化路線規(guī)劃(Personalized Route Planning)(Nadi,Delavar,2011;Yiakoumettis,et al.,2013;Yu,Chang,2009;Zhang,et al.,2011)、個性化路線引導(dǎo)(Personalized Route Guidance)(Panou,2012)和個性化路線推薦(Personalized Route Recommendation)(Tsai,Chung,2012),等。這些分支當(dāng)中,涉及旅途中路線選擇、導(dǎo)航或引導(dǎo)的文獻主要包括:Maruyama等(2004)提出一個有效導(dǎo)航多重目的地的個人導(dǎo)航系統(tǒng),系統(tǒng)根據(jù)游客到達時刻、停留時間以及目的地偏好度計算出使游客滿意的旅游路線并實現(xiàn)導(dǎo)航;Shiraishi等(2005)根據(jù)游客的費用預(yù)算和滿意程度定制出不同的旅游時間表讓游客自主選擇,并為其按時到達下一站提供導(dǎo)航;Vansteenwegen等(2009a)把旅游線路設(shè)計歸結(jié)為TOPTW(Team Orienteering Problem with Time Windows)問題,并提出迭代局部求解算法,以實時求出個性化旅游路線;Garcia等(2009)在Vansteenwegen研究的基礎(chǔ)上,把旅游線路設(shè)計進一步歸結(jié)為MCTOPTW(Multi Constrained Team Orienteering Problem with Time Windows)問題,并提出一個包含旅行往返時間、旅行節(jié)奏和旅游興趣點的智能個性化電子導(dǎo)游系統(tǒng);Yu和Chang(2009)根據(jù)游客的個人喜好,結(jié)合游客的當(dāng)前位置對其附近的游覽景點、餐飲和住宿等做出簡單的行程安排;Zhang等(2011)試圖利用衛(wèi)星地圖和移動設(shè)備來解決交通換乘問題,能結(jié)合實時交通情況、停車信息搜索列車到達時刻表,并提供自駕、鐵路、公交或步行等多種路線信息;Nadi和Delavar(2011)提出了多種不同方案的路徑選擇系統(tǒng),以滿足用戶的靈活需求;Tsai和Chung(2012)根據(jù)以往相似游客的歷史路徑,結(jié)合當(dāng)前排隊信息作判斷,以便讓游客游覽更多的景點。

縱觀國內(nèi)外文獻,國外在旅游路線選擇的問題上似乎更多是從游客出發(fā)前的計劃安排上開展研究,而針對游客在游覽過程中的干預(yù)、引導(dǎo)和管理則較少涉及,而國內(nèi)針對景區(qū)內(nèi)部小尺度的時空分流研究還剛剛起步,多采用數(shù)學(xué)和運籌學(xué)的方法建模求解,能同時考慮游客的個性化需求和現(xiàn)場環(huán)境信息、形成時空一體的旅游個性化推介服務(wù)(李仁杰,路紫,2011)的時空分流模式還鮮見(鄭天翔,等,2015)。因此,現(xiàn)實中對于景區(qū)在個別景點人流過于集中、游客因等待時間過長而游憩質(zhì)量下降的難題,目前還缺乏行之有效的方案,而這卻是智慧景區(qū)的建設(shè)核心之一(梁倩,張宏梅,2013)。由于時空分流問題涉及游客游憩行為,有研究指出,這種旅游系統(tǒng)難以采用傳統(tǒng)數(shù)學(xué)分析方法建模,而計算機仿真正是研究這種復(fù)雜社會系統(tǒng)的較好方法(黎j,2013;黎j,杜栓柱,2011)。因此,本文針對景區(qū)游客時空分流的決策支持系統(tǒng)(陳建斌,等,2014),借助計算機推理技術(shù)提出一種具有時空一體化特征的游憩方向決策算法,并通過計算機仿真系統(tǒng)與傳統(tǒng)的最短距離算法進行實驗?zāi)M和比較分析,以驗證本文算法的優(yōu)越性。

1 研究設(shè)計

1.1 研究對象

由于旅游管理決策實際上是一種復(fù)雜事件的推理過程,對問題觀察而導(dǎo)致的建模也只能是一種近似描述(杜軍平,周亦鵬,2009),因此,本文選擇較為簡單的主題公園作為研究對象。與其他風(fēng)景區(qū)相比,主題公園的“簡單性”主要有以下表現(xiàn)。

(1) 景點的承載力可以預(yù)先確定――風(fēng)景區(qū)的景點以名勝古跡、山水生物為主,具有共享性,同一時刻可供游覽的人數(shù)不定;主題公園的景點主要以游樂設(shè)施為主,游樂設(shè)施具有獨占性,同一時刻可供游玩的人數(shù)相對固定。

(2) 景點的游覽時間可以預(yù)先確定――游客在風(fēng)景區(qū)的景點停留時長不定,拍照留念、欣賞、休憩、飲食、消費等因人而異;而游客在主題公園的游樂設(shè)施上的停留時長相對固定。

(3) 單步求解而非全路線求解(詳見1.3節(jié))――風(fēng)景為主的景區(qū),堅決避免走回頭路,應(yīng)當(dāng)使所有的景點串聯(lián)成環(huán)形游線,通常采用全路線求解方案,在游客游覽前確定所有路線;而游樂設(shè)施為主的主題公園,相鄰景點之間距離不會太遠,很多時候為了減少等候時間,同一路徑游客會重復(fù)往返,因此適合單步求解,能在游客游覽過程中逐次獲得下一步路線。

1.2 基本假設(shè)

在主題公園(下簡稱景區(qū))的特定案例下,我們假設(shè):

?不同游客在同一游樂設(shè)施(下簡稱景點)的游覽時間相同,且在景點設(shè)計時已經(jīng)確定,稱為景點游覽時間。

?每個景點的承載力(景點容量)在景點設(shè)計時已經(jīng)確定。

?相鄰兩個景點之間的路徑長度在景點設(shè)計時已經(jīng)確定。

?在不考慮乘車的前提下,每個游客的游憩速度(下簡稱步速)一樣。

?每個游客在一次完整的旅游經(jīng)歷過程中(從進入景區(qū)門口開始直到離開景區(qū)),不會重復(fù)游覽已經(jīng)游玩過的景點,但允許多次來回經(jīng)過相鄰兩景點之間的路徑。

1.3 模型分析

無論是“給定景點求路徑不重復(fù)的全路線最短成本”的旅行商問題(Traveling Salesman Problem,TSP)(吳凱,2004),還是“盡可能多的游覽景點,路徑不重復(fù)且全路線成本最小”的定向越野問題(Orienteering Problem,OP)(Tsiligirides,1984),都屬于圖論中的NP完全問題,不存在多項式時間的算法(王曉東,2004)。因此,本文針對游客在同一個景區(qū)中的單日游行程安排問題,試圖在“給定景點求單步最少成本”上尋找解決方案,借此讓不同游客從時間和空間(景點)上分離開來,達到時空分流的效果。

借鑒前人研究成果(黎j,2013)并進行簡化后,本文假定景區(qū)涉及的對象僅包含兩個:景點和游客。對于景點來說,具有景點位置、景點容量、景點游覽時間、景點開放時刻和景點關(guān)閉時刻等靜態(tài)屬性,也具有景點下次提供服務(wù)時刻、景點外排隊等候人數(shù)等動態(tài)屬性。對于游客來說,具有游客編號、到達時刻、預(yù)計離開時刻和游覽偏好(感興趣景點)等靜態(tài)屬性,也具有步速、游憩方向(黎j,2013)和等待時間等動態(tài)屬性。其中,游客動態(tài)屬性隨游憩行為而取不同值(黎j,2013),圖1和圖2展示了其自身在景區(qū)中的一次完整游憩行為,可以歸納為8個要素和3個狀態(tài)。

圖2 游客的狀態(tài)切換圖

首先,我們來看看這3個狀態(tài):(1) 棧道行走等待游玩:狀態(tài)的切換由當(dāng)前游客“到達景點”觸發(fā),這時候可以確定游客需要等候的時間(詳見1.4節(jié));(2) 等待游玩正在游玩:狀態(tài)的切換由前一個(批)游客“離開景點”觸發(fā),當(dāng)前游客進入游覽,這時候可以確定景點下次提供服務(wù)時刻=當(dāng)前時刻+景點游覽時間;(3) 正在游玩棧道行走:狀態(tài)的切換由當(dāng)前游客“離開景點”觸發(fā),此時需要對下一個游玩景點(游憩方向)進行決策,這就要求設(shè)計一種擇優(yōu)選擇的機制來逐次確定(詳見1.4節(jié))。

其次,我們來看看這8個要素。對它們進行歸類,可以得知:(1) 屬于動作:到達景區(qū)、到達景點、離開景點、離開景區(qū);(2) 屬于活動:前往景點、游玩景點;(3) 屬于判定:尋找下一個景點、能否游玩。其中,“動作”使用計算機科學(xué)技術(shù)領(lǐng)域中的“離散事件驅(qū)動”(劉衛(wèi)東,等,1998)來模擬,“活動”使用虛擬時鐘來實現(xiàn),“判定”使用計算機推理算法來判斷(詳見1.4節(jié))。

對這8個要素的進一步分析,可以得知這些要素的模擬關(guān)鍵:(1) 到達景區(qū):記錄游客的到達時刻、預(yù)計離開時刻、步速和感興趣的景點等信息;(2) 前往景點:使用虛擬時鐘來模擬,每隔一定時間游客移動一步,這時候游客處于棧道行走狀態(tài);(3) 到達景點:由于 “前往景點”存在不確定因素(游憩方向有可能是景點或景點外排隊隊列,或者步行過程中其他游客可能更早一步到達同一景點),使得該事件沒有固定的發(fā)生時刻,因此無法通過“事件驅(qū)動”來模擬,只能作為“前往景點”這個活動的結(jié)束標(biāo)志。而此時,游客的等待時間可以確定下來,同時由于離開景點的時刻能確定(景點游覽時間+等待時間),因此可以產(chǎn)生“離開景點”事件;(4) 能否游玩:如果等待時間+景點下次提供服務(wù)時刻 > 景點關(guān)閉時刻,則游客無法游玩,只能離開景點;(5) 游玩景點:這部分主要由等待游玩和正在游玩兩個狀態(tài)構(gòu)成;(6) 離開景點:根據(jù)景點容量把排隊靠前的游客設(shè)為正在游玩狀態(tài),其他游客在隊列的位置相應(yīng)前移;(7) 離開景區(qū):為了簡化模型,僅輸出與整個游覽過程相關(guān)的信息,而不作為事件來模擬;(8) 尋找下一個景點:需要構(gòu)造游憩方向的決策算法,根據(jù)算法的返回結(jié)果判斷是否找到。

1.4 算法和仿真設(shè)計

1.4.1 算法設(shè)計

根據(jù)上一節(jié)的分析,我們需要確定游客的等待時間和游憩方向的決策算法。表1展示了游客等待時間的計算方法。

注:所有景點的下次提供服務(wù)時刻,其初始值均為景點開始時刻,下同。當(dāng)景點處于關(guān)閉期間,游客的等待時間設(shè)為0,意味著游客必須離開當(dāng)前景點,重新選擇其他景點。

上述算法中,“景點下次提供服務(wù)時刻”是“等待游玩正在游玩”狀態(tài)切換的時候確定的;“排隊等候人數(shù)”在仿真中可以采用“隊列”結(jié)構(gòu)(劉衛(wèi)東,等,1998)來模擬,所以根據(jù)隊列元素個數(shù)便可獲知等候人數(shù)。

接下來我們需要確定游憩方向(下一個景點)的算法,該算法必須是一個自適應(yīng)的推理決策過程,能根據(jù)現(xiàn)場環(huán)境信息和游客需求,共同確定游客當(dāng)前時刻的目標(biāo)選擇,最后推送給游客。構(gòu)造的關(guān)鍵在于既要考慮游客自身的個性化信息,也要考慮現(xiàn)場環(huán)境信息,例如景點本身的運營情況(包括景點游覽時間、景點下次提供服務(wù)時刻和景點開放時間)、其他游客的位置(主要指他們在各景點的排隊等候情況)和游客本身的位置,最后從若干個候選景點中選擇單步成本最少的一個。表2展示了構(gòu)建的算法。

1.4.2 仿真設(shè)計

為了檢驗上述算法的有效性,我們必須模擬多名游客在景區(qū)的整個游玩過程,并借助仿真實驗進行比較分析。如1.3節(jié)所述,我們使用“離散事件驅(qū)動”來模擬“到達景區(qū)”和“離開景點”這兩個事件,并使用虛擬時鐘來模擬“前往景點”和“游玩景點”這兩個活動。虛擬時鐘本質(zhì)上是游客在景區(qū)停留和游玩過程中的時間粒度(Tick)(黎j,2013)。由于兩個事件的發(fā)生時刻均可由系統(tǒng)自動確定,故可放在虛擬時鐘一并處理。借助“最小堆”結(jié)構(gòu)(劉衛(wèi)東,等,1998),不但可以以時間遞增即時光流逝的順序逐一模擬所有事件的發(fā)生,而且每次僅需檢查堆頂元素的事件發(fā)生時刻即可。

利用虛擬時鐘周期性觸發(fā)的特性(時鐘每增加一個步長,系統(tǒng)自動執(zhí)行事件一次,重新決策下一個Tick的行為),我們構(gòu)造的仿真方案如表3所示。

2 實驗?zāi)M與結(jié)果分析

2.1 系統(tǒng)運行參數(shù)

仿真系統(tǒng)采用 Borland C++ Builder 6.0 開發(fā),運行于 Windows 7平臺。系統(tǒng)將根據(jù)仿真輸入數(shù)據(jù)自動生成游客在景區(qū)中的游憩行為,并對游憩過程進行跟蹤、記錄。當(dāng)一個仿真結(jié)束后,系統(tǒng)將對所記錄的數(shù)據(jù)進行分析并輸出分析結(jié)果。在本文的例子中,系統(tǒng)的輸入包括:景區(qū)的空間布局圖(含各景點之間的路徑長度);各景點的基本情況(開始時刻、關(guān)閉時刻、景點游覽時間和景點容量);游客的信息(到達時刻、預(yù)計離開時刻和感興趣的景點)。系統(tǒng)的輸出包括游客的游玩次序、等待時間和實際離開時刻。

仿真方案

1. 事件的判斷――檢查堆頂事件的發(fā)生時刻,如果等于當(dāng)前時刻,則彈出堆頂事件,直到最小堆為空:

如果是“到達景區(qū)”事件

游客出現(xiàn)在景區(qū)門口

記錄游客的到達時刻、預(yù)計離開時刻、感興趣的景點和步速等信息

利用 “游憩方向決策算法”尋找下一個景點,如果沒有找到(返回值為空值),則游客離開景區(qū)

如果是“離開景點”事件

游客離開景點,利用 “游憩方向決策算法”尋找下一個景點,如果沒有找到(返回值為空),則游客離開景區(qū)

排隊靠前的游客設(shè)為正在游玩狀態(tài),設(shè)置景點下次提供服務(wù)時刻=當(dāng)前時刻+景點游覽時間

隊列的其他游客依次前移

2. 游客的移動――對每個游客進行判斷:

如果該游客處于等待游玩或正在游玩狀態(tài),則保持不動

否則,該游客向目標(biāo)(“游憩方向決策算法”的返回值)移動一步,此時游客處于棧道行走狀態(tài)

如果游客已到達景點或景點外排隊等候隊列末尾,則:

按照表1的方法計算游客的等待時間

如果景點下次提供服務(wù)時刻+等待時間>景點關(guān)閉時刻,則此景點無法游玩,游客繼續(xù)尋找下一個景點。否則,游客根據(jù)排隊情況等待游玩或進入游玩

如果景點空閑,則該游客進入景點游玩,此時游客處于正在游玩狀態(tài)。設(shè)置景點下次提供服務(wù)時刻=當(dāng)前時刻+景點游覽時間

否則,游客必須排隊等候,此時游客處于等待游玩狀態(tài)

生成“離開景點”事件,事件發(fā)生時刻=景點游覽時間+游客等待時間

2.2 算法比較

為了方便比較,本文引入前人研究(任競斐,鄭偉民,2013;肖雄輝,等,2013;鄭天翔,2012)中使用的基于距離的決策方案做分析。在本文的特定因素下,基于最短距離的決策算法(下簡稱距離算法)如表4所示。

B=g(A)

輸入:A是當(dāng)前游覽完畢的景點或到達的景區(qū)門口

輸出:B是經(jīng)決策后的下一個待游覽景點(下一步的游憩方向)

1. 在感興趣的所有未游玩景點中,對每個景點C進行下面的判斷:

計算所需成本=A與C之間的路徑長度/步速,并把景點C加入候選景點集合

如果 所需成本+當(dāng)前時刻

如果景點C處于關(guān)閉期間

如果景點C的開始時刻已經(jīng)過了(當(dāng)前時刻 > 景點C關(guān)閉時刻),則從候選景點集合中剔除景點C

否則,如果 所需成本+當(dāng)前時刻

如果景點C處于開放期間

如果 所需成本+當(dāng)前時刻 > 景點C關(guān)閉時刻,則從候選景點集合中剔除景點C

否則,從候選景點集合中剔除景點C

2. 如果候選景點集合為空,則返回“空值”;否則,從候選景點集合中選擇成本最少的一個,作為B返回

2.3 實驗數(shù)據(jù)

假定景區(qū)的空間布局圖如圖3所示。

其中,復(fù)選鈕代表景點和門口,其中以V開頭標(biāo)記的是景點(如V1,…,V5),以G開頭標(biāo)記的是門口(如G1,G2,G3)。景點與景點、景點與門口之間的數(shù)字代表路徑長度。仿真系統(tǒng)的輸入包括:

?系統(tǒng)參數(shù):為方便起見,假設(shè)虛擬時鐘的時間粒度(Tick)為1秒。

?景點的基本情況:所有景點的游覽時間統(tǒng)一設(shè)置為20秒,所有景點容量統(tǒng)一設(shè)置為1。至于景點的開始時刻和關(guān)閉時刻,景點V1、V2和V3跟隨景區(qū)開放而開放,景點V4的開始時刻隨機設(shè)為景區(qū)開放后1分54秒,持續(xù)時間為2分17秒,景點V5的開始時刻為景區(qū)開放后1分44秒,持續(xù)時間為2分30秒。

?游客信息:為了使游客數(shù)據(jù)在兩種算法的仿真實驗中保持一致,我們首先隨機生成所有游客的信息,然后把這些信息錄入系統(tǒng),并對每個游客生成“到達事件”,最后全部加入到最小堆中。其中,各游客的預(yù)計離開時刻參見2.4.1節(jié),感興趣的景點參見2.4.2節(jié),至于各游客的到達時刻,由于前后兩次仿真時刻不可能相同,因此只需保證相對時間(相鄰兩個游客的到達時間間隔)一致即可。限于篇幅,僅保留其編號信息,編號規(guī)則是按照其到達景區(qū)的時間先后進行依次編號的。此外,為簡單起見,假設(shè)所有游客都從G2到達。

?仿真系統(tǒng)的輸出:與整個游覽過程相關(guān)的信息,包括游客的游玩次序、等待時間和實際離開時刻。

2.4 結(jié)果分析

2.4.1 游客等待時間

兩組算法在游客等待時間上的結(jié)果如表5和圖4所示。

從表5和圖4可以清楚看到,本文算法的等待時間在各游客上差別不大(趨勢線的斜率為0.89),表明游客的等待基本不受其到達景區(qū)的時刻先后所影響,而對于距離算法,到達時刻較早的游客等待時間較短,到達時刻較晚的游客等待時間較長,因此趨勢線的斜率較大(4.89)。此外,有研究者指出,游客滿意度是與等待時間占逗留時間的比例(張影莎,等,2012)(下簡稱等逗比)密切相關(guān)的,從表5和圖 5的結(jié)果來看,本文算法的等逗比在各個游客上趨于平均,而距離算法則波動較大,到達時刻較早的游客其等逗比普通較低,到達較晚的游客等逗比普遍較高,對編號為12、13和14的游客來說,花費在景點上的等待時間甚至占據(jù)了在景區(qū)逗留時間的60%或更多。

2.4.2 游客游玩的景點數(shù)量

收集游客實際游覽(成功游玩)的景點數(shù)據(jù),整理后結(jié)果如表6所示。

注:“提前”是指在“尋找下一個景點”的決策中,選擇任一候選景點都將超過游客預(yù)計離開時刻,算法返回值為空,游客提前離開景區(qū)?!板e過”是指在“尋找下一個景點”的決策中,選擇任一候選景點都將超過了景點關(guān)閉時刻,算法返回值為空,游客未能前往游玩?!斑z憾”是指當(dāng)游客到達景點后,發(fā)現(xiàn)景點來不及游玩(已關(guān)閉,或者等候人數(shù)太多超過景點關(guān)閉時刻,或者超過游客預(yù)計離開時刻),無奈地重新選擇下一個景點。

從表6可以看到,本文算法與距離算法相比,能夠讓游客成功游玩更多的景點(見表6陰影部分)。此外,從游客所付出的代價來看,“提前”和“錯過”要比“遺憾”要小。本文算法能提前告知游客候選景點能否游玩,因此沒有出現(xiàn)當(dāng)游客到達景點后才發(fā)現(xiàn)景點不能游玩的情況;而距離算法則由于無法提前預(yù)知,因此在模擬過程中出現(xiàn)3次游客到達景點后才發(fā)現(xiàn)該景點不能游玩的情況:游客11和14(見表5)分別到達景點V5后、游客16(見表5)到達景點V4后,詳見下文表8。

2.4.3 景點容量利用率

為了計算景點容量利用率(張影莎,等,2012),把各景點人數(shù)變動的時刻一一記錄下來,也就是說,記錄游客到達該景點的時刻(游玩或等候)或在該景點上游玩結(jié)束離開景點的時刻,然后記下接待人次和統(tǒng)計等候人數(shù)。結(jié)果分別如表7和表8所示。

首先,由表7和表8可知,對于景點V1V5,本文算法分別接待了9、9、11、7、7人次,而距離算法分別接待了6、11、11、6、7人次,由此可見各景點的接待能力大致相同。然而,表7和表8反映了兩個截然不同的事實:在本文算法下,各景點的負荷比較接近,排隊等候人數(shù)峰值大概為3~4人,而在距離算法下,每個景點的負荷非常不均衡,景點V1、V3、V4的排隊等候人數(shù)峰值在1~2人之間,而景點V5的峰值在4人左右,景點V2的峰值甚至達到了7人。

注:根據(jù)2.3節(jié)假設(shè),景點V4的開放時刻為23:25:58,關(guān)閉時刻為23:28:15;景點V5的開放時刻為23:25:48,關(guān)閉時刻為23:28:18。在23:28:03上,游客16到達V4后發(fā)現(xiàn)景點快要接近關(guān)閉,不能游玩導(dǎo)致景點V4的接待人次/等候人數(shù)并沒有增加。在23:26:48上,游客11到達V5后發(fā)現(xiàn)景點外排隊等候有3人,屆時輪到自己的時候景點已經(jīng)關(guān)閉,不能游玩導(dǎo)致景點V5的接待次數(shù)/等候人數(shù)并沒有增加。在23:27:49上,游客14到達V5后發(fā)現(xiàn)若選擇游玩則將會超過預(yù)計離開景區(qū)時刻,而其他未游覽景點(V1和V4)根據(jù)決策算法也將超時,因此只能離開景區(qū)。

其次,各景點容量利用率可以借助容量剩余來間接反映:當(dāng)游客到達景點后,如果能進入游玩而無需等候,則說明該景點處于閑置中,有大量的容量剩余;反之,說明該景點處于忙碌中,沒有容量剩余。在表7和表8中,這對應(yīng)于接待人次(有具體數(shù)值)所在行的等候人數(shù):如果等候人數(shù)為0,則說明景點處于閑置中,反之則處于忙碌中。可見,本文算法下各景點的剩余容量大致相同,景點容量利用率基本一致。而距離算法下,景點V1、V3、V4有大量的容量剩余,說明這些景點很多時候處于閑置狀態(tài),景點容量利用率較低,而景點V2和V5則沒有足夠的容量剩余,說明這兩個景點長期處于繁忙狀態(tài),景點容量利用率很高。

2.4.4 景點平均等待時間

從表5可以計算出在本文算法和距離算法下游客的平均等待時間(總等待時間和總?cè)藬?shù)的比值)(Lovejoy,et al.,2004)分別為66.63秒和72.44秒,顯然,本文算法更占優(yōu)。本節(jié)中,我們將進一步比較每個景點的游客平均等待時間。

首先定義每個景點的游客平均等待時間,其計算方法為在該景點上的等待時間之和與在該景點需要等待的游客人數(shù)之比值。該指標(biāo)可以計算出游客在某個景點上的等待成本,能客觀反映景區(qū)中各景點的實際運營情況。

從表9的結(jié)果來看,在本文算法下,各景點的平均等待時間基本一致,表明沒有出現(xiàn)游客在個別景點高度集中的情況,人群分布較均勻,擁擠程度較低。而在距離算法下,各景點的平均等待時間存在明顯差異,游客在景點V2和V5所需等待時間較長,而在其他景點所需等待時間則較短,表明游客在景點V2和V5高度集中,擁擠程度嚴重,而其他景點則隨到隨玩。

表9 兩種算法在“景點平均等待時間”上的結(jié)果

等待時間之和(秒)

本文算法距離算法

等待人數(shù)

本文算法距離算法

景點平均等待時間(秒)

本文算法距離算法

V1289628436.115.5

V218166271025.966.2

V3206818525.816.2

V4196337428.08.3

V51943216832.340.1

3 結(jié)論與討論

本文針對主題公園游客時空分流的決策支持系統(tǒng)問題,借助計算機推理技術(shù)提出一種基于現(xiàn)場環(huán)境的游憩方向決策算法,并設(shè)計了一個計算機仿真系統(tǒng)進行實驗?zāi)M。與傳統(tǒng)的最短距離算法相比,本文算法在游客等待時間、游客游玩景點數(shù)量、景點容量利用率和景點平均等待時間4個指標(biāo)上均顯示出良好的性能,具有時空一體化的特性。從實驗結(jié)果來看,本文所創(chuàng)建的時空分流模型,讓游客自動分流并導(dǎo)航到較少擁擠的景點上,既能均衡各景點的接待能力,同時能降低游客的等待成本,有助于主題公園的客流時空分布調(diào)控。與以往時空分流模型或算法的不同之處在于,它既充分考慮了各景點的開放和運營情況,也考慮了游客本身的多種需求,同時還考慮其他游客的位置,從而獲得單步最少成本的路徑。

本文提出的游憩方向決策支持算法,其研究雖然目前停留在模擬階段,但從實驗效果來看,有助于景區(qū)客流運轉(zhuǎn)的可控性和有序化,對景區(qū)管理者、景點設(shè)施和游客來說都是大有裨益的。首先,對景區(qū)管理者來說,景區(qū)旅游擁擠加劇和生態(tài)環(huán)境破壞等問題需要對旅游客流和景區(qū)內(nèi)資源的使用情況進行監(jiān)控,以便必要時進行現(xiàn)場疏導(dǎo),其最大的障礙莫過于無法掌握游客在景區(qū)內(nèi)的游憩行為。本文算法可以讓景區(qū)管理者了解游客的行蹤(實踐中需借助物聯(lián)網(wǎng)技術(shù)),算法產(chǎn)生的推薦路線能讓游客自動分流并導(dǎo)航到較少擁擠的景點上,不用擔(dān)心熱門景點由于游客過多而出現(xiàn)局部擁堵或混亂的局面,有望節(jié)省用于現(xiàn)場疏導(dǎo)的人力資源。其次,對景點設(shè)施來說,本文算法能夠均衡各景點的接待能力和承受能力,既不會造成資源閑置浪費,也不會造成景區(qū)局部擁擠。再者,對游客來說,在景區(qū)的游憩過程中,擁擠的人群和錯綜復(fù)雜的地圖讓他們很難通過目測或者經(jīng)驗獲得最佳旅游線路,本文算法可輔助游客個性化定制感興趣的景點,并在確定游憩方向(景點的游歷次序)上把繁瑣的自行搜索篩選變?yōu)榱酥鲃油扑停瑴p少游客在景區(qū)的等待時間,并有可能增加游客體驗項目數(shù)(張影莎,等,2012),從而提高游客的游玩效率。

致謝 感謝暨南大學(xué)深圳旅游學(xué)院吳圳杰對本文仿真系統(tǒng)的測試所做的諸多工作。

參考文獻:

[1] 陳建斌,鄭麗,張凌云.智慧景區(qū)IT能力模型及其核心構(gòu)成研究[J].旅游科學(xué),2014(1):1421.

[2] 陳治佳,王曦,何苗.大型游樂場快速通道優(yōu)化模型與仿真模擬[J].哈爾濱工業(yè)大學(xué)學(xué)報,2005(9):12611263.

[3] 杜軍平,周亦鵬.基于數(shù)據(jù)的旅游管理決策支持系統(tǒng)研究[J].自動化學(xué)報,2009(6):834840.

[4] 馮剛,任佩瑜,戈鵬,朱忠福,冉建華.基于管理熵與RFID的九寨溝游客高峰期“時空分流”導(dǎo)航管理模式研究[J].旅游科學(xué),2010(2):717.

[5] 馮剛,任佩瑜,肖維陽,鄧貴平,蹇代君.基于RFID模式對景區(qū)生態(tài)保護的研究――以九寨溝諾日朗餐廳就餐分流為例[J].西南民族大學(xué)學(xué)報 (人文社科版),2009(11):151154.

[6] 戈鵬,鄭偉民,肖雄輝,邱厭慶,任佩瑜.基于九寨溝區(qū)域時空負荷均衡的仿真研究[J].管理工程學(xué)報,2013(2):99106.

[7] 姜向陽,任佩瑜.自然保護區(qū)旅游高峰期時空分流導(dǎo)航管理的模型構(gòu)建與分析[J].旅游科學(xué),2012(4):1725.

[8] 黎j.景區(qū)游客游憩行為計算機仿真模型[J].旅游科學(xué),2013(5):4251.

[9] 黎j,杜栓柱.景區(qū)游憩行為計算機仿真系統(tǒng)研究綜述[J].旅游學(xué)刊,2011(7):8594.

[10] 李仁杰,路紫.旅游個性化推介服務(wù)的未來發(fā)展:時空一體化[J].旅游學(xué)刊,2011(10):8288.

[11] 梁倩,張宏梅.智慧景區(qū)發(fā)展?fàn)顩r研究綜述[J].西安石油大學(xué)學(xué)報( 社會科學(xué)版),2013(5):5256.

[12] 劉衛(wèi)東,沈官林,嚴蔚敏.數(shù)據(jù)結(jié)構(gòu)C++語言描述[M].北京:清華大學(xué)出版社,1998.

[13] 邱厭慶,戈鵬,賴力,吳艷,任佩瑜.九寨溝景區(qū)初態(tài)聚類分流實證研究[J].資源科學(xué),2010(10):19871992.

[14] 邱厭慶,戈鵬,劉柱勝,任佩瑜.基于復(fù)雜系統(tǒng)控制的景區(qū)游客時空分流導(dǎo)航管理研究[J].軟科學(xué),2011(9):5457.

[15] 邱厭慶,戈鵬,任佩瑜.基于九寨溝景點負荷均衡的時空分流導(dǎo)航研究[J].資源科學(xué),2010(1):118123.

[16] 任競斐,鄭偉民.景區(qū)旅游高峰期游客旅游路線動態(tài)實時調(diào)度仿真研究[J].統(tǒng)計與決策,2013(8):4245.

[17] 王仁志,苗維亞.基于M/M/n排隊論的大型旅游景區(qū)內(nèi)部排隊現(xiàn)象研究[J].經(jīng)濟體制改革,2012(3):177180.

[18] 王曉東.計算機算法設(shè)計與分析[M].第二版.北京:電子工業(yè)出版社,2004.

[19] 吳凱.旅游線路設(shè)計與優(yōu)化中的運籌學(xué)問題[J].旅游科學(xué),2004(1):4144.

[20] 肖雄輝,戈鵬,朱虹明,任佩瑜,鄭偉民,章小平.旅游高峰期景區(qū)游客引力分流調(diào)度模型研究――以九寨溝風(fēng)景區(qū)為例[J].旅游科學(xué),2013(6):3951.

[21] 張凌云.試論排隊論在旅游業(yè)中的應(yīng)用――兼析餐廳服務(wù)員的最優(yōu)配置[J].社會科學(xué)家,1988(1):4754.

[22] 張影莎,蘇勤,胡興報,盧松.基于排隊論的方特歡樂世界主題公園容量研究[J].旅游學(xué)刊,2012(1):6672.

[23] 鄭天翔.基于動態(tài)實時調(diào)度的主題公園游客時空分流導(dǎo)航管理研究[J].旅游科學(xué),2012(4):816.

[24] 鄭天翔,吳蓉,羅海媛.國內(nèi)景區(qū)旅游流調(diào)控研究綜述[J].地理與地理信息科學(xué),2015(5):9096.

[25] Akasaka Y,Onisawa T(2008).Personalized pedestrian navigation system with subjective preference based route selection[M]//Intelligent Decision and Policy Making Support Systems.Berlin Heidelberg:SpringerVerlag,7391.

[26] Button K(2006).The Disney Queue Line Survival Guidebook[M].Scottsdale:Infinity Publishing.

[27] Cope Iii R F,Cope R F,Davis H E(2008).Disney’s Virtual Queues:A Strategic Opportunity To CoBrand Services?[J].Journal of Business & Economics Research,6(10),1320.

[28] Erlang A K(1909).The theory of probabilities and telephone conversations[J].Nyt Tidsskrift for Matematik B,20(16),3339.

[29] Garcia A,Arbelaitz O,Linaza M T,Vansteenwegen P,Souffriau W(2010).Personalized tourist route generation[M]//Current Trends in Web Engineering.Springer,486497.

[30] Garcia A,Linaza M T,Arbelaitz O,Vansteenwegen P(2009).Intelligent Routing System for a Personalised Electronic Tourist Guide:Proceedings of the International Conference on Information and Communication Technologies in Tourism,Amsterdam,The Netherlands[C].

[31] Garcia A,Vansteenwegen P,Arbelaitz O,Souffriau W,Linaza M T(2013).Integrating public transportation in personalised electronic tourist guides[J].Computers & Operations Research,40(3),758774.

[32] Heger C,Offermans S,F(xiàn)rens J(2009).Waiting as part of the fun:Interactive gaming in theme park queues:Proceedings of the fifth Student Interaction Design Research Conference,Eindhoven University of Technology,the Netherlands[C].

[33] Lovejoy T C,Aravkin A Y,SchneiderMizell C(2004).Kalman Queue:An Adaptive Approach to Virtual Queueing[J].The UMAP Journal,25(3),337352.

[34] Lutz H(2008).The impact of virtual queues for amusement parks:Proceedings of the 39th Annual Meeting of the Decision Sciences Institute,Atlanta,Georgia State University[C].

[35] Maruyama A,Shibata N,Murata Y,Yasumoto K,Ito M(2004).A personal tourism navigation system to support traveling multiple destinations with time restrictions:Proceedings of the 18th International Conference on Advanced Information Networking and Applications,F(xiàn)ukuoka,Japan[C].IEEE.

[36] Nadi S,Delavar M R(2011).Multicriteria,personalized route planning using quantifierguided ordered weighted averaging operators[J].International Journal of Applied Earth Observation and Geoinformation,13(3),322335.

[37] Panou M(2012).Personalized application for multimodal route guidance for travellers[J].European Transport Research Review,4(1),1926.

[38] Shiraishi T,Shibata M N N,Nagata M,Shibata N,Murata Y,Yasumoto K,Ito M(2005).A personal navigation system with a schedule planning facility based on multiobjective criteria:Proc.of 2nd International Conference on Mobile Computing and Ubiquitous Networking[C].Citeseer.

[39] Souffriau W,Vansteenwegen P,Vertommen J,Berghe G V,Oudheusden D V(2008).A personalized tourist trip design algorithm for mobile tourist guides[J].Applied Artificial Intelligence,22(10),964985.

[40] Sylejmani K,Dorn J,Musliu N(2012).A Tabu Search approach for Multi Constrained Team Orienteering Problem and its application in touristic trip planning:12th International Conference on Hybrid Intelligent Systems[C].IEEE.

[41] Tsai C Y,Chung S H(2012).A personalized route recommendation service for theme parks using RFID information and tourist behavior[J].Decision Support Systems,52(2),514527.

[42] Tsiligirides T(1984).Heuristic methods applied to orienteering[J].Journal of the Operational Research Society,35,797809.

[43] Universal City Studios INC(2002).Reservation system and methods for theme parks:USA,US2002116235 A1[P].20020822.

[44] Vansteenwegen P,Souffriau W,Berghe G V,Van Oudheusden D(2009b).Metaheuristics for tourist trip planning[M]//Metaheuristics in the service industry.Berlin Heidelberg:SpringerVerlag,1531.

[45] Vansteenwegen P,Souffriau W,Vanden Berghe G,Van Oudheusden D(2009a).Iterated local search for the team orienteering problem with time windows[J].Computers & Operations Research,36(12),32813290.

[46] Vansteenwegen P,Van Oudheusden D(2007).The mobile tourist guide:an OR opportunity[J].OR Insight,20(3),2127.

[47] Yiakoumettis C,Doulamis N,Miaoulis G,Ghazanfarpour D(2013).Active learning of user’s preferences estimation towards a personalized 3D navigation of georeferenced scenes[J].GeoInformatica,136.

[48] Yu C,Chang H(2009).Personalized locationbased recommendation services for tour planning in mobile tourism applications[M]//ECommerce and Web Technologies.Berlin Heidelberg:SpringerVerlag,3849.

[49] Zhang L,Li J,Zhou K,Gupta S D,Li M,Zhang W,Miller M A,Misener J A(2011).Traveler information tool with integrated realtime transit information and multimodal trip planning[J].Transportation Research Record,(2215),110.

Decision Support System to Personalized Route

Guidance Service for Tourists in Theme Parks Based on

Computer Reasoning Technology:Design,Simulation and Comparison

ZHENG Tianxiang1, WU Rong2

(1.Shenzhen Tourism College, Jinan University, Shenzhen 518053, China;

2.Geography and Planning School, Sun YatSen University, Guangzhou 510275, China)

Abstract:

The paper is a study of the decision support system concerning personalized route guidance service for tourists in theme parks. It first outlined a single complete recreational behavior of a tourist while visiting at the park, thus summarizing the components and states related to this behavior. To simulate these components and accomplish the switching states, it presented, using computer reasoning technology, a stateofart model (recreation direction) finding algorithm via contextual environment, which integrated the tourist’s preferences, the availability of the targeted recreation facility (amusement ride) and the queuing situation of other facilities, so as to get the singlestep optimal direction. A computerized simulation system based on discrete event modeling was then implemented and experiment was conducted on an analog dataset as compared with the traditional shortestpath algorithm. The findings show that the proposed model outperforms its competitor in four evaluating indicators including tourist waiting time, amount of nonvisited rides, utilization of each ride and average waiting cost on each ride. The validity of this study depends on its temporalspatial integration by generating an appropriate visiting route for each tourist to follow, which in turn, theoretically, guides him/her to those vacant rides or less congested areas. All these indicate that this work caters to modulating the spatial and temporal distribution of tourist flow in theme parks, where queuing problem generally occurs, by balancing the capacity of each park ride as well as reducing the waiting cost of the tourists.

篇2

關(guān)鍵詞:計算機視覺圖像 精密測量 構(gòu)造幾何模型 信號源的接收

中圖分類號:TP391 文獻標(biāo)識碼:A 文章編號:1009-3044(2013)05-1211-02

新型計算機視覺圖像精密測量是一種基于計算機程序設(shè)計以及圖像顯示的高精度的關(guān)鍵技術(shù),它廣泛用于測量的領(lǐng)域,對于測量的準確性有很好的保證。這種關(guān)鍵技術(shù)是幾何了光學(xué)的特性,發(fā)揮了圖像學(xué)的顯影性,把普通的測量技術(shù)瞬間提升到了一個新的高度。在這項關(guān)鍵技術(shù)中包含了物理學(xué)中光的效應(yīng),圖像中的傳感器以及計算機中的編程軟件,這還不完全,還有一些其他科學(xué)領(lǐng)域知識的輔助,可以說這項關(guān)鍵技術(shù)是一個非常有技術(shù)含量的技術(shù),很值得學(xué)者進行研究。

1 計算機視覺圖像精密測量的關(guān)鍵技術(shù)的具體形式

在以往的測量中,選擇的測量方式還是完全采用機械的形式,但是在使用了計算機視覺圖像精密測量后,完成了許多以往技術(shù)所不能達到的任務(wù)。在我們的研究中,計算機視覺圖像測量的原理是通過攝像機將被處理的對象采集進行影像采集,在多個控制點的數(shù)據(jù)采集完成后,系統(tǒng)會自動將這些圖像進行整合,得出相關(guān)的幾何多變參數(shù),再在計算機上以具體的數(shù)據(jù)顯示出來,以供技術(shù)人員使用參照。

在上面所說的攝像機并不是我們通常意義上生活中使用的攝像機。它是一種可視化較強,表針比較敏感的測試儀??梢詫⒁曈X中的二維形態(tài)通過顯影,記錄在機械的光譜儀上,再將這種的二維圖像做數(shù)學(xué)處理,有二階矩陣轉(zhuǎn)換為三階矩陣,通過播放儀呈現(xiàn)出三維的影像。這時的圖像變?yōu)榱Ⅲw化,更有層次感,效果上也有了明顯的變化,這是一種顯示方法。此外還有一種造價較高的儀器,我們不常使用,就是圖像提取器。同樣是采集控制點的數(shù)據(jù),將數(shù)據(jù)整合在系統(tǒng)之內(nèi),然后對于原始的圖像進行預(yù)處理,不再經(jīng)過有曝光這個程序,將圖像中關(guān)鍵點的坐標(biāo)在整個內(nèi)部軸面上體現(xiàn)出來,提取數(shù)據(jù)幀數(shù),再運用機器的智能識別系統(tǒng),對控制點的坐標(biāo)進行數(shù)據(jù)分析,自動生成圖形,這也可以用于精密測量。它的優(yōu)點就是使用上極其的方面,基本只要架立儀器和打開開關(guān),其他的工作機械系統(tǒng)都會自動的完成。使用的困難就是造價極其的高,不適合一般企業(yè)使用。在基于計算機視覺圖像測量中使用上的原理如下:

1) 計算出觀察控制點到計算機視覺圖像測量儀器的有效距離;

2) 得出觀察點到目標(biāo)控制點之間的三維的運動幾何參數(shù);

3) 推斷出目標(biāo)控制點在整個平面上的表面特征( 大多時候要求形成立體視覺);

4) 還通過觀察可以判斷出目標(biāo)物體的幾何坐標(biāo)方位。

在整個計算機視覺圖像精密測量的關(guān)鍵技術(shù)中最關(guān)鍵的元件就是壓力應(yīng)變電阻儀,這也是傳感器的一部分。壓力應(yīng)變電阻儀的使用方式是將應(yīng)力片粘貼在控制點位上,事先在物體表面打磨平整,清理干凈后,涂抹丙酮試劑,在液體完全風(fēng)干后就可以黏貼應(yīng)力片,通過導(dǎo)線的聯(lián)接,形成了一小段閉合的電路,時刻讓計算機視覺圖像系統(tǒng)可以感應(yīng)到并作跟蹤觀察。因受到來自不同方面諧波的影響后,應(yīng)力片會產(chǎn)生一定數(shù)值的電阻,在電路中,這些電阻會轉(zhuǎn)化為電流,視覺圖像系統(tǒng)接收到了電流后就會顯示在儀表盤上相應(yīng)的數(shù)據(jù),我們就可以根據(jù)儀表盤中的數(shù)據(jù)記錄測量中的數(shù)據(jù),很好的解決了原始機械在使用過程中大量的做無用功所消耗資源的現(xiàn)象。傳感器對每個應(yīng)點都進行動態(tài)的測量,將數(shù)據(jù)模轉(zhuǎn)換成現(xiàn)實中的圖像,精確的成像可以測算出控制點的位置,用計算機視覺圖像精密測量結(jié)合數(shù)據(jù)方面的相關(guān)的分析,得出施工中的可行性報告分析,減低了施工中的成本,將施工的預(yù)算控制在一個合理的范圍之內(nèi)。

當(dāng)無法觀察到控制點是,計算機視覺圖像精密測量可以通過接收信號或是相關(guān)的頻率波段來收集數(shù)據(jù),不會因為以往測量的環(huán)境不好,距離太遠,誤差太大的影響。

2 計算機視覺圖像精密測量的關(guān)鍵技術(shù)分析

在計算機視覺圖像精密測量的關(guān)鍵技術(shù)中解決了很多以往很難完成的任務(wù),但是在使用過程中還是發(fā)生了很多的問題。尤其在視覺圖像的選擇中,無法使用高幀數(shù)的圖片顯示,無法將計算機視覺圖像精密測量的關(guān)鍵技術(shù)的優(yōu)點發(fā)揮出來。我們就計算機視覺圖像精密測量的關(guān)鍵技術(shù)中常見的問題進行討論。

2.1 降低失誤的概率

在很多的數(shù)據(jù)誤差中,有一部分是出現(xiàn)在人為的因素上面。對于機器的不熟悉和操作中的疏忽都會在一定程度上對圖像的視覺感模擬帶來麻煩。對于網(wǎng)絡(luò)設(shè)備的配置上,要經(jīng)常性的學(xué)習(xí),將配置在可能的情況下設(shè)置的更加合理和使用,保證網(wǎng)絡(luò)連接系統(tǒng)的安全性。為防止更多因操作帶來的誤差,選用系統(tǒng)登入的制度,用戶在通過識別后進入系統(tǒng),在采集數(shù)據(jù)后,確定最終數(shù)據(jù)上又相關(guān)的再次確定的標(biāo)識,系統(tǒng)對本身有的登錄服務(wù)器和路由器有相關(guān)的資料解釋,記錄好實用操作的時間,及時備份。

2.2 對于權(quán)限的控制

權(quán)限控制是針對測量關(guān)鍵所提出的一種安全保護措施,它是在使用計算機視覺圖像精密測量的關(guān)鍵技術(shù)中對用戶和用戶組賦予一定的權(quán)限,可以限制用戶和用戶組對目錄、子目錄、文件、打印機和其他共享資源的瀏覽和更改。圖像中的運行服務(wù)器在停止的情況下可以做出不應(yīng)答的操作指令,立刻關(guān)閉當(dāng)前不適用的界面,加快系統(tǒng)的運行速度,對于每天的日志文件實時監(jiān)控,一旦發(fā)現(xiàn)問題及時解決。對于數(shù)據(jù)終端的數(shù)據(jù)可采用可三維加密的方法,定時進行安全檢測等手段來進一步加強系統(tǒng)的安全性。如果通過了加密通道,系統(tǒng)可以將數(shù)據(jù)自動的保存和轉(zhuǎn)換為視圖模式,對于數(shù)據(jù)的審計和運行可以同時進行,這樣就可以很好的保證大地測量中的圖像數(shù)據(jù)安全,利用防護墻將采集中廢棄的數(shù)據(jù)革除在外,避免數(shù)值之間發(fā)生紊亂的現(xiàn)象,進一步改善計算機視覺圖像精密測量的關(guān)鍵技術(shù)。

2.3 開啟自動建立備份系統(tǒng)

計算機視覺圖像精密測量的關(guān)鍵技術(shù)的完善中會常遇到系統(tǒng)突然崩潰或是圖像受到嚴重干擾導(dǎo)致無法轉(zhuǎn)換的一系列情況,發(fā)生這種情況最大的可能性就是系統(tǒng)在處理多組數(shù)據(jù)后無法重新還原成進入界面。這時為保證圖片轉(zhuǎn)換成數(shù)字的系統(tǒng)數(shù)據(jù)不丟失,我們對系統(tǒng)進行備份。選定固定的磁盤保存數(shù)據(jù),定期將產(chǎn)生的數(shù)據(jù)(轉(zhuǎn)換前的圖像和轉(zhuǎn)換后的數(shù)值)導(dǎo)出,保證程序的正常運行。當(dāng)系統(tǒng)一旦發(fā)生錯誤,可以盡快的恢復(fù)數(shù)據(jù)的初始狀態(tài),為測量任務(wù)的完成爭取更多的時間。我們還要減少信號源周圍的干擾,定期的更新系統(tǒng)數(shù)據(jù)庫,保持數(shù)據(jù)采集的穩(wěn)定性,把攝像機記錄出的數(shù)據(jù)節(jié)點保存在相應(yīng)的技術(shù)圖紙上,用這樣的方式來知道測量工作。系統(tǒng)備份的數(shù)據(jù)還可以用于數(shù)據(jù)的對比,重復(fù)測量后得出的數(shù)據(jù),系統(tǒng)會自動也備份的數(shù)據(jù)進行比對,發(fā)現(xiàn)誤差值在規(guī)定以外,就會做出相應(yīng)的預(yù)警,這樣也能在工作中降低出現(xiàn)誤差的概率。

3 計算機視覺圖像精密測量的關(guān)鍵技術(shù)遇到的困難和使用前景

計算機視覺圖像精密測量的關(guān)鍵技術(shù)作為一種新興技術(shù)在使用時間上不過十幾年,其使用的程度已經(jīng)無法估算。正是因為它的簡單、使用、精度高以及自動化能力卓越的特點受到了測量單位的廣泛青睞。在測量方面的這些可靠性和穩(wěn)定性也是有目共睹的。在土木和機械測量的行業(yè)計算機視覺圖像精密測量的關(guān)鍵技術(shù)都會有廣泛和良好的使用,前景也是十分的廣闊。但是不容忽視該技術(shù)也有一些弊端。這項關(guān)鍵技術(shù)中涵蓋的學(xué)科非常的多,涉及到的知識也很全面,一旦出現(xiàn)了機器的故障,在維修上還是一個很大的問題,如何很好的解決計算機視覺圖像技術(shù)的相關(guān)核心問題就是當(dāng)下亟待解決的。

我們都知道,人的眼睛是可以受到吱聲的控制,想要完成觀測是十分簡單的,但是在計算機視覺圖像技術(shù)中,畢竟是采取攝像機取景的模式,在取得的點位有的時候不是特別的有代表性,很難將這些問題具體化、形象化。達不到我們設(shè)計時的初衷。所以在這些模型的構(gòu)建中和數(shù)據(jù)的轉(zhuǎn)換上必須有嚴格的規(guī)定和要求,切不可盲目的實施測量,每項技術(shù)操作都要按規(guī)程來實施。

上文中也談到了,計算機視覺圖像精密測量的關(guān)鍵技術(shù)中最主要的構(gòu)建是傳感器,一個合理的傳感器是體統(tǒng)的“心臟”,我們在儀器的操作中,不能時時刻刻對傳感器進行檢查,甚至這種高精度的元件在檢查上也并不是一件簡單的事情,通過不斷的研究,將傳感器的等級和使用方法上進行一定的創(chuàng)新也是一項科研任務(wù)。

4 結(jié)束語

在測量工程發(fā)展的今天,很多的測量技術(shù)已經(jīng)離不了計算機視覺圖像技術(shù)的輔助,該文中詳細的談到了基于計算機視覺圖像精密測量的關(guān)鍵技術(shù)方面的研究,對于之中可能出現(xiàn)的一些問題也提出了相應(yīng)的解決方案。測量工程中計算機視覺圖像精密測量的關(guān)鍵技術(shù)可以很好的解決和完善測量中遇到的一些問題,但是也暴露出了很多的問題。

將基于計算機視覺圖像精密測量的關(guān)鍵技術(shù)引入到測量工程中來,也是加強了工程建設(shè)的信息化水平??梢灶A(yù)見的是,在未來使用計算機視覺圖像技術(shù)建立的測量模型會得到更多、更好的應(yīng)用。但作為一個長期復(fù)雜的技術(shù)工程,在這個建設(shè)過程中定會有一些困難的出現(xiàn)。希望通過不斷的發(fā)現(xiàn)問題、總結(jié)經(jīng)驗,讓計算機視覺圖像精密測量的關(guān)鍵技術(shù)在測量中作用發(fā)揮的更好。

參考文獻:

[1] 湯劍,周芳芹,楊繼隆.計算機視覺圖像系統(tǒng)的技術(shù)改造[J].機電產(chǎn)品開發(fā)與創(chuàng)新周刊,2005,14(18):33-36.

[2] 段發(fā)階,等. 拔絲??仔斡嬎銠C視覺檢測技術(shù)[J]. 光電工程時報, 1996,23(13):189-190.

篇3

關(guān)鍵詞:計算機視覺技術(shù) 鐵路檢測 應(yīng)用

中圖分類號:TP391 文獻標(biāo)識碼:A 文章編號:1007-3973(2012)002-075-03

1 前言

自1825年世界第一條鐵路在英國出現(xiàn)以來,鐵路已經(jīng)成為人們不可或缺的交通工具,越來越多的人在使用鐵路出行,由于近年來鐵路事故頻頻發(fā)生,促使了計算機視覺技術(shù)在鐵路檢測上的廣泛使用并大力發(fā)展。

傳統(tǒng)的鐵路檢測一直是靠人工和靜態(tài)檢測,這種檢測缺乏實時性和準確性,并且效率低下,根本無法滿足鐵路的發(fā)展。這就要求研究一種新的檢測方法來適應(yīng)環(huán)境的發(fā)展,人們就試圖將計算機視覺技術(shù)應(yīng)用于鐵路檢測上,并取得了很好的效果。將計算機視覺技術(shù)應(yīng)用在鐵路檢測上顯著提高了鐵路檢測的實時性、準確性,有效的減輕了人工檢測中工作條件惡劣,工作量大等缺點。它能在列車行駛的過程中就能對鐵路和列車狀況進行檢測,并及時的做出預(yù)警,防止安全事故的發(fā)生。目前有關(guān)鐵路檢測主要集中在鐵路信號檢測、軌道檢測、接觸網(wǎng)檢測、電力機車檢測及站臺環(huán)境監(jiān)測等五個方面。

2 計算機視覺技術(shù)

計算機視覺,也稱機器視覺。它是利用一個代替人眼的圖像傳感器獲取物體的圖像,將圖像轉(zhuǎn)換成數(shù)字圖像,并利用計算機模擬人的判別準則去理解和識別圖像,達到分析圖像和作出結(jié)論的目的。

計算機視覺是多學(xué)科的交叉和結(jié)合,涉及到數(shù)學(xué)、光學(xué)、人工智能、神經(jīng)生物學(xué)、心理物理學(xué)、計算機科學(xué)、圖像處理、圖像理解、模式識別等多個領(lǐng)域。計算機視覺已有多年的發(fā)展歷程。隨著計算機、控制理論、模式識別、人工智能和生物技術(shù)的發(fā)展,計算機視覺在機器人、工業(yè)檢測、物體識別的應(yīng)用越來越廣,研究方向也從二維到三維,從串行到并行,從直接依賴于輸入信號的低層處理到依賴于特征、結(jié)構(gòu)、關(guān)系和知識的高層處理。

一般的計算機視覺系統(tǒng)是有CCD(電荷耦合器件)攝像機、裝備有圖像采集板的計算機、光照系統(tǒng)以及專用圖像處理軟件等組成。CCD攝像機將所要研究的對象和背景以圖像的形式記錄下來,這其實是一個光電傳感器,將光學(xué)信號轉(zhuǎn)成電信號,圖像采集板把采集的電信號轉(zhuǎn)為數(shù)字信號,即數(shù)字化,一般情況下在攝取圖像時都需要一個照明系統(tǒng)提供光照,然后再用專用的圖像處理軟件對圖像進行處理,輸出分析結(jié)果。

3 計算機視覺技術(shù)在鐵路信號中的應(yīng)用

鐵路信號燈和現(xiàn)在的交通公路上的紅綠燈是一個功能,但鐵路和公路不同,鐵路有限定的道路,列車必須在限定的股道上行駛,所以一旦與其他車輛相遇的話根本沒有辦法避讓,如果發(fā)生車禍將會對國家和人民的生命和財產(chǎn)造成嚴重的損失,因此列車必須嚴格按照信號燈的指示行駛。

鐵路信號燈識別主要是利用了信號燈在不同情況下會發(fā)出特定色彩光的特點。文獻[1]在HSV空間中對S分量圖像邊緣檢測和膨脹等,結(jié)合各種信號燈色調(diào)H分量的取值范圍得到信號燈區(qū)域,然后多次腐蝕直到消除孤立點得到信號燈的邊緣,最后填充信號燈區(qū)域,從而實現(xiàn)了信號燈的識別。在文獻[2]也與此類似。文獻[3]將彩色圖像由RGB模式轉(zhuǎn)化為HSI模式,用彩色特征聚類分析法來對圖像進行分割,文中提出了基于顏色和形狀相結(jié)合的復(fù)雜環(huán)境中目標(biāo)檢測與識別方法,用Hough變化來提取目標(biāo)邊界,從而提取出特定目標(biāo),而后得到指示燈區(qū)域所有像素的H,S統(tǒng)計值確定信號燈的顏色。在文獻[4]提出一種基于改進的Hough變化的吊車信號燈識別算法。Roberto將攝取的圖片轉(zhuǎn)換到HIS顏色空間,用基于形狀特征和模板匹配的方法探測到相關(guān)的鐵路標(biāo)志而放棄無關(guān)的基礎(chǔ)設(shè)施。

為了部分消除因為光照條件、背景和拍攝角度對目標(biāo)識別的影響,文獻[5]提出使用一種利用sift特征的方法,它首先建立已知樣本模型的特征集,然后將視頻流每幀灰度圖像的sift特征與之比較,從而實現(xiàn)對目標(biāo)的檢測或跟蹤。實驗表明該方法不僅能避免目標(biāo)的錯誤識別,而且也明顯優(yōu)于基于邊緣檢測的算法,在識別準確率上達到了90%。

4 計算機視覺技術(shù)在軌道檢測中的應(yīng)用

隨著世界鐵路運營速度的不斷提高,列車在行駛時對軌道的撞擊、摩擦加劇,這就會造成軌道的變形、零件松動、磨損乃至缺失等,這些都會對列車的安全性造成嚴重影響,極有可能會造成鐵路安全事故的發(fā)生。因此軌道設(shè)備具備良好的狀態(tài)是鐵路運輸安全的重要保證。

隨著電子技術(shù)和檢測技術(shù)的發(fā)展,軌道檢測技術(shù)也經(jīng)歷了翻天覆地的變化,其中也有不少研究機構(gòu)將計算機視覺技術(shù)應(yīng)用于軌道檢測上,且取得了若干有效的檢測方法。

軌道表面缺陷對列車行駛的質(zhì)量和鐵路系統(tǒng)的安全性會造成嚴重的影響,文獻[7]提出了一種軌道表面缺陷檢測的實時視覺檢測系統(tǒng)。利用跟蹤提取算法分割出軌道的灰度圖像,然后用局部歸一化法增強軌道圖像的對比度,最后用基于投影輪廓的缺陷定位法檢測缺陷。該算法對噪聲有較強的魯棒性和計算速度快,在一定程度上克服了光照不均和軌道表面反射性質(zhì)不同對圖像的影響,但對局部歸一化過程中參數(shù)的選擇有待進一步研究,以使該系統(tǒng)有更強的魯棒性。該系統(tǒng)在216km/h速度下能進行實時檢測,但隨著檢測速度的提高檢測的準確度會明顯下降且缺乏實時性。

文獻[8]利用一排結(jié)構(gòu)光視覺傳感器,將鋼軌輪廓的大圓周和小圓周的中心作為檢查點。首先結(jié)構(gòu)光視覺傳感器拍攝鐵軌側(cè)面并且將其標(biāo)記 在參考坐標(biāo)幀中,最后通過比較測量的鋼軌輪廓與參考輪廓的比較計算出鐵軌磨損程度。該方法簡單快速精確且不需要特殊的圖像處理設(shè)備,在列車較高速度時仍然能達到良好效果。

5 計算機視覺技術(shù)在接觸網(wǎng)檢測中的應(yīng)用

接觸網(wǎng)是沿鐵路線上空架設(shè)的向電力機車供電的特殊形式的輸電線路。其由接觸懸掛、支持裝置、定位裝置、支柱與基礎(chǔ)幾部分組成。它是軌道交通的主要組成部分,主要為機車提供動力,接觸網(wǎng)的連接件由于受外界因素的影響容易產(chǎn)生過熱現(xiàn)象,嚴重時會導(dǎo)致供電中斷,引發(fā)列車停運事故。

我國的計算機視覺技術(shù)的接觸網(wǎng)檢測系統(tǒng)是基于德國相關(guān)技術(shù)而建立起來的,目前基于計算機視覺技術(shù)的接觸網(wǎng)磨耗檢測主要有兩種方案:(1)基于鏡面反射,激光照射接觸線,線性CCD照相機捕獲反射圖像;(2)基于漫反射原理和CMOS(互補金屬氧化物半導(dǎo)體)照相機。由于長期的頻繁摩擦,接觸網(wǎng)與受電弓接觸部分很少被空氣氧化,所以用光進行照射時該部分光反射率明顯高于其他部分,因此這也為計算機視覺技術(shù)用于接觸網(wǎng)檢測提供了可能。

基于機器視覺的接觸網(wǎng)檢測系統(tǒng)主要是建立在圖像識別和圖像處理等視覺技術(shù)基礎(chǔ)之上的,檢測的內(nèi)容涵蓋接觸網(wǎng)的所有基本幾何參數(shù)。隨著鐵路的發(fā)展,原有的檢測系統(tǒng)已經(jīng)暴露出了一些問題,已無法滿足需求,所以研究人員在系統(tǒng)硬件設(shè)備不變的情況下提出了許多改進的算法,如文獻[9]針對現(xiàn)行的接觸網(wǎng)定位器傾斜度檢測方法效率低下、精確度不高的缺點,提出了一種基于計算機視覺的接觸網(wǎng)定位器傾斜度自動測量裝置,應(yīng)用圖像分割、剔除干擾線、圖像細化等算法,對采集的圖像進行處理,然后利用改進的霍夫(Hough)變換檢測細化后的圖像,對相鄰的特征像素點進行聚類并感知編組,最后用隨機Hough變換使感知編組后的每條線段更接近直線,進而計算裝置中定位器的傾斜度,實驗證明該算法精度高、速度快。

6 計算機視覺技術(shù)在電力機車檢測中的應(yīng)用

在列車的行進過程中,機車車輪與鋼軌接觸面不斷發(fā)生摩擦,也就是輪緣與踏面的摩擦。從而會造成踏面的擦傷或剝離,而剝離會嚴重影響列車運行的安全性和平穩(wěn)性以及軌道設(shè)施的使用壽命,因此需要對輪緣進行定期的檢測和維修。

傳統(tǒng)的檢測方法需要人工逐項檢測,存在費時費力、工作量大、工作環(huán)境差、效率低等缺點,所以人們就提出了一種基于計算機視覺技術(shù)的檢測技術(shù),該技術(shù)是一種非接觸式檢測方法,它能檢測出所有關(guān)于火車輪緣輪廓的幾何參數(shù),從而計算出火車輪緣的磨損情況。這種檢測方法檢測速度快、準確率高且大大減輕了勞動強度,在實驗中取得了滿意的效果,并且在實際檢測中也得到了廣泛的應(yīng)用。

文獻[10]中研發(fā)設(shè)計了一種利用CCD成像測量技術(shù)、圖像處理理論和計算機控制等相關(guān)技術(shù),提出了一種非接觸式的在線測量系統(tǒng)。采用二元多項式方法對由于硬件裝置引起的誤差的圖像進行幾何校正,用統(tǒng)計均值法對圖像進行分割,從而求出車輪踏面的各項參數(shù),通過在實驗室對標(biāo)準物進行測試實驗而得到的測量數(shù)據(jù)結(jié)果進行分析而得出。此系統(tǒng)能夠完成對火車輪對幾何參數(shù)的測量,并且可得到相對準確的測量結(jié)果。

為了解決檢測輪緣高度和寬度存在精度難以保證及穩(wěn)定性不高的問題,文獻[11]提出了一種基于三角法測量的在線監(jiān)測系統(tǒng),該系統(tǒng)由CCD高速攝像機和結(jié)構(gòu)光發(fā)射器完成數(shù)據(jù)的采集,然后利用三角測量原理導(dǎo)出測量模型和計算模型,根據(jù)輪緣高度和寬度的定義完成對高度和寬度的測量,最終對輪緣磨損程度進行量化,實驗表明該算法測量精度高,結(jié)果穩(wěn)定可靠。

7 計算機視覺技術(shù)在站臺環(huán)境監(jiān)測中的應(yīng)用

近年來鐵路交通事業(yè)發(fā)展迅速,鐵路客流量也不斷增大,如中國每年的春運期間都有上億人次通過火車返鄉(xiāng),各種危害乘客安全的事故也時有發(fā)生,因此世界各國特別是中國站臺監(jiān)控就顯得越來越重要,目前的站臺監(jiān)控主要是依靠安裝在各個角落的閉路電視或?qū)I(yè)技術(shù)人員,這不僅需要專業(yè)技術(shù)知識還需要大量的人力物力。隨著計算機、圖像處理等技術(shù)的快速發(fā)展,對站臺的自動監(jiān)控也逐漸成為發(fā)展趨勢。

近年來人們做了許多關(guān)于站臺人群檢測的研究,這些研究大都使用鐵路站臺中的閉路電視(CCTV)系統(tǒng),在現(xiàn)代的CCTV系統(tǒng)中基本上使用的是數(shù)字化圖像,在人群監(jiān)測過程中大量使用了數(shù)字圖像處理技術(shù),如邊緣檢測、細化、像素計算等,通過圖像的處理可以輕易的得到想要的結(jié)果。

文獻[12]仍采用原有的CCTV監(jiān)控系統(tǒng)拍攝的灰度圖像作為處理對象,利用基于視覺的經(jīng)過最小二乘法和全局搜索的混合算法訓(xùn)練的工業(yè)的額神經(jīng)網(wǎng)絡(luò)來估算站臺的擁擠程度,該系統(tǒng)在實際的運行中獲得了較高的精確度,雖然不能計算人數(shù)但卻能實時的預(yù)測人群的密度。

文獻[13]所設(shè)計的系統(tǒng)就較為復(fù)雜,它利用多臺攝像頭對站臺進行檢測。首先判斷站臺上列車的四種狀態(tài),如:沒有列車、有列車、列車正在出站、列車正在入站等,然后對物體或行人檢測及跟蹤,最后對所檢測的結(jié)果綜合分析,做出合理的預(yù)警或警告。

8 計算機視覺技術(shù)在鐵路檢測上的發(fā)展趨勢

隨著計算機視覺技術(shù)的鐵路檢測中的應(yīng)用越來越廣泛和深入,并且隨著計算機視覺技術(shù)等關(guān)鍵技術(shù)的不斷發(fā)展,計算機視覺技術(shù)在鐵路檢測上應(yīng)用發(fā)揮更大的作用,它就目前而言在鐵路檢測的應(yīng)用上仍然存在技術(shù)難題需要研究:

篇4

關(guān)鍵詞:動態(tài)場景;自適應(yīng)預(yù)測;多特征融合;計算機視覺;運動目標(biāo)

接受信息的關(guān)鍵手段之一就是視覺系統(tǒng),隨著科學(xué)技術(shù)水平的不斷發(fā)展,以及計算機和信號處理理論的誕生,讓機器擁有人類視覺功能已經(jīng)不再是夢。對所采集視頻中的運動目標(biāo)進行跟蹤、檢測,并對其目標(biāo)行為進行分析,就是運動目標(biāo)分析的內(nèi)容,運動目標(biāo)分析是計算機視覺領(lǐng)域關(guān)鍵內(nèi)容之一,其屬于圖像理解與圖像分析的范疇。而在運動目標(biāo)分析系統(tǒng)中,跟蹤與檢測運動目標(biāo)則為中級和低級處理部分,是分析與理解行為的高等層分析模塊的基礎(chǔ)。檢測與跟蹤運動目標(biāo)技術(shù)主要包括了:機器人視覺導(dǎo)航、軍事領(lǐng)域、運動圖像編碼、交通管制、視覺監(jiān)視等。

1目標(biāo)檢測算法

連續(xù)圖像序列由視頻中提取出,由前景區(qū)域與背景區(qū)域共同組成了整個畫面。前景區(qū)域包含了如運動的人體、車輛等動態(tài)要素,它是指人們較為感興趣的區(qū)域。而背景區(qū)域主要包含例如樹木、建筑物等靜態(tài)要素,它的像素值僅發(fā)生微弱變化或者不產(chǎn)生變化。在連續(xù)圖像序列中,采用一系列算法分隔開背景區(qū)域和前景區(qū)域,將運動目標(biāo)信息有效提取,則為運動目標(biāo)檢測。以靜態(tài)場景為基礎(chǔ)的運動目標(biāo)檢測算法包括了光流法、背景差分法、幀間查分法等,文章主要針對背景差分法進行介紹。

背景差分法通常適用于靜態(tài)場景,其是將背景圖像與當(dāng)前幀圖像進行差分,運動目標(biāo)依靠閥值化進行檢測,因為該算法僅能夠在背景變化緩慢或者不發(fā)生變化的情況下應(yīng)用,因此就有著一定的局限性。假設(shè)當(dāng)前幀圖像為fk(x,y),背景圖像B(x,y)可通過一定的方法得出,而這時背景差分圖像則為:

(1)

而假設(shè)二值化閥值為Th,二值化圖像B(x,y)則為:

(2)

運動目標(biāo)檢測結(jié)果可通過數(shù)學(xué)形態(tài)學(xué)處理獲得。

2 背景模型的實時更新

要更新背景圖像可采用一階KALMAN濾波來實現(xiàn),為了克服氣候變化、光照變化等外部環(huán)境變化對運動檢測產(chǎn)生的影響,采用一階KALMAN濾波更新背景圖像公式如下:

Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)

而增益因子則為:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)

公式中?琢1和?琢2是權(quán)值系數(shù);M是第k時刻二值化后目標(biāo)圖像中p像素的值;B為背景圖像;I為當(dāng)前幀圖像。要想將運動目標(biāo)從背景序列圖像中有效分割出來,就必須要達到?琢2足夠小的條件,且?琢1應(yīng)等于或者大于10?琢2,若?琢1值過大,就會將算法自身的去噪特性喪失,在序列背景圖像中也會存儲越來越多的運動變化。

3 更新車輛目標(biāo)模型

核與活動輪廓算法具有效率高、技術(shù)復(fù)雜度低等特點,它以非參數(shù)核概率密度估計理論為基礎(chǔ),在視頻運動目標(biāo)跟蹤中廣泛應(yīng)用。彩色圖像序列通過攝像機獲取,人臉目標(biāo)模型可以采用RGB顏色空間來進行描述。在跟蹤車輛的過程中,噪聲、遮擋、光照等干擾或多或少存在,因干擾因素的存在,車輛像素特征也會發(fā)生相應(yīng)的微弱變化。若不對目標(biāo)模型進行更新,會對跟蹤精度產(chǎn)生影響,所以,采用的矩形模板會包括一定背景。而在實施跟蹤的過程中,要對車輛目標(biāo)模型進行更換。如果其過程物遮擋,當(dāng)BHATTACHARYYA系數(shù)滿足?籽>Tudm條件時,更新車輛目標(biāo)模型,更新模型為:

(5)

公式中Tudm是模板更新閥值;qk-1是更新之前的車輛目標(biāo)模型。通過視頻跟蹤,在近場景和遠場景拍攝到的視頻中,多尺度圖像空間由各個幀圖像構(gòu)成。例如:將將書本作為跟蹤對象,由遠及近從書本的正上方拍攝六十幀圖像,為了能使矩形框正好能夠包含書本,對每幀圖像張書本手工劃定矩形框,并對框內(nèi)圖像的信息量進行統(tǒng)計。最后,隨書本尺度的變化,給出圖像信息量變化曲線。

4 計算機視覺原理

計算機視覺是一門研究怎樣使機器進行觀察的科學(xué),更切確地說,就是指利用電腦和攝影機代替人眼對目標(biāo)進行識別、跟蹤和測量等機器視覺,并進一步做圖形處理,用電腦處理成為傳送給儀器檢測或更適合人眼觀察的圖像。計算機視覺研究相關(guān)的理論和技術(shù)作為一個科學(xué)學(xué)科,嘗試創(chuàng)建能夠從圖像或者多維數(shù)據(jù)中獲取信息的人工智能系統(tǒng)。這里所指的信息指Shannon定義的,可以用來幫助做一個決定的信息。因為感知可以看作是從感官信號中提取信息,所以計算機視覺也可以看作是研究如何使人工系統(tǒng)從圖像或多維數(shù)據(jù)中感知的科學(xué)。

計算機視覺就是由計算機來代替大腦完成處理和解釋,用各種成象系統(tǒng)代替視覺器官作為輸入敏感手段。使計算機能象人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力就是計算機視覺的最終研究目標(biāo),而需要經(jīng)過長期的努力才能達到這個目標(biāo)。所以,在實現(xiàn)最終目標(biāo)以前,通過努力的中期目標(biāo)是建立一種視覺系統(tǒng),這個系統(tǒng)能依靠反饋的某種程度的智能和視覺敏感完成一定的任務(wù)。例如:計算機視覺的一個重要應(yīng)用領(lǐng)域就是自主車輛的視覺導(dǎo)航,但要實現(xiàn)自主導(dǎo)航的系統(tǒng),卻還沒有條件實現(xiàn)象人那樣能識別和理解任何環(huán)境。所以,人們通過不懈的努力,研究在高速公路上具有道路跟蹤能力,有效避免與前方車輛碰撞的視覺輔助駕駛系統(tǒng)。人類視覺系統(tǒng)是有史以來,人們所知道的功能最強大和完善的視覺系統(tǒng)。這里要指出的一點是在計算機視覺系統(tǒng)中計算機起代替人腦的作用。計算機視覺可以而且應(yīng)該根據(jù)計算機系統(tǒng)的特點來進行視覺信息的處理,但并不等于計算機必須按人類視覺的方法完成視覺信息的處理。可以說,對人類視覺處理機制的研究將給計算機視覺的研究提供指導(dǎo)和啟發(fā),所以,用計算機信息處理的方法研究人類視覺的機理,建立人類視覺的計算理論,與此同時也是一個十分重要和讓人感興趣的研究領(lǐng)域。這方面的研究被稱為計算視覺。計算視覺可被認為是計算機視覺中的一個研究領(lǐng)域。計算機視覺領(lǐng)域的不完善性與多樣性為其突出特點。

5 結(jié)束語

對視頻中的運動目標(biāo)進行跟蹤、識別、檢測,并對目標(biāo)行為進行研究、分析,這就是基于視覺運動目標(biāo)分析。以計算機視覺為基礎(chǔ),分析運動目標(biāo),包括了目標(biāo)行為的理解與分析、目標(biāo)跟蹤、運動目標(biāo)檢測、預(yù)處理圖像等,它是計算機視覺領(lǐng)域重要內(nèi)容之一。理解與分析運動目標(biāo)的行為,既是計算機視覺的根本目的之一,也是檢測與跟蹤運動目標(biāo)的最終目標(biāo)。從理論層考慮,理解與分析運動目標(biāo)的行為可以分為人工智能理論研究與模式識別。簡要闡述基于計算機視覺的運動目標(biāo)分析,而所面臨的是對運動目標(biāo)行為的理解。

參考文獻

[1]楊可,劉明軍,毛欣,夏維建,劉偉,周旋,吳煒,周凱.基于計算機視覺的電纜終端表面溫升分析系統(tǒng)[J].電視技術(shù),2013(7).

[2]葉闖,沈益青,李豪,曹思汗,王柏祥.基于人類視覺特性(HVS)的離散小波變換(DWT)數(shù)字水印算法[J].浙江大學(xué)學(xué)報:理學(xué)版,2013(2).

[3]何青海,馬本學(xué),瞿端陽,李宏偉,王寶.基于機器視覺棉葉螨自動監(jiān)測與分級方法研究[J].農(nóng)機化研究,2013(4).

[4]賈挺猛,茍一,鮑官軍,董茂,楊慶華.基于機器視覺的葡萄樹枝骨架提取算法研究[J].機電工程,2013(4).

篇5

關(guān)鍵詞 陶瓷設(shè)計,計算機視覺、觸覺設(shè)計

1前 言

歷經(jīng)數(shù)十年發(fā)展,CAD/CAM技術(shù)已取得了巨大成功,并迎來了數(shù)字化設(shè)計、數(shù)字化制造的時代。NURBS曲線曲面(非均勻有理B樣條)以其強大的形狀表示能力和配套的計算、編輯算法,已成為事實上的產(chǎn)品表示標(biāo)準。細分曲面、隱式曲面是近年曲面造型研究的熱點,它們突破了NURBS在拓撲結(jié)構(gòu)上的局限性,更容易表達某些復(fù)雜的形狀。

在陶瓷設(shè)計領(lǐng)域,經(jīng)常需要設(shè)計人體、動物等自然雕塑形體,現(xiàn)有的CAD系統(tǒng)可采用NURBS曲面、細分曲面、隱式曲面等來描述這些復(fù)雜對象[1],但如何能快速、精確地設(shè)計出來,目前尚無有效的數(shù)字化工具。人們認識、改變外在事物時,主要利用視覺與觸覺的感官功能,通過手眼協(xié)調(diào)來設(shè)計出新的事物,設(shè)計師在設(shè)計新的對象時,也可如此操作。

近些年出現(xiàn)了一些價格較為便宜的觸覺式設(shè)計系統(tǒng),如FreeForm系統(tǒng),它抽取了大型虛擬現(xiàn)實系統(tǒng)的單一觸覺功能,可提供真實感的數(shù)字雕塑工具。但一般設(shè)計人員使用后的效果并不理想,雖可以在局部修修補補,但缺乏對整體形態(tài)的把握[2]。

本文提出了一套視覺與觸覺相結(jié)合的數(shù)字設(shè)計系統(tǒng),以數(shù)碼相機和力感觸覺系統(tǒng)為工具,快速實現(xiàn)復(fù)雜形體的數(shù)字建模。首先利用數(shù)碼相機拍照,攝取參考對象的圖像,通過一個專門設(shè)計的攝影測量與計算機視覺集成系統(tǒng)重構(gòu)出參考對象的三維數(shù)字模型;然后將此模型輸入到觸覺設(shè)計系統(tǒng),經(jīng)局部的修正,得到新的設(shè)計模型。以下詳述系統(tǒng)組成及原理,并給出設(shè)計實例予以驗證。

2造型設(shè)計系統(tǒng)的組成

本文所提出的系統(tǒng)主要分為兩個模塊:視覺子系統(tǒng)與觸覺子系統(tǒng)。其中觸覺子系統(tǒng)是購置的,視覺子系統(tǒng)是獨立開發(fā)的[3]。相機采用奧林巴斯CL5050,拍攝的照片經(jīng)視覺反求系統(tǒng)處理后,得到VRML格式的三維模型,然后輸入FreeForm觸覺設(shè)計系統(tǒng),進行再設(shè)計,最終輸出改型設(shè)計后的數(shù)字模型。圖1所示是視覺系統(tǒng)實物,圖2是觸覺系統(tǒng)的實物照片。

2.1 視覺系統(tǒng)[4]

本文提出的系統(tǒng)中,視覺系統(tǒng)為自主開發(fā)的,先講述相關(guān)的主要原理。

本文采用的視覺系統(tǒng)結(jié)合了攝影測量法的高精度與計算機視覺法的靈活性。近年來由圖片生成3D模型是一個熱門的計算機視覺研究領(lǐng)域,并相應(yīng)提出了諸多的研究方法,其核心問題包括:相機標(biāo)定、對應(yīng)點匹配及3D重構(gòu)等;針對每個問題均有大量的研究算法,特別是相機標(biāo)定技術(shù)幾乎成為一個關(guān)鍵環(huán)節(jié)。

類似于測量系統(tǒng)控制網(wǎng)的概念,我們設(shè)計了一套控制特征點,相機直接根據(jù)控制特征點進行標(biāo)定,可得到精度較高的相機內(nèi)外參數(shù)。圖3所示是控制點分布的實物圖。

我們對控制點分布采取了特殊設(shè)計,使任意角度下拍照,均有10個(通常要求至少6個)以上特征點被攝取。對特征點,采用了高精度的專業(yè)攝影測量系統(tǒng)Aicon加以標(biāo)定,其空間坐標(biāo)保存于一個數(shù)據(jù)文件中,以備相機標(biāo)定時采用。

有了高精度的相機參數(shù),就可以利用成熟的計算機視覺方法重構(gòu)3D模型。我們采用了遮擋輪廓法[1]及空間剝離法[2]這兩種對環(huán)境要求較低、算法較為穩(wěn)定的方法,處理標(biāo)定過的圖像,得到三維模型主要形態(tài),可作為觸覺設(shè)計的基礎(chǔ)。

2.2 觸覺系統(tǒng)

觸覺子系統(tǒng)采用FreeForm觸覺式虛擬設(shè)計系統(tǒng),通常也亦稱為3D Touch系統(tǒng),采用了力回饋技術(shù),手握觸覺筆在空間旋轉(zhuǎn)移動,屏幕里相應(yīng)的雕刻刀便隨之移動;當(dāng)?shù)窨痰督佑|到模型時,會有力回饋到握筆的手上,讓使用者感受到接觸時的力量。在雕刻時可設(shè)定模型的軟硬度,進而調(diào)整雕刻所需的力。常規(guī)的實物雕刻操作,在系統(tǒng)內(nèi)均有對應(yīng)的虛擬工具,無論是雕刻效果,還是虛擬雕刻過程中的感受,與實際雕刻幾乎一樣,提供了十分逼真的雕刻環(huán)境。

3陶瓷狗的造型設(shè)計

在陶瓷設(shè)計中,經(jīng)常需要參考某種實物樣品。本實驗以圖1中的玩具狗作為參考對象,借助視覺、觸覺集成系統(tǒng)進行了兩次造型、建模試驗。視覺系統(tǒng)從不同角度攝取了10幅圖片,由這10幅圖片生成一個三維模型(見圖4)。整個建模過程僅需十幾分鐘,方便快捷。輸出的模型包含了參考對象的主要形態(tài),稍加修整,即可得到新的改型設(shè)計。

以視覺系統(tǒng)的輸出為骨架,在FreeForm系統(tǒng)中進行細部的修整與再設(shè)計,并可添加修飾色彩,得到新的設(shè)計結(jié)果,見圖5。

在試驗中,如果僅依靠觸覺設(shè)計系統(tǒng),即使熟練的操作人員,要設(shè)計出比例協(xié)調(diào)、結(jié)構(gòu)合理的模型,也需要花費一天或數(shù)天時間。視覺系統(tǒng)的輸入極大地簡化了主體形態(tài)的構(gòu)造,使不太熟練的設(shè)計人員也能利用觸覺系統(tǒng),很快設(shè)計出新的作品。

4總 結(jié)

本文提出了視覺、觸覺相結(jié)合的方法,利用計算機視覺系統(tǒng)幫助設(shè)計人員觀察、感知設(shè)計對象,并把結(jié)果以數(shù)字形式保存起來;觸覺系統(tǒng)直接利用已有的觀察結(jié)果,通過手眼協(xié)調(diào)完成最終設(shè)計。這種混合系統(tǒng)彌補了非專業(yè)人員所缺乏的空間形體洞察力及操縱力,使他們不用經(jīng)過長期的專業(yè)訓(xùn)練,也可快速地設(shè)計出新的作品。本文給出的實例已驗證了這一觀點。

本文揭示了虛擬雕刻過程所忽略的視覺思維環(huán)節(jié),并設(shè)計出計算機視覺系統(tǒng)來加以彌補,取得了良好的結(jié)果,這套視、觸覺結(jié)合的設(shè)計系統(tǒng)可用于陶瓷產(chǎn)品的設(shè)計制造,可大幅度提高設(shè)計效率和設(shè)計質(zhì)量。

參考文獻

1 Potemesil M.Generating octree model of 3D objects from their silhouetttes in a sequence of

images[J].Computer Vision&Graphics Image Processing,1987,40(1):1~29

2 K.Kutulakos and S.Seitz. A theory of shape by space carving[J]. International Journal of Computer

Vision,2000, 38(3):199~218

篇6

關(guān)鍵詞關(guān)鍵詞:OpenCV;人臉檢測;微笑檢測;JNI

DOIDOI:10.11907/rjdk.162330

中圖分類號:TP319文獻標(biāo)識碼:A文章編號文章編號:16727800(2017)001011502

隨著人工智能技術(shù)的發(fā)展,機器學(xué)習(xí)、計算機視覺等領(lǐng)域也逐漸成為計算機科學(xué)中的熱點問題,人臉檢測便是計算機視覺中的一個分支。OpenCV作為一個開源的視覺庫,提供了不少關(guān)于人臉檢測的模型與處理接口,而大部分接口與算法均采用C/C++語言編寫。Java雖有其跨平臺的巨大優(yōu)勢,但是這種特性也給Java帶來了局限性,在調(diào)用動態(tài)數(shù)據(jù)庫文件時存在不便。因此,通過JNI工具,可以利用C/C++語言的特性彌補Java的不足[13]。

1相關(guān)技術(shù)原理

1.1JNI技術(shù)分析

JNI(Java Native Interface)提供了若干API 實現(xiàn)Java與其它語言的通信(主要是C/C++)。從Java 1.1開始,JNI標(biāo)準成為Java平臺的一部分,它允許Java和其它語言編寫的代碼進行交互。然而使用Java與本地已編譯的代碼交互,通常會喪失平臺可移植性[45]。

通常遇到以下幾種情況需要使用JNI:①所開發(fā)的程序需要用到其它平臺屬性,但在Java的標(biāo)準庫中不支持此屬性;②程序?qū)τ谶\行效率要求較高,因此希望能用較低級的語言(如C/C++)來實現(xiàn);③Java已經(jīng)擁有實現(xiàn)需要的程序和庫,希望C/C++對其直接進行調(diào)用[67]。

1.2JNI技術(shù)架構(gòu)

JNI允許運行在Java虛擬機上的應(yīng)用程序調(diào)用其它語言(如C/C++語言)來編寫需要的方法或類庫,也能將Java虛擬機嵌入到本地應(yīng)用程序中。

圖1是JNI在本地應(yīng)用程序與Java應(yīng)用之間各自扮演的角色圖。從圖中可以看出,JNI作為Java與C/C++函悼庵間的橋梁,可以實現(xiàn)Java代碼與C/C++庫函數(shù)當(dāng)中本地代碼之間的交互。然而JNI沒有改變Java語言的屬性,只是讓Java語言擁有一種能夠?qū)ν庹{(diào)用的形式[89]。

1.3OpenCV介紹

OpenCV(Open Source Computer Vision Library)是一個基于BSD許可發(fā)行的跨平臺計算機視覺庫。它輕量而且高效,由C函數(shù)與C++類構(gòu)成,同時提供了Python、Java等語言的接口,可實現(xiàn)圖像處理和計算機視覺方面的很多通用算法。OpenCV中對于人臉的檢測方法是基于處理成的灰度圖像的弱特征檢測方法。該方法建立在Haar特征[10]檢測方法基礎(chǔ)上,可以獲得檢測人臉的實時處理速度。

OpenCV中也提供了訓(xùn)練分類器[1112]的程序及方法來檢測特征。使用者可以將此方法應(yīng)用于一些項目中的二次開發(fā),比如雙目視覺的三維重構(gòu)、物體識別,協(xié)助機器人完成復(fù)雜任務(wù),以及在智能監(jiān)控中的人臉檢測、智能交通中的行人檢測等。

2開發(fā)工具選擇

選用的工具是eclipse,Java版本為JDK1.7,C++使用的是VS2010。另外PC端需要具備內(nèi)置或外置攝像頭,PC機配置為Inter Core i5-3230M CPU 2.6GHz。

3實現(xiàn)過程

從圖2中編寫JNI代碼的大致步驟可以看出Java需要將字節(jié)碼文件通過javah生成頭文件,再與C代碼共同生成動態(tài)鏈接庫,進而與Java中的代碼進行交互。

3.4人臉檢測實驗結(jié)果

篇7

關(guān)鍵詞:印制電路板;圖像處理;機器視覺;PCB裸板;自動光學(xué)檢測;缺陷檢測 文獻標(biāo)識碼:A

中圖分類號:TP391 文章編號:1009-2374(2016)09-0010-05 DOI:10.13535/ki.11-4406/n.2016.09.005

我國是全球第一大PCB生產(chǎn)基地,作為電子產(chǎn)品承載體的電路板,其集成度和產(chǎn)量不斷在提高。為了保證電子產(chǎn)品的性能,電路板缺陷檢測技術(shù)已經(jīng)成為電子行業(yè)中非常關(guān)鍵的技術(shù)。建立在圖像處理算法基礎(chǔ)上的機器視覺檢測技術(shù)與傳統(tǒng)的人工檢測技術(shù)相比,提高了缺陷檢測的效率和準確度。因此,設(shè)計一種高效精準的機器視覺檢測電路板缺陷的系統(tǒng),具有非常重要的現(xiàn)實意義。評估印刷電路板質(zhì)量的一個重要因素就是表觀檢測,PCB的表觀質(zhì)量對產(chǎn)品性能及成品使用安全有著極大的重要性。而伴隨著近年來在工業(yè)生產(chǎn)領(lǐng)域崛起的計算機視覺,當(dāng)前表觀缺陷檢測和分類識別的研究方向已經(jīng)轉(zhuǎn)向了利用計算機視覺技術(shù)來實現(xiàn)。計算機圖像處理識別技術(shù)這種基于計算機視覺的檢測技術(shù)成功取代了傳統(tǒng)的PCB缺陷檢測方法,在自動光學(xué)檢測系統(tǒng)眾多應(yīng)用中占據(jù)了相對重要的地位,一躍成為PCB生產(chǎn)業(yè)表觀缺陷的主要檢測方法。

圖1 系統(tǒng)框圖

因此本文通過設(shè)計AOI自動光學(xué)檢測系統(tǒng),搭建較為簡單的PCB缺陷自動檢測系統(tǒng)的實驗平臺,對PCB中四類較為關(guān)鍵、常見的缺陷進行檢測、分析、識別、判定,為研究推廣PCB缺陷自動檢測系統(tǒng)開拓應(yīng)用前景,如能實現(xiàn)工業(yè)上的產(chǎn)業(yè)化檢測,將有高額的經(jīng)濟收益。本文側(cè)重對PCB中的四類較為關(guān)鍵、常見的缺陷進行檢測、分析、識別、判定,并且僅搭建了較為簡單的PCB缺陷自動檢測系統(tǒng)的實驗平臺,即通過復(fù)雜算法對采集到的圖像進行處理、配準、對比,從而得出PCB缺陷類型及對其進行標(biāo)識。如圖1所示。

1 硬件設(shè)計方案

PCB缺陷檢測的總體系統(tǒng)設(shè)計方案主要是基于自動光學(xué)檢測技術(shù)來搭建PCB缺陷檢測系統(tǒng),硬件設(shè)計是使用CNC-T程控光源高精度影像測試系統(tǒng)操作臺,對待測電路板進行圖像采集,再通過VS2010軟件所編寫程序處理,得出待測電路板的缺陷種類。整個系統(tǒng)主要分為運動控制、光源、圖像采集、圖像處理四個模塊,分模塊簡要闡述了實驗過程、所需設(shè)備以及軟件算法,搭建了一個相對完整的系統(tǒng)工作平臺。

圖2 CNC-T程控光源影像操作臺

該設(shè)備具有測量元素種類齊全、手動測量、自動對焦等多種功能,使用該設(shè)備采集圖像進行二維檢測,測量軟體為YR-CNC,將圖像儲存至電腦后便由VS軟件進行圖像處理。實驗組成如圖3所示:

圖3 實驗系統(tǒng)框圖

1.1 運動控制模塊

本系統(tǒng)運動流程為:被檢測的PCB在檢測臺上,通過步進電機XY軸運動到攝像機拍攝區(qū)域,CCD攝像機固定在工作臺上方(Z軸),通過Z軸的運動實現(xiàn)聚焦。如圖4所示:

圖4 平臺運動示意圖

設(shè)備工作臺臺面尺寸為746mm×506mm,承載玻璃面尺寸為452mm×354mm,有效測量行程為400×300×200。本裝置既可通過軟件驅(qū)動自動采集圖像,也可以通過手動控制,移動并聚焦采集待測PCB的圖像。

1.2 光源模塊

輔助光照――采用的是正向和背向光源這兩種輔助光照。其中正光源和攝像頭同側(cè),均位于Z軸上,正光源主要用于檢測待測物體的表面特征。背光源位于檢測臺面下方,與正光源處于同軸反向關(guān)系,背光源能突出待測物體的輪廓特征,常用于檢測物體輪廓尺寸。

圖像采集:分別利用正光源突出PCB表面如走線、過孔和焊盤等主要特征,而下光源主要使PCB的輪廓尺寸和過孔產(chǎn)生強烈的輪廓對比。

光源:使用的是高度集中照明光源中心的LDR系列,由于該光源的傘狀結(jié)構(gòu)緊密排列著LED且采用了CCS獨創(chuàng)的柔性板,使之成為LED照明系統(tǒng)的標(biāo)準模式。照明系統(tǒng)如圖5所示:

圖5 照明系統(tǒng)

1.3 圖像采集模塊

圖像采集模塊是由圖像采集卡、相機和鏡頭組成的,該模塊是圖像配準階段的硬件基礎(chǔ)。計算機采集圖像的媒介就是相機,而相機按照不同原理又分為多種,常見的有CCD(Charge Coupled Device)和CMOS(Complementary Metal Oxide Semiconductor)兩類。本系統(tǒng)采用的是CCD 1/2英寸43萬像素彩色攝像頭和高清晰度0.7~4.5X變焦倍率鏡頭,顯示分辨率為0.001mm。

1.4 圖像處理模塊

通常獲得的圖像將受到工業(yè)現(xiàn)場環(huán)境、光照等條件的干擾,計算機所獲得的圖像質(zhì)量多數(shù)參差不齊,圖像的清晰度不一致,大大增加了PCB缺陷檢測的難度,所以在利用復(fù)雜算法檢測、識別PCB缺陷前要先對圖像進行預(yù)處理。

本圖像處理模塊主要通過VS軟件在OpenCV計算機視覺庫的基礎(chǔ)上,通過一系列算法對圖像進行處理對比。

2 系統(tǒng)軟件設(shè)計

2.1 OpenCV

OpenCV(Open Source Computer Vision Library)是一個跨平臺的可以運行在Linux、Windows和Mac OS操作系統(tǒng)上的基于(開源)發(fā)行的計算機視覺庫。它重量輕而高效,開放了多種接口如MATLAB、Ruby和Python等,并且在計算機視覺和圖像處理中大多數(shù)通用的算法都是被允許的。OpenCV可用于開發(fā)實時圖像處理、計算機視覺和模式識別方案,它提供了多種函數(shù),實現(xiàn)了大量的計算機視覺算法,算法涵蓋了從最基礎(chǔ)的濾波至以高級的物體檢測。OpenCV實際上是一堆C和C++語言源代碼文件,許多常見的計算機視覺算法由這些源代碼文件實現(xiàn)。如C接口函數(shù)cvCanny()實現(xiàn)Canny邊緣檢測算法。它可直接加入到我們自己的軟件項目編程中,而無需去編寫自己的Canny算子代碼,就是沒有必要重復(fù)“造輪子”。

根據(jù)OpenCV中源代碼文件巨多的特點,以算法的功能為基準,將這些源文件分到多個模塊中,如core、imgproc、highgui等。將每個模塊中的源文件編譯成一個庫文件(如opencv_core.lib、opencv_imgproc.lib、opencv_highgui.lib等),用戶在使用時,僅需在自己的項目中添加要用的庫文件,與自己的源文件一起連接成可執(zhí)行程序即可。

OpenCV計算機視覺庫的出現(xiàn),是為了使人們利用方便快捷的計算機視覺框架,在計算機視覺領(lǐng)域可以更加輕松地設(shè)計出更為復(fù)雜的應(yīng)用程序。OpenCV涵蓋了多種計算機視覺應(yīng)用區(qū)域,如用戶界面、信息安全、醫(yī)學(xué)影像學(xué)、工廠產(chǎn)品檢驗、立體視覺、機器人和攝像機標(biāo)定等,約有500多個函數(shù)。因為計算機視覺與機器學(xué)習(xí)是相輔相成的,所以O(shè)penCV也開放了MLL(Machine Learning Library)機器學(xué)習(xí)庫。MLL除了在視覺任務(wù)相關(guān)中使用,也可以很容易地應(yīng)用到其他機器學(xué)習(xí)中。

2.2 Microsoft Visual Studio2010

Visual Studio是微軟公司推出的開發(fā)環(huán)境,是同行業(yè)中目前最流行的Windows平臺應(yīng)用程序開發(fā)環(huán)境。Visual Studio 2010于2010年4月12日,其集成開發(fā)環(huán)境(IDE)已被重新設(shè)計和組織,變得更簡單了。

Visual Studio 2010同時帶來了NET Framework 4.0、Microsoft Visual Studio 2010 CTP(Community Technology Preview――CTP),并且支持開發(fā)面向Windows 7的應(yīng)用程序。除了Microsoft SQL Server外,它還支持IBM DB2和Oracle數(shù)據(jù)庫。目前有專業(yè)版、高級版、旗艦版、學(xué)習(xí)版和測試版五個版本。Visual Studio的用處十分廣泛,不僅可被用來基于Windows平臺創(chuàng)建Windows應(yīng)用程序和Web應(yīng)用程序,還可被用來創(chuàng)建智能設(shè)備、Office插件和Web服務(wù)等應(yīng)用程序。微軟的Visual Studio 2010將成為一個版本的經(jīng)典,這是相當(dāng)于6.0版本。該版本可以自定義開始頁,新功能還包括:(1)C# 4.0中的動態(tài)類型和動態(tài)編程;(2)多顯示器支持;(3)使用Visual Studio 2010的特性支持TDD;(4)支持Office;(5)Quick Search特性;(6)C++ 0x新特性;(7)IDE增強;(8)使用Visual C++ 2010創(chuàng)建Ribbon界面;(9)新增基于.NET平臺的語言F#。本課題將基于OpenCV計算機視覺庫使用Microsoft Visual Studio2010開發(fā)環(huán)境,通過編輯算法實現(xiàn)PCB缺陷檢測。

3 圖像預(yù)處理

要使用計算機對圖像進行處理,所得到的連續(xù)圖像就必須被轉(zhuǎn)換為離散的數(shù)據(jù)集,這是因為計算機只能處理離散度數(shù)據(jù),這一過程我們稱之為圖像采集。圖像采集由圖像采集系統(tǒng)實現(xiàn),如圖6所示。圖像采集系統(tǒng)的三個主要模塊是成像系統(tǒng)、采樣系統(tǒng)和量化器。

圖6

將整理出的字符圖像交予識別模塊來識別,被稱為圖像的預(yù)處理。PCB的圖像預(yù)處理包括灰度化、增強、濾波、二值化、配準等,處理后的PCB輸出的圖像質(zhì)量將得到改善,在很大程度上使得該圖像特征更直觀,方便計算機分析和處理。PCB的圖像預(yù)處理為整個PCB缺陷檢測系統(tǒng)的核心部件,很大程度上決定了檢測的準確性。圖像預(yù)處理流程如圖7所示:

圖7 圖像預(yù)處理流程圖

4 PCB缺陷檢測

本文針對四種常見缺陷:斷路、短路、毛刺(凸起)、缺損(凹陷)進行檢測研究。在這四種缺陷中,最為嚴重的缺陷類型是斷路和短路,它們將會使整塊板子失去本來的功能;而凸起、凹陷也可能影響到PCB在使用過程中的穩(wěn)定性能。如圖8所示為幾種常見的缺陷:

圖8 常見電路板缺陷

4.1 PCB缺陷的檢測方法

常用的PCB缺陷檢測方法有參考法和非參考法兩種。要是從概念理解和電路難易程度看,參考法明顯更加具有概念直觀、電路簡單的優(yōu)勢;要是從檢測所需要的條件來看,非參考法則在不需要待測PCB與標(biāo)準PCB進行準確對準這一點上優(yōu)于參考法。

本課題采用參考法進行PCB缺陷檢測。

使用參考法對PCB缺陷進行檢測的流程為:(1)確定標(biāo)準的PCB圖像并放入?yún)⒖紟?;?)通過成像設(shè)備采集待測PCB圖像,進行圖像預(yù)處理之后,再二值化PCB待測圖像,并對其進行連通域提??;(3)然后將處理結(jié)果與標(biāo)準圖像進行對比,利用圖像相減來判斷PCB可能存在的缺陷;(4)進行分類,確定缺陷類型。

4.2 圖像連通域

像素是圖像中最小的單位,每個像素周圍有8個鄰接像素,常見的鄰接關(guān)系有兩種:4鄰接與8鄰接。4鄰接一共4個點,即上下左右。包括對角線位置的點,8鄰接的點一共有8個,如圖9所示:

圖9 領(lǐng)域示圖

如果像素點A與B鄰接,我們稱A與B連通,即有如下的結(jié)論:

如果A與B連通、B與C連通,則A與C連通。在視覺上看來,點與點相互連通,形成一個區(qū)域,而不是連通的點形成不同的區(qū)域。這種相互立體的所有的點,我們稱為連通區(qū)域。連通區(qū)域標(biāo)記常用的方法有Two-Pass(兩遍掃描法)和Seed Filling(種子填充法)兩種方法,本課題主要介紹第二種。

Seed Filling來源于計算機圖形學(xué),通常應(yīng)用在填充圖形上。思路:以一個前景像素當(dāng)作種子,而后在處于同一像素值且位置相鄰的連通區(qū)域,把和種子相鄰的前景像素融合到同一組像素中,結(jié)果將是獲得一個像素集,即連通區(qū)域。接下來介紹使用種子填充法實現(xiàn)的連通區(qū)域分析法:

第一,重復(fù)掃描圖像,當(dāng)?shù)玫疆?dāng)前像素點B(x,y)=1時停止:(1)賦予B(x,y)一個label,并將像素位置作為種子,接著將所有位于該種子周圍的前景像素都壓入棧中;(2)將棧頂像素賦以相同的label值并彈出,接著將全部位于棧頂像素周邊的前景像素都壓入棧中;(3)重復(fù)(2)步驟,直到棧為空。此時,圖像B中的一個像素值被標(biāo)記為label的連通區(qū)域便被找到了。

第二,在掃描結(jié)束前,重復(fù)第一個步驟,由此可以獲得圖像B中所有的連通區(qū)域在掃描結(jié)束后。

掃描所得的連通域如圖10所示:

圖10 圖像連通域提取

4.3 缺陷識別

缺陷識別具體特征如表1所示:

表1 缺陷特征

缺陷種類 二值圖像面積 連通區(qū)域數(shù)

斷路 減少 增加

短路 增加 減少

凸起 增加 不變

凹陷 減少 不變

第一,短路和斷路。在出現(xiàn)短路缺陷時,待測圖像與標(biāo)準圖像相比,其所包含的連通區(qū)域數(shù)將會減少。同理可得,在出現(xiàn)斷路缺陷時,待測圖像與標(biāo)準圖像相比,其所包含的連通區(qū)域數(shù)將會增多。因此,斷路和短路缺陷便可利用比較連通區(qū)域數(shù)來判定和識別。

第二,凸起和凹陷。凸起缺陷將導(dǎo)致導(dǎo)線和導(dǎo)線、導(dǎo)線和其他導(dǎo)體間的間隙變小,而凹陷缺陷將導(dǎo)致導(dǎo)線和導(dǎo)線、導(dǎo)線和其他導(dǎo)體間的間隙變大,二者均會導(dǎo)致PCB使用過程中出現(xiàn)不穩(wěn)定狀態(tài)。而觀察可知,這兩種缺陷的連通區(qū)域相同,差別在于各自二值化面積的大小,所以可以通過計算該待測圖像的連通區(qū)域面積來識別凸起、凹陷缺陷。

識別過程:將經(jīng)過圖像預(yù)處理的待測PCB圖像與標(biāo)準圖像進行對比后,通過算法找出缺陷。比較二者的連通區(qū)域數(shù),若前者大于后者,則標(biāo)定該缺陷點為斷路,反之則為短路;若二者連通區(qū)域數(shù)相同,則比較二值化圖像面積,若前者大于后者,則標(biāo)定該缺陷點為凸起,反之則為凹陷。檢測流程如圖11所示:

圖11 PCB缺陷檢測流程圖

5 系統(tǒng)實驗

本文使用CNC-T程控光源高精度影像測試系統(tǒng)操作臺,結(jié)合VS2010軟件基于OpenCV計算機視覺庫的算法編程來實現(xiàn)PCB的缺陷檢測。整體實驗過程為:手動控制操作臺捕捉、聚焦、采集待測PCB的圖像,采集到的圖像與標(biāo)準圖像進行對比、識別,得出缺陷種類并顯示結(jié)果。

本課題一共就所研究缺陷類型,做了40組實驗,通過實驗結(jié)果計算正確率。如表2所示:

表2 實驗結(jié)果統(tǒng)計

缺陷類型 實驗次數(shù) 正確率

斷路 10 100%

短路 10 100%

凸起 10 100%

凹陷 10 100%

針對不同電路板圖中出現(xiàn)的同種斷路類型進行檢測,效果如圖12a、圖12b、圖12c所示,可準確檢測出缺陷存在。

圖12

針對不同電路板圖中出現(xiàn)的同種短路類型進行檢測,效果如圖13a、圖13b、圖13c所示,可準確檢測出缺陷存在。

圖13

針對不同電路板圖中出現(xiàn)的同種凸起類型進行檢測,效果如圖14a、圖14b、圖14c所示,可準確檢測出缺陷存在。

圖14

針對不同電路板圖中出現(xiàn)的同種凹陷類型進行檢測,效果如圖15a、圖15b、圖15c所示,可準確檢測出缺陷存在。

圖15

6 結(jié)語

PCB板面向體積越來越小、密度越來越高的方向發(fā)展。在檢測產(chǎn)品價格方面,國外AOI檢測產(chǎn)品價格普遍偏高,而由于經(jīng)濟原因,在國內(nèi)PCB板生產(chǎn)制造商多數(shù)仍采用人工目測等傳統(tǒng)檢測方法檢測。隨著經(jīng)濟的發(fā)展,數(shù)字圖像處理研究的深入,自動光學(xué)檢測系統(tǒng)也開始頻繁活躍在人們視線中,但在PCB缺陷檢測方面的應(yīng)用卻還有待完善。因此,本論文建立在深入掌握工控系統(tǒng)結(jié)構(gòu)并從PCB板的質(zhì)量標(biāo)準、圖像特點、缺陷特征及檢測要求的分析基礎(chǔ)上,對以圖像處理為基礎(chǔ)的PCB缺陷檢測技術(shù)進行了深入研究。由于PCB缺陷自動檢測系統(tǒng)的研究涉及多個領(lǐng)域的知識,其研究過程十分耗時、繁瑣,由此,本論文僅僅對PCB缺陷檢測中較為常見的問題進行了較深入研究,并且僅搭建了較為簡單的PCB缺陷自動檢測系統(tǒng)的實驗平臺,對PCB中的四類較為關(guān)鍵、常見的缺陷進行檢測、分析、識別、判定。雖然還未實現(xiàn)真正實現(xiàn)工業(yè)上產(chǎn)業(yè)化檢測,但是在未來幾十年中,研究推廣的PCB缺陷自動檢測系統(tǒng)將有十分良好的應(yīng)用前景,也將有高額的經(jīng)濟收益。

參考文獻

[1] 陳勝勇,劉盛,等.基于OpenCV的計算機視覺技術(shù)實現(xiàn)[M].北京:科學(xué)出版社,2008.

[2] Gary Bradski,Adrian Kaebler,于仕琪,等.學(xué)習(xí)OpenCV[M].北京:清華大學(xué)出版社,2009.

[3] 周長發(fā).精通Visual C++圖像處理編程(第3版)

[M].北京:電子工業(yè)出版社,2006.

[4] 黨振.中國大陸PCB產(chǎn)業(yè)的現(xiàn)狀與未來[J].印制電路信息,2006,32(1).

[5] 胡躍明,譚穎.自動光學(xué)檢測在中國的應(yīng)用現(xiàn)狀和發(fā)展[J].微計算機信息,2006,(4).

[6] 李漢,何星,等.印刷電路板的自動光學(xué)檢測系統(tǒng)

[J].無損檢測,2004,26(6).

[7] 張利,高永英,等.PCB板檢測中的定位研究[J].中國圖像圖形學(xué),1999,4(8).

[8] 姚立新,張武學(xué),等.AOI系統(tǒng)在PCB中的應(yīng)用[J].電子工業(yè)專用備,2004,(5).

[9] 范小濤,夏雨人.一種基于圖像處理的PCB檢測算法研究[J].計算機工程與應(yīng)用,2004,(13).

[10] 傅莉.印制電路板的發(fā)展及前景[J].電腦與電信,2010,(5).

[11] 張明軒.基于視頻序列的人臉檢測與跟蹤算法研究[D].中北大學(xué),2011.

[12] 張馳.基于機器視覺的智能控制與圖像識別問題研究[D].蘭州理工大學(xué),2009.

[13] 謝飛.基于計算機視覺的自動光學(xué)檢測關(guān)鍵技術(shù)與應(yīng)用研究[D].南京大學(xué),2013.

[14] 張靜.PCB表觀缺陷的自動光學(xué)檢測理論與技術(shù)

[D].電子科技大學(xué),2013.

[15] 俞瑋.AOI技術(shù)在PCB缺陷檢測中的應(yīng)用研究[D].電子科技大學(xué),2007.

篇8

摘要:研究基于計算機視覺的實時動態(tài)手勢識別技術(shù),并利用OpenCV計算機視覺庫在VS2010平臺上設(shè)計一個基于該技術(shù)在多媒體教學(xué)中PPT演示控制方面的應(yīng)用。首先,利用背景差分法進行手勢檢測,在背景更新的基礎(chǔ)上,通過背景差分圖和顏色直方圖的反投影圖來檢測運動手勢區(qū)域,可以達到較為滿意的實時運動手勢檢測效果;其次,采用基于顏色直方圖的粒子跟蹤算法進行手勢跟蹤,基本能滿足跟蹤的實時性;最后,在手勢識別階段,采用基于Hu不變矩的輪廓匹配算法,得到較好的手勢識別效果;使用六種手勢,來實現(xiàn)演示文稿中的控制應(yīng)用。

關(guān)鍵詞:計算機視覺;背景差分;粒子跟蹤;手勢識別;Hu矩

中圖分類號:TP391.41文獻標(biāo)識碼:A

1引言

隨著計算機軟硬件技術(shù)的發(fā)展,人機交互已經(jīng)由過去的鼠標(biāo)、鍵盤方式逐漸向更加靈活生動的語音、姿勢等新穎交互方式發(fā)展。由于基于視覺方式具有便捷和開銷低等優(yōu)點,因此,利用計算機視覺技術(shù)來使計算機理解用戶的命令,從而做出控制動作,這一領(lǐng)域的研究得到越來越多的重視。其中,人的手勢作為日常生活中最為廣泛使用的一種交流方式;因此,國內(nèi)外許多研究機構(gòu)開始對手勢識別技術(shù)進行研究,并已經(jīng)取得了一些階段性的成果。較早的有:Freeman和Roth等人提出的基于方向直方圖的手勢識別系統(tǒng);國內(nèi)的高文教授等人于1994年提出了一種靜態(tài)復(fù)雜背景手勢目標(biāo)的捕獲與識別。經(jīng)過二三十年的發(fā)展,

人們對運動目標(biāo)檢測及跟蹤進行了大量深入的研究:美國MIT實驗室通過提取左右手質(zhì)心的運動軌跡以及手勢形狀特征參數(shù),結(jié)合語法規(guī)則識別40個美國手語,準確率達到97%;另外,Microsoft Korea的HyeonKyu Lee,采用HMM的閾值模型,識別9種動態(tài)手勢命令,平均識別率高達98.19%;國內(nèi)的任海兵提出了基于DTW的手勢識別算法,該算法能準確識別12種手勢。

現(xiàn)在,基于視覺的手勢識別技術(shù)更多的是應(yīng)用在娛樂、游戲方面,比如微軟前段時間推出的Xbox360游戲機體的體感外設(shè)Kinect及多款相配套的體感游戲,玩家可以通過手勢在游戲中進行操作和互動,使得人機互動娛樂進入了一個新紀元。與此同時,還沒有比較成熟的手勢識別技術(shù)應(yīng)用在現(xiàn)代教學(xué)系統(tǒng)中。因此,本文的研究重點是基于視覺的實時手勢識別技術(shù)在多媒體教學(xué)演示控制中的應(yīng)用。在基于視覺的手勢識別研究中,需要解決的問題主要有兩個:一是實時檢測運動手勢的信息,二是識別運動手勢的信息并做出響應(yīng)。對運動手勢檢測,本文采用背景差分結(jié)合改進顏色直方圖特征的運動檢測方法[1];對運動手勢跟蹤,本文采用粒子濾波算法[2]結(jié)合改進顏色直方圖信息的方法;手勢識別階段,本文采用了基于Hu不變矩特征[3]的輪廓匹配算法[4];本文研究基于計算機視覺的手勢識別系統(tǒng),實現(xiàn)了在播放控制中運用手勢進行開始、翻頁、退出等功能,極大的提高了課堂教學(xué)的靈活性。

2手勢檢測

實時視頻圖像中的運動手勢檢測所需要完成的任務(wù)是:能夠快且準的檢測出手勢在實時圖像中的主要位置,并且能將位置所在的特定區(qū)域作為后續(xù)跟蹤、識別的感興趣區(qū)域。手勢檢測算法的好壞,直接影響整個系統(tǒng)的跟蹤以及識別的效果。

目前,運動目標(biāo)檢測[5]的算法比較常用的有三種方法:光流法、幀間差分法和背景差分法。本文考慮實現(xiàn)環(huán)境為固定攝像頭采集實時視頻圖像,背景基本不動,因此采用背景差分結(jié)合改進顏色直方圖信息的運動檢測方法。

2.1背景差分法

本文研究中,選取攝像頭啟動后的前10幀圖像的平均作為最初的背景圖像,把以后的實時序列圖像當(dāng)前幀和背景圖像相減,進行背景消去??梢缘玫?,運動手勢區(qū)域的像素點的差分值比較大,背景區(qū)域的像素點的差分值比較小。另外,由于真實場景中的背景會因光線等外部條件產(chǎn)生微小的變化,長期的誤差積累會造成最后得不到理想的手勢區(qū)域,因此背景需要進行實時更新,從而能及時反映當(dāng)前幀的背景圖像,背景更新[6]的公式如下:

背景更新操作以后,對當(dāng)前幀進行背景差分,大于閾值th1的圖像點即為運動手勢區(qū)域的點,并將得到的運動手勢區(qū)域圖像進行二值化操作,公式如下:

3手勢跟蹤

現(xiàn)在常用的一些跟蹤算法主要有:卡爾曼預(yù)測算法、粒子濾波算法、均值偏移算法以及Camshift跟蹤算法等。考慮到卡爾曼預(yù)測算法和均值偏移算法等都是線性跟蹤算法,不能很好的應(yīng)對目標(biāo)運動的隨機性,本文采用了粒子濾波算法。

3.1粒子濾波算法原理

粒子濾波法是指通過用一組帶有權(quán)值的隨機樣本,以及基于這些樣本的估算來表示動態(tài)系統(tǒng)的后驗概率密度。當(dāng)樣本很大的時候,這種估計就等同于后驗概率密度。這些樣本就稱為“粒子”。假設(shè)在t=0時刻每個粒子都有一個解,每個解與真實解都有一定的相似度,這個相似度可以表示為權(quán)重,隨著時間的增加,相似度越大的粒子權(quán)重越大,而相似度越小的粒子權(quán)重就越小,最后趨于0,從而找到真實解(如圖2)。

3.2基于改進顏色直方圖信息的粒子跟蹤

視頻圖像跟蹤方面,目標(biāo)的運動模型主要表現(xiàn)為目標(biāo)位置、速度隨時間改變的狀態(tài)轉(zhuǎn)移過程,目標(biāo)的觀測模型主要表現(xiàn)為每幀圖像中運動目標(biāo)的特征(如顏色、輪廓等)與真實目標(biāo)的相似度的似然過程。在粒子濾波算法中,運動模型可以稱為粒子傳播或者粒子采樣,它是一種隨機過程[11]。粒子在經(jīng)過傳播以后,狀態(tài)會發(fā)生改變,但權(quán)值沒有跟著改變,這就需要系統(tǒng)的觀測模型對當(dāng)前粒子的狀態(tài)進行計算從而更新粒子的權(quán)值。本文的研究中,觀測值由目標(biāo)區(qū)域的顏色直方圖決定。

基于顏色直方圖信息的粒子濾波就是將圖像顏色特征的相似度作為粒子濾波算法要求解的后驗概率,利用巴氏距離(Bhattacharyya)來計算相似度,得到粒子的權(quán)重。巴氏系數(shù)[12]如公式(9):

4.2識別算法過程

本文研究中,首先建立手勢模板庫,然后通過實時提取手勢幀,經(jīng)過前面第2部分的結(jié)合改進顏色直方圖信息的手勢檢測,然后再經(jīng)過形態(tài)學(xué)處理之后,得到效果良好手勢區(qū)域的二值圖,再用輪廓提取及跟蹤來得到手勢的輪廓圖,然后計算其7Hu矩特征,最后運用歐氏距離將其與模板庫中定義的手勢進行特征匹配,完成手勢識別。

輪廓提取就是要掏空內(nèi)部的點:如果其八個相鄰的點都是黑色,則可以判定為內(nèi)部點,然后刪除改點。

輪廓跟蹤方法:首先找出輪廓中最左下方的點作為搜索的起點,然后按照一定規(guī)則來搜索手勢輪廓上的其他像素點。由于輪廓是連續(xù)的,因此每個輪廓上的點的位置都可以用其前一個點的所張的角度來表示。研究中采用如下跟蹤準則,第一個點開始定義搜索方向為左上,如果左上方的點是黑點,則它也是輪廓上的點;如果不是,那么順時針旋轉(zhuǎn),直到找到第一個黑點,即輪廓上的下一個點。繼續(xù)同樣的方法搜索,直到返回最初的起點,搜索結(jié)束。

下圖是輪廓跟蹤算法[15]的示意圖,搜索方向用箭頭表示。

5系統(tǒng)實現(xiàn)

本文的系統(tǒng)是在微軟的VS2010平臺上,使用C++語言進行軟件開發(fā),在圖像處理相關(guān)方面是基于計算機視覺庫(OpenCV)進行研究的。程序界面如下圖:

左邊底層區(qū)的按鈕可以觀察實時手勢跟蹤和識別效果的功能(如圖4和圖7)。

手勢識別的結(jié)果可以定義成一個變量,不同

的識別結(jié)果對應(yīng)的變量值不同,然后根據(jù)變量值調(diào)用不同的API接口函數(shù),這樣就可以實現(xiàn)實時手勢識別技術(shù)在演示控制中的應(yīng)用。本文研究在控制部分挑選了六種手勢,分別控制PPT播放中的開始、退出、上下翻頁、跳轉(zhuǎn)首末頁等功能。手勢命令定義如下:手勢4控制開始播放;手勢3控制退出播放;手勢1控制跳轉(zhuǎn)首頁;手勢2為跳轉(zhuǎn)尾頁;手勢10為向下翻頁頁;手勢5控制向前翻頁。對電腦中某一PPT進行實際的播放控制(列舉其中4個手勢的控制狀態(tài)),效果如下:

1)識別手勢4,開始播放:

2)識別手勢10,向下翻頁:

3)識別手勢1,跳轉(zhuǎn)到首頁:

4)識別手勢3,退出:

系統(tǒng)通過筆記本自帶30W像素的攝像頭,采用DirectShow技術(shù)進行實時視頻的獲取,圖像尺寸是320*240,fps可以達到30-60幀/秒,可以很好的滿足實時性的要求。

6結(jié)語

本文通過研究設(shè)計了一個基于視覺的手勢識別技術(shù)在演示控制中的應(yīng)用系統(tǒng),可以看出背景差分結(jié)合顏色直方圖的運動檢測可以得到較好的手勢區(qū)域效果;采用的基于顏色直方圖的粒子跟蹤也能基本實現(xiàn)實時跟蹤的任務(wù);在識別過程中,基于Hu不變矩的輪廓匹配算法具有很好的魯棒性,可以得到較好手勢識別效果;在應(yīng)用階段,使用手勢來完成控制命令,基本實現(xiàn)了在播放控制中的應(yīng)用。

同時,仍存在一些問題:對于光照和人臉微小晃動等外部因素引起的噪聲,只能降低而無法消除,這對于手勢跟蹤與識別的效果還是有一定的影響,在應(yīng)用時會產(chǎn)生一定的誤操作。這些問題仍需繼續(xù)研究,才能使得基于視覺的手勢識別技術(shù)得到更成熟的應(yīng)用。

參考文獻

[1]吳曉陽.基于OpenCV的運動目標(biāo)檢測與跟蹤[D].杭州:浙江大學(xué),2008.

[2]CHO J U, JIN S H, PHAM X D. Object tracking circuit using particle filter with multiple features [C] / / SICE-ICASE: International Joint Conference. Las Vegas: IEEE, 2006: 1431-1436.

[3]甘志杰.基于Hu矩和支持向量機的靜態(tài)手勢識別及應(yīng)用[D].青島:青島科技大學(xué),2008.

[4]華斌,夏利娜.基于中值濾波和Hu矩向量的手語識別[J].計算機工程與設(shè)計,2011,32(2): 615- 618.

[5]伏思華,張小虎.基于序列圖像的運動目標(biāo)實時檢測方法[J].光學(xué)術(shù),2004,30(2): 215- 217.

[6]LINDEBERC T. Scale-space theory: a basic tool for analyzing structures at different scales [J]. Joumal of Applied Statistics. 1994, 21(2):224-270.

[7]于華平.視頻序列中的手勢檢測與跟蹤[D].南寧:廣西大學(xué),2010.

[8]QIN WEN, PENG QICONG. An improved particle filter algorithm based on neural network for visual tracking [C] / / International Conference on Communications, Circuits and Systems. Las Vegas: IEEE, 2007:765-768.

[9]龔翔. 基于粒子濾波的視覺跟蹤算法研究[D]. 南京:南京理工大學(xué),2009.

[10]YU JIAXIA, LIU WENJING, YANG Y. Improved particle filter algorithms based on partial systematic resambling [C]/ /IEEE International Conference on Intelligent Computing and Intelligent Systems. Las Vegas: IEEE, 2010: 483-487.

[11]朱志宇.粒子濾波算法及其應(yīng)用[M].北京:北京科學(xué)出版社,2010.

[12]FAZLI S, POUR H M, BOUZARI H. Particle filter based object tracking with sift and color feature [C] / / Second International Conference on Machine Vision. Las Vegas: IEEE, 2009:89-93.

[13]侯一明,郭雷,倫向敏,等.運動背景下基于粒子濾波的目標(biāo)跟蹤[J].計算機工程與應(yīng)用,2007,43(8): 62- 64.

篇9

關(guān)鍵詞:果品;無損檢測;品質(zhì)

我國水果產(chǎn)量居世界第一,果品出口成為我國外貿(mào)的重要組成部分。但是我國大多數(shù)農(nóng)產(chǎn)品國際市場競爭力弱,出口價格低廉。其中品質(zhì)因素是重要原因之一,這是由于檢測技術(shù)、評判標(biāo)準等限制,所以對果品進行合適的品質(zhì)檢測對提高經(jīng)濟效益和市場競爭力具有重要意義。對農(nóng)產(chǎn)品品質(zhì)的無損檢測,已引起國內(nèi)外廣泛關(guān)注。

所謂無損檢測,又稱非破壞檢測,是不破壞被檢對象卻能評價其品質(zhì)的方法。它利用自身力學(xué)、光學(xué)、電學(xué)及聲學(xué)等物理性質(zhì)對評價對象品質(zhì)進行非破壞檢測,并按照一定標(biāo)準進行分級分選的新興技術(shù),廣泛應(yīng)用于工業(yè)和農(nóng)業(yè)。農(nóng)業(yè)中的無損檢測技術(shù)是利用農(nóng)產(chǎn)品的物理性質(zhì)如光學(xué)性質(zhì)、聲學(xué)性質(zhì)、電磁學(xué)性質(zhì)和熱學(xué)性質(zhì)等的變化而實現(xiàn)。目前,無損檢測技術(shù)主要包括:近紅外技術(shù)、聲學(xué)檢測技術(shù)、軟X射線技術(shù)、計算機視覺技術(shù)、核磁共振檢測技術(shù)、力學(xué)特性檢測技術(shù)等。

1.果品無損檢測技術(shù)

1.1新型可見、近紅外光譜無損檢測技術(shù)

可見、近紅外光譜法是農(nóng)產(chǎn)品內(nèi)部成分無損檢測的有效方法,是利用農(nóng)產(chǎn)品吸收、散射、反射和透射光的特性,進而確定內(nèi)部成分的方法。近紅外分析技術(shù)作為一種高新分析技術(shù),能改造我國傳統(tǒng)農(nóng)業(yè),提高農(nóng)產(chǎn)品質(zhì)量,尤其是農(nóng)產(chǎn)品加工的質(zhì)量控制,將產(chǎn)生巨大作用。為改造我國的傳統(tǒng)行業(yè),企業(yè)迫切需要對原料進行質(zhì)量監(jiān)測、生產(chǎn)過程監(jiān)控的設(shè)備和技術(shù)。國際經(jīng)驗來看,近紅外技術(shù)是首選。

韓東海等[1]利用柑橘正常及損傷部位在紫外光源下的差異發(fā)射性,可有效確定柑橘損傷果。Slaugther DC[2]鑒于近紅外和可見光的分光光度技術(shù),建立完好的桃及油桃內(nèi)部品質(zhì)的無損關(guān)系式,能夠預(yù)測完好無損的桃與油桃的山梨糖醇含量、蔗糖和可溶性固形物等。Lammertyn J[3]通過研究近紅外光譜和可見光譜對紅玉蘋果質(zhì)量的無損測量,進而得到雙叉光纖記錄的反射光譜與蘋果參數(shù)之間的關(guān)系。Ali Moghimi[4]等用近紅外光譜技術(shù)結(jié)合化學(xué)計量學(xué)建立獼猴桃SSC和pH的校正模型,比較多元散射校正、變量標(biāo)準化、中值濾波和一階導(dǎo)數(shù)光譜預(yù)處理對所建獼猴桃SSC和pH校正模型的影響,表明變量標(biāo)準化結(jié)合中值濾波和一階倒數(shù)預(yù)處理光譜后,用PCR-PLS法建立的SSC和pH的校正模型精度較高。

目前,分光檢測技術(shù)在果蔬品質(zhì)檢測中的應(yīng)用廣泛,因為這種方法具有適應(yīng)性強、高檢測靈敏度、人體無害性、靈活使用性、成本低廉和自動化易實現(xiàn)性等優(yōu)勢。利用這種技術(shù)能自動分級果品,而合理的分級標(biāo)準,便于果品深加工和遠銷售。近紅外光譜的研究雖起步較晚,但是其應(yīng)用廣,特別是在農(nóng)產(chǎn)品的品質(zhì)檢測和分級領(lǐng)域取得較大的進展,開發(fā)應(yīng)用前景廣闊。

1.2聲學(xué)無損檢測技術(shù)

聲學(xué)無損檢測技術(shù)是利用果品聲學(xué)特性與內(nèi)部組織變化的關(guān)系,例如結(jié)構(gòu)、成分、物理狀態(tài)等物化特性信息來檢測果品品質(zhì)。聲學(xué)特性是指在聲波作用下農(nóng)產(chǎn)品的反射、散射和吸收特性、衰減系數(shù)和傳播速度及其本身的聲阻抗與固有頻率等,它們均反映聲波與農(nóng)產(chǎn)品相互作用的規(guī)律,這些特性隨農(nóng)產(chǎn)品內(nèi)部組織變化而變化。一般使用低能超聲波來檢測,因為低能超聲波在被檢測物中傳播不會引起物理或化學(xué)特性變化。超聲方法檢測果品品質(zhì)始于近年,國內(nèi)外研究集中針對水果成熟度、硬度和內(nèi)部質(zhì)量缺陷等無損檢測。

與光學(xué)、電學(xué)及其他無損檢測技術(shù)相比,聲學(xué)無損檢測技術(shù)具有適應(yīng)性強、投資較低、操作簡便快捷等有死,特別適用于在線檢測,在農(nóng)產(chǎn)品檢測領(lǐng)域應(yīng)用前景良好[5]。

1.3軟X射線技術(shù)

適用性極強的X射線成像能夠與圖像識別、人工智能、現(xiàn)代通信技術(shù)等相聯(lián)系。若待檢測物體的密度和厚度不同,則不同的透射X射線量產(chǎn)生。鑒于分析穿透量,進而判斷果品內(nèi)部品質(zhì)。軟X射線擁有巨大優(yōu)勢,特別是在農(nóng)產(chǎn)品的內(nèi)部品質(zhì)檢測上,因軟X射線具有穿透物料的特性,所以檢測那種易損壞的農(nóng)產(chǎn)品,能無損檢測內(nèi)部的品質(zhì)。所需X射線強度方面,農(nóng)產(chǎn)品檢測弱于工業(yè),所以稱為低能X射線或軟X射線。這種X射線成像技術(shù)來檢測農(nóng)產(chǎn)品內(nèi)部品質(zhì)方法已經(jīng)受到研究者關(guān)注,例如基于X射線成像技術(shù)的檢測核桃果核與果肉厚度,基于X射線圖像的評價牛肉嫩度,以及評價紅毛丹內(nèi)部品質(zhì)等。韓東海[6]用X射線來檢測柑橘皺皮果,結(jié)果表明射線與激光分析法在果實品質(zhì)檢測中的可行性。然而目前國內(nèi)此方面的技術(shù)開發(fā)較落后,期待學(xué)者們進一步的研究和探索。

1.4計算機視覺技術(shù)

伴隨專業(yè)化的圖像處理技術(shù)以及下降的計算機硬件成本和高速度特性,計算機視覺技術(shù)對農(nóng)產(chǎn)品品質(zhì)自動識別和分級的應(yīng)用日益廣泛。計算機視覺技術(shù)即以各種成象系統(tǒng)代替視覺器官作為輸入敏感手段,借助于計算機替代大腦完成處理和解釋。計算機視覺的最終研究目標(biāo)是使計算機可以像人一樣,通過視覺觀察來理解世界,具有自主適應(yīng)環(huán)境的能力。

基于機器視覺的果品無損檢測的技術(shù),一般是借助于CCD攝像頭獲取果品圖像,圖像信息輸入計算機,進而應(yīng)用檢測方法和算法得到果品在大小、缺陷、外部損傷、內(nèi)部品質(zhì)等方面的特質(zhì)值,從而來分級果品[7]。這種方法通常是由CCD攝像頭、配備圖像采集卡的計算機、光照系統(tǒng)和專用圖像處理軟件組成。在一定光源照射情況下,利用CCD攝像頭得到水果形狀、顏色、缺陷等視覺方面的圖像信息,憑借圖像采集卡轉(zhuǎn)換為數(shù)字信號傳輸?shù)诫娔X,分隔圖像、提取特征值,從而得到特征值參數(shù)和水果顏色、質(zhì)量狀況、破損程度等品質(zhì)指標(biāo)間模型關(guān)系,進而確定內(nèi)外品質(zhì)等級。這種方法快速、準確、無損,使用一次能同時檢測多項品質(zhì)指標(biāo),方便設(shè)計自動分級流水線,自動識別水果外在品質(zhì)(外形、缺陷、顏色、大小等)和內(nèi)在品質(zhì)(成熟度、堅實度、含糖量、含水率等),因此具有廣闊的應(yīng)用前景[8]。

我國利用計算機視覺系統(tǒng),檢測農(nóng)產(chǎn)品品質(zhì)和分類農(nóng)產(chǎn)品的研究方法開展較晚,始于20世紀90年代,但逐漸受到重視。與國際先進水平相比,在農(nóng)業(yè)領(lǐng)域的應(yīng)用我國計算機視覺技術(shù)研究具有一定程度的差距,我國目前處于實驗研究以及理論探索階段,實用化和商品化的程度還未達到。這項項目基于數(shù)碼攝像技術(shù),通過電腦直接處理圖像信息,其研發(fā)促使使我國獲得最快速、最便利的視覺技術(shù)。

1.5核磁共振檢測技術(shù)

1946年,核磁共振現(xiàn)象由美國科學(xué)家F.Bloch和E.M.Purcell發(fā)現(xiàn),這一技術(shù)廣泛應(yīng)用于研究物質(zhì)結(jié)構(gòu)。核磁共振可以便利地生成果實內(nèi)部組織結(jié)構(gòu)的高清圖像。方便檢測果品壓傷、蟲害以及成熟度,因此在檢測蘋果、香蕉糖度等方面潛在價值極高。而那些因采收成熟度而影響品質(zhì)的品種,鑒于核磁共振技術(shù),能提高收獲和運輸可靠性?,F(xiàn)階段,這種技術(shù)要想真正應(yīng)用于果品檢測和評價果品質(zhì)量,還存在諸多問題,然而其優(yōu)勢明顯,這種技術(shù)無疑是一種良好的果品無損檢測方法[9]。

1.6力學(xué)特性檢測技術(shù)

基于動力學(xué)原理測度農(nóng)產(chǎn)品硬度的檢測方法是力學(xué)特性檢測技術(shù)。采用振動頻率分析法以及沖擊力檢測法,檢測果品堅實度來判斷果實成熟度。力學(xué)特性檢測技術(shù)方便判斷果品的采收期,依照成熟度分級、貯藏果品,確定果品的保鮮期和貯存期。盡管這種技術(shù)具有較為堅實的實踐應(yīng)用基礎(chǔ)及歷史,但介于果品品質(zhì)和物理參數(shù)間的復(fù)雜關(guān)系,實際應(yīng)用是一個漫長的研究過程[10]。

篇10

【關(guān)鍵詞】計算機視覺;屏蔽罩;共面度

【Abstract】Computer vision is a branch of science that studies how to make the machine to "see" .Based on this, we developed a set of visual inspection equipment, and applied to the assembly line, to enable it to detect the mobile phone shielding cover coplanar degree and make it quickly and accurately.

【Key words】Computer vision;Shield;Coplanar degrees

0 前言

工業(yè)生產(chǎn)中流水線技術(shù)已經(jīng)成熟,但是機器的工作效率并不能使產(chǎn)品的合格率完全得到保障。我們需要將檢測裝置添加到流水線系統(tǒng)中,實現(xiàn)產(chǎn)品合格與否的信息反饋。通過檢測產(chǎn)品合格與否,不合格的收回改進,來進一步提高生產(chǎn)過程中產(chǎn)品的合格率。而且一個簡單的檢測裝置可以替代大量人工勞動,整體上提高生產(chǎn)效率和利潤。

屏蔽罩(框)是手機的重要部件,傳統(tǒng)的屏蔽罩在沖壓成型和超聲清洗過程中會導(dǎo)致個別產(chǎn)品的四邊平面度不達標(biāo)(需小于0.1mm),屏蔽罩平面度的不達標(biāo)會影響下一工序的包裝和焊接。因此公司需要一大批工人進行平面度人工目測和人工半自動包裝,生產(chǎn)效率較低,檢測+包裝約650片/人?小時)。

本項目擬研制一個自動檢測設(shè)備,用機器視覺檢測代替人工檢測,每臺機器可以替換4-5人,生產(chǎn)效率提高5-7倍。

1 總體系統(tǒng)設(shè)計方案

1.1 檢測平臺的搭建

首先根據(jù)需要對相機,鏡頭進行選型,合理搭配,要求圖像抓取效果要好。其次合理利用光學(xué)原理,給目標(biāo)合適角度合適光照強度,能給相機抓取最優(yōu)圖像。最后通過驅(qū)動設(shè)置相機參數(shù)進一步對抓取的圖像質(zhì)量進行微調(diào)。

1.2 圖像處理

將相機抓取的圖像傳送到計算機利用計算機高效運算速度進行處理。

第一步:圖像預(yù)處理。顏色空間的轉(zhuǎn)換,顏色分量通道提取,圖像銳化,圖像平滑,圖像增強等,都在預(yù)處理范圍。這一步主要目的是增強目標(biāo)區(qū)域,降低噪聲,削弱背景。

第二步:圖像分割。顏色區(qū)域提取,閾值提取,邊緣提取等。這一步目的在于將我們的目標(biāo)信息進行降維處理,減少運算量。

第三步:特征統(tǒng)計,模板匹配。

2 待測物承載平臺的搭建

整個平臺由Basler acA2500 14gm相機和外部供電電源,亞克力板搭建的平臺,偉郎可調(diào)節(jié)紅色環(huán)形光源和光源控制器組成。

Basler工業(yè)相機性能上遠超普通相機,可以達到工業(yè)測量的高精度要求;亞克力板表面能夠保證較高平滑,這對于共面的檢測而言至關(guān)重要;可調(diào)光源可以根據(jù)環(huán)境變化給平臺進行任意需求量的補光,對于長時間工作的工業(yè)測量必不可少。

平臺的搭建要方便相機采集我們所關(guān)心的目標(biāo)的最為清晰的圖像。利用光的折射性質(zhì),我們就讓光源、目標(biāo)物和相機成一定角度,剛好光源的光照射到目標(biāo)物上,發(fā)生反射后的放射光剛好射入相機內(nèi)。這個時候感光片能采集到最為理想的圖像,對于后面的程序中的圖像預(yù)處理也是相當(dāng)方便的。光源的強度調(diào)節(jié)能夠在光源相機固定后,改變相機采集到的圖像的亮暗程度,從而對目標(biāo)景物進行適當(dāng)?shù)耐怀雠c削弱。

3 數(shù)字圖像處理

3.1 數(shù)字圖像處理軟件

數(shù)字圖象處理軟件的總體設(shè)計決定整個可視化界面的視覺效果。軟件的功能必須能很方便快捷的完成測量與決策的任務(wù)。

軟件設(shè)計主要內(nèi)容:可視化界面布局設(shè)計、圖像處理和決策菜單、處理軟件框架編寫、編寫、各個按鈕功能實現(xiàn)和菜單功能編輯等。

功能菜單中包含:圖像預(yù)處理、包含圖像銳化、圖像灰度化、圖像反色、圖像二值化、中值濾波、Sobel邊緣檢測、Prewitt邊緣檢測、Robert邊緣檢測、Kirsch邊緣檢測、Laplace邊緣檢測;R轉(zhuǎn)G、R轉(zhuǎn)B、G轉(zhuǎn)R、G轉(zhuǎn)B、B轉(zhuǎn)R、B轉(zhuǎn)G、RG交換、RB交換、BG交換,包含的顏色空間有CMY、HSI、HSV、YU、YIQ,這里提供各種顏色空間的雙向轉(zhuǎn)換。

3.2 設(shè)計計算和校核

3.2.1 手機屏蔽罩邊緣與校準面縫隙計算

K=C*N

式中:K:縫隙寬度(mm);N:縫隙寬度對應(yīng)的像素個數(shù);C:單位像素對應(yīng)的實際尺寸(mm)

N=Imax-Imin

式中:N:縫隙對應(yīng)的像素個數(shù);Imax:縫隙最大處對應(yīng)的縱坐標(biāo)較大點的坐標(biāo)值;

Imin :縫隙最大處對應(yīng)的縱坐標(biāo)較小點的坐標(biāo)值。

3.2.2 攝像系統(tǒng)的尺寸比例的計算

攝像系統(tǒng)的尺寸比例包括光源和目標(biāo)物的距離,鏡頭和目標(biāo)物的距離,相機內(nèi)感光片和鏡頭間的距離,標(biāo)準目標(biāo)物的實際尺寸。

因為我們這里的鏡頭和相機完全擰合時,焦距為3m左右,而實際中需要的焦距為15cm。為了調(diào)整焦距,只能將鏡頭往外擰出3mm才能達到要求。但是這個時候,鏡頭出現(xiàn)向下偏折。這個時候利用理論方法計算存在較大誤差。我們用合格產(chǎn)品作為測量校準如圖,合格品側(cè)面厚度為1.2mm。采集多次數(shù)據(jù),得出單位像素實際對應(yīng)的尺寸值,然后作為標(biāo)準值測量,如圖1。

圖1 用合格產(chǎn)品進行尺寸校準

1)攝像頭與目標(biāo)距離的計算

攝像頭和目標(biāo)物的距離在光源和相機固定后用直尺便可以測出。我們的平工后,測的的實際距離是200mm。

2)攝像圖片尺寸與實際尺寸比例的計算

攝像圖片尺寸和實際尺寸的比例有兩種方法可以求得:

方法一:將一個已經(jīng)經(jīng)過校準后的知道具體尺寸的物體放在目標(biāo)物的位置上,采集圖像并計算對應(yīng)尺寸的像素個數(shù),便可以知道單位像素個數(shù)代表著實際尺寸的大小。

計算公式如下: C=L/N 式中:C:單位像素個數(shù)代表的實際尺寸大?。╩m);L:物體的實際尺寸(mm);N:在采集的圖像中,L對應(yīng)的像素個數(shù)。

方法二:根據(jù)鏡頭的焦距,相機內(nèi)感光片到鏡頭的距離和鏡頭到目標(biāo)物的距離,然后根據(jù)光學(xué)原理進行演算,得出采集的圖像中一個像素對應(yīng)的實際尺寸大小。

3.2.3 數(shù)字圖像處理算法的設(shè)計

數(shù)字圖像處理算法包括圖像預(yù)處理、圖像濾波、邊緣提取和最終決策。

1)圖像預(yù)處理算法的設(shè)計

(1)圖像銳化,效果如圖2

這里用目標(biāo)像素點的灰度值與相鄰像素點進行差值運算,最后結(jié)果和0,255進行比較,不同結(jié)果進行不同操作。

(2)圖像反色,效果如圖3

圖2 圖像銳化

圖3 圖像反色

3.2.4 圖像濾波算法的設(shè)計

由于成像系統(tǒng)、傳輸介質(zhì)和記錄設(shè)備等的不完善,數(shù)字圖像在其形成、傳輸記錄過程中往往會受到多種噪聲的污染。另外,在圖像處理的一些環(huán)節(jié)輸入的對象不理想時也會在結(jié)果圖像中引入噪聲。

它們常常表現(xiàn)為一些較強視覺效果的孤立象素點或者是象素塊。破壞圖像的正確性。通過圖像濾波能很好地保護圖像目標(biāo)的形狀、大小及特定的幾何和拓撲結(jié)構(gòu)特征。

本項目中使用的濾波手段有:中值濾波、圖像閾值二值化(效果如圖4)。

3.2.5 邊緣提取算法的設(shè)計

1、Sobel算子如下

W1=[-1,-2,-1;0,0,0;1,2,1];W2=[-1,0,1;-2,0,2;-1,0,1];

2、Robert算子如下

W1=[-1,0;0,1];W2=[0,-1;1,0];效果如圖5。

圖4 圖像閾值二值化

圖5 Sobel算子邊緣提取

代碼實現(xiàn)如下;

for (i = 1; i < Height-1; i ++)

{

for (j = 1; j < Width-1; j ++)

{

R=-ImageArray[2][i-1][j-1]-2*ImageArray[2][i-1][j]-ImageArray[2][i-1][j+1]+0*ImageArray[2][i][j-1]+0*ImageArray[2][i][j]+0*ImageArray[2][i][j+1]+ImageArray[2][i+1][j-1]+2*ImageArray[2][i+1][j]+ImageArray[2][i+1][j+1];

G=-ImageArray[1][i-1][j-1]-2*ImageArray[1][i-1][j]-ImageArray[1][i-1][j+1]+0*ImageArray[1][i][j-1]+0*ImageArray[1][i][j]+0*ImageArray[1][i][j+1]+ImageArray[1][i+1][j-1]+2*ImageArray[1][i+1][j]+ImageArray[1][i+1][j+1];

B=-ImageArray[0][i-1][j-1]-2*ImageArray[0][i-1][j]-ImageArray[0][i-1][j+1]+0*ImageArray[0][i][j-1]+0*ImageArray[0][i][j]+0*ImageArray[0][i][j+1]+ImageArray[0][i+1][j-1]+2*ImageArray[0][i+1][j]+ImageArray[0][i+1][j+1];

r=-ImageArray[2][i-1][j-1]+0*ImageArray[2][i-1][j]+ImageArray[2][i-1][j+1]-2*ImageArray[2][i][j-1]+0*ImageArray[2][i][j]+2*ImageArray[2][i][j+1]-ImageArray[2][i+1][j-1]+0*ImageArray[2][i+1][j]+ImageArray[2][i+1][j+1];

g=-ImageArray[1][i-1][j-1]+0*ImageArray[1][i-1][j]+ImageArray[1][i-1][j+1]-2*ImageArray[1][i][j-1]+0*ImageArray[1][i][j]+2*ImageArray[1][i][j+1]-ImageArray[1][i+1][j-1]+0*ImageArray[1][i+1][j]+ImageArray[1][i+1][j+1];

b=-ImageArray[0][i-1][j-1]+0*ImageArray[0][i-1][j]+ImageArray[0][i-1][j+1]-2*ImageArray[0][i][j-1]+0*ImageArray[0][i][j]+2*ImageArray[0][i][j+1]-ImageArray[0][i+1][j-1]+0*ImageArray[0][i+1][j]+ImageArray[0][i+1][j+1];

ImageArray1[2][i][j]=MIN(255,MAX(0,MAX(abs(R),abs(r))));

ImageArray1[1][i][j]=MIN(255,MAX(0,MAX(abs(G),abs(g))));

ImageArray1[0][i][j]=MIN(255,MAX(0,MAX(abs(B),abs(b))));

3.2.5 最終決策

通過一系列的計算之后,決策將對計算結(jié)果進行判斷,得出手機屏蔽罩是否合格的結(jié)論,并通過亮燈來顯示結(jié)果。

4 視覺檢測系統(tǒng)測試數(shù)據(jù)

通過選擇合格樣品進行多次測量(如圖6),我們就可以建立一個標(biāo)準。樣品與相機距離保持一致,鏡頭保持焦距不變,這個時候合格樣品在檢測中的數(shù)值為164px,而樣品在合格情況下,這個像素值對應(yīng)2.4mm。

因此,單位像素對應(yīng)實際尺寸大小為2.4/164=0.0146341mm。

那么,不合格樣品1號(如圖7)的誤差為(191-164)*0.0146341=0.395mm,即不合格樣品1號,邊角不共面而且偏差為0.52/2=0.1975mm。

5 結(jié)束語

機器視覺用機器代替人眼來做測量和判斷,不僅提高了準確性還提高了效率,這在已經(jīng)成為全球制造業(yè)的加工中心的國內(nèi)市場,特別是高要求的零部件加工及其相應(yīng)的先進生產(chǎn)線越來越有存在意義。本設(shè)備作為這方面的一個產(chǎn)品,能夠真真切切的為相關(guān)公司帶來顯著的經(jīng)濟效益。

【參考文獻】

[1]徐貴力,毛罕平,胡永光.基于計算機視覺技術(shù)參考物法測量葉片面積[J].農(nóng)業(yè)工程學(xué)報,2002,01:154-157+3.

[2]孔斌.人類視覺與計算機視覺的比較[J].自然雜志,2002,01:51-55.