計(jì)算機(jī)視覺(jué)的應(yīng)用方向范文

時(shí)間:2023-12-18 17:59:12

導(dǎo)語(yǔ):如何才能寫好一篇計(jì)算機(jī)視覺(jué)的應(yīng)用方向,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

計(jì)算機(jī)視覺(jué)的應(yīng)用方向

篇1

關(guān)鍵詞 計(jì)算機(jī)視覺(jué);攝像機(jī)定標(biāo)方法;應(yīng)用特點(diǎn);線性關(guān)系;參照物

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671—7597(2013)022-067-3

計(jì)算機(jī)視覺(jué)中的攝像機(jī)定標(biāo)方法總得來(lái)說(shuō)可以分為兩類——傳統(tǒng)的攝像機(jī)定標(biāo)法和攝像機(jī)自定標(biāo)法。為了能夠使所獲取的場(chǎng)景更加自然,計(jì)算機(jī)視覺(jué)系統(tǒng)可以通過(guò)運(yùn)用攝像機(jī)定標(biāo)方法,加之合理安排攝像機(jī)和計(jì)算機(jī)這兩種成像裝置,來(lái)對(duì)二維的圖像信息進(jìn)行虛擬空間的三維建模,進(jìn)而控制整個(gè)攝像效果。這其中攝像及內(nèi)部的一些參數(shù)起到了很大的作用,最初在計(jì)算機(jī)視覺(jué)中都是采用的傳統(tǒng)攝像機(jī)定標(biāo)方法,但是這種方法存在著一定的局限性。這種定標(biāo)方法在攝像機(jī)隨意運(yùn)動(dòng)和未知場(chǎng)景的安排下很難進(jìn)行有效的標(biāo)定。隨著計(jì)算機(jī)視覺(jué)中的攝像機(jī)定標(biāo)方法的不斷進(jìn)步和發(fā)展,以及攝像機(jī)自定標(biāo)方法的誕生,使得這項(xiàng)技術(shù)逐漸獲得了相對(duì)廣泛的應(yīng)用。

1 計(jì)算機(jī)視覺(jué)中與攝像機(jī)定標(biāo)解析

計(jì)算機(jī)視覺(jué)的基本任務(wù)是采集一定數(shù)量的圖片或視頻資料并進(jìn)行處理,以此來(lái)獲得相應(yīng)場(chǎng)景環(huán)境下的的三維信息。而這些三維信息與圖像、視頻對(duì)應(yīng)點(diǎn)的相互關(guān)系需要通過(guò)攝像機(jī)的幾何模型來(lái)決定,經(jīng)過(guò)計(jì)算分析得出這些幾何模型參數(shù)的過(guò)程即為攝像機(jī)定標(biāo)。如此看來(lái),計(jì)算機(jī)視覺(jué)與攝像機(jī)定標(biāo)的關(guān)系密不可分,目前可知,計(jì)算機(jī)視覺(jué)與攝像機(jī)定標(biāo)的結(jié)合已經(jīng)運(yùn)用到相關(guān)領(lǐng)域,如高速公路上的車輛自主導(dǎo)航,部分醫(yī)學(xué)圖像的處理,電腦中臉孔或指紋識(shí)別等。但是由于所使用的目標(biāo)人群相對(duì)較窄,以及攝像機(jī)定標(biāo)方法的相對(duì)局限,使得計(jì)算機(jī)視覺(jué)的攝像機(jī)定標(biāo)無(wú)法廣泛的運(yùn)用到各個(gè)行業(yè)領(lǐng)域。正因如此,才加大了對(duì)計(jì)算機(jī)中攝像機(jī)定標(biāo)方法的研究的必要性。下面就來(lái)對(duì)攝像機(jī)定標(biāo)的兩種方法進(jìn)行簡(jiǎn)要的探討。

2 傳統(tǒng)的攝影機(jī)定標(biāo)方法及應(yīng)用特點(diǎn)

傳統(tǒng)的攝像機(jī)定標(biāo)方法主要是在相應(yīng)的攝像機(jī)模型下面,通過(guò)對(duì)一系列的數(shù)學(xué)公式進(jìn)行變換計(jì)算和改進(jìn)優(yōu)化,然后對(duì)標(biāo)定的具體參照物進(jìn)行科學(xué)的圖像處理,最終來(lái)獲取攝像機(jī)模型的主要外部參數(shù)和內(nèi)部參數(shù)。但是,由于不同的標(biāo)的參照物與不同的算法思路的限制,傳統(tǒng)的攝像機(jī)定標(biāo)方法也各不相同,其大致可分為以下三種:三維型——3D立體靶標(biāo)定標(biāo)法、平面型——2D平面靶標(biāo)定標(biāo)法以及以徑向約束為基準(zhǔn)的定標(biāo)法。

2.1 基于3D立體靶標(biāo)的攝像機(jī)定標(biāo)

這種基于3D立體靶標(biāo)的攝像機(jī)定標(biāo)方法就是在攝像機(jī)的前面安置一個(gè)具有3D效果的立體靶標(biāo)裝置,然后將靶標(biāo)上面的任何一個(gè)點(diǎn)都拿出來(lái)作為i這個(gè)參照物的特征點(diǎn)。在計(jì)算機(jī)視覺(jué)系統(tǒng)的作用下,將每一個(gè)靶標(biāo)上面的特征點(diǎn)在整個(gè)三維坐標(biāo)系中進(jìn)行精確的制作測(cè)定。與此同時(shí),攝像機(jī)首先在拍攝過(guò)程中獲取靶標(biāo)上面的特征點(diǎn)影像信息,然后對(duì)平面圖像坐標(biāo)系和立體空間坐標(biāo)系二者的內(nèi)外部數(shù)據(jù)參數(shù)排列出非線性方程,找出方程中系數(shù)矩陣的非線性關(guān)系,最后通過(guò)數(shù)學(xué)算法中的線性變換法來(lái)對(duì)整個(gè)透視系數(shù)矩陣中的每一個(gè)元素進(jìn)行求解。通常在這種定標(biāo)方法的應(yīng)用過(guò)程中,計(jì)算機(jī)視覺(jué)系統(tǒng)都會(huì)忽略攝相機(jī)鏡頭在拍攝時(shí)的非線性畸變,將透視變幻矩陣中的相關(guān)元素定義為未知數(shù),繼而在整個(gè)定標(biāo)過(guò)程確定有效的三維控制點(diǎn)和相應(yīng)的圖像點(diǎn)。在裝置3D立體靶標(biāo)后,整個(gè)攝像機(jī)定標(biāo)就能夠根據(jù)靶標(biāo)上特征點(diǎn)的圖像坐標(biāo)和世界坐標(biāo),在數(shù)學(xué)變幻算法的應(yīng)用下,計(jì)算出攝像機(jī)的內(nèi)部參數(shù)和外部參數(shù)。

這種3D立體靶標(biāo)的攝像機(jī)定標(biāo)方法不僅能夠優(yōu)化定標(biāo)物的獲取方法,而且能夠適應(yīng)程序功能的改進(jìn),并且較高的精度,因而得到了廣泛的應(yīng)用,但是這種定標(biāo)方法通常比較繁瑣。

2.2 基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)

基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)方法在傳統(tǒng)攝像機(jī)定標(biāo)方法分類中屬于一種新型的定標(biāo)方法,又名張正友定標(biāo)法。這種定標(biāo)法具有靈活適用的特點(diǎn),也是對(duì)傳統(tǒng)攝像機(jī)定標(biāo)方法的一種簡(jiǎn)化。在定標(biāo)過(guò)程中首先是要在兩個(gè)以上的不同方位對(duì)一個(gè)平面靶標(biāo)進(jìn)行攝相機(jī)拍攝,整個(gè)拍攝過(guò)程中2D平面靶標(biāo)和攝相機(jī)鏡頭都能夠自由地進(jìn)行移動(dòng),而且要保持整個(gè)攝像機(jī)的內(nèi)部參數(shù)一直固定。通常在基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)法的應(yīng)用中,我們都需要先假定這個(gè)靶標(biāo)在三維空間坐標(biāo)系中的豎軸為0,然后為了求出攝像機(jī)內(nèi)外參數(shù)的優(yōu)化解,要建立相應(yīng)的線性模型,通過(guò)對(duì)線性模型的線性分析來(lái)計(jì)算出優(yōu)化解,最后,運(yùn)用最大似然法排列參數(shù)之間的非線性關(guān)系來(lái)求出其非線性解。在整個(gè)定標(biāo)流程中,必須對(duì)攝像機(jī)的鏡頭畸變的目標(biāo)函數(shù)進(jìn)行綜合考慮,才能夠計(jì)算出攝像機(jī)的外部和內(nèi)部參數(shù)。

這種方法既具有較高的精確性,又不需要很昂貴的定標(biāo)成本,因此在計(jì)算機(jī)視覺(jué)系統(tǒng)中很為實(shí)用。但是,這種方法在進(jìn)行整個(gè)攝像機(jī)內(nèi)外參數(shù)的線性分析時(shí),因?yàn)樘卣鲌D像上面的直線在透視之后依然是直線,在進(jìn)行圖像處理的過(guò)程中,會(huì)引入一定的誤差。因此,在很多具有廣角鏡頭的攝像機(jī)定標(biāo)上會(huì)出現(xiàn)因?yàn)殓R頭畸變而引起的較大誤差。

2.3 基于徑向約束的攝像機(jī)定標(biāo)

基于徑向約束的攝像機(jī)定標(biāo)就是通常所說(shuō)的兩步法標(biāo)定方法。這種方法通常是先利用徑向一致約束對(duì)超定性的線性方程進(jìn)行最小二乘法求解,這樣就能夠?qū)⒊藬z像機(jī)光軸方向平移外的其他的攝像機(jī)參數(shù),然后對(duì)攝相機(jī)鏡頭存在和不存在透鏡畸變的情況下分別進(jìn)行其他攝像機(jī)參數(shù)的求解。這種方法的計(jì)算量較為適中,而且精度也比較高,適用于攝像機(jī)的精密測(cè)量。然而,兩步法對(duì)于整個(gè)定標(biāo)設(shè)備的要求也高,對(duì)于簡(jiǎn)單的攝像機(jī)標(biāo)定而言不易采用。

總的來(lái)說(shuō),基于徑向約束的攝像機(jī)定標(biāo)的精準(zhǔn)是通過(guò)設(shè)備的復(fù)雜和精確來(lái)獲得的,因此具有針對(duì)性的應(yīng)用特點(diǎn)。

3 攝像機(jī)自定標(biāo)方法及其應(yīng)用特點(diǎn)

攝像機(jī)自定標(biāo)方法是指在攝像機(jī)在移動(dòng)時(shí),周圍環(huán)境中的圖像會(huì)形成一定的對(duì)應(yīng)關(guān)系,通過(guò)這種對(duì)應(yīng)關(guān)系來(lái)對(duì)攝像機(jī)進(jìn)行定標(biāo)的方法,這種方法無(wú)需依賴參照物。攝像機(jī)自定標(biāo)方法主要有以下四種:基于主動(dòng)視覺(jué)的自定標(biāo)法、基于Kruppa方程的自定標(biāo)方法、分層逐步定標(biāo)法以及基于二次曲面的自定標(biāo)方法等。這些方法相較于傳統(tǒng)的攝像機(jī)定標(biāo)方法來(lái)說(shuō)有了很大的改進(jìn)和提高,下面就進(jìn)行簡(jiǎn)要的探討。

3.1 基于主動(dòng)視覺(jué)的自定標(biāo)法

目前,在攝像機(jī)自定標(biāo)方法中的應(yīng)用最為普遍的方法便是基于主動(dòng)視覺(jué)的自定標(biāo)法。這種方法主要是能夠通過(guò)對(duì)攝像機(jī)在移動(dòng)過(guò)程中的對(duì)環(huán)境中的多幅圖像進(jìn)行標(biāo)定,進(jìn)而建立對(duì)應(yīng)關(guān)系來(lái)求出標(biāo)定參數(shù),由此可見,整個(gè)標(biāo)定過(guò)程不需要精密的標(biāo)定物,如此一來(lái)就能夠使得標(biāo)定問(wèn)題簡(jiǎn)單化。主動(dòng)視覺(jué)系統(tǒng)是這種標(biāo)定方法的核心技術(shù),就是攝像機(jī)在拍攝過(guò)程中被固定在了一個(gè)能夠得到精確控制的移動(dòng)平臺(tái)上,并且這個(gè)平臺(tái)的相關(guān)參數(shù)能夠通過(guò)計(jì)算機(jī)進(jìn)行精確的讀出,在整個(gè)拍攝過(guò)程中攝像機(jī)只需要通過(guò)一定的特殊運(yùn)動(dòng)來(lái)獲取多幅圖像信息,然后在結(jié)合攝像機(jī)運(yùn)動(dòng)的具體參數(shù)和圖像的參數(shù)來(lái)確定整個(gè)攝像機(jī)的內(nèi)部和外部參數(shù),達(dá)到攝像機(jī)定標(biāo)的效果。其中基于主動(dòng)視覺(jué)的自定標(biāo)法的代表方法就是馬頌德提出的控制攝像機(jī)的兩組三正交平移運(yùn)動(dòng)的標(biāo)定方法。后來(lái),李華、楊長(zhǎng)江等人對(duì)這種方法進(jìn)行了改進(jìn)和優(yōu)化,提出了基于四組平面正交和五組平面正交運(yùn)動(dòng)的標(biāo)定方法,并能夠利用獲取圖像中的機(jī)電信息來(lái)對(duì)攝像機(jī)的參數(shù)進(jìn)行線性表定。

這種方法算法簡(jiǎn)便,能夠獲得整個(gè)參數(shù)的線性解,但是這種方法對(duì)整個(gè)攝像機(jī)的運(yùn)動(dòng)平臺(tái)要求很高,因此要求必須具有精確控制的能力。

3.2 基于Kruppa方程的自定標(biāo)方法

基于Kruppa方程的自定標(biāo)方法主要是在整個(gè)攝像機(jī)自定標(biāo)過(guò)程中導(dǎo)入了Kruppa方程,并對(duì)該方程進(jìn)行直接求解,從而得到整個(gè)攝像機(jī)的具體參數(shù)的方法?;贙ruppa方程的自定標(biāo)方法在應(yīng)用時(shí)利用了極線變幻和二次曲線像的概念對(duì)Kruppa進(jìn)行推導(dǎo),直接進(jìn)行求解。

這種標(biāo)定方法不需要對(duì)整個(gè)圖像的序列進(jìn)行射影重建,通常是對(duì)兩個(gè)圖像之間的信息建立一個(gè)方程,相較于逐步分層標(biāo)定方法而言,基于Kruppa方程的自定標(biāo)方法能夠?qū)⒛承┖茈y做到所有圖像整合到一個(gè)統(tǒng)一的射影框架中的情況更加具有優(yōu)勢(shì),但是這種方法還是存在著一定的局限性,它無(wú)法保證在無(wú)窮遠(yuǎn)處的平面能夠保持所有圖像在確定的攝影平面中還具有一致性的效果。當(dāng)整個(gè)攝像機(jī)拍攝的圖像的序列較長(zhǎng)的時(shí)候,基于Kruppa方程的自定標(biāo)方法就顯得很不穩(wěn)定,繼而不能夠很好地算出整個(gè)攝像機(jī)的內(nèi)外參數(shù),對(duì)定標(biāo)造成了一定的影響。

3.3 分層逐步定標(biāo)法

分層逐步定標(biāo)法是攝像機(jī)自定標(biāo)方法中的一個(gè)研究熱點(diǎn),在攝像機(jī)自定標(biāo)的實(shí)際應(yīng)用中以及逐步取代了可以直接求解的基于Kruppa方程的自定標(biāo)方法。分層逐步定標(biāo)法在應(yīng)用過(guò)程中首先需要對(duì)整個(gè)拍攝的圖像序列進(jìn)行攝影重建,這點(diǎn)和基于Kruppa方程的自定標(biāo)方法一樣,然后利用絕對(duì)二次曲面加以約束,最后在確定出無(wú)窮遠(yuǎn)處平面方程中的仿射參數(shù)以及攝像機(jī)內(nèi)部的參數(shù)。分層逐步定標(biāo)法的應(yīng)用特點(diǎn)是必須建立在射影定標(biāo)的基礎(chǔ)之上,利用某一幅圖形作為特征基準(zhǔn)點(diǎn)進(jìn)行射影對(duì)其,將整個(gè)攝像機(jī)自定標(biāo)的未知數(shù)的數(shù)量減少,再運(yùn)用數(shù)學(xué)算法中的非線性優(yōu)化算法來(lái)進(jìn)行未知數(shù)的求解。

這種方法的不知自出就是在進(jìn)行非線性優(yōu)化算法時(shí),初值是通過(guò)事前的預(yù)估得到的,不能夠保證這個(gè)方程的收斂性。由于在射影重建時(shí),選擇的基準(zhǔn)圖像不同,整個(gè)攝像機(jī)自定標(biāo)的結(jié)果也會(huì)存在差異。

3.4 基于二次曲面的自定標(biāo)方法

基于二次曲面的自定標(biāo)方法和基于Kruppa方程的自定標(biāo)方法在本質(zhì)上答題一致,這兩種方法都是利用了絕對(duì)二次曲面在歐式變幻算法的計(jì)算下維持的不變性進(jìn)行的。最早將二次曲面的概念引入到計(jì)算機(jī)視覺(jué)系統(tǒng)中攝像機(jī)自定標(biāo)方法的是Triggs,他在這種定標(biāo)方法上作出了可行性的研究,最后形成了基于二次曲面的自定標(biāo)方法。

在輸入了多幅的圖像并且在進(jìn)行統(tǒng)一的射影重建的狀態(tài)下,基于二次曲面的自定標(biāo)方法會(huì)比基于Kruppa方程的自定標(biāo)方法更加適用一些,原因就是基于二次曲面的自定標(biāo)方法包含了絕對(duì)二次曲面和無(wú)窮遠(yuǎn)處平面的所有信息,進(jìn)而能夠辦證整個(gè)圖像在無(wú)窮遠(yuǎn)處平面的一致性。

4 傳統(tǒng)攝像機(jī)定標(biāo)方法與自定標(biāo)方法優(yōu)缺點(diǎn)分析

從上文可知,對(duì)于傳統(tǒng)攝像機(jī)定標(biāo)方法應(yīng)該取其精華,去其糟粕;對(duì)于攝像機(jī)自定標(biāo)方法,在吸取傳統(tǒng)攝像機(jī)定標(biāo)方法的優(yōu)點(diǎn)的同時(shí),應(yīng)該加強(qiáng)自身的精度要求??偠灾瑑煞N攝像機(jī)定標(biāo)方法各自存在利弊,如何改進(jìn)才是正確的研究方向。

4.1 傳統(tǒng)的攝像機(jī)定標(biāo)方法弊端

傳統(tǒng)的攝像機(jī)定標(biāo)方法通過(guò)實(shí)踐證明,在理論上和實(shí)際運(yùn)用上十分有用的,但仍有不少地方需要進(jìn)一步改進(jìn),以下為它目前存在的問(wèn)題所在:1)攝像機(jī)所拍攝的圖像或視頻存在一定噪聲。在實(shí)際數(shù)據(jù)計(jì)算分析中,這種噪音無(wú)論大小,都會(huì)對(duì)內(nèi)部參數(shù)的實(shí)際解造成大的干擾,并且使實(shí)際解與由約束關(guān)系所求得的解之間有著相當(dāng)大的差異。因此,怎樣才能夠提高解的魯棒性、減少解之間的差異性成為了傳統(tǒng)攝像機(jī)定標(biāo)亟待解決的1問(wèn)題;2)線性模型所得的優(yōu)化解并非全局的。由上可知,攝像機(jī)定標(biāo)的實(shí)際過(guò)程便是獲得實(shí)際參數(shù)的過(guò)程,即使用各種不同的優(yōu)化計(jì)算方法,來(lái)獲得相應(yīng)的非線性方程的一組解,但實(shí)際上,以此所獲得的優(yōu)化解并非全局的。因此,如何變化或者提高線性方程的解答方法也很重要;3)攝像機(jī)定標(biāo)參數(shù)的不確定性。一般來(lái)講,攝像機(jī)定標(biāo)參數(shù)的不確定性決定著計(jì)算參數(shù)的可信程度,同時(shí),其對(duì)三維重建有著影響,進(jìn)一步來(lái)講,攝像機(jī)定標(biāo)的不確定性也決定著約束關(guān)系的不確定性傳播。因此,這個(gè)問(wèn)題也需要深入進(jìn)一步研究。

總之,傳統(tǒng)攝像機(jī)的定標(biāo)方法依然存在著許多無(wú)法忽視的弊端和需要解決的問(wèn)題,深入研究并盡快解決這些問(wèn)題,應(yīng)該是傳統(tǒng)攝像機(jī)的定標(biāo)方法今后的大的研究方向。

4.2 攝像機(jī)自定標(biāo)方法相關(guān)問(wèn)題

目前普遍認(rèn)為,攝像機(jī)自定標(biāo)方法實(shí)現(xiàn)隨時(shí)隨地的校準(zhǔn)攝像機(jī)模型參數(shù),與傳統(tǒng)的攝像機(jī)定標(biāo)方法相比顯得更為靈活先進(jìn)。攝像機(jī)自定標(biāo)方法無(wú)需參照物,僅僅從圖像或視頻的相關(guān)點(diǎn)中得到它們之間的約束關(guān)系,從而通過(guò)相應(yīng)的分析,計(jì)算出攝像機(jī)模型的參數(shù).這種定標(biāo)方法看似毫無(wú)缺點(diǎn),但自定標(biāo)的精度與傳統(tǒng)的攝像機(jī)定標(biāo)方法相比,還是存在者一定的缺點(diǎn),以下便是對(duì)其缺點(diǎn)的歸納總結(jié):部分?jǐn)z像機(jī)自定標(biāo)方法所求得的解不夠穩(wěn)定。例如:在圖像或視頻存在一定噪聲的情況下,實(shí)際的解與理論的解有著相當(dāng)差異,或者所求得的解并不唯一。因此,解的不穩(wěn)定性和精度不夠的情況,不僅是傳統(tǒng)攝像機(jī)定標(biāo)方法的缺點(diǎn),也是自定標(biāo)方法的一個(gè)問(wèn)題,提高解的精度及穩(wěn)定性,是自定標(biāo)研究的一個(gè)重要方向。實(shí)際上,在現(xiàn)在的解決方案中,各種優(yōu)化算法是最常用最普遍的方法,但是,在多解的情況下,優(yōu)化算法也無(wú)法能夠保證得出全局的最優(yōu)解。由此看來(lái),這個(gè)問(wèn)題是計(jì)算機(jī)是絕種攝像機(jī)定標(biāo)方法普遍存在的關(guān)鍵性問(wèn)題。

5 結(jié)束語(yǔ)

隨著計(jì)算機(jī)視覺(jué)系統(tǒng)的不斷發(fā)展,攝像機(jī)定標(biāo)技術(shù)也呈現(xiàn)了進(jìn)步的狀態(tài)。綜上所述,計(jì)算機(jī)視覺(jué)中的攝像機(jī)定標(biāo)方法主要有傳統(tǒng)的攝像機(jī)定標(biāo)法和攝像機(jī)自定標(biāo)法,對(duì)這兩類的定標(biāo)方法進(jìn)行深入的研究能夠?yàn)槿嬲J(rèn)識(shí)和了解攝像機(jī)定標(biāo)方法起到很好的幫助作用。計(jì)算機(jī)視覺(jué)中的攝像機(jī)定標(biāo)方法在今后的發(fā)展過(guò)程中應(yīng)該得到更多的研究,但其所存在的不足和弊端也理應(yīng)得到研究人員的重視。在這個(gè)多元化信息化的世界里,計(jì)算機(jī)視覺(jué)中的攝像機(jī)定標(biāo)技術(shù)若能夠根據(jù)現(xiàn)有的條件,適應(yīng)如今的環(huán)境,選擇合適的方法,對(duì)一些還存在局限性的環(huán)節(jié)取得更好地突破,則能夠?qū)⒄麄€(gè)定標(biāo)技術(shù)提升一個(gè)高度。相信隨著未來(lái)計(jì)算機(jī)視覺(jué)系統(tǒng)的不斷擴(kuò)展和不斷完善,攝像機(jī)定標(biāo)技術(shù)的應(yīng)用范圍也會(huì)越來(lái)越廣闊。

參考文獻(xiàn)

[1]宋雪峰,楊明,王宏.用于攝像機(jī)標(biāo)定的網(wǎng)格狀紋理的檢測(cè)方法[A].2001年中國(guó)智能自動(dòng)化會(huì)議論文集(下冊(cè))[C].2001.

[2]譚躍鋼,吳正平.一種新的基于雙目視模型的三維重建方法[A].中國(guó)儀器儀表學(xué)會(huì)第三屆青年學(xué)術(shù)會(huì)議論文集(上)[C].2001.

[3]劉健勤,鮑光淑.面向數(shù)據(jù)采掘的自適應(yīng)圖象分割技術(shù)[A].中國(guó)圖象圖形科學(xué)技術(shù)新進(jìn)展——第九屆全國(guó)圖象圖形科技大會(huì)論文集[C].1998.

[4]洪俊田,陶劍鋒,李剛,桂預(yù)風(fēng),徐曉英.基于灰色關(guān)聯(lián)的數(shù)字圖像去噪研究[J].武漢理工大學(xué)學(xué)報(bào)(交通科學(xué)與工程版),2006,04.

[5]趙江濤,周仁斌,劉寶源.基于線結(jié)構(gòu)激光三維掃描系統(tǒng)的攝像機(jī)標(biāo)定方法研究[A].2010振動(dòng)與噪聲測(cè)試峰會(huì)論文集[C].2010.

[6]王鵬,王紅平.基于網(wǎng)格圖像的雙線性插值畸變校正的方法研究[A].科技創(chuàng)新與節(jié)能減排——吉林省第五屆科學(xué)技術(shù)學(xué)術(shù)年會(huì)論文集(上冊(cè))[C].2008.

[7]程建璞,項(xiàng)輝宇,于修洪.基于OpenCV的視覺(jué)測(cè)量技術(shù)中攝像機(jī)標(biāo)定方法[J].北京工商大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,01.

[8]趙越,江南.一種基于3D矩形靶標(biāo)的攝像機(jī)標(biāo)定算法及其實(shí)現(xiàn)[A].第九屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集Ⅰ[C].2011.

篇2

1.1計(jì)算機(jī)在和藝術(shù)融合時(shí)

有效結(jié)合圖像、文本、聲音、動(dòng)畫等因素,在豐富藝術(shù)語(yǔ)言表現(xiàn)形式時(shí),也使作品更具有感染力。當(dāng)計(jì)算機(jī)視覺(jué)藝術(shù)與數(shù)字媒體結(jié)合在一起時(shí),使人們?cè)谟^看畫面時(shí),不僅是欣賞畫面,也能夠感受到聲、色等。數(shù)字媒體通過(guò)計(jì)算機(jī)視覺(jué)藝術(shù)利用高度仿真的視覺(jué)、觸覺(jué)和聽覺(jué),使大眾在觀看電影或玩游戲時(shí),能夠真實(shí)感受到虛擬世界,同時(shí)還可以通過(guò)肢體語(yǔ)言、動(dòng)作以及視線的轉(zhuǎn)移,與計(jì)算機(jī)進(jìn)行有效交流。比如在2010年開展的上海世博會(huì)上,德國(guó)館所開展的動(dòng)力之源”金屬球表演1.3噸重、裝有40萬(wàn)根LED發(fā)光二極管的互動(dòng)金屬球。在互動(dòng)開始時(shí),觀眾被分成兩批跟著解說(shuō)員的指令呼喊,金屬球自動(dòng)找到聲音最響亮的那個(gè)方向。然后,哪邊的呼喊聲大,互動(dòng)球向那一邊的搖擺也更為劇烈,同時(shí),球體表面上,亦不斷展現(xiàn)出一幅幅城市的美好愿景。使大眾不僅是單獨(dú)欣賞電影,而是可以參與到視覺(jué)藝術(shù)表演中。數(shù)字媒體通過(guò)計(jì)算機(jī)視覺(jué)藝術(shù),在最大程度上滿足藝術(shù)創(chuàng)作對(duì)感受的表現(xiàn)。

1.2計(jì)算機(jī)視覺(jué)藝術(shù)在數(shù)字媒體中的應(yīng)用

豐富了藝術(shù)的表達(dá)形式。交互技術(shù)的發(fā)展與成熟,使計(jì)算機(jī)視覺(jué)藝術(shù)的領(lǐng)域得到很好的拓展,并在各種數(shù)字媒體藝術(shù)中得到廣泛應(yīng)用。比如在網(wǎng)頁(yè)、游戲等內(nèi)容。交互技術(shù)的應(yīng)用,使人們不再是被動(dòng)的欣賞,而是參與到視覺(jué)藝術(shù)中,讓大眾去參與、選擇和判斷,而且可以通過(guò)不同的選擇將過(guò)程和結(jié)局進(jìn)行不同的呈現(xiàn),調(diào)動(dòng)觀眾的興趣,提高大眾的參與度。

1.3計(jì)算機(jī)視覺(jué)藝術(shù)在電子游戲中的應(yīng)用

首先是大型電子游戲應(yīng)用的計(jì)算機(jī)視覺(jué)藝術(shù)。比如日本科樂(lè)美公司在推出警匪槍戰(zhàn)射擊《警察官2》游戲時(shí),就受到許多玩家的歡迎。在游戲中,玩家不再只是使用鼠標(biāo)和鍵盤來(lái)進(jìn)行游戲,而是玩家可以通過(guò)身體行動(dòng),比如“蹲、閃及側(cè)身等行為以此進(jìn)行移動(dòng)。機(jī)器通過(guò)攝像機(jī)部捕捉到玩家的身體動(dòng)作,玩家可以有效操作與機(jī)器相連的手槍,將屏幕中的對(duì)象進(jìn)行射中。其次是手機(jī)上的小型電子游戲,比如在《神廟逃亡》,玩家只需要用手指向左、向右滑動(dòng)屏幕,可以人物向左或向右轉(zhuǎn)向;而向上、向下滑動(dòng)則可以讓人物跳躍或下滑過(guò)各種障礙。另外在需要游戲人物在左側(cè)或右側(cè)奔跑時(shí),只需要側(cè)一下手機(jī)就可以,并且游戲畫面有著充足的聲光效果,可進(jìn)行互動(dòng),有著極高的震撼力,對(duì)提高大眾的參與度有著積極的促進(jìn)作用。

1.4計(jì)算機(jī)視覺(jué)藝術(shù)在數(shù)字媒體中的應(yīng)用

使數(shù)字媒體技術(shù)將藝術(shù)進(jìn)行有效表現(xiàn),并在純藝術(shù)和實(shí)用藝術(shù)中應(yīng)用到數(shù)字媒體,而數(shù)字媒體技術(shù)可以將單純的個(gè)人視覺(jué)進(jìn)行有效的創(chuàng)造,并將藝術(shù)轉(zhuǎn)化為社會(huì)性視覺(jué)產(chǎn)品,并可以獲得經(jīng)濟(jì)效益。而大眾可以利用拷貝、剪切等方式將數(shù)字媒體中的視覺(jué)藝術(shù)進(jìn)行獲取,然后將藝術(shù)資源進(jìn)行轉(zhuǎn)化,為個(gè)人視覺(jué)藝術(shù)的創(chuàng)作奠定了堅(jiān)實(shí)的基礎(chǔ)。隨著大眾對(duì)獨(dú)特性以及個(gè)性化的藝術(shù)要求越來(lái)越高,在追求獨(dú)特的視覺(jué)藝術(shù)時(shí),追求刺激的視覺(jué)藝術(shù)時(shí),也提高了對(duì)視覺(jué)藝術(shù)作品的評(píng)價(jià)標(biāo)準(zhǔn)。計(jì)算機(jī)視覺(jué)藝術(shù)在數(shù)字媒體中的應(yīng)用,給大眾帶來(lái)美的享受,使大眾在觀看視覺(jué)藝術(shù)時(shí)可以懷著愉悅、舒適的感覺(jué)進(jìn)行欣賞,也可以獲得相應(yīng)的審美評(píng)價(jià),在潛移默化中改變著人的精神追求。計(jì)算機(jī)視覺(jué)藝術(shù)在數(shù)字媒體中應(yīng)用時(shí),沒(méi)有摻雜其他因素,使計(jì)算機(jī)視覺(jué)因素只是追求視覺(jué)形式和視覺(jué)美感,能夠在最大程度上體現(xiàn)藝術(shù)的本質(zhì)。并且數(shù)字媒體本身就具有美的品格,與計(jì)算機(jī)視覺(jué)藝術(shù)相結(jié)合,使數(shù)字媒體藝術(shù)在具備了美時(shí),也可以體現(xiàn)真。因此,計(jì)算機(jī)視覺(jué)藝術(shù)在數(shù)字媒體中的應(yīng)用,提高了審美價(jià)值,大眾通過(guò)感受、體悟數(shù)字媒體所體現(xiàn)出的視覺(jué)藝術(shù),領(lǐng)悟到視覺(jué)藝術(shù)中的美,能夠在很大程度上滿足大眾對(duì)美的追求。

2總結(jié)

篇3

關(guān)鍵詞: 危險(xiǎn)氣體罐車; 液位檢測(cè); 計(jì)算機(jī)視覺(jué); 報(bào)警系統(tǒng)

中圖分類號(hào): TN948.64?34; TP216 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)22?0067?0

0 引 言

隨著自動(dòng)化測(cè)試技術(shù)的發(fā)展,采用智能測(cè)試和計(jì)算機(jī)視覺(jué)方法進(jìn)行液位檢測(cè)和監(jiān)控,借助的物理場(chǎng)有超聲波、微波雷達(dá)、射線及激光等,能實(shí)現(xiàn)高低位報(bào)警功能,在工業(yè)控制場(chǎng)合中,固定位置處的液位監(jiān)控是保障工業(yè)控制安全的重要技術(shù),特別是在危險(xiǎn)光車的運(yùn)輸過(guò)程中,需要對(duì)危險(xiǎn)氣體罐車的液位進(jìn)行實(shí)時(shí)監(jiān)控和識(shí)別,通過(guò)感應(yīng)元件實(shí)現(xiàn)對(duì)液位的準(zhǔn)確檢測(cè),通過(guò)檢測(cè)發(fā)射和接收的時(shí)延來(lái)確定液位的高度。隨著計(jì)算機(jī)視覺(jué)處理技術(shù)的發(fā)展,以及圖像處理技術(shù)的應(yīng)用,采用計(jì)算機(jī)視覺(jué)部監(jiān)控方法進(jìn)行危險(xiǎn)氣體罐車的液位監(jiān)控識(shí)別成為未來(lái)實(shí)現(xiàn)液位準(zhǔn)確監(jiān)測(cè)和定位的重要發(fā)展方向,研究基于計(jì)算機(jī)視覺(jué)的危險(xiǎn)罐車的液位檢測(cè)監(jiān)控報(bào)警系統(tǒng),在保障危險(xiǎn)罐車運(yùn)輸安全方面具有重要意義,相關(guān)的系統(tǒng)設(shè)計(jì)方法受到人們的重視[1?3]。

目前,對(duì)液位的檢測(cè)方法按照測(cè)量液位的感應(yīng)元件與被測(cè)液體是否接觸,其可分為接觸型和非接觸型兩大類。通過(guò)人工檢尺法[4?6],加裝浮子測(cè)量裝置進(jìn)行液位檢測(cè),微波雷達(dá)、射線及激光主要是應(yīng)用在檢測(cè)罐體為危險(xiǎn)物質(zhì),將微波發(fā)射器和接收器安裝在罐頂,利用超聲技術(shù)并結(jié)合數(shù)字信號(hào)處理算法進(jìn)行液位檢測(cè)[7?9]。但是,上述設(shè)計(jì)方案因無(wú)法找到超聲信號(hào)為零的位置,所以考慮使用靈敏度相同的另一液位檢測(cè)傳感器作為參考通道進(jìn)行自適應(yīng)噪聲抵消,參考液位檢測(cè)傳感器應(yīng)放置在對(duì)目標(biāo)反射信號(hào)較小,更多的反映液位反射的超聲信號(hào)的位置,但是對(duì)電磁波、光波等超聲無(wú)法穿過(guò)的介質(zhì),液位檢測(cè)的精度不高[10],難以實(shí)現(xiàn)有效的監(jiān)控識(shí)別和報(bào)警。針對(duì)上述問(wèn)題,本文進(jìn)行危險(xiǎn)氣體罐車液位監(jiān)控識(shí)別報(bào)警系統(tǒng)的改進(jìn)設(shè)計(jì),首先進(jìn)行了液位檢測(cè)原理分析,構(gòu)建系統(tǒng)裝置的總體結(jié)構(gòu)模型,然后進(jìn)行了危險(xiǎn)氣體罐車液位計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別報(bào)警系統(tǒng)的硬件模塊化設(shè)計(jì)和軟件設(shè)計(jì),最后通過(guò)實(shí)驗(yàn)分析驗(yàn)證了本文設(shè)計(jì)的液位監(jiān)控識(shí)別報(bào)警系統(tǒng)的優(yōu)越性能,得出有效性結(jié)論。

1 液位計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別報(bào)警系統(tǒng)的總體設(shè)計(jì)

根據(jù)上述液位檢測(cè)弊端分析,進(jìn)行危險(xiǎn)氣體罐車液位計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別報(bào)警系統(tǒng)設(shè)計(jì),首先分析系統(tǒng)設(shè)計(jì)的總體架構(gòu)模型,系統(tǒng)設(shè)計(jì)包括了系統(tǒng)的硬件設(shè)計(jì)和軟件設(shè)計(jì)部分。硬件設(shè)計(jì)中,主要是在計(jì)算機(jī)視覺(jué)環(huán)境下完成液位視覺(jué)特征的獲取,并對(duì)接收到的視覺(jué)特征進(jìn)行相應(yīng)的處理。本系統(tǒng)的硬件部分主要是數(shù)據(jù)采集和數(shù)字信號(hào)處理。接收探頭采集的視覺(jué)特征通過(guò)信號(hào)采集電路進(jìn)行高分辨率的A/D采樣,液位視覺(jué)的差異性可以通過(guò)對(duì)分辨率和采樣率的大小來(lái)判斷。在對(duì)液位檢測(cè)的超聲信號(hào)檢測(cè)的基礎(chǔ)上,設(shè)計(jì)自適應(yīng)濾波器進(jìn)行信號(hào)濾波,通過(guò)自適應(yīng)均衡方法得到基于視覺(jué)傳感器的液位檢測(cè)特征,為系統(tǒng)設(shè)計(jì)提供了準(zhǔn)確的數(shù)據(jù)基礎(chǔ)。因此,采集電路的設(shè)計(jì)必須采用高分辨率,硬件電路設(shè)計(jì)中,包括確定DSP處理器型號(hào)、Visual DSP++集成開發(fā)環(huán)境、器件以及連接關(guān)系。根據(jù)I/O設(shè)備的數(shù)據(jù)采集量確定液位監(jiān)控識(shí)別系統(tǒng)的分辨率和基線恢復(fù)性能,采用ADI公司的ADSP21160處理器系統(tǒng)作為計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別的主控芯片,數(shù)字信號(hào)處理器主要完成對(duì)整個(gè)硬件系統(tǒng)的電路控制,根據(jù)設(shè)計(jì)的功能指標(biāo)得到本文設(shè)計(jì)的監(jiān)控系統(tǒng)的計(jì)算機(jī)視覺(jué)的像素值的系統(tǒng)最低采樣率為1 024 MHz, 則DSP的最低速度應(yīng)大于[25×20=500 MHz]。

在進(jìn)行罐體液位監(jiān)控中,研究的罐體的厚度分別為5 mm平面罐體,20 mm平面罐體。由于本文構(gòu)建的系統(tǒng)是一個(gè)高采樣率的數(shù)據(jù)采集系統(tǒng),在進(jìn)行液位監(jiān)控識(shí)別報(bào)警中,需要利用C8051F處理器發(fā)射頻率為120 kHz左右的脈沖序列,作為原始聲信號(hào)數(shù)據(jù)存入計(jì)算機(jī)系統(tǒng),以此進(jìn)行監(jiān)控識(shí)別,根據(jù)上述描述,得到系統(tǒng)設(shè)計(jì)的模塊構(gòu)架如圖1所示。

2 系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

2.1 硬件電路設(shè)計(jì)的指標(biāo)分析

在上述進(jìn)行了危險(xiǎn)氣體罐車液位計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別報(bào)警系統(tǒng)的液位檢測(cè)原理分析和系統(tǒng)設(shè)計(jì)總體構(gòu)建描述的基礎(chǔ)上,進(jìn)行系統(tǒng)的硬件設(shè)計(jì),系統(tǒng)的硬件模塊主要包括了超聲信號(hào)A/D采樣電路、時(shí)鐘電路、濾波電路、程序加載電路和電源電路等。系統(tǒng)的設(shè)計(jì)指標(biāo)描述如下:

(1) 危險(xiǎn)氣體罐車液位計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別報(bào)警系統(tǒng)的輸出信號(hào)幅度

(2) 監(jiān)控系統(tǒng)的整體功耗

(3) 計(jì)算機(jī)視覺(jué)監(jiān)控接收機(jī)采樣率不低于12 MHz;

(4) CAN總線對(duì)無(wú)液狀態(tài)采集數(shù)據(jù)采樣分辨率不低于8位;

(5) 有液狀態(tài)采集數(shù)據(jù)中具有高壓控制功能;

(6) 具有基線恢復(fù)功能。

根據(jù)上述設(shè)計(jì)的指標(biāo),進(jìn)行硬件模塊化設(shè)計(jì)。

2.2 系統(tǒng)硬件模塊化設(shè)計(jì)與電路實(shí)現(xiàn)

首先設(shè)計(jì)圖像信號(hào)A/D采樣電路,A/D采樣電路是實(shí)現(xiàn)罐車液位計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別報(bào)警系統(tǒng)設(shè)計(jì)的基礎(chǔ),通過(guò)A/D采樣電路上傳圖譜數(shù)據(jù),使用AD公司一款高性能A/D芯片AD9225對(duì)上一個(gè)緩沖區(qū)數(shù)據(jù)進(jìn)行峰值檢測(cè),利用A/D芯片內(nèi)的采樣保持器和參考電壓進(jìn)行計(jì)算機(jī)視覺(jué)特征監(jiān)測(cè)和液位脈沖數(shù)據(jù)采樣,結(jié)合視覺(jué)特征在危險(xiǎn)氣體罐車中傳播可以進(jìn)行信號(hào)轉(zhuǎn)換,通過(guò)A/D采樣電路轉(zhuǎn)化為計(jì)算機(jī)視覺(jué)監(jiān)控系統(tǒng)能識(shí)別的數(shù)字信號(hào),A/D芯片通過(guò)時(shí)鐘把脈沖信息輸入到罐體液位監(jiān)測(cè)系統(tǒng)的中央處理單元,數(shù)字輸出包括12位數(shù)字輸出和一個(gè)溢出指示位,采用多樣化的數(shù)據(jù)捕捉和傳送模式,罐車液位計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別報(bào)警系統(tǒng)的PPI的所有操作與A/D、D/A轉(zhuǎn)換器、視頻編碼/解碼器進(jìn)行并行串口通信,由此實(shí)現(xiàn)控制信號(hào)的無(wú)幀同步、內(nèi)部觸發(fā)。根據(jù)上述設(shè)計(jì),得到罐車液位計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別報(bào)警系統(tǒng)A/D采樣的時(shí)序邏輯如圖2所示。

罐車液位計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別報(bào)警系統(tǒng)的輸入超聲信號(hào)采用的是單端輸入,耦合方式可以是交流耦合,通過(guò)上述邏輯結(jié)構(gòu),構(gòu)建A/D采樣電路如圖3所示。

圖4中,WDO引腳產(chǎn)生的超聲波將發(fā)生反射縱波(或橫波),利用多層介質(zhì)中超聲波的傳播規(guī)律進(jìn)行計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別,實(shí)現(xiàn)對(duì)罐體液位狀態(tài)的檢測(cè)。

2.3 軟件算法的設(shè)計(jì)

由于是單峰液位突變特征,因此,可結(jié)合角點(diǎn)檢測(cè)的特點(diǎn),利用Harris角點(diǎn)檢測(cè)方法能夠?qū)崿F(xiàn)丙烯聚合過(guò)程中非正常液位的檢測(cè)和識(shí)別。角點(diǎn)能夠描述液位圖像中兩個(gè)邊緣的相交點(diǎn),Harris角點(diǎn)檢測(cè)方法主要通過(guò)液位圖像中的特征點(diǎn)形狀進(jìn)行非正常液位的檢測(cè)和識(shí)別,即使液位的顏色發(fā)生變化仍能進(jìn)行有效的檢測(cè)。

設(shè)置液位圖像[I(x,y)],對(duì)其進(jìn)行平移[(Δx,Δy)]后圖像具有自相似性,這種自相似性能夠用自相關(guān)函數(shù)進(jìn)行評(píng)價(jià),其公式如下:

[c(x,y;Δx,Δy)=(u,v)∈W(x,y)ω(u,v)[I(u,v)-I(u+Δx,v+Δy)]2] (1)

式中:[W(x,y)]為以[(x,y)]為中心模板的窗口;[ω(u,v)]為加權(quán)函數(shù),可以將其設(shè)置為常數(shù)或者高斯函數(shù)。對(duì)泰勒公式進(jìn)行展開,能夠得到:

[I(u+Δx,v+Δy)≈I(u,v)+Ix(u,v)Δx+Iy(u,v)Δy =I(u,v)+[Ix(u,v)Iy(u,v)]ΔxΔy] (2)

則:

[c(x,y;Δx,Δy)=ω(u,v)[I(u,v)-I(u+Δx,v+Δy)]2 ≈[Ix(u,v)Iy(u,v)]ΔxΔy2ω(u,v) =[Δx,Δy]M(x,y)ΔxΔyω(u,v)](3)式中:

[M(x,y)=Ix(u,v)2Ix(u,v)Iy(u,v)Ix(u,v)Iy(u,v)Iy(u,v)2=ACCB] (4)

因此,對(duì)液位圖像進(jìn)行平移后得到的自相關(guān)函數(shù)能夠近似于下述二次項(xiàng)函數(shù):

[c(x,y;Δx,Δy)≈[Δx,Δy]M(x,y)ΔxΔy] (5)

進(jìn)而能夠得到丙烯聚合過(guò)程中液位的視覺(jué)方程:

[Δx,ΔyM(x,y)ΔxΔy=1] (6)

圖像中液位圖像的尺寸是由[M]矩陣的特征值決定的,特征值能描述液位圖像中灰度變化的速度和方向。Harris角點(diǎn)法無(wú)需對(duì)[M]的特征值進(jìn)行計(jì)算,只要計(jì)算出一個(gè)角點(diǎn)的響應(yīng)即可,其計(jì)算公式如下:

[R=detM-α(traceM)2] (7)

式中,[α]為經(jīng)驗(yàn)參數(shù),通常取值為0.04~0.06。利用上述方法取得的全部Harris角點(diǎn),計(jì)算全部的角點(diǎn)縱坐標(biāo)的均值進(jìn)行計(jì)算即可得到實(shí)際的液位高度,從而實(shí)現(xiàn)丙烯聚合過(guò)程中非正常液位的準(zhǔn)確檢測(cè)與識(shí)別。

3 系統(tǒng)軟件開發(fā)仿真環(huán)境描述和系統(tǒng)調(diào)試結(jié)果分析

危險(xiǎn)氣體罐車液位計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別報(bào)警系統(tǒng)的軟件開發(fā)建立在嵌入式Linux開發(fā)系統(tǒng)基礎(chǔ)上,系統(tǒng)軟件需要實(shí)現(xiàn)的功能包括危險(xiǎn)氣體罐車液位超聲采集、能譜測(cè)量、計(jì)算機(jī)視覺(jué)圖像控制、CAN通信以及A/D采樣E2PROM燒寫。SPI E2PROM AT25HP512用于DSP的程序加載,正確配置DSP的SPI寄存器,采用DIP封裝實(shí)現(xiàn)程序加載,根據(jù)上述軟件開發(fā)環(huán)境,發(fā)送WREN指令直接通過(guò)燒寫器燒寫,進(jìn)行危險(xiǎn)氣體罐車液位計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別報(bào)警系統(tǒng)的仿真測(cè)試。首先采用層次聚類方法在計(jì)算機(jī)視覺(jué)環(huán)境下進(jìn)行液位狀態(tài)數(shù)據(jù)采集,然后進(jìn)行信號(hào)轉(zhuǎn)換,得到有液狀態(tài)和無(wú)液狀態(tài)下的采集結(jié)果如圖5所示。

對(duì)上述原始數(shù)據(jù)進(jìn)行信號(hào)處理,采用自適應(yīng)濾波電路進(jìn)行有用信息提取,得到提取結(jié)果如圖6所示。

監(jiān)控識(shí)別,由圖6可見,采用本文設(shè)計(jì)的系統(tǒng)進(jìn)行危險(xiǎn)氣體罐車的液位檢測(cè),在計(jì)算機(jī)視覺(jué)下能實(shí)時(shí)準(zhǔn)確檢測(cè)液位值,實(shí)現(xiàn)準(zhǔn)確的監(jiān)控識(shí)別和報(bào)警,性能可靠穩(wěn)定。

4 結(jié) 語(yǔ)

本文進(jìn)行了危險(xiǎn)氣體罐車液位計(jì)算機(jī)視覺(jué)監(jiān)控識(shí)別報(bào)警系統(tǒng)優(yōu)化設(shè)計(jì),利用不同液位狀態(tài)下聲波在不同罐體環(huán)境中的傳播特征的差異性,進(jìn)行聲波在不同罐體環(huán)境中的傳播的差異性特征提取,判定液位狀態(tài)。進(jìn)行系統(tǒng)的硬件設(shè)計(jì)和軟件設(shè)計(jì),包括A/D采樣電路、時(shí)鐘電路、濾波電路、程序加載電路和電源電路等。通過(guò)危險(xiǎn)氣體罐車液位檢測(cè)系統(tǒng)輸入的參考信號(hào)對(duì)有液和無(wú)液的狀態(tài)進(jìn)行區(qū)別檢測(cè),采用計(jì)算機(jī)視覺(jué)監(jiān)測(cè)方法,進(jìn)行危險(xiǎn)氣體罐車液位內(nèi)部狀態(tài)特征的視覺(jué)監(jiān)測(cè)。研究表明,該系統(tǒng)具有較好的液位檢測(cè)性能,實(shí)現(xiàn)危險(xiǎn)氣體罐車液位的有效監(jiān)控識(shí)別報(bào)警,具有較好的應(yīng)用價(jià)值。

參考文獻(xiàn)

[1] 劉茂旭,何怡剛,鄧芳明,等.融合RFID的無(wú)線濕度傳感器節(jié)點(diǎn)設(shè)計(jì)研究[J].電子測(cè)量與儀器學(xué)報(bào),2015,29(8):1171?1178.

[2] 呂富勇,周瑞卿,阮世陽(yáng),等.高頻磁場(chǎng)檢測(cè)中采樣保持器的設(shè)計(jì)及其性能分析[J].電子測(cè)量技術(shù),2015,38(8):13?16.

[3] 郭靜波,譚博,蔡雄.基于反相雙峰指數(shù)模型的微弱瞬態(tài)極低頻信號(hào)的估計(jì)與檢測(cè)[J].儀器儀表學(xué)報(bào),2015,36(8):1682?1691.

[4] JAFAR S A. Interference alignment: A new look at signal dimensions in a communication network [J]. Foundations and trends in communications and information theory, 2011, 7(1): 129?134.

[5] GOMA/DAM K, CA/DAMBE V R, JAFAR S A. A distributed numerical approach to interference alignment and applications to wireless interference networks [J]. IEEE transactions on information theory, 2011, 57(6): 3309?3322.

[6] PATCHARAMANEEPAKRON P, ARMOUR S, DOUFEXI A. Coordinated beamforming schemes based on modified signal?to? leakage?plus?noise ratio precoding designs [J]. IET communications, 2015, 9(4): 558?567.

[7] KALEVA J, TOLLI A, JUNTTI M. Weighted sum rate maximization for interfering broadcast channel via successive convex approximation [C]// Proceedings of IEEE Global Communications Conference. Anaheim, USA: IEEE, 2012: 3838?3843.

[8] LIU H, DING Z G, FAN P Z, et al. Precoding design for interference suppression in multi?cell multi?user networks [J]. IET communications, 2014, 8(9): 1534?1540.

[9] RATHEESH M, DAVID M J. System?level performance of interference alignment [J]. IEEE transactions on wireless communications, 2015, 14(2): 1060?1070.

篇4

關(guān)鍵詞:自動(dòng)控制技術(shù)農(nóng)業(yè)自動(dòng)化

中圖分類號(hào): DF413.1文獻(xiàn)標(biāo)識(shí)碼: A

由于歷史、觀念和技術(shù)等方面的原因, 我國(guó)傳統(tǒng)農(nóng)業(yè)機(jī)械與發(fā)達(dá)國(guó)家相比有很大差距, 已遠(yuǎn)遠(yuǎn)不能適應(yīng)農(nóng)業(yè)的科技進(jìn)步。近些年來(lái), 自動(dòng)化的研究逐漸被人們所認(rèn)識(shí), 自動(dòng)控制在農(nóng)業(yè)上的應(yīng)用越來(lái)越受到重視。例如,把計(jì)算機(jī)技術(shù)、微處理技術(shù)、傳感與檢測(cè)技術(shù)、信息處理技術(shù)結(jié)合起來(lái), 應(yīng)用于傳統(tǒng)農(nóng)業(yè)機(jī)械, 極大地促進(jìn)了產(chǎn)品性能的提高。我國(guó)農(nóng)業(yè)部門總結(jié)了一些地區(qū)的農(nóng)業(yè)自動(dòng)化先進(jìn)經(jīng)驗(yàn)(如臺(tái)灣地區(qū)的農(nóng)業(yè)生產(chǎn)自動(dòng)化、漁業(yè)生產(chǎn)自動(dòng)化、畜牧業(yè)生產(chǎn)自動(dòng)化及農(nóng)產(chǎn)品貿(mào)易自動(dòng)化)的開發(fā)與應(yīng)用情況, 同時(shí)也汲取了國(guó)外一些國(guó)家的先進(jìn)經(jīng)驗(yàn)、技術(shù), 如日本的四行半喂人聯(lián)合收割機(jī)是計(jì)算機(jī)控制的自動(dòng)化裝置在半喂人聯(lián)合收割機(jī)中的應(yīng)用,英國(guó)通過(guò)對(duì)施肥機(jī)散播肥料的動(dòng)力測(cè)量來(lái)控制肥料的精確使用量。這些技術(shù)和方法是我國(guó)農(nóng)業(yè)機(jī)械的自動(dòng)化裝置得到了補(bǔ)充和新的發(fā)展, 從而形成了一系列適合我國(guó)農(nóng)業(yè)特點(diǎn)的自動(dòng)化控制技術(shù)。

一、已有的農(nóng)業(yè)機(jī)械及裝置的部分自動(dòng)化控制

自動(dòng)化技術(shù)提高了已有農(nóng)業(yè)機(jī)械及裝置的作業(yè)性能和操作性能。浙江省把自動(dòng)化技術(shù)應(yīng)用于茶葉機(jī)械上, 成功研制出6CRK-55型可編程控制加壓茶葉揉捻機(jī), 它利用計(jì)算機(jī)控制電功加壓機(jī)構(gòu), 能根據(jù)茶葉的具體情況編制最佳揉捻程序?qū)崿F(xiàn)揉捻過(guò)程的自動(dòng)控制, 是機(jī)電一體化技術(shù)在茶葉機(jī)械上的首次成功應(yīng)用。

1.應(yīng)用于拖拉機(jī)

在農(nóng)用拖拉機(jī)上已廣泛使用了機(jī)械油壓式三點(diǎn)聯(lián)結(jié)的位調(diào)節(jié)和力調(diào)節(jié)系統(tǒng)裝置, 現(xiàn)又在開發(fā)和采用性能更完善的電子油壓式三點(diǎn)聯(lián)結(jié)裝置。

2.應(yīng)用于施肥播種機(jī)

根據(jù)行駛速度和檢測(cè)種子粒數(shù)來(lái)確定播種量是否符合要求的裝置, 以及將馬鈴薯種子割成瓣后播種的裝置等。

3.應(yīng)用于谷物干燥機(jī)

不受外界條件干擾, 能自動(dòng)維持熱風(fēng)溫度的裝置停電或干燥機(jī)過(guò)熱引起火災(zāi)時(shí), 自動(dòng)掐斷燃料供給的裝置。

二、微灌自動(dòng)控制技術(shù)

我國(guó)從20世紀(jì)年50代就開始進(jìn)行節(jié)水灌溉的研究與推廣據(jù)統(tǒng)計(jì)。到1992年, 全國(guó)共有節(jié)水灌溉工程面積0.133億m2, 其中噴灌面積80萬(wàn)m2, 農(nóng)業(yè)節(jié)水工程取得了巨大的進(jìn)展。灌溉管理自動(dòng)化是發(fā)展高效農(nóng)業(yè)的重要手段, 高效農(nóng)業(yè)和精細(xì)農(nóng)業(yè)要求必須實(shí)現(xiàn)水資源的高效利用。采用遙感遙測(cè)等新技術(shù)監(jiān)測(cè)土壤墑性和作物生長(zhǎng)情況, 對(duì)灌溉用水進(jìn)行動(dòng)態(tài)監(jiān)測(cè)預(yù)報(bào), 實(shí)現(xiàn)灌溉用水管理的自動(dòng)化和動(dòng)態(tài)管理。在微灌技術(shù)領(lǐng)域, 我國(guó)先后研制和改進(jìn)了等流量滴灌設(shè)備、微噴灌設(shè)備、微灌帶、孔口滴頭、壓力補(bǔ)償式滴頭、折射式和旋轉(zhuǎn)式微噴頭、過(guò)濾器和進(jìn)排氣閥等設(shè)備, 總結(jié)出了一套基本適合我國(guó)國(guó)情的微灌設(shè)計(jì)參數(shù)和計(jì)算方法, 建立了一批新的試驗(yàn)示范基地。在一些地區(qū)實(shí)現(xiàn)了自動(dòng)化灌溉系統(tǒng), 可以長(zhǎng)時(shí)間地自動(dòng)啟閉水泵和自動(dòng)按一定的輪灌順序進(jìn)行灌溉。這種系統(tǒng)中應(yīng)用了灌水器、土壤水分傳感器、溫度傳感器、壓力傳感器、水位傳感器和雨量傳感器、電線等。

三、自動(dòng)控制技術(shù)在精準(zhǔn)農(nóng)業(yè)中的應(yīng)用

精準(zhǔn)農(nóng)業(yè)是在傳統(tǒng)農(nóng)業(yè)與農(nóng)業(yè)機(jī)裝備技術(shù)上, 運(yùn)用高新技術(shù)進(jìn)行農(nóng)業(yè)生產(chǎn)管理。精準(zhǔn)農(nóng)業(yè)較傳統(tǒng)農(nóng)業(yè)其先進(jìn)之處主要是應(yīng)用全球定位系統(tǒng)(GPS)、地理信息技術(shù)、計(jì)算機(jī)控制技術(shù)、專家與決策知識(shí)系統(tǒng), 實(shí)現(xiàn)農(nóng)業(yè)生產(chǎn)的定位、定量、定時(shí), 做到精耕細(xì)作和由于農(nóng)業(yè)水土管理區(qū)管理點(diǎn)較為分散, 用傳統(tǒng)方法進(jìn)行數(shù)據(jù)采集和信息傳輸精度差、速度慢。把電子技術(shù)、微電子技術(shù)和通信技術(shù)緊密結(jié)合起來(lái), 采用現(xiàn)代方法進(jìn)行自動(dòng)化監(jiān)控和管理非常必要, 如在渠系、灌水、泵站等方面實(shí)現(xiàn)自動(dòng)化監(jiān)控與管理。農(nóng)業(yè)自動(dòng)化向智能化方向發(fā)展, 進(jìn)一步發(fā)展精準(zhǔn)農(nóng)業(yè)重點(diǎn)發(fā)展節(jié)水、節(jié)肥精準(zhǔn)農(nóng)業(yè)技術(shù)體系的自動(dòng)化控制, 實(shí)施精準(zhǔn)灌溉、精準(zhǔn)施肥, 提高水資源和化肥資源的利用率。精細(xì)設(shè)施農(nóng)業(yè)主要發(fā)展以溫室為主的自動(dòng)控制系統(tǒng)智能化研究, 從而現(xiàn)降低成本、提高作物產(chǎn)量、提高農(nóng)產(chǎn)品品質(zhì)。這有助于我國(guó)農(nóng)業(yè)資源的高效利用和農(nóng)業(yè)環(huán)境保護(hù), 是發(fā)展持續(xù)農(nóng)業(yè)的重要途徑。將計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用于農(nóng)業(yè)自動(dòng)化領(lǐng)域計(jì)算機(jī)視覺(jué)技術(shù)是一個(gè)相當(dāng)新且發(fā)展十分迅速的研究領(lǐng)域, 日本、美國(guó)等發(fā)達(dá)國(guó)家已在農(nóng)業(yè)計(jì)算機(jī)視覺(jué)方面進(jìn)行了廣泛而深入的研究, 如農(nóng)業(yè)種質(zhì)資源管理、獲取作物生長(zhǎng)狀態(tài)信息、農(nóng)產(chǎn)品自動(dòng)收獲、農(nóng)產(chǎn)品品質(zhì)鑒定等。英國(guó)開發(fā)研制的采摘蘑菇機(jī)器人, 在定位蘑菇采摘點(diǎn)和測(cè)量時(shí), 已經(jīng)利用了計(jì)算機(jī)視覺(jué)和圖像處理技術(shù)。計(jì)算機(jī)視覺(jué)技術(shù)在我國(guó)農(nóng)業(yè)生產(chǎn)和農(nóng)業(yè)現(xiàn)代化方面已開始應(yīng)用, 但在設(shè)施農(nóng)業(yè)、虛擬農(nóng)業(yè)中的應(yīng)用尚處于起步階段, 應(yīng)進(jìn)一步加強(qiáng)、加快該領(lǐng)域的研究與應(yīng)用。

我國(guó)農(nóng)業(yè)自動(dòng)化已在設(shè)施農(nóng)業(yè)中的溫室自動(dòng)化控制、排灌機(jī)械自動(dòng)化、部分農(nóng)業(yè)機(jī)械裝置自動(dòng)化等方面得到一定的發(fā)展, 尤其精準(zhǔn)農(nóng)業(yè)的發(fā)展越來(lái)越得到重視。電子技術(shù)和計(jì)算機(jī)技術(shù)的迅速發(fā)展推動(dòng)了農(nóng)業(yè)機(jī)器向自動(dòng)化方向發(fā)展。隨著智能化技術(shù)的發(fā)展, 人工智能將是世紀(jì)農(nóng)業(yè)工程發(fā)展的重點(diǎn)。各種農(nóng)業(yè)機(jī)器人或智能化系統(tǒng)將在農(nóng)業(yè)自動(dòng)化控制中不斷涌現(xiàn), 繼續(xù)推動(dòng)和實(shí)現(xiàn)農(nóng)業(yè)自動(dòng)化是農(nóng)業(yè)機(jī)械化工程技術(shù)工作者所面臨的長(zhǎng)遠(yuǎn)課題和挑戰(zhàn), 并進(jìn)一步促進(jìn)農(nóng)業(yè)自動(dòng)化控制技術(shù)向智能化技術(shù)發(fā)展。

四、自動(dòng)控制技術(shù)在精準(zhǔn)農(nóng)業(yè)中的應(yīng)用

精準(zhǔn)農(nóng)業(yè)是在傳統(tǒng)農(nóng)業(yè)與農(nóng)業(yè)機(jī)裝備技術(shù)上, 運(yùn)用高新技術(shù)進(jìn)行農(nóng)業(yè)生產(chǎn)管理。精準(zhǔn)農(nóng)業(yè)較傳統(tǒng)農(nóng)業(yè)其先進(jìn)之處主要是應(yīng)用全球定位系統(tǒng)(GPS)、地理信息技術(shù)、計(jì)算機(jī)控制技術(shù)、專家與決策知識(shí)系統(tǒng), 實(shí)現(xiàn)農(nóng)業(yè)生產(chǎn)的定位、定量、定時(shí), 做到精耕細(xì)作和由于農(nóng)業(yè)水土管理區(qū)管理點(diǎn)較為分散, 用傳統(tǒng)方法進(jìn)行數(shù)據(jù)采集和信息傳輸精度差、速度慢。把電子技術(shù)、微電子技術(shù)和通信技術(shù)緊密結(jié)合起來(lái), 采用現(xiàn)代方法進(jìn)行自動(dòng)化監(jiān)控和管理非常必要, 如在渠系、灌水、泵站等方面實(shí)現(xiàn)自動(dòng)化監(jiān)控與管理。農(nóng)業(yè)自動(dòng)化向智能化方向發(fā)展, 進(jìn)一步發(fā)展精準(zhǔn)農(nóng)業(yè)重點(diǎn)發(fā)展節(jié)水、節(jié)肥精準(zhǔn)農(nóng)業(yè)技術(shù)體系的自動(dòng)化控制, 實(shí)施精準(zhǔn)灌溉、精準(zhǔn)施肥, 提高水資源和化肥資源的利用率。精細(xì)設(shè)施農(nóng)業(yè)主要發(fā)展以溫室為主的自動(dòng)控制系統(tǒng)智能化研究, 從而現(xiàn)降低成本、提高作物產(chǎn)量、提高農(nóng)產(chǎn)品品質(zhì)。這有助于我國(guó)農(nóng)業(yè)資源的高效利用和農(nóng)業(yè)環(huán)境保護(hù), 是發(fā)展持續(xù)農(nóng)業(yè)的重要途徑。將計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用于農(nóng)業(yè)自動(dòng)化領(lǐng)域計(jì)算機(jī)視覺(jué)技術(shù)是一個(gè)相當(dāng)新且發(fā)展十分迅速的研究領(lǐng)域, 日本、美國(guó)等發(fā)達(dá)國(guó)家已在農(nóng)業(yè)計(jì)算機(jī)視覺(jué)方面進(jìn)行了廣泛而深入的研究, 如農(nóng)業(yè)種質(zhì)資源管理、獲取作物生長(zhǎng)狀態(tài)信息、農(nóng)產(chǎn)品自動(dòng)收獲、農(nóng)產(chǎn)品品質(zhì)鑒定等。英國(guó)開發(fā)研制的采摘蘑菇機(jī)器人, 在定位蘑菇采摘點(diǎn)和測(cè)量時(shí), 已經(jīng)利用了計(jì)算機(jī)視覺(jué)和圖像處理技術(shù)。計(jì)算機(jī)視覺(jué)技術(shù)在我國(guó)農(nóng)業(yè)生產(chǎn)和農(nóng)業(yè)現(xiàn)代化方面已開始應(yīng)用, 但在設(shè)施農(nóng)業(yè)、虛擬農(nóng)業(yè)中的應(yīng)用尚處于起步階段, 應(yīng)進(jìn)一步加強(qiáng)、加快該領(lǐng)域的研究與應(yīng)用。

我國(guó)農(nóng)業(yè)自動(dòng)化已在設(shè)施農(nóng)業(yè)中的溫室自動(dòng)化控制、排灌機(jī)械自動(dòng)化、部分農(nóng)業(yè)機(jī)械裝置自動(dòng)化等方面得到一定的發(fā)展, 尤其精準(zhǔn)農(nóng)業(yè)的發(fā)展越來(lái)越得到重視。電子技術(shù)和計(jì)算機(jī)技術(shù)的迅速發(fā)展推動(dòng)了農(nóng)業(yè)機(jī)器向自動(dòng)化方向發(fā)展。隨著智能化技術(shù)的發(fā)展, 人工智能將是世紀(jì)農(nóng)業(yè)工程發(fā)展的重點(diǎn)。各種農(nóng)業(yè)機(jī)器人或智能化系統(tǒng)將在農(nóng)業(yè)自動(dòng)化控制中不斷涌現(xiàn), 繼續(xù)推動(dòng)和實(shí)現(xiàn)農(nóng)業(yè)自動(dòng)化是農(nóng)業(yè)機(jī)械化工程技術(shù)工作者所面臨的長(zhǎng)遠(yuǎn)課題和挑戰(zhàn), 并進(jìn)一步促進(jìn)農(nóng)業(yè)自動(dòng)化控制技術(shù)向智能化技術(shù)發(fā)展。

【參考文獻(xiàn)】

[1]馬玉敏等.工業(yè)以太網(wǎng)的最新發(fā)展.自動(dòng)化系統(tǒng)工程,2006(2):2.

篇5

國(guó)內(nèi)人工智能產(chǎn)業(yè)鏈解構(gòu)

基礎(chǔ)技術(shù)、人工智能技術(shù)和人工智能應(yīng)用構(gòu)成了人工智能產(chǎn)業(yè)鏈的三個(gè)核心環(huán)節(jié),我們將主要從這三個(gè)方面對(duì)國(guó)內(nèi)人工智能產(chǎn)業(yè)進(jìn)行梳理,并對(duì)其中的人工智能應(yīng)用進(jìn)行重點(diǎn)解構(gòu)。

人工智能的基礎(chǔ)技術(shù)主要依賴于大數(shù)據(jù)管理和云計(jì)算技術(shù),經(jīng)過(guò)近幾年的發(fā)展,國(guó)內(nèi)大數(shù)據(jù)管理和云計(jì)算技術(shù)已從一個(gè)嶄新的領(lǐng)域逐步轉(zhuǎn)變?yōu)榇蟊娀?wù)的基礎(chǔ)平臺(tái)。而依據(jù)服務(wù)性質(zhì)的不同,這些平臺(tái)主要集中于三個(gè)服務(wù)層面,即基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺(tái)即服務(wù)(PaaS)和軟件即服務(wù)(SaaS)?;A(chǔ)技術(shù)提供平臺(tái)為人工智能技術(shù)的實(shí)現(xiàn)和人工智能應(yīng)用的落地提供基礎(chǔ)的后臺(tái)保障,也是一切人工智能技術(shù)和應(yīng)用實(shí)現(xiàn)的前提。

對(duì)于許多中小型企業(yè)來(lái)說(shuō),SaaS 是采用先進(jìn)技術(shù)的最好途徑,它消除了企業(yè)購(gòu)買、構(gòu)建和維護(hù)基礎(chǔ)設(shè)施和應(yīng)用程序的需要;而 IaaS通過(guò)三種不同形態(tài)服務(wù)的提供(公有云、私有云和混合云)可以更快地開發(fā)應(yīng)用程序和服務(wù),縮短開發(fā)和測(cè)試周期;作為 SaaS 和 IaaS 中間服務(wù)的 PaaS 則為二者的實(shí)現(xiàn)提供了云環(huán)境中的應(yīng)用基礎(chǔ)設(shè)施服務(wù)。

人工智能技術(shù)平臺(tái)

與基礎(chǔ)技術(shù)提供平臺(tái)不同,人工智能技術(shù)平臺(tái)主要專注于機(jī)器學(xué)習(xí)、模式識(shí)別和人機(jī)交互三項(xiàng)與人工智能應(yīng)用密切相關(guān)的技術(shù),所涉及的領(lǐng)域包括機(jī)器視覺(jué)、指紋識(shí)別、人臉識(shí)別、視網(wǎng)膜識(shí)別、虹膜識(shí)別、掌紋識(shí)別、專家系統(tǒng)、自動(dòng)規(guī)劃、智能搜索、定理證明、博弈、自動(dòng)程序設(shè)計(jì)、智能控制、機(jī)器人學(xué)習(xí)、語(yǔ)言和圖像理解和遺傳編程等。

機(jī)器學(xué)習(xí):通俗的說(shuō)就是讓機(jī)器自己去學(xué)習(xí),然后通過(guò)學(xué)習(xí)到的知識(shí)來(lái)指導(dǎo)進(jìn)一步的判斷。我們用大量的標(biāo)簽樣本數(shù)據(jù)來(lái)讓計(jì)算機(jī)進(jìn)行運(yùn)算并設(shè)計(jì)懲罰函數(shù),通過(guò)不斷的迭代,機(jī)器就學(xué)會(huì)了怎樣進(jìn)行分類,使得懲罰最小。這些學(xué)到的分類規(guī)則可以進(jìn)行預(yù)測(cè)等活動(dòng),具體應(yīng)用覆蓋了從通用人工智能應(yīng)用到專用人工智能應(yīng)用的大多數(shù)領(lǐng)域,如:計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、生物特征識(shí)別、證券市場(chǎng)分析和DNA 測(cè)序等。

模式識(shí)別:模式識(shí)別就是通過(guò)計(jì)算機(jī)用數(shù)學(xué)技術(shù)方法來(lái)研究模式的自動(dòng)處理和判讀,它偏重于對(duì)信號(hào)、圖像、語(yǔ)音、文字、指紋等非直觀數(shù)據(jù)方面的處理,如語(yǔ)音識(shí)別,人臉識(shí)別等,通過(guò)提取出相關(guān)的特征來(lái)實(shí)現(xiàn)一定的目標(biāo)。文字識(shí)別、語(yǔ)音識(shí)別、指紋識(shí)別和圖像識(shí)別等都屬于模式識(shí)別的場(chǎng)景應(yīng)用。

人機(jī)交互:人機(jī)交互是一門研究系統(tǒng)與用戶之間交互關(guān)系的學(xué)問(wèn)。系統(tǒng)可以是各種各樣的機(jī)器,也可以是計(jì)算機(jī)化的系統(tǒng)和軟件。在應(yīng)用層面,它既包括人與系統(tǒng)的語(yǔ)音交互,也包含了人與機(jī)器人實(shí)體的物理交互。

而在國(guó)內(nèi),人工智能技術(shù)平臺(tái)在應(yīng)用層面主要聚焦于計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別和語(yǔ)言技術(shù)處理領(lǐng)域,其中的代表企業(yè)包括科大訊飛、格靈深瞳、捷通華聲(靈云)、地平線、SenseTime、永洪科技、曠視科技、云知聲等。

人工智能應(yīng)用

人工智能應(yīng)用涉及到專用應(yīng)用和通用應(yīng)用兩個(gè)方面,這也是機(jī)器學(xué)習(xí)、模式識(shí)別和人機(jī)交互這三項(xiàng)人工智能技術(shù)的落地實(shí)現(xiàn)形式。其中,專用領(lǐng)域的應(yīng)用涵蓋了目前國(guó)內(nèi)人工智能應(yīng)用的大多數(shù)應(yīng)用,包括各領(lǐng)域的人臉和語(yǔ)音識(shí)別以及服務(wù)型機(jī)器人等方面;而通用型則側(cè)重于金融、醫(yī)療、智能家居等領(lǐng)域的通用解決方案,目前國(guó)內(nèi)人工智能應(yīng)用正處于由專業(yè)應(yīng)用向通用應(yīng)用過(guò)度的發(fā)展階段。

(1)計(jì)算機(jī)視覺(jué)在國(guó)內(nèi)計(jì)算機(jī)視覺(jué)領(lǐng)域,動(dòng)靜態(tài)圖像識(shí)別和人臉識(shí)別是主要研究方向

圖像識(shí)別:是計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)像的技術(shù)。識(shí)別過(guò)程包括圖像預(yù)處理、圖像分割、特征提取和判斷匹配。

人臉識(shí)別:是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中檢測(cè)和跟蹤人臉,進(jìn)而對(duì)檢測(cè)到的人臉進(jìn)行臉部的一系列相關(guān)技術(shù),通常也叫做人像識(shí)別、面部識(shí)別。

目前,由于動(dòng)態(tài)檢測(cè)與識(shí)別的技術(shù)門檻限制,靜態(tài)圖像識(shí)別與人臉識(shí)別的研究暫時(shí)處于領(lǐng)先位置,其中既有騰訊、螞蟻金服、百度和搜狗這樣基于社交、搜索大數(shù)據(jù)整合的互聯(lián)網(wǎng)公司,也有三星中國(guó)技術(shù)研究院、微軟亞洲研究院、Intel中國(guó)研究院這類的傳統(tǒng)硬件與技術(shù)服務(wù)商;同時(shí),類似于 Face++ 和FaceID 這類的新興技術(shù)公司也在各自專業(yè)技術(shù)和識(shí)別準(zhǔn)確率上取得了不錯(cuò)的突破。

而在難度最大的動(dòng)態(tài)視覺(jué)檢測(cè)領(lǐng)域,格靈深瞳、東方網(wǎng)力和 Video++ 等企業(yè)的著力點(diǎn)主要在企業(yè)和家庭安防,在一些常見的應(yīng)用場(chǎng)景也與人臉識(shí)別技術(shù)聯(lián)動(dòng)使用。

(2)語(yǔ)音/語(yǔ)義識(shí)別

語(yǔ)音識(shí)別的關(guān)鍵基于大量樣本數(shù)據(jù)的識(shí)別處理,因此,國(guó)內(nèi)大多數(shù)語(yǔ)音識(shí)別技術(shù)商都在平臺(tái)化的方向上發(fā)力,希望通過(guò)不同平臺(tái)以及軟硬件方面的數(shù)據(jù)和技術(shù)積累不斷提高識(shí)別準(zhǔn)確率。

在通用識(shí)別率上,各企業(yè)的成績(jī)基本維持在 95% 左右,真正的差異化在于對(duì)垂直領(lǐng)域的定制化開發(fā)。類似百度、科大訊飛這樣的上市公司憑借著深厚的技術(shù)、數(shù)據(jù)積累占據(jù)在市場(chǎng)前列的位置,并且通過(guò)軟硬件服務(wù)的開發(fā)不斷進(jìn)化著自身的服務(wù)能力;此外,在科大訊飛之后國(guó)內(nèi)第二家語(yǔ)音識(shí)別公有云的云知聲在各項(xiàng)通用語(yǔ)音服務(wù)技術(shù)的提供上也占據(jù)著不小的市場(chǎng)空間。值得注意的是,不少機(jī)器人和通用硬件制造商在語(yǔ)音、語(yǔ)義的識(shí)別上也取得了不錯(cuò)的進(jìn)展,例如智臻智能推出的小 i 機(jī)器人的語(yǔ)義識(shí)別、圖靈機(jī)器人的個(gè)性化語(yǔ)音助手機(jī)器人和服務(wù)、被 Google 投資的出門問(wèn)問(wèn)的軟硬件服務(wù)。

(3)智能機(jī)器人

由于工業(yè)發(fā)展和智能化生活的需要,目前國(guó)內(nèi)智能機(jī)器人行業(yè)的研發(fā)主要集中于家庭機(jī)器人、工業(yè)企業(yè)服務(wù)和智能助手三個(gè)方面其中,工業(yè)及企業(yè)服務(wù)類的機(jī)器人研發(fā)企業(yè)依托政策背景和市場(chǎng)需要處于較為發(fā)達(dá)的發(fā)展階段,代表性企業(yè)包括依托中科院沈陽(yáng)自動(dòng)化研究所的新松機(jī)器人、聚焦智能醫(yī)療領(lǐng)域的博實(shí)股份,以及大疆、優(yōu)愛(ài)寶機(jī)器人、Slamtec 這類專注工業(yè)生產(chǎn)和企業(yè)服務(wù)的智能機(jī)器人公司。在以上三個(gè)分類中,從事家庭機(jī)器人和智能助手的企業(yè)占據(jù)著絕大多數(shù)比例,涉及到的國(guó)內(nèi)企業(yè)近 300 家。

(4)智能家居

與家庭機(jī)器人不同,智能家居和物聯(lián)企業(yè)的主要著力點(diǎn)在于智能設(shè)備和智能中控兩個(gè)方面。在這其中,以海爾和美的為代表的傳統(tǒng)家電企業(yè)依托自身渠道、技術(shù)和配套產(chǎn)品優(yōu)勢(shì)建立起了實(shí)體化智能家居產(chǎn)品生態(tài). 而以阿里、騰訊、京東、小米和樂(lè)視等互聯(lián)網(wǎng)企業(yè)為代表的公司則通過(guò)各自平臺(tái)內(nèi)的數(shù)據(jù)和終端資源提供不同的軟硬件服務(wù)。

值得關(guān)注的是,科沃斯、broadlink、感居物聯(lián)、風(fēng)向標(biāo)科技、歐瑞博、物聯(lián)傳感和華為等技術(shù)解決方案商在通用硬件和技術(shù)、系統(tǒng)級(jí)解決方案上已成為諸多智能家居和物聯(lián)企業(yè)的合作伙伴。綜合來(lái)看,智能家居和物聯(lián)企業(yè)由于市場(chǎng)分類、技術(shù)種類和數(shù)據(jù)積累的不同各自提供著差異化的解決方案。在既定市場(chǎng)中,沒(méi)有絕對(duì)意義上的排斥競(jìng)爭(zhēng),各企業(yè)之間的合作融合度較強(qiáng)。

(5)智能醫(yī)療

目前國(guó)內(nèi)智能醫(yī)療領(lǐng)域的研究主要集中于醫(yī)療機(jī)器人、醫(yī)療解決方案和生命科學(xué)領(lǐng)域。由于起步較晚和技術(shù)門檻的限制,目前國(guó)內(nèi)醫(yī)用機(jī)器人的研發(fā)水平和普及率相較于國(guó)際一線水平仍存在一定的差距,從事企業(yè)主要集中與手術(shù)機(jī)器人和康復(fù)機(jī)器人兩大領(lǐng)域,以新松機(jī)器人、博實(shí)股份、妙手機(jī)器人、和技創(chuàng)等企業(yè)為代表。

在醫(yī)療解決方案方面,以騰訊、阿里巴巴、百度和科大訊飛為代表的公司通過(guò)和政府、醫(yī)療機(jī)構(gòu)的合作,為腦科學(xué)、疾病防治與醫(yī)療信息數(shù)據(jù)等領(lǐng)域提供智能解決方案。而在生命科學(xué)領(lǐng)域,研究的著眼點(diǎn)在以基因和細(xì)胞檢測(cè)為代表的前沿研究領(lǐng)域。

綜合來(lái)看,國(guó)內(nèi)人工智能產(chǎn)業(yè)鏈的基礎(chǔ)技術(shù)鏈條已經(jīng)構(gòu)建成熟,人工智能技術(shù)和應(yīng)用則集中在人臉和圖像識(shí)別、語(yǔ)音助手、智能生活等專用領(lǐng)域的場(chǎng)景化解決方案上。就趨勢(shì)來(lái)看,未來(lái)國(guó)內(nèi)人工智能領(lǐng)域的差異化競(jìng)爭(zhēng)和突破將主要集中在人工智能相關(guān)技術(shù)的突破和應(yīng)用場(chǎng)景升級(jí)兩個(gè)層面。

未來(lái)國(guó)內(nèi)人工智能行業(yè)發(fā)展的五大趨勢(shì)

(1)機(jī)器學(xué)習(xí)與場(chǎng)景應(yīng)用將迎來(lái)下一輪爆發(fā)

根據(jù) Venture Scanner 的統(tǒng)計(jì),截至 2015 年 9 月,全球人工智能領(lǐng)域獲得投資的公司中,按照平均融資額度排名的五大業(yè)務(wù)依次是:機(jī)器學(xué)習(xí)(應(yīng)用類)、智能機(jī)器人、計(jì)算機(jī)視覺(jué)(研發(fā)類)、機(jī)器學(xué)習(xí)(研發(fā)類)和視頻內(nèi)容識(shí)別等。

自 2009 年以來(lái),人工智能已經(jīng)吸引了超過(guò) 170 億美元的投資。過(guò)去四年間,人工智能領(lǐng)域的民間投資以平均每年 62% 的增長(zhǎng)速率增加,這一速率預(yù)計(jì)還會(huì)持續(xù)下去。而在 2015 年,全球人工智能領(lǐng)域的投資占到了年度總投資的 5%,盡管高于 2013 年的2% ,但相比其他競(jìng)爭(zhēng)領(lǐng)域仍處于落后位置。

目前中國(guó)地區(qū)人工智能領(lǐng)域獲得投資最多的五大細(xì)分領(lǐng)域是計(jì)算機(jī)視覺(jué)(研發(fā)類)、自然語(yǔ)言處理、私人虛擬助理、智能機(jī)器人和語(yǔ)音識(shí)別。從投資領(lǐng)域和趨勢(shì)來(lái)看,未來(lái)國(guó)內(nèi)人工智能行業(yè)的資本將主要涌向機(jī)器學(xué)習(xí)與場(chǎng)景應(yīng)用兩大方向。

(2)專用領(lǐng)域的智能化仍是發(fā)展核心

基于 GPU(圖形處理器)計(jì)算速度(每半年性能增加一倍)和基礎(chǔ)技術(shù)平臺(tái)的飛速發(fā)展,企業(yè)對(duì)于人工智能神經(jīng)網(wǎng)絡(luò)的構(gòu)建取得了前所未有的突破。但是,由于人工智能各領(lǐng)域技術(shù)和算法的復(fù)雜性,未來(lái) 20 年內(nèi)人工智能的應(yīng)用仍將集中于人臉和圖像識(shí)別、語(yǔ)音助手和智能家居等專用領(lǐng)域。

通過(guò)上述產(chǎn)業(yè)鏈環(huán)節(jié)構(gòu)成和投資分類可以看出,優(yōu)勢(shì)企業(yè)的核心競(jìng)爭(zhēng)力主要集中于特定領(lǐng)域的專用技術(shù)研發(fā);其中,計(jì)算機(jī)視覺(jué)和語(yǔ)音識(shí)別領(lǐng)域的研發(fā)和應(yīng)用已處于國(guó)際一流水平,專業(yè)應(yīng)用機(jī)器人的研發(fā)也有望近 10 年內(nèi)迎來(lái)突破性發(fā)展??梢灶A(yù)見的是,在由專業(yè)領(lǐng)域向通用領(lǐng)域過(guò)渡的過(guò)程中,自然語(yǔ)言處理與計(jì)算機(jī)視覺(jué)兩個(gè)方向?qū)?huì)成為人工智能通用應(yīng)用最大的兩個(gè)突破口。

(3)產(chǎn)業(yè)分工日漸明晰,企業(yè)合作大于競(jìng)爭(zhēng)

隨著專用領(lǐng)域應(yīng)用開發(fā)的成熟和差異化技術(shù)門檻的存在,國(guó)內(nèi)人工智能產(chǎn)業(yè)將逐漸分化為底層基礎(chǔ)構(gòu)建、通用場(chǎng)景應(yīng)用和專用應(yīng)用研發(fā)三個(gè)方向。

在底層基礎(chǔ)構(gòu)建方面,騰訊、阿里巴巴、百度、華為等企業(yè)依托自身數(shù)據(jù)、算法、技術(shù)和服務(wù)器優(yōu)勢(shì)為行業(yè)鏈條的各公司提供基礎(chǔ)資源支持的同時(shí),也會(huì)將自身優(yōu)勢(shì)轉(zhuǎn)化為通用和專業(yè)應(yīng)用領(lǐng)域的研究,從而形成自身生態(tài)內(nèi)的人工智能產(chǎn)業(yè)鏈閉環(huán)。

在通用場(chǎng)景應(yīng)用方面,以科大訊飛、格靈深瞳和曠視科技為代表的企業(yè)將主要以計(jì)算機(jī)視覺(jué)和語(yǔ)音識(shí)別為方向,為安防、教育和金融等領(lǐng)域提供通用解決方案。而在專用應(yīng)用研發(fā)方面則集中了大部分硬件和創(chuàng)業(yè)企業(yè),這其中既包括以小米和 broadlink 為代表的智能家居解決方案商,也包含了出門問(wèn)問(wèn)、linkface 和優(yōu)必選這類的差異化應(yīng)用提供商。

總的來(lái)說(shuō),由通用領(lǐng)域向?qū)I(yè)領(lǐng)域的進(jìn)化離不開產(chǎn)業(yè)鏈條各核心環(huán)節(jié)企業(yè)的相互配合,專用領(lǐng)域的競(jìng)爭(zhēng)盡管存在,但各分工層級(jí)間的協(xié)作互通已成為多數(shù)企業(yè)的共識(shí)。

(4)系統(tǒng)級(jí)開源將成為常態(tài)

任何一個(gè)人工智能研究分支都涉及到異常龐大的代碼計(jì)算,加上漏洞排查與跨領(lǐng)域交叉,任何一家企業(yè)都無(wú)法做到在封閉環(huán)境內(nèi)取得階段性突破的可能??梢钥吹降内厔?shì)是,Google、微軟、Facebook 和雅虎等視人工智能為未來(lái)核心競(jìng)爭(zhēng)力的頂級(jí)企業(yè)都先后開放了自身的人工智能系統(tǒng)。

需要明確的一點(diǎn)是,開源并不代表核心技術(shù)和算法的完全出讓,底層系統(tǒng)的開源將會(huì)讓更多企業(yè)從不同維度參與到人工智能相關(guān)領(lǐng)域的研發(fā),這為行業(yè)層面新產(chǎn)品的快速迭代和共同試錯(cuò)提供了一個(gè)良性且規(guī)范化的共生平臺(tái)。于開放企業(yè)而言,這也確保了它們與行業(yè)最新前沿技術(shù)的同步。

(5)算法突破將拉開競(jìng)爭(zhēng)差距

作為人工智能實(shí)現(xiàn)的核心,算法將成為未來(lái)國(guó)內(nèi)人工智能行業(yè)最大的競(jìng)爭(zhēng)門檻。以 Google 為例,Google 旗下的搜索算法實(shí)驗(yàn)室每天都要進(jìn)行超過(guò) 200 次的改進(jìn),以完成由關(guān)鍵字匹配到知識(shí)圖譜、語(yǔ)義搜索的算法創(chuàng)新。

在未來(lái)競(jìng)爭(zhēng)的重點(diǎn)機(jī)器學(xué)習(xí)領(lǐng)域,監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和增強(qiáng)學(xué)習(xí)三個(gè)方面算法的競(jìng)爭(zhēng)將進(jìn)入白熱化階段。而正是算法層面的突破造就了騰訊優(yōu)圖、科大訊飛和格靈深瞳等企業(yè)在圖像識(shí)別和計(jì)算機(jī)視覺(jué)領(lǐng)域取得了突破性進(jìn)展和國(guó)際一線的技術(shù)水平。

但就目前國(guó)內(nèi)人工智能算法的總體發(fā)展而言,工程學(xué)算法雖已取得階段性突破,但基于認(rèn)知層面的算法水平還亟待提高,這也是未來(lái)競(jìng)爭(zhēng)的核心領(lǐng)域。

總的來(lái)看,雖然基礎(chǔ)技術(shù)的成熟帶來(lái)了存儲(chǔ)容量和機(jī)器學(xué)習(xí)等人工智能技術(shù)的提升,但由于現(xiàn)階段運(yùn)算能力以及大規(guī)模 CPU 和GPU 并行解決方案的局限,目前國(guó)內(nèi)人工智能的發(fā)展主要集中于計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、智能生活等方向上。

雖然專用化領(lǐng)域的場(chǎng)景應(yīng)用仍是目前研發(fā)和投資的核心,但隨著技術(shù)、數(shù)據(jù)的積累演化以及超算平臺(tái)的應(yīng)用,由專用化領(lǐng)域的場(chǎng)景應(yīng)用向語(yǔ)音、視覺(jué)等領(lǐng)域的通用化解決方案應(yīng)該在未來(lái) 20 年內(nèi)成為發(fā)展的主流。

篇6

關(guān)鍵詞:計(jì)算機(jī)視覺(jué);地圖匹配;SLAM;機(jī)器人導(dǎo)航;路徑規(guī)劃

1概述

計(jì)算機(jī)視覺(jué)在人工智能學(xué)科占據(jù)重要地位,為自主移動(dòng)機(jī)器人視覺(jué)導(dǎo)航做了深厚的理論鋪墊。目前,機(jī)器人導(dǎo)航技術(shù)有很多種,傳感器導(dǎo)航技術(shù)如里程計(jì)、激光雷達(dá)、超聲波、紅外線、微波雷達(dá)、陀螺儀、指南針、速度、加速度計(jì)或觸覺(jué)等得到了普遍應(yīng)用,與上述非計(jì)算機(jī)視覺(jué)導(dǎo)航技術(shù)相比較,計(jì)算機(jī)視覺(jué)導(dǎo)航技術(shù)如人眼般具有靈敏度高且可捕獲的信息量大以及成本低等優(yōu)點(diǎn)。由于室內(nèi)相對(duì)室外空間比較狹小且內(nèi)部環(huán)境復(fù)雜,所以普通移動(dòng)機(jī)器人在作業(yè)過(guò)程中,完成躲避眼前障礙物、自主導(dǎo)航以及為自身找出一條可行路徑等一系列操作會(huì)相對(duì)比較困難。計(jì)算機(jī)視覺(jué)導(dǎo)航技術(shù)可利用本身的攝像頭獲得室內(nèi)周圍的環(huán)境信息,實(shí)時(shí)對(duì)其周身的場(chǎng)景進(jìn)行快速反饋,對(duì)視野前方障礙物進(jìn)行快速識(shí)別和檢測(cè),從而確定一條高效的可行的安全路徑。本文對(duì)計(jì)算機(jī)視覺(jué)導(dǎo)航技術(shù)進(jìn)行分類研究,主要分為3類:第一類是環(huán)境地圖事先已知,提前對(duì)外界環(huán)境特征進(jìn)行提取和處理,建立全局地圖,并將地圖信息存儲(chǔ)在機(jī)器人內(nèi)存數(shù)據(jù)庫(kù)中,在導(dǎo)航的時(shí)候?qū)崟r(shí)進(jìn)行地圖匹配;第二類是同時(shí)定位與地圖構(gòu)建,移動(dòng)機(jī)器人在自身位置不確定的情況下根據(jù)自身的攝像頭獲取周圍未知環(huán)境信息,在作業(yè)時(shí)逐步構(gòu)建周圍的環(huán)境地圖,根據(jù)構(gòu)建的增量式地圖自主實(shí)時(shí)定位和導(dǎo)航;第三類是不依賴環(huán)境地圖,自主移動(dòng)機(jī)器人不需要依賴任何的環(huán)境地圖,其在作業(yè)活動(dòng)時(shí)的可行區(qū)域主要取決于攝像頭實(shí)時(shí)識(shí)別和檢測(cè)的環(huán)境相對(duì)信息。

2環(huán)境地圖的表示方法

目前,計(jì)算機(jī)視覺(jué)導(dǎo)航技術(shù)多采用柵格地圖、幾何地圖、拓?fù)涞貓D和混合地圖構(gòu)建環(huán)境地圖信息。

2.1柵格地圖

柵格地圖,將柵格圖像考慮為一矩形,均分為一系列柵格單元,將每個(gè)柵格單元賦予一個(gè)平均概率值,并利用傳感信息估計(jì)每個(gè)單元內(nèi)部?jī)?nèi)存障礙物的概率。構(gòu)建柵格地圖的優(yōu)點(diǎn)是其地圖表達(dá)形式直觀,創(chuàng)建和維護(hù)比較容易;但當(dāng)劃分的柵格單元數(shù)量不斷增多時(shí),實(shí)時(shí)性就會(huì)慢慢變差;當(dāng)劃分的柵格單元越大時(shí),環(huán)境地圖的分辨率越低。

2.2幾何地圖

幾何地圖利用幾何特征如點(diǎn)、直線、平面等來(lái)構(gòu)成環(huán)境主要框架,需要知道這些特征在環(huán)境中信息的具置,所以幾何地圖通常使用其對(duì)應(yīng)的三維空間坐標(biāo)來(lái)表示。幾何地圖構(gòu)建過(guò)程相對(duì)簡(jiǎn)單,保留了室內(nèi)環(huán)境的各種重要信息,是基于計(jì)算機(jī)視覺(jué)的定位與地圖構(gòu)建算法中最常用的一種表示方式。但是為了完成環(huán)境的建模需要標(biāo)記大量的特征,從而計(jì)算量也非常的大,降低了實(shí)時(shí)性,其重建的地圖也容易出現(xiàn)與全局不一致的情況。

2.3拓?fù)涞貓D

拓?fù)涞貓D用許多節(jié)點(diǎn)和連接這些節(jié)點(diǎn)的曲線來(lái)表示環(huán)境信息。其中,每個(gè)節(jié)點(diǎn)相對(duì)應(yīng)真實(shí)環(huán)境中的特征點(diǎn)(如門角、窗戶、椅子、桌子角及拐角等),而節(jié)點(diǎn)之間的曲線表示兩個(gè)節(jié)點(diǎn)對(duì)應(yīng)的地點(diǎn)是相聯(lián)通的。拓?fù)涞貓D把環(huán)境信息表上在一線圖上,不需要精確表示不同節(jié)點(diǎn)間的地理位置關(guān)系,圖像較為抽象,表示起來(lái)方便且簡(jiǎn)單。機(jī)器人首先識(shí)別這些節(jié)點(diǎn)進(jìn)而根據(jù)識(shí)別的節(jié)點(diǎn)選擇節(jié)點(diǎn)與節(jié)點(diǎn)間的曲線作為可作業(yè)的路徑。

2.4混合地圖

混合地圖主要包括3種形式:柵格一幾何地圖、幾何一拓?fù)涞貓D以及柵格一拓?fù)涞貓D。混合地圖采用多種地圖表示,可結(jié)合多種地圖的優(yōu)勢(shì),與單一的地圖表示相比更具有靈活性、準(zhǔn)確性和魯棒性,但其不同類別的地圖結(jié)合起來(lái)管理會(huì)比較復(fù)雜,難以協(xié)調(diào),增加了地圖構(gòu)建的難度。文獻(xiàn)針對(duì)室內(nèi)環(huán)境所建立的模型分為全局拓?fù)浜途植繋缀伪硎霾糠?,整體環(huán)境通過(guò)拓?fù)涔?jié)點(diǎn)串連起來(lái),維護(hù)了整體環(huán)境表述的全局一致性;而以每個(gè)拓?fù)涔?jié)點(diǎn)為核心所采用的幾何表述則可確保局部精確定位的實(shí)現(xiàn),這樣建立的幾何一拓?fù)浠旌檄h(huán)境模型可將二者的優(yōu)勢(shì)都表現(xiàn)出來(lái),使得移動(dòng)機(jī)器人定位和地圖構(gòu)建同時(shí)進(jìn)行,實(shí)現(xiàn)容易。

3基于計(jì)算機(jī)視覺(jué)的室內(nèi)導(dǎo)航

基于計(jì)算機(jī)視覺(jué)的室內(nèi)導(dǎo)航技術(shù)可利用攝像頭捕獲機(jī)器人周圍環(huán)境的全部信息,對(duì)其周身的場(chǎng)景進(jìn)行反饋,對(duì)障礙物進(jìn)行快速識(shí)別和檢測(cè),從而確定一條高效的可行的安全路徑。本文將計(jì)算機(jī)視覺(jué)室內(nèi)導(dǎo)航技術(shù)主要分為3類:第一類是環(huán)境地圖事先已知;第二類是定位與地圖構(gòu)建同時(shí)進(jìn)行;第三類是不依賴環(huán)境地圖。

3.1環(huán)境地圖事先已知

提前對(duì)外界環(huán)境特征進(jìn)行提取和處理,建立全局地圖,并將地圖信息存儲(chǔ)在機(jī)器人內(nèi)存數(shù)據(jù)庫(kù)中,在導(dǎo)航的時(shí)候?qū)崟r(shí)進(jìn)行地圖匹配,即預(yù)存環(huán)境地圖。在環(huán)境地圖事先已知的導(dǎo)航中,路標(biāo)信息保存在計(jì)算機(jī)內(nèi)存的數(shù)據(jù)庫(kù)中,視覺(jué)系統(tǒng)中心利用圖像特征直接或間接向移動(dòng)機(jī)器人提供一系列路標(biāo)信息,一旦路標(biāo)被確定后,通過(guò)匹配觀察到的圖像和所期望圖像,機(jī)器人借助地圖實(shí)現(xiàn)自身精確定位和導(dǎo)航。該導(dǎo)航技術(shù)過(guò)程可分為以下步驟:

a)圖像獲?。簲z像頭獲取其周圍的視頻圖像;

b)路標(biāo)識(shí)別及檢測(cè):利用相關(guān)圖像處理算法對(duì)圖像進(jìn)行一系列預(yù)處理如進(jìn)行邊緣檢測(cè)和提取、平滑、濾波、區(qū)域分割;

c)路標(biāo)匹配標(biāo)志:在觀察到的圖像和所期望圖像之間進(jìn)行匹配,搜索現(xiàn)有的路標(biāo)數(shù)據(jù)庫(kù)進(jìn)行標(biāo)志路標(biāo);

d)位置計(jì)算:當(dāng)有特征點(diǎn)進(jìn)行匹配時(shí),視覺(jué)系統(tǒng)會(huì)根據(jù)數(shù)據(jù)庫(kù)中的路標(biāo)位置進(jìn)行自身精確定位和導(dǎo)航。

在基于計(jì)算機(jī)視覺(jué)的地圖匹配定位過(guò)程中,主要有2種地圖匹配較為典型。

①已知起點(diǎn),已知地圖。這種條件下的定位稱為局部定位,采用的是一種相對(duì)定位的方法,如圖1所示為其位姿估計(jì)過(guò)程,這種情況目前導(dǎo)航技術(shù)研究得最多。

②不知起點(diǎn),已知地圖。這種條件下的定位稱為全局定位。當(dāng)機(jī)器人需要重置時(shí),通常使用這種定位方法來(lái)檢索機(jī)器人的當(dāng)前位置(即姿態(tài)初始化)。常用的輔助方法是在環(huán)境中添加一些人造信標(biāo),如無(wú)線收發(fā)器,幾何信標(biāo),條碼技術(shù),紅外或超聲波接收系統(tǒng)進(jìn)行位置識(shí)別,利用視覺(jué)系統(tǒng)識(shí)別自然標(biāo)志,自主定位。

3.2定位與地圖構(gòu)建同時(shí)進(jìn)行

不知起點(diǎn),不知地圖。SLAM技術(shù)最早由Smith等人于1986年提出,移動(dòng)機(jī)器人在自身位置不確定的情況下根據(jù)自身的攝像頭獲取周圍未知環(huán)境信息,在作業(yè)時(shí)逐步構(gòu)建周圍的環(huán)境地圖,根據(jù)構(gòu)建的增量式地圖自主實(shí)時(shí)定位和導(dǎo)航。在日后的導(dǎo)航研究中,混合地圖中的幾何一拓?fù)浠旌檄h(huán)境模型被得到廣泛應(yīng)用,主要用來(lái)解決SLAM問(wèn)題。

2003年,在解決SLAM技術(shù)難題上,Arras等人采用基于Kalman濾波器和最鄰近(nearest neighbor)匹配策略的隨機(jī)地圖創(chuàng)建方法。下面是該算法步驟:

a)數(shù)據(jù)采集:首先初始化系統(tǒng),從攝像頭傳感器采集距離數(shù)據(jù);

b)狀態(tài)預(yù)測(cè):視覺(jué)系統(tǒng)預(yù)測(cè)機(jī)器人運(yùn)動(dòng)狀態(tài),實(shí)時(shí)返回新位姿信息和協(xié)方差矩陣,預(yù)測(cè)地圖;

c)觀測(cè):從原始捕獲的信息中提取主要特征信息并將此信息返回給局部地圖;

d)測(cè)量預(yù)測(cè):預(yù)測(cè)機(jī)器人當(dāng)前位姿的全局地圖;

e)位置匹配:應(yīng)用最鄰近濾波器匹配局部地圖中的觀測(cè)點(diǎn)和預(yù)測(cè)點(diǎn);

f)估計(jì):使用擴(kuò)展Kalman濾波器更新地圖;

g)創(chuàng)建:將非相關(guān)的觀測(cè)點(diǎn)加入地圖,對(duì)機(jī)器人返回增量式地圖;

h)輸出地圖。

制約機(jī)器人視覺(jué)系統(tǒng)性能的重要因素是信息實(shí)時(shí)處理的計(jì)算復(fù)雜度和處理效率,SLAM算法需要在地圖密度與計(jì)算效率之間取得權(quán)衡。

3.3無(wú)環(huán)境地圖

在這類系統(tǒng)中,機(jī)器人不需要依賴任何的環(huán)境地圖信息,機(jī)器人的活動(dòng)取決于其當(dāng)時(shí)識(shí)別和提取出來(lái)的環(huán)境信息,這些環(huán)境信息可能是桌子、椅子和門等,不需要知道這些環(huán)境元素的絕對(duì)位置。無(wú)環(huán)境地圖的導(dǎo)航技術(shù)典型的技術(shù)有3大類:基于光流的導(dǎo)航技術(shù)、基于外觀信息的導(dǎo)航技術(shù)、基于目標(biāo)識(shí)別的導(dǎo)航技術(shù)和基于目標(biāo)跟蹤的導(dǎo)航技術(shù)。

3.3.1基于光流的導(dǎo)航技術(shù)

光流是三維空間運(yùn)動(dòng)物體在觀測(cè)成像面上的像素運(yùn)動(dòng)的瞬時(shí)速度,也是圖像亮度的運(yùn)動(dòng)信息描述。光流法計(jì)算最初是由Horn和Schunck于1981年提出的,其利用二維速度場(chǎng)與灰度,引入光流約束方程,得到光流計(jì)算的基本算法。光流計(jì)算基于物體移動(dòng)的光學(xué)特性提出了2個(gè)假設(shè):①運(yùn)動(dòng)物體的灰度在很短的間隔時(shí)間內(nèi)保持不變;②給定鄰域內(nèi)的速度向量場(chǎng)變化是緩慢的。如Santos-Victor等人研發(fā)了一種基于光流的robee視覺(jué)系統(tǒng),該系統(tǒng)模擬了蜜蜂的視覺(jué)行為。在robee視覺(jué)系統(tǒng)中,使用單獨(dú)的雙目視覺(jué)方法來(lái)模擬蜜蜂的中心反射(Centering Reflex):當(dāng)機(jī)器人移動(dòng)到走廊兩側(cè)的墻壁中心時(shí),左眼捕獲場(chǎng)景的瞬時(shí)速度與右眼捕獲場(chǎng)景的瞬時(shí)速度是相同的,幾乎沒(méi)有差別,那么機(jī)器人就可以知道他們?cè)谧呃鹊闹行?。如果眼睛兩?cè)的眼睛的瞬時(shí)變化速度不同,則機(jī)器人移動(dòng)到較慢的速度。在自動(dòng)機(jī)器人導(dǎo)航的實(shí)現(xiàn)中,基于這個(gè)想法是測(cè)量攝像機(jī)捕獲圖像場(chǎng)景瞬時(shí)速度差異。這種導(dǎo)航技術(shù)只能用于室內(nèi)單通道直走道導(dǎo)航,不能引導(dǎo)機(jī)器人改變方向,具有一定的局限性。

3.3.2基于外觀信息的導(dǎo)航技術(shù)

基于外觀的機(jī)器人導(dǎo)航方法,不需要構(gòu)建真實(shí)的地圖導(dǎo)航,機(jī)器人通過(guò)自身所攜帶的攝像頭和傳感器感知周圍目標(biāo)的外觀信息進(jìn)行自主定位和導(dǎo)航。其中,所述的外觀信息多為目標(biāo)信息的顏色、亮度、形狀、空間大小和物理紋路等。機(jī)器人在導(dǎo)航時(shí)存儲(chǔ)連續(xù)視頻幀的環(huán)境圖像信息,并將連續(xù)視頻幀與控制指令相關(guān)聯(lián),從而再執(zhí)行指令規(guī)劃有效路徑到達(dá)目的地。

3.3.3基于目標(biāo)識(shí)別導(dǎo)航技術(shù)

為了達(dá)到目標(biāo)點(diǎn)或是識(shí)別目標(biāo),機(jī)器人很多時(shí)候只能獲取少量的圖像信息。Kim等人提出了一種用符號(hào)代替導(dǎo)航各個(gè)位置的賦值方法。該賦值方法中,機(jī)器人執(zhí)行命令如“去窗邊”“去你后面的椅子旁”等。這樣,通過(guò)相關(guān)的符號(hào)命令,機(jī)器人自動(dòng)識(shí)別并建立路標(biāo),通過(guò)符號(hào)指令到達(dá)目標(biāo)點(diǎn)。例如“去你后面的椅子旁”,這樣的命令就是告訴機(jī)器人路標(biāo)是椅子、路徑向后。該導(dǎo)航技術(shù)的難點(diǎn)在于目標(biāo)是否可以準(zhǔn)確實(shí)時(shí)識(shí)別路標(biāo)。第一,識(shí)別大量不同類別的物體,室內(nèi)環(huán)境有許多不同類別的物體,需要將它們組織到一個(gè)在給定的容易搜索圖像數(shù)據(jù)結(jié)構(gòu)中去,起到容易識(shí)別是用什么度量來(lái)區(qū)分物體;第二,識(shí)別大量不同背景下的物體,一個(gè)合適的物體表達(dá)式有助于將圖像組織成片斷,而這些片斷來(lái)自于物體的種類且與物體無(wú)關(guān)的;第三,在抽象層次上識(shí)別物體,機(jī)器人可以不需要在看到一個(gè)具體的杯子之前便能知道它是一個(gè)杯子,相關(guān)程序能夠類似的物體進(jìn)行識(shí)別和區(qū)分。

3.3.4基于目標(biāo)跟蹤的導(dǎo)航技術(shù)

基于目標(biāo)跟蹤的導(dǎo)航技術(shù),為機(jī)器人構(gòu)造一個(gè)虛擬地圖,機(jī)器人通過(guò)攝像頭獲取連續(xù)的視頻序定一個(gè)跟蹤的目標(biāo),為了達(dá)到對(duì)目標(biāo)的精確定位和實(shí)時(shí)跟蹤,可以利用粒子濾波算法對(duì)需要跟蹤的目標(biāo)進(jìn)行建模?;诹W訛V波的目標(biāo)跟蹤主要包含四個(gè)階段,分別是初始化目標(biāo)區(qū)域,概率轉(zhuǎn)移,目標(biāo)區(qū)域權(quán)重計(jì)算,目標(biāo)區(qū)域重采樣。在機(jī)器人導(dǎo)航之前,通過(guò)視頻序列的當(dāng)前幾幀標(biāo)注機(jī)器人所需要跟蹤的目標(biāo),在導(dǎo)航時(shí),機(jī)器人通過(guò)連續(xù)的視頻幀感知周圍的待跟蹤目標(biāo),同時(shí)對(duì)所需要跟蹤的目標(biāo)散播粒子,當(dāng)獲取的視頻幀對(duì)目標(biāo)區(qū)域重采樣后足以讓機(jī)器人確定所需要跟蹤的目標(biāo)時(shí),機(jī)器人通過(guò)確定的目標(biāo)為自己規(guī)劃最有效的路徑到達(dá)目的地。獲取視頻序列目標(biāo)跟蹤是算機(jī)視覺(jué)領(lǐng)域中的重要分支,它在工業(yè)生產(chǎn)、交通導(dǎo)航、國(guó)防建設(shè)、航空導(dǎo)航等各個(gè)領(lǐng)域有著廣泛的應(yīng)用。

篇7

關(guān)鍵詞:數(shù)字圖像技術(shù);應(yīng)用;發(fā)展趨勢(shì)

中圖分類號(hào):TP391.41

計(jì)算機(jī)的特點(diǎn)在于能夠處理各種數(shù)據(jù),數(shù)字圖像能夠經(jīng)過(guò)增強(qiáng)、復(fù)原、分割等處理,隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展和進(jìn)步,現(xiàn)在的數(shù)字圖像技術(shù)具有圖像處理多樣性、精度高、圖像的再現(xiàn)性好、處理量大的優(yōu)點(diǎn),本文主要研究數(shù)字圖像處理技術(shù)的發(fā)展現(xiàn)狀和發(fā)展趨勢(shì)。

1 數(shù)字圖像處理技術(shù)研究現(xiàn)狀

所謂圖像處理是指利用計(jì)算機(jī)來(lái)處理圖像的過(guò)程,主要是實(shí)現(xiàn)改善圖像的視覺(jué)效果,研究的內(nèi)容主要包括圖像數(shù)字化、圖像增強(qiáng)、圖像還原以及圖像分割等。數(shù)字圖像處理最早來(lái)源于20世紀(jì)20年代的報(bào)紙業(yè),到20世紀(jì)50年代,隨著計(jì)算機(jī)的發(fā)展,數(shù)字圖像處理技術(shù)得到人們的普遍關(guān)注,數(shù)字圖像處理技術(shù)隨著太空計(jì)劃得到很大的發(fā)展,最具有典型的例子,是對(duì)月球照片的處理。

進(jìn)入到20世紀(jì)70年代后,數(shù)字圖像處理技術(shù)隨著計(jì)算機(jī)斷層掃面(CT)的出現(xiàn)得到發(fā)展,在以后的時(shí)間里,數(shù)字圖像處理技術(shù)不斷有新的研究成果,1975年EWI公司研究的CT裝置獲得諾貝爾獎(jiǎng),目前數(shù)字圖像技術(shù)已廣泛應(yīng)用在各行各業(yè)中。

2 數(shù)字圖像處理技術(shù)的應(yīng)用

數(shù)字圖像處理技術(shù)目前在各行各業(yè)中都得到了很大的進(jìn)展。在遙感航空航天方面,不少國(guó)家都派出了偵查飛機(jī)對(duì)目標(biāo)地區(qū)進(jìn)行空中攝影,進(jìn)而通過(guò)圖像處理技術(shù)來(lái)分析照片,節(jié)省了人力、物理,也能夠從圖片中得到其他的有用信息。在20世紀(jì)60年代以來(lái),美國(guó)以及其他的一些國(guó)家發(fā)射了資源遙感衛(wèi)星,由于成像條件非常差,因此圖像本身的質(zhì)量也不高,需要采取數(shù)字圖像處理技術(shù)處理,如采用多波段掃描器進(jìn)行掃描成像,圖像分辨率為30m,這些圖像轉(zhuǎn)變?yōu)閿?shù)字信號(hào)傳送下來(lái),再經(jīng)過(guò)處理。數(shù)字圖像處理技術(shù)在各國(guó)的應(yīng)用中已非常廣泛,如用在森林調(diào)查、災(zāi)害監(jiān)測(cè)、資源勘查以及城市規(guī)劃中。

數(shù)字圖像處理技術(shù)最早來(lái)源于醫(yī)藥方面,因此在生物醫(yī)學(xué)工程方面,數(shù)字圖像處理技術(shù)也發(fā)揮出了巨大作用,除了上文所講述的CT之外,還有一些顯微圖像處理技術(shù),主要是識(shí)別紅細(xì)胞、白細(xì)胞以及染色體分析等,在醫(yī)學(xué)診治方面X光肺圖像增強(qiáng)、心電圖分析以及超聲波圖像處理技術(shù)等發(fā)揮出了重要作用。

在通信工程方面,目前通信主要的發(fā)展趨勢(shì)為綜合性的多媒體通信,也就是將電視、計(jì)算機(jī)以及電話聯(lián)合在一起在數(shù)字通信網(wǎng)上傳輸,在傳輸?shù)倪^(guò)程中最為復(fù)雜和困難的地方集中在圖像的處理中,比如說(shuō),彩色電視信號(hào)速率為100Mbit/s以上,想要傳輸出去就需要壓縮信息的比特量,因此技術(shù)成敗的關(guān)鍵就在于編碼壓縮。目前國(guó)家正在大力研發(fā)的新的編碼方法,如小波變換圖像壓縮編碼以及自適應(yīng)圖像網(wǎng)絡(luò)編碼等。

在工業(yè)和工程方面,主要的應(yīng)用集中在自動(dòng)裝置配線中檢測(cè)零件的質(zhì)量、彈性力學(xué)照片的應(yīng)力分析以及郵政信件的自動(dòng)分檢等,另外在智能機(jī)器人中也有應(yīng)用。在軍事、公安方面,數(shù)字圖像處理技術(shù)的應(yīng)用主要集中在導(dǎo)彈的精確制導(dǎo)、偵查照片以及圖像的傳輸和顯示方面,在公安方面,主要應(yīng)用在鑒別人臉、識(shí)別指紋以及圖片復(fù)原方面。數(shù)字圖像處理技術(shù)除了以上所講述的應(yīng)用領(lǐng)域之外,在電視圖像的編輯、服裝設(shè)計(jì)、發(fā)型設(shè)計(jì)以及文物資料復(fù)原等方面也有廣泛的使用。

3 數(shù)字圖像處理技術(shù)的發(fā)展趨勢(shì)

目前數(shù)字圖像技術(shù)隨著科技的進(jìn)步得到了很大的發(fā)展,隨著低成本硬件相關(guān)技術(shù)的發(fā)展可以想象數(shù)字圖像技術(shù)將會(huì)得到更加廣泛的應(yīng)用,目前國(guó)內(nèi)的研究成果主要集中在一些診斷、圖像壓縮編碼以及目標(biāo)識(shí)別等方面,但是還沒(méi)有廣泛應(yīng)用在實(shí)際生活中。數(shù)字圖像處理技術(shù)將會(huì)向著高分辨率、立體化、超高速以及智能化等方面發(fā)展,下面具體講述數(shù)字圖像處理技術(shù)的發(fā)展趨勢(shì)。

隨著計(jì)算機(jī)、人工智能以及思維科學(xué)研究的不斷發(fā)展,數(shù)字圖像處理技術(shù)在計(jì)算機(jī)視覺(jué)方面將會(huì)進(jìn)一步的發(fā)展,智能機(jī)器人的重要感覺(jué)器官是視覺(jué),目前研究的開放話題集中在理解和識(shí)別三維應(yīng)力,將會(huì)應(yīng)用在軍事勘察、危險(xiǎn)環(huán)境作業(yè)以及家庭服務(wù)等方面,目前人們對(duì)于自身的視覺(jué)了解的還非常少,因此在計(jì)算機(jī)視覺(jué)方面還需要進(jìn)一步的探索。

數(shù)字圖像處理技術(shù)還會(huì)向著虛擬現(xiàn)實(shí)發(fā)展,所謂虛擬現(xiàn)實(shí)就是使用計(jì)算機(jī)構(gòu)成一個(gè)虛擬的三維空間,這項(xiàng)技術(shù)的發(fā)展是在計(jì)算機(jī)硬件技術(shù)的提高方面提出的,人們應(yīng)用機(jī)器人身上的攝像機(jī)能夠真實(shí)的感受到所在的環(huán)境,進(jìn)而操縱機(jī)器人的行為,另外網(wǎng)上虛擬現(xiàn)實(shí)也是未來(lái)的一個(gè)發(fā)展方向。人們?cè)谕瓿缮鐣?huì)生產(chǎn)中往往習(xí)慣使用自身的認(rèn)識(shí)和工具,將這些掌握在自身手中,因此目前時(shí)代的發(fā)展趨勢(shì)就是將原來(lái)二維的東西向著三維發(fā)展,如三維重建技術(shù)在地圖方面的使用,在軍事方面能夠使用電子沙盤實(shí)現(xiàn)任意角度的轉(zhuǎn)化和計(jì)算,也能夠真實(shí)的直觀的反應(yīng)兩點(diǎn)之間的障礙物等,還能夠?qū)崿F(xiàn)模擬飛行路線,為作戰(zhàn)指揮帶來(lái)極大的便利。在計(jì)算機(jī)中進(jìn)行三維重建目前的熱點(diǎn)和難點(diǎn)問(wèn)題主要是計(jì)算機(jī)視覺(jué)研究領(lǐng)域。在圖像壓縮、識(shí)別以及分割方面,目前已取得很大的研究進(jìn)展,目前圖像處理面臨的新的問(wèn)題主要是圖像專業(yè)壓縮算法、圖像識(shí)別算法等。

4 結(jié)束語(yǔ)

綜上所述,本文先分析了數(shù)字圖像處理技術(shù)研究現(xiàn)狀和主要的應(yīng)用領(lǐng)域,進(jìn)而研究數(shù)字圖像技術(shù)的發(fā)展趨勢(shì)。目前數(shù)字圖像處理技術(shù)已廣泛的應(yīng)用在生活中,如在網(wǎng)絡(luò)、手機(jī)等中的應(yīng)用,數(shù)字圖像處理技術(shù)的發(fā)展與人們的生活息息相關(guān),隨著技術(shù)的不斷發(fā)展,數(shù)字圖像處理技術(shù)還會(huì)不斷得到進(jìn)步,這些還需要更多的人努力去研究。

參考文獻(xiàn):

[1]孔大力,崔洋.數(shù)字圖像處理技術(shù)的研究現(xiàn)狀與發(fā)展方向[J].山東水利職業(yè)學(xué)院院刊,2012(04):11-14.

[2]陳炳權(quán),劉宏立,孟凡斌.數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向[J].吉首大學(xué)學(xué)報(bào)(自然科學(xué)版),2009(01):63-70.

[3]呂戈靜.淺談數(shù)字圖像處理技術(shù)的現(xiàn)狀及發(fā)展[J].電腦知識(shí)與技術(shù),2012(33):8035-8036.

[4]丁可.數(shù)字圖像處理技術(shù)研究與發(fā)展方向[J].經(jīng)濟(jì)研究導(dǎo)刊,2013(18):246+270.

篇8

【關(guān)鍵詞】視頻跟蹤 手部識(shí)別

1 引言

計(jì)算機(jī)從誕生至今,其輸入設(shè)備從最初的機(jī)電開關(guān),逐漸發(fā)展為打孔紙帶、磁帶,再到今天的鍵盤、鼠標(biāo)和游戲手柄,向計(jì)算機(jī)輸入數(shù)據(jù)的效率越來(lái)越高,但方法的本質(zhì)并未改變,都要將自然信息通過(guò)機(jī)械式方式輸入計(jì)算機(jī)。這些方式都是基于2D的圖形界面,將用戶的操作限制于特定的外部設(shè)備上,無(wú)法實(shí)現(xiàn)自然而隨意的人機(jī)交互。長(zhǎng)時(shí)間使用,會(huì)使用戶感到疲憊,導(dǎo)致用戶體驗(yàn)下降。

對(duì)于用戶來(lái)說(shuō),人的語(yǔ)音、手勢(shì)等可以說(shuō)是最為自然、最為方便的交流手段,同時(shí)手勢(shì)在3D環(huán)境中意義明確、方向精確,是極好的人機(jī)交互手段。許多大型互聯(lián)網(wǎng)公司與游戲公司早就對(duì)此進(jìn)行了探索。微軟,索尼,任天堂等公司有著自己研發(fā)的外部設(shè)備,如游戲手套和傳感器等,以此來(lái)捕捉并記錄手部的運(yùn)動(dòng)軌跡,實(shí)現(xiàn)特定的操作乃至體感游戲。但這類外部設(shè)備的缺陷也是很明顯的:這類設(shè)備一般為機(jī)械傳感器式或光纖傳感器式,帶有傳感器、機(jī)械部件甚至用來(lái)與主機(jī)連接的電纜等,沉重、累贅、不靈活;且通常價(jià)格昂貴、極易損壞,用戶體驗(yàn)不佳;更重要的是限制于特定平臺(tái),不具備通用性,普及度不高。

若能實(shí)現(xiàn)基于計(jì)算機(jī)視覺(jué)技術(shù)的手勢(shì)識(shí)別及操作系統(tǒng),不僅可以將我們的雙手從特定外部設(shè)備上解放出來(lái),使操作更加輕松、隨意,還能獲得更好的人機(jī)交互體驗(yàn),推動(dòng)“虛擬現(xiàn)實(shí)”的研究。目前已經(jīng)有了大量的跟蹤算法和相關(guān)設(shè)別,如微軟的Kinect攝像頭及最新的Hololens頭盔已經(jīng)能達(dá)到很好的效果,但都較為復(fù)雜。因此本文研究一種簡(jiǎn)單通用的基于計(jì)算機(jī)視覺(jué)的手部跟蹤算法。

2 手部區(qū)域提取

2.1 樣本采集

為了保證研究的順利進(jìn)行,首先需要采集手部樣本圖片。為保證實(shí)驗(yàn)結(jié)果的準(zhǔn)確性,樣本圖片數(shù)量最好在100張以上,并記錄不同姿態(tài),其中男性樣本和女性樣本的數(shù)量保持相等。

2.2 膚色信息分析

膚色信息近似為皮膚的顏色信息,物體表面的顏色即表面色是因光照而呈現(xiàn)的顏色[6]。我們采用RGB顏色模型對(duì)手部表面膚色進(jìn)行分析,發(fā)現(xiàn)膚色處于某個(gè)范圍之內(nèi)。方法如下:手動(dòng)提取樣本圖像中的手部,對(duì)其進(jìn)行RGB顏色分量統(tǒng)計(jì),得到各分量直方圖。由于各分量直方圖上手部體現(xiàn)為一個(gè)近似波峰,所以可取波峰的半峰全寬(Full Width at Half Maxium)作為手部的膚色閾值。

根據(jù)膚色閾值提取手部,設(shè)HandSkin表示膚色閾值范圍,RGB(m, n)表示點(diǎn)(m, n)處的顏色信息,而bw(m, n)代表該點(diǎn)是否是手部,則:

2.3 模式識(shí)別

通過(guò)膚色信息初步提取手部后,可能會(huì)有孤立的局部點(diǎn)集出現(xiàn)。為此,統(tǒng)計(jì)所有互相連接的點(diǎn)集,提取點(diǎn)集對(duì)應(yīng)的幾何特征,建立規(guī)則來(lái)選取符合手部的點(diǎn)集。

幾何特征一般包括面積、周長(zhǎng)、重心等。而手部可以分為手掌和手指部分,手掌形狀近似于橢圓,手指為細(xì)長(zhǎng)的柱體,因此整個(gè)手部的周長(zhǎng)面積比會(huì)與其他物體有所區(qū)分,所以根據(jù)周長(zhǎng)面積比將手部從背景中提取出來(lái):

面積:指物體區(qū)域包含的像素?cái)?shù),用符號(hào)s表示。

周長(zhǎng):物體輪廓線上像素間距離之和,用符號(hào)c表示。在進(jìn)行周長(zhǎng)計(jì)算時(shí),需根據(jù)像素間的連接方式,分別計(jì)算距離。像素間距離可分為并列連接像素與傾斜連接像素。并列有上下左右四個(gè)方向,像素間距離為1;傾斜方向有左上、左下、右上、右下,其像素間距離等于單位正方體的對(duì)角線長(zhǎng)度。本文中先獲取二值圖像的邊緣信息,再使用8向鏈碼求周長(zhǎng)。

周長(zhǎng)面積比:用r表示,r = c/s。

求得所有樣本的面積周長(zhǎng)比后,通過(guò)統(tǒng)計(jì)建立規(guī)則,并排除異常數(shù)據(jù)。設(shè)h表示點(diǎn)集,hand表示手部,handrule表示手部點(diǎn)集所必需滿足的規(guī)則,noise表示噪聲,s.t.表示滿足,則最終的手部點(diǎn)集為:

3 手部跟蹤

基于計(jì)算機(jī)視覺(jué)的手部跟蹤算法具體步驟:

步驟1:第一幀圖像預(yù)處理。根據(jù)上文所述方法進(jìn)行第一幀的初始化。通過(guò)膚色信息和面積周長(zhǎng)比特征提取出第一幀圖像中的手。為了方便描述手的運(yùn)動(dòng)軌跡,用幾何圖形來(lái)近似表示手部區(qū)域,本文選用包圍手部區(qū)域的最小橢圓來(lái)表示手部,該橢圓的中心O1表示手部中心點(diǎn)。

步驟2:依次掃描視頻的每一幀。對(duì)于第n幀,由于相鄰幀的時(shí)間相隔較短,手部不會(huì)有太大位移。根據(jù)上一幀手部區(qū)域的位置,設(shè)置該幀的掃描范圍。通過(guò)第2章方法,得出當(dāng)前幀手部的中心點(diǎn)On。不斷重復(fù)算法直至視頻結(jié)束。

步驟3:描繪運(yùn)動(dòng)軌跡。從視頻最后一幀的中心點(diǎn)On開始,逆序依次連接On與On-1,直至視頻第一幀的中心點(diǎn)O1,得到完整的手部運(yùn)動(dòng)軌跡。

4 結(jié)論

本文所提出的以手部膚色信息為基礎(chǔ)的手部跟蹤算法,工程實(shí)現(xiàn)上較為簡(jiǎn)答,算法效率高,經(jīng)試驗(yàn)測(cè)試,能夠較為準(zhǔn)確地再現(xiàn)手部運(yùn)動(dòng)軌跡。同時(shí),該種方法也具有缺點(diǎn),在手部快速移動(dòng)或做復(fù)雜運(yùn)動(dòng)時(shí),算法所描繪的運(yùn)動(dòng)軌跡可能會(huì)出現(xiàn)斷裂,且該算法對(duì)光照敏感,在過(guò)強(qiáng)或過(guò)弱光照條件下,算法的準(zhǔn)確性都會(huì)受到影響。今后的工作將繼續(xù)完善本算法,將嘗試以HSI顏色模型進(jìn)行分析,考慮引入手部紋理與邊緣信息,減弱算法的光照敏感性,采用專家系統(tǒng)、智能優(yōu)化、神經(jīng)網(wǎng)絡(luò)、特征降維等高級(jí)技術(shù)。

參考文獻(xiàn)

[1]俞烈彬,孟凡文.武器裝備系統(tǒng)中的人機(jī)交互新技術(shù)[J].電子世界,2013(12): 164-165.

[2]孟艷麗,郭建.二語(yǔ)演講中手勢(shì)功能的實(shí)證分析[J].河南科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2014,32(3):62-67.

[3]劉晉鋼,劉衛(wèi)斌,劉晉霞.Kinect與Unity3D數(shù)據(jù)整合技術(shù)在體感游戲中的應(yīng)用研究[J].電腦開發(fā)與應(yīng)用,2014, 27(11):7-14.

[4]張蓬,王曉沖,陳建義.多自由度機(jī)械臂的虛擬現(xiàn)實(shí)仿真實(shí)現(xiàn)[J].機(jī)械設(shè)計(jì)與制造,2015(01):128-134.

[5]閆慶森,李臨生,徐曉峰,等.視頻跟蹤算法研究綜述[J].計(jì)算機(jī)科學(xué),2013, 40(6A):204-209.

[6]奚吉,趙曉鈴,張煜東.改進(jìn)的沃爾什濾波的圖像插值算法[J].計(jì)算機(jī)工程, 2010,36(22):211-213.

[7]張煜東,吳樂(lè)南,王水花.專家系統(tǒng)發(fā)展綜述[J].計(jì)算機(jī)工程與應(yīng)用,2010, 46(19):43-47.

[8]王水花,張煜東,吉根林.群智能算法的理論及應(yīng)用綜述[J].南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版),2014,14(4):31-38.

[9]張煜東,吳樂(lè)南,韋耿.神經(jīng)網(wǎng)絡(luò)泛化增強(qiáng)技術(shù)研究[J].科學(xué)技術(shù)與工程,2009(17):4997-5002.

[10]張煜東,霍元鎧,吳樂(lè)南,等.降維技術(shù)與方法綜述[J].四川兵工學(xué)報(bào),2010, 31(10):1-7.

作者簡(jiǎn)介

羅偉,男,江西省景德鎮(zhèn)市人?,F(xiàn)供職于南京師范大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院。研究方向?yàn)槭謩?shì)跟蹤。

通訊作者

張煜東,男,江蘇省南京市人。博士學(xué)位?,F(xiàn)為南京師范大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院教授。研究方向?yàn)閳D像處理。

作者單位

篇9

在用常見的手勢(shì)進(jìn)行交流時(shí),人們很容易就能互相理解,在經(jīng)過(guò)學(xué)習(xí)之后,聾啞人或是正常人都可以運(yùn)用手語(yǔ)進(jìn)行交流。不過(guò),想象一下,當(dāng)你對(duì)計(jì)算機(jī)(或機(jī)器)做一個(gè)手勢(shì),它就能領(lǐng)會(huì)你的意圖會(huì)是怎樣的情景呢?如果計(jì)算機(jī)(或機(jī)器)看得懂手語(yǔ),又意味著什么呢?姑且不管實(shí)現(xiàn)這樣的人機(jī)交流有何深遠(yuǎn)的意義,還是先讓我們來(lái)探究一下這樣的可行性吧,想想看得懂手語(yǔ)的計(jì)算機(jī)(或機(jī)器)能有什么用途。

人機(jī)交互:從呆板到員活

人類之間的交流往往聲情并茂,既采用自然語(yǔ)言(口語(yǔ)、書面語(yǔ)言),還廣泛采用人體語(yǔ)言(表情、體勢(shì)、手勢(shì))。與人類之間的交流相比,人機(jī)交互就顯得呆板多了。以計(jì)算機(jī)的輸入方式為例,人要向計(jì)算機(jī)下達(dá)指令,最常見的方式還是通過(guò)鍵盤輸入。當(dāng)然,手寫輸入也正為許多人所接受和喜愛(ài),語(yǔ)音輸入的研究也進(jìn)行得熱火朝天,最初單一而呆板的輸入方式已經(jīng)得到了擴(kuò)展。然而,科學(xué)研究是永無(wú)止境的,人體語(yǔ)言這種簡(jiǎn)單快捷的信息交流方式得到了很多研究者的關(guān)注,他們想,能不能把這種靈活的信息交流方式也引進(jìn)人機(jī)交互中呢?

于是研究人員展開了對(duì)人體語(yǔ)言理解的研究。人體語(yǔ)言的感知、人體語(yǔ)言與自然語(yǔ)言的信息融合對(duì)提高計(jì)算機(jī)的人類語(yǔ)言理解水平,加強(qiáng)人機(jī)接口的可實(shí)用性有著積極的意義。手語(yǔ)(手勢(shì))是人體語(yǔ)言的一個(gè)非常重要的組成部分,它是包含信息量最多的一種人體語(yǔ)言,它與語(yǔ)言、書面語(yǔ)等自然語(yǔ)言的表達(dá)能力相同。因而完全可以把手語(yǔ)作為人機(jī)交互的一種手段,它具有很強(qiáng)的視覺(jué)效果,生動(dòng)、形象、直觀??梢姡瑢⑹謩?shì)運(yùn)用于計(jì)算機(jī)能夠很好地改善人機(jī)交互的效率。

計(jì)算機(jī)怎樣識(shí)別手勢(shì)?

從不同的角度可以對(duì)手勢(shì)進(jìn)行不同的分類。分為交互性手勢(shì)和操作性手勢(shì),前者手的運(yùn)動(dòng)表示特定的信息(如樂(lè)隊(duì)指揮),靠視覺(jué)來(lái)感知,后者不表達(dá)任何信息(如彈琴);分為自主性手勢(shì)和非自主性手勢(shì),后者需要與語(yǔ)音配合用來(lái)加強(qiáng)或補(bǔ)充某些信息(如演講者用手勢(shì)描述動(dòng)作、空間結(jié)構(gòu)等信息),分為離心手勢(shì)和向心手勢(shì),前者直接針對(duì)說(shuō)話人,有明確的交流意圖,后者只是反應(yīng)說(shuō)話人的情緒和內(nèi)心的愿望。

手勢(shì)的各種組合、運(yùn)動(dòng)相當(dāng)復(fù)雜,不過(guò)簡(jiǎn)單來(lái)看,手勢(shì)主要有如下的特點(diǎn):手是彈性物體,因此同一手勢(shì)之間差別很大,手有大量冗余信息,由于人識(shí)別手勢(shì)關(guān)鍵是識(shí)別手指特征,因此手掌特征是冗余的信息:手的位置是在三維空間,很難定位:手的表面是,非平滑的,容易產(chǎn)生陰影。

了解了手勢(shì)的這些特點(diǎn),就可以在手勢(shì)研究中對(duì)手勢(shì)做適當(dāng)?shù)姆指?、假設(shè)和約束。例如,可以給出如下約束:如果整個(gè)手處于運(yùn)動(dòng)狀態(tài),那么手指的運(yùn)動(dòng)和狀態(tài)就不重要,如果手勢(shì)主要由各手指之間的相對(duì)運(yùn)動(dòng)構(gòu)成,那么手就應(yīng)該處于靜止?fàn)顟B(tài)。比如鼠標(biāo)和筆式交互設(shè)備就是通過(guò)識(shí)別手的整體運(yùn)動(dòng)來(lái)完成人與計(jì)算機(jī)的交互,但它們不能識(shí)別手指的動(dòng)作,其優(yōu)點(diǎn)是僅利用軟件算法就能實(shí)現(xiàn),適合于一般桌面系統(tǒng)。只有當(dāng)用鼠標(biāo)或筆式交互設(shè)備的運(yùn)動(dòng)或方向變化來(lái)傳達(dá)信息時(shí),才可將鼠標(biāo)或筆式交互設(shè)備看作手勢(shì)表達(dá)工具。筆式交互設(shè)備發(fā)展很快,它提供了充分的交互信息,如壓力、方向、旋轉(zhuǎn)和位置信息,但現(xiàn)有交互主要是簡(jiǎn)單地替代鼠標(biāo)。

計(jì)算機(jī)識(shí)別手勢(shì)的手段主要有兩種:

1.?dāng)?shù)據(jù)手套。數(shù)據(jù)手套是虛擬現(xiàn)實(shí)系統(tǒng)中廣泛使用的傳感設(shè)備,用戶通過(guò)數(shù)據(jù)手套,能做出各種手勢(shì)向系統(tǒng)發(fā)出命令,與虛擬世界進(jìn)行各種交互操作:比如通過(guò)一只與數(shù)據(jù)手套對(duì)應(yīng)的在計(jì)算機(jī)屏幕上顯示的虛擬手,使用戶成為虛擬世界中的一員:抓取物體,如果手套有力反饋,還能讓用戶感覺(jué)到物體的重量和材質(zhì)等。美國(guó)在“洞穴”虛擬系統(tǒng)中就是利用數(shù)據(jù)手套來(lái)研制武器。數(shù)據(jù)手套的主要優(yōu)點(diǎn)是可以測(cè)定手指的姿勢(shì)和手勢(shì),但是相對(duì)而言代價(jià)較為昂貴,并且有時(shí)會(huì)給用戶帶來(lái)不便(如出汗)。

2.計(jì)算機(jī)視覺(jué)。即利用攝像機(jī)輸人手勢(shì),其優(yōu)點(diǎn)是不干擾用戶,這是一種很有前途的技術(shù),目前有許多研究者致力于此項(xiàng)工作。但在技術(shù)上存在很多困難,目前的計(jì)算機(jī)視覺(jué)技術(shù)還難以勝任手勢(shì)識(shí)別和理解的任務(wù)。

目前較為實(shí)用的手勢(shì)識(shí)別是基于數(shù)據(jù)手套的,因?yàn)閿?shù)據(jù)手套不僅可以輸入包括三維空間運(yùn)動(dòng)在內(nèi)的較為全面的手勢(shì)信息,而且比基于計(jì)算機(jī)視覺(jué)的手勢(shì)在技術(shù)上要容易得多。

更好地為人服務(wù)

日本三菱電子研究實(shí)驗(yàn)室的研究人員已經(jīng)使用低成本的視覺(jué)系統(tǒng),通過(guò)手勢(shì)就可以控制一臺(tái)電視機(jī)。由計(jì)算機(jī)控制的美國(guó)航空航天局虛擬太空站也是采用美國(guó)Cybernet公司開發(fā)的手語(yǔ)識(shí)別軟件,通過(guò)一部架設(shè)在頂部的攝像機(jī)來(lái)追蹤指揮者的手勢(shì)。當(dāng)系統(tǒng)捕捉到揮手等手勢(shì)時(shí),就會(huì)做出相應(yīng)的反應(yīng),讓指揮者像航天員一樣在計(jì)算機(jī)虛擬的阿爾法國(guó)際太空站上移動(dòng)(確切地說(shuō)是飄動(dòng))。

Cybemet公司的軟件還能識(shí)別一系列的特定手勢(shì),就像工地上的工人或交通警察經(jīng)常用的那種手語(yǔ),通過(guò)這些手勢(shì)你能夠旋轉(zhuǎn)在虛擬旅行中看到的三維圖像,還可以向上或是向下改變你的視角。美國(guó)航空航天局正在考慮把這套系統(tǒng)用于真正的太空站,因?yàn)楸恐氐暮教旆臀⒅亓Νh(huán)境使得鼠標(biāo)和鍵盤都變得難以操縱。也許不久之后,航天員就能用簡(jiǎn)單的手語(yǔ)來(lái)控制機(jī)器人在太空中抓取物體。

手語(yǔ)(手勢(shì))識(shí)別系統(tǒng)的研究還有助于改善和提高聾啞人的生活學(xué)習(xí)和工作條件,為他們提供更好的服務(wù)。同時(shí)也可以應(yīng)用于計(jì)算機(jī)輔助啞語(yǔ)教學(xué)、電視節(jié)目雙語(yǔ)播放、虛擬人的研究、電影制作中的特技處理、動(dòng)畫的制作、醫(yī)療研究、游戲娛樂(lè)等諸多方面。另外,手語(yǔ)識(shí)別系統(tǒng)的研究涉及到教學(xué)、計(jì)算機(jī)圖形學(xué)、機(jī)器人運(yùn)動(dòng)學(xué)、醫(yī)學(xué)等多學(xué)科。因此,手語(yǔ)識(shí)別系統(tǒng)的研究非常有意義。

篇10

【關(guān)鍵詞】圖像識(shí)別 邊緣檢測(cè) 小波算法

小波算法在圖形識(shí)別、壓縮等方面有著較為廣泛的應(yīng)用,且具有較高的應(yīng)用效率。在圖形識(shí)別與壓縮中實(shí)現(xiàn)小波算法的應(yīng)用,能夠更加有效地實(shí)現(xiàn)應(yīng)用數(shù)據(jù)的識(shí)別與壓縮。當(dāng)前,在圖像識(shí)別與邊緣檢測(cè)領(lǐng)域中依舊存在著計(jì)算方法相對(duì)單一的情況,這種局限性對(duì)圖像識(shí)別與邊緣檢測(cè)的進(jìn)一步發(fā)展造成了嚴(yán)重的阻礙作用。因此,要實(shí)現(xiàn)小波算法在圖像識(shí)別與邊緣檢測(cè)中的廣泛應(yīng)用,促進(jìn)其進(jìn)一步發(fā)展。

1 小波算法概述

法國(guó)地球物理學(xué)家J?Morlet在1984年首次提出了小波的概念,隨后Hardy空間分子解說(shuō)研究為小波算法的誕生奠定了理論基礎(chǔ)。當(dāng)前,小波算法在圖像處理中有著非常廣泛的應(yīng)用,并且其應(yīng)用效果非常良好。小波算法主要是對(duì)非平穩(wěn)的信號(hào)進(jìn)行分析,在小波算法壓縮、平移等處理功能的支持之下,能夠從多個(gè)尺度對(duì)函數(shù)或者信號(hào)進(jìn)行分析,實(shí)現(xiàn)空間域與頻率域的具備變換,從而能夠更加有效地對(duì)信息進(jìn)行檢索。因此,小波算法屬于新興的信號(hào)處理技術(shù)。

在傳統(tǒng)的信號(hào)表示中,正交基有著非常廣泛的應(yīng)用?;瘮?shù)具有正交性,這使得基函數(shù)相應(yīng)的表示函數(shù)能夠通過(guò)內(nèi)積進(jìn)行計(jì)算。小波算法實(shí)現(xiàn)了局部化思想的發(fā)展,屬于信號(hào)的“時(shí)間――頻率”分析方法,其主要的特點(diǎn)為多分辨率分析,同時(shí)在時(shí)間域與頻率域中都能夠?qū)π盘?hào)的具備特征進(jìn)行表示。

2 圖像識(shí)別中小波算法的應(yīng)用分析

圖像識(shí)別指的是通過(guò)計(jì)算機(jī)實(shí)現(xiàn)對(duì)圖像的處理、分析與理解。通過(guò)圖像識(shí)別工作能夠?qū)崿F(xiàn)不同模式目標(biāo)、對(duì)象的計(jì)算機(jī)識(shí)別工作。一般情況下,圖像識(shí)別的有效支持包括兩個(gè)方面,一方面是進(jìn)入到系統(tǒng)中的信息,另一方面是系統(tǒng)中原本保存的信息,通過(guò)對(duì)這兩種信息的對(duì)比之后實(shí)現(xiàn)對(duì)圖像的有效識(shí)別。不同的圖像具有不同的特征,計(jì)算機(jī)在進(jìn)行圖像識(shí)別的過(guò)程中通常會(huì)將視線集中在圖像較為突出的特征方面,從一個(gè)突出的特征向下一個(gè)突出的特征進(jìn)行依次掃描。因此,在圖像識(shí)別的過(guò)程中,知覺(jué)機(jī)制的工作原理為排除多余信息、識(shí)別關(guān)鍵信息,因此小波算法有著非常關(guān)鍵的作用。一般情況下,在圖像識(shí)別中實(shí)現(xiàn)小波算法的應(yīng)用,能夠有效地整理按照階段獲得的信息,以此為基礎(chǔ)形成完成的知覺(jué)映像。此外,在圖像識(shí)別中實(shí)現(xiàn)小波算法的應(yīng)用還能夠有效地處理與計(jì)算信息的細(xì)節(jié),促進(jìn)圖像識(shí)別效率的提高。

利用冗余小波對(duì)圖像進(jìn)行J個(gè)尺度的二維小波變換,得到3?J+1幅子圖像,其公式為

[Cj?{dj1,dj2,dj3},j=1,2,3,……,J] (1)

其中,Cj代表原圖像尺度aj上的二維小波變換得到的低頻子帶圖像;djk代表原圖像在尺度2j與方向k上的二維小波變換得到的高頻細(xì)節(jié)自帶圖像,其中k=1,2,3,分別對(duì)應(yīng)高頻子帶圖像的水平部分,垂直部分與對(duì)角線部分。

3 邊緣檢測(cè)中小波算法的應(yīng)用分析

在計(jì)算機(jī)視覺(jué)中,邊緣檢測(cè)是非常重要的核心問(wèn)題之一。一般情況下,邊緣檢測(cè)的主要目的就是對(duì)數(shù)字圖像中具有明顯亮度變化的點(diǎn)進(jìn)行標(biāo)識(shí)。在邊緣檢測(cè)的過(guò)程中,圖像屬性中一些較為顯著的變化能夠?qū)χ匾录⒆兓冗M(jìn)行反映。例如,如果在圖像的屬性方面出現(xiàn)了表面方向不連續(xù)的情況,這就說(shuō)明在這一地方存在著比較重要的事件、變化等。此外,邊緣檢測(cè)在圖像處理與計(jì)算機(jī)視覺(jué)中還發(fā)揮著特征提取的關(guān)鍵作用。實(shí)現(xiàn)了小波算法在邊緣檢測(cè)中的應(yīng)用,能夠在很大程度上實(shí)現(xiàn)相應(yīng)數(shù)據(jù)計(jì)算量的降低,同時(shí)還能夠?qū)⒂?jì)算機(jī)視覺(jué)中一些不相干的冗雜信息進(jìn)行有效的剔除,同時(shí)能夠合理地對(duì)結(jié)構(gòu)屬性進(jìn)行辨識(shí)與保留。小波算法在邊緣檢測(cè)中的應(yīng)用包括兩種類型,第一種類型為查找計(jì)算,第二種類型為穿越計(jì)算。在邊緣檢測(cè)的查找計(jì)算中,工作人員通過(guò)以查找方法為基礎(chǔ)的小波算法對(duì)計(jì)算機(jī)圖像中的一階導(dǎo)數(shù)最大值與最小值進(jìn)行尋找,從而實(shí)現(xiàn)邊緣檢測(cè)工作。在邊緣小波基選取的過(guò)程中,遵循的原則包括:第一,邊緣檢測(cè)小波應(yīng)該選擇高通濾波器,濾波器的脈沖回應(yīng)函數(shù)包括奇對(duì)稱與偶對(duì)策兩個(gè)部分,

f(x)=f1(x)+f2(x),其中f1(-x)=-f1(x),f2(-x)=f2(x)

除此之外,小波算法在邊緣檢測(cè)的應(yīng)用過(guò)程中,其主要的應(yīng)用效果還包括在數(shù)據(jù)壓縮方面取得了較好的效果。小波算法首先對(duì)邊緣檢測(cè)中的線性頻率進(jìn)行分析,之后實(shí)現(xiàn)相關(guān)信息與數(shù)據(jù)的壓縮與處理,通過(guò)小波算法實(shí)現(xiàn)壓縮與處理之后,其圖像的分辨率普遍較高,出現(xiàn)這種情況的主要原因是在邊緣檢測(cè)中實(shí)現(xiàn)小波算法的應(yīng)用能夠使邊緣檢測(cè)中存在的高頻信號(hào)進(jìn)行消除,在高頻信號(hào)消除的基礎(chǔ)上對(duì)信息與數(shù)據(jù)進(jìn)行壓縮工作,從而取得較好的效果。然而,在利用小波算法實(shí)現(xiàn)邊緣檢測(cè)中的數(shù)據(jù)與信息壓縮時(shí),工作人員還應(yīng)該關(guān)注到邊緣檢測(cè)中存在的非線性不穩(wěn)定信號(hào),在對(duì)這些信號(hào)進(jìn)行處理的過(guò)程中,小波算法的應(yīng)用效果并不明顯。因此,在邊緣檢測(cè)中實(shí)現(xiàn)小波算法的應(yīng)用,應(yīng)該注重小波算法形態(tài)的有效選擇,從而實(shí)現(xiàn)邊緣檢測(cè)水平整體上的提升。

4 總結(jié)

隨著計(jì)算機(jī)視覺(jué)處理技術(shù)的快速發(fā)展,圖像處理與邊緣檢測(cè)中已經(jīng)實(shí)現(xiàn)了小波算法的廣泛應(yīng)用,且已經(jīng)取得了非常良好的應(yīng)用效果。因此,工作人員在圖像識(shí)別與邊緣檢測(cè)的過(guò)程中,對(duì)小波算法的應(yīng)用已經(jīng)有了非常明確的了解,通過(guò)小波算法的有效應(yīng)用能夠促進(jìn)圖像識(shí)別與邊緣檢測(cè)水平的不斷提高。

參考文獻(xiàn)

[1]喬鬧生,鄒北驥,鄧?yán)?,曾友兵,鄒劍臣.一種基于圖像融合的含噪圖像邊緣檢測(cè)方法[J].光電子.激光,2012,11(65):2215-2220.

[2]馬麗亞木?阿布來(lái)孜,艾力米努.阿卜杜如蘇力.一種基于邊緣圖像融合的圖像邊緣檢測(cè)方法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2012,12(41):182-185.

[3]王婭囡,谷方,楊厚俊,范延濱,賈冬雪.基于PET醫(yī)學(xué)圖像邊緣檢測(cè)算法的研究[J].現(xiàn)代生物醫(yī)學(xué)進(jìn)展,2014,05(42):965-968.

[4]王曉丹,吳崇明.基于MATLAB的系統(tǒng)分析與設(shè)計(jì)--圖像處理[M].陜西:西安電子科技大學(xué)出版社,2014,02(44):96-98.