數字圖像處理論文范文
時間:2023-03-29 08:49:34
導語:如何才能寫好一篇數字圖像處理論文,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
關鍵詞:數字圖像處理;教學改革;課程建設;研究性教學
作者簡介:寧紀鋒(1975-),男,陜西韓城人,西北農林科技大學信息工程學院,副教授。(陜西 楊凌 712100)
基金項目:本文系西北農林科技大學教學改革研究項目(項目編號:JY1102077)、西北農林科技大學本科優(yōu)質課程建設項目的研究成果。
中圖分類號:G642.0 文獻標識碼:A 文章編號:1007-0079(2013)34-0122-02
“數字圖像處理”是西北農林科技大學(以下簡稱“我?!保┬畔⒐こ虒W院為計算機科學與技術、軟件工程、信息與計算科學等多個理工科專業(yè)所開設的一門專業(yè)必修課。該課程涵蓋數學、物理、信號處理、心理學、計算機科學等多個領域的知識,與本科階段的高等數學、線性代數、概率論、面向對象編程、數據結構、算法分析等多門課程密切相關,對后續(xù)的特征提取和圖像理解等高級計算機視覺處理課程具有重要的基礎作用。同時,它在“模式識別”、“人工智能”和“機器學習”等專業(yè)課程體系中起著重要的作用。[1-3]
一、課程改革的必要性
由于圖像處理理論性強,內容抽象,算法較多,涉及的理論和方法既包含時域(空域)、變換域(頻域為主)、數學形態(tài)學、地理學(如分水嶺算法),還涉及到模式識別理論的一些知識,學生理解起來有一定難度,在解決實際問題時,面臨著無從下手的困難。同時,圖像處理技術應用較為廣泛,隨著數字成像設備的廣泛使用和智能手機的普及,社會對圖像處理人才的需求也日益增加,這些都對課程教學提出了更高的要求。在教學過程中發(fā)現“數字圖像處理”的傳統(tǒng)教學模式中,在課程定位、教學模式和教學內容上存在一些問題。
1.課程定位不明確
“數字圖像處理”在本科教學過程中有著兩種比較沖突的定位,導致課程教學過程存在兩種傾向。一是不顧本科學生實際情況向研究生課程看齊,將重點放在數字圖像處理理論內容。但這些內容與實際應用聯系并不緊密,忽視它的應用性和實踐性強的特點,從而導致理論與實踐脫節(jié),造成學生在編程能力上的欠缺。二是過分強調應用技能,把數字圖像處理等同于講授Photoshop等應用軟件的使用,或以講授MATLAB和Open CV圖像處理函數為主,不重視原理和算法,忽略了對本科生科學素質和研究能力的培養(yǎng)。
2.傳統(tǒng)教學模式與授課對象差異性的矛盾
“數字圖像處理”通常要求先研修“高等數學”、“線性代數”、“概率論與數理統(tǒng)計”和“數字信號處理”等課程,但是一些本科專業(yè)并沒有完整開設這些課程。例如,我校計算機科學與技術專業(yè)學習“數字信號處理”課程,但軟件工程和信息與計算科學專業(yè)未開設該類課程。此外,在實驗環(huán)節(jié)中,教師根據教學大綱設置的實驗內容通常比較固定,而未考慮學生專業(yè)和背景知識的差異、統(tǒng)一的實驗環(huán)境模式,使得有的專業(yè)學生因為知識儲備不足,學習起來有一定困難;而有的專業(yè)學生則感覺學習內容簡單、缺乏挑戰(zhàn)性,使得教師講授時在調動學生積極性、提高學生實踐能力方面難以協(xié)調。
3.教材與學科發(fā)展不一致
數字圖像處理內容涉及到矩陣運算、信號處理、概率論與數理統(tǒng)計等多個內容交叉學科,與新興學科的發(fā)展密切相關。當前,在人工智能、模式識別和機器學習等新興學科的推動下,數字圖像處理技術發(fā)展越來越快。傳統(tǒng)的教材或過于偏重推導理論,與應用實踐偏離,或成為圖像處理軟件或函數(如 Photoshop、MATLAB或Open CV)的使用說明書,使得學生難以深入學習圖像處理知識,影響對該門課程的掌握。
二、課程改革方法
根據授課專業(yè)對象的實際情況,在教學內容、教學方法、完善實驗教學和考核等方面對該門課程進行一系列改革,充分利用圖像處理實踐性強的特點,依托我校在數字圖像處理方面長期積累的理論和研究資源,將理論方法與實踐應用有機結合,構建了全面系統(tǒng)的數字圖像處理教學體系。多年教學效果表明,該教學模式有效克服傳統(tǒng)數字圖像處理教學存在的局限,極大增強了學生的學習興趣,提高了學生的動手能力和創(chuàng)新素養(yǎng)。
1.完善課程內容體系,適應圖像處理發(fā)展
數字圖像處理是一門發(fā)展中的課程,每年都有許多新的研究理論和方法不斷涌現,需對課程不斷進行完善,以適應圖像處理學科的發(fā)展。在保持圖像處理課程核心內容的基礎上,注重將最近的該學科具有代表性的成果納入教學。精簡和更新一些陳舊的和目前圖像處理實際中很少使用的一些方法。其次,將一些現代經典的科研論文,以補充教材的形式,作為教學內容。將一些理論性較強,對數學基礎要求較高的內容,如主動輪廓分割模型和目標跟蹤方法等作為選學內容,供有興趣的學生學習。
考慮到OpenCV和MATLAB的廣泛使用,圖像文件的讀寫已非常簡單,因此,減少對圖像文件格式的講解;在圖像分割與邊緣檢測中,刪掉投影法與差影法內容,因為該方面內容在實際中已很少使用;在頻域處理中,淡化對傅里葉變換理論和算法的講解,重點放在其思想和應用上。
2.應用全方位教學手段,構建立體化教學資源
針對“數字圖像處理”課程理論性和實踐性較強、可視化程度較高的特點,綜合利用圖像、視頻信息、可視化編程軟件和網絡資源等現代化教育技術,從課堂、實驗、應用實踐等諸多環(huán)節(jié)探索立體化教學資源。結合不同專業(yè)需求,運用MATLAB、Open CV等軟件工具包開發(fā)圖像處理實驗平臺,建立網絡化輔助教學系統(tǒng),使抽象概念和算法形象化,激發(fā)學生思維。例如,建立圖像處理標準測試庫,包括了圖像去噪、圖像分割、圖像變換和特征提取與識別等核心內容涉及到的測試數據;在參考教材方面,提供了國內外知名大學出版的數字圖像處理和計算機視覺教材及計算機視域的專著;在多媒體課件方面,提供多年從國內外知名大學網站上搜集到多個數字圖像處理和計算機視覺的電子課件,供學生學習;在代碼方面,提供了數字圖像處理方面的經典和最新的一些科研成果的源代碼或可執(zhí)行軟件,學生自己運行代碼并分析實驗結果,加深對圖像處理課程的認識。
3.以學生發(fā)展為本,建立多元化的考核評價標準
在傳統(tǒng)方式下,教師常以期末考試和出勤率來評價學習效果,忽略了對學生參與學習活動和學習過程的評價。大部分學生往往在考試前突擊學習,沒有真正掌握扎實的知識。因此,本教學改革以過程控制為中心,以能力提高為目標,對考核方式進行改革,實行常規(guī)考核與過程性考核相結合的方式,準確把握學生的真實成績,全面衡量和控制教學質量,既要考學生的基本理論,更要考他們運用知識和方法設計圖像處理方案、完成圖像處理實際任務的能力。在授課過程中,注重課堂考察環(huán)節(jié),加強師生交互,動態(tài)掌握學生對授課內容的理解。開展專題討論課程,讓學生大膽提問,鍛煉學生創(chuàng)新思維能力,對表現突出的學生增加平時分。
4.開展研究性課堂教學探索
在教學改革中,精選了若干圖像處理經典和前沿專題討論,包括論文、程序源代碼和輔助材料。在課程一開始就布置任務給學生課下自學,并安排學生上臺講授,其他學生提問,教師給予點評,并組織學生一起討論,加深對圖像處理課程的認識,培養(yǎng)學生綜合運用知識的能力,提高創(chuàng)新素養(yǎng)。
例如,在圖像分割專題討論中,以經典Mean Shift分割為主要內容,Graph Cut和交互式分割兩個方向作為補充內容,開展專題討論。因為這些廣泛使用的算法涉及到高等數學、線性代數、概率論、數據結構和算法設計等多門所學課程。通過自學、上課討論和教師點評,學生對以前所學基礎和專業(yè)知識有了更深層次的理解。同時,這些算法都面向彩色圖像,克服了教材中以灰度圖像為主要分割對象的不足。
5.開展研究性實踐教學
傳統(tǒng)“數字圖像處理”課程實踐教學強調基本算法的實現,未強調算法之間的邏輯聯系,忽略了數字圖像處理基本算法的綜合訓練。在改革中,保留圖像處理基本核心算法,將科研項目融入教學實踐中,通過設計研究性綜合實踐項目,注重學生對所學知識的綜合理解和提升。例如,“圖像去霧”綜合訓練實踐,以如何有效果去除圖像中的霧增強圖像質量為目標。該任務以2009年國際計算機視覺和模式識別會議(CVPR)的最佳論文《基于暗通道通先驗的單幅圖像去霧》[4]為主要內容,涉及到圖像處理的多個基本算法,同時也包含了物理學和光學的一些知識。通過將新的實踐教學手段應用到教學中,突出對學生思維能力、科研能力和創(chuàng)新能力的培養(yǎng)。
三、結論
通過分析數字圖像處理目前存在的課程定位模糊、傳統(tǒng)的教學模式與授課對象差異性的矛盾和教材內容與學科發(fā)展脫節(jié)等問題,筆者根據學科專業(yè)特點,結合授課教師的科研項目,從完善課程內容體系、構建立體化教學資源、多元化考核評價標準和開展研究性教學探索等五個方面進行開展數字圖像處理教學改革。多年教學效果表明,該教學方法克服傳統(tǒng)教學方法所存在的弊端,極大地提高了學生的自主學習能力。學生較好地掌握數字圖像處理的核心內容,了解當代圖像處理的代表性成果和前沿趨勢,綜合應用能力和創(chuàng)新素養(yǎng)明顯增強,為培養(yǎng)具有較強適應能力的應用型和創(chuàng)新型人才打下堅實的基礎,適應了新世紀對信息技術人才的培養(yǎng)要求。
參考文獻:
[1]何東健.數字圖像處理[M].西安:西安電子科技大學出版社,2008.
[2]杜云明,郝兵,劉文科.“數字圖像處理”課程任務驅動教學模式的實踐[J].中國電力教育,2013,(10):113-114.
篇2
關鍵詞:數字圖像 圖像處理 數字技術 應用
一、數字圖像處理綜述
數字圖像處理(Digital Image Processing)又稱為計算機圖像處理,它是指將圖像信號轉換成數字信號并利用計算機對其進行處理的過程。
數字圖像處理最早出現于20世紀50年代,當時的電子計算機已經發(fā)展到一定水平,人們開始利用計算機來處理圖形和圖像信息,數字圖像處理作為一門學科大約形成于20世紀60年代初期,早期的圖像處理的目的是改善圖像的質量,它以人為對象,以改善人的視覺效果為目的。圖像處理中,輸入的是質量低的圖像,輸出的是改善質量后的圖像,常用的圖像處理方法有圖像增強、復原、編碼、壓縮等。
首次獲得實際成功應用的是美國噴氣推進實驗室(JPL),他們對航天探測器徘徊者7號在1964年發(fā)回的幾千張月球照片使用了圖像處理技術,如幾何校正、灰度變換、去除噪聲等方法進行處理,并考慮了太陽位置和月球環(huán)境的影響,由計算機成功地繪制出月球表面地圖,獲得了巨大的成功。隨后又對探測飛船發(fā)回的近十萬張照片進行更為復雜的圖像處理,以致獲得了月球的地形圖、彩色圖及全景鑲嵌圖,獲得了非凡的成果,為人類登月創(chuàng)舉奠定了堅實的基礎,也推動了數字圖像處理這門學科的誕生。在以后的宇航空間技術,醫(yī)學技術中數字圖像處理技術都發(fā)揮了巨大的作用。
從70年代中期開始,隨著計算機技術和人工智能、思維科學研究的迅速發(fā)展,數字圖像處理向更高、更深層次發(fā)展,人們已開始研究如何用計算機系統(tǒng)解釋圖像,實現類似人類視覺系統(tǒng)理解外部世界,這被稱為圖像理解或計算機視覺。很多國家,特別是發(fā)達國家投入更多的人力、物力到這項研究,取得了不少重要的研究成果。其中代表性的成果是70年代末MIT的Marr提出的視覺計算理論,這個理論成為計算機視覺領域其后十多年的主導思想。圖像理解雖然在理論方法研究上已取得不小的進展,但它本身是一個比較難的研究領域,存在不少困難,因人類本身對自己的視覺過程還了解甚少,因此計算機視覺是一個有待人們進一步探索的新領域。
二、國內外研究現狀
目前,國內圖像識別的算法研究多是關于數字、文字、人臉、以及醫(yī)用病理方面的較多,對產品內表圖像進行分析識別、分類的還很少。國內已研制出了具有先進水平的高精度內表檢測系統(tǒng)和裝置,如何對產品零部件的外形,尺寸進行較高精度測量的激光在線檢測系統(tǒng)等,但迄今為止,尚無能對生產出的產品內表面進行自動檢測和識別的系統(tǒng)。應用CCD、電子、計算機技術檢測內表面的實時自動檢測技術在國內正處于剛剛起步的階段,對內表面圖像進行分析識別、分類的軟件系統(tǒng)還沒有十分完善,現在的識別算法對圖像中的疵病部分定位不是很準確,對疵病的范圍、大小、方位不能做定量分析,只能作定性分析,精度低,采用的傳統(tǒng)的最小距離等分類器在圖像復雜且類別多時,很難表示和提取特征,進行圖像識別十分困難。
國外關于圖像識別中的圖像分割,特征信號提取,邊緣檢測,紋理識別等的算法已經取得了一定的成果,提出了一些新方法,如利用直線分割來識別三維人臉,通過子圖匹配法在相鄰區(qū)域間識別不同目標,用雙值微波仿射不變函數識別二維形形狀等等,近年來,國外基于圖像識別與分類技術的圖像檢索,人臉識別,字體識別發(fā)展十分迅速。
在國外,為提高自動目標識別能力而開發(fā)的算法現在正被引入許多偵測和成像系統(tǒng)之中,圖像分割、特征信號探測和析取、靜止目標的模式識別等方面已取得了很大進步,這一自動目標識別能力大大減輕了操作人員的工作負擔。如美國正在加緊自動檢測能力與自動目標識別的研究工作,并在硬件能力的基礎上開發(fā)多種用于信號圖像處理的算法和開展各種算法軟件的研制,包括相關法(匹配濾波器技術)、自適應多維處理法、基于模型的方法等。
三、數字圖像處理的應用
圖像是人類獲取和交換信息的主要來源,因此,圖像處理的應用領域必然涉及到人類生活和工作的方方面面,隨著人類活動范圍的不斷擴大,圖像處理的應用領域也將隨之不斷擴大。
1、航天和航空技術方面的應用
數字圖像處理技術在航天和航空技術方面的應用,除了JPL對月球、火星照片的處理之外,另一方面的應用是在飛機遙感和衛(wèi)星遙感技術中?,F在世界各國都在利用陸地衛(wèi)星所獲取的圖像進行資源調查,災害檢測,資源勘察,農業(yè)規(guī)劃,城市規(guī)劃,我國也陸續(xù)開展了以上諸方面的一些實際應用,并獲得了良好的效果。在氣象預報和對太空其它星球研究方面,數字圖像處理技術也發(fā)揮了相當大的作用。
2、生物醫(yī)學工程方面的應用
數字圖像處理在生物醫(yī)學工程方面的應用十分廣泛,而且很有成效。除了一般的CT技術之外,還有一類是對醫(yī)用顯微圖像的處理分析,如紅細胞、白細胞分類,染色體分析,癌細胞識別等,此外,在X光肺部圖像增晰、超聲波圖像處理、心電圖分析、立體定向放射治療等醫(yī)學診斷方面都廣泛地應用圖像處理技術。
3、通信工程方面的應用
當前通信的主要發(fā)展方向是聲音、文字、圖像和數據結合的多媒體通信。具體地講是將電話、電視和計算機以三網合一的方式在數字通信網上傳輸。其中以圖像通信最為復雜和困難,因圖像的數據量十分巨大,如傳送彩色電視信號的速率達100Mbit/s以上,要將這樣高速率的數據實時傳送出去,必須采用編碼技術來壓縮信息的比特量。在一定意義上講,編碼壓縮是這些技術成敗的關鍵。除了已應用較廣泛的熵編碼、DPCM編碼、變換編碼外,目前國內外正在大力開發(fā)研究新的編碼方法,如分行編碼、自適應網絡編碼、小波變換圖像壓縮編碼等。
4、工業(yè)和工程方面的應用
在工業(yè)和工程領域中圖像處理技術有著廣泛的應用,如自動裝配線中檢測零件的質量、并對零件進行分類,印刷電路板疵病檢查,彈性力學照片的應力分析,流體力學圖片的阻力和升力分析,郵政信件的自動分揀,在一些有毒、放射性環(huán)境內識別工件及物體的形狀和排列狀態(tài),先進的設計和制造技術中采用工業(yè)視覺等等。其中值得一提的是研制具備視覺、聽覺和觸覺功能的智能機器人,將會給工農業(yè)生產帶來新的激勵,目前已在工業(yè)生產中的噴漆、焊接、裝配中得到有效的利用。
5、軍事公安方面的應用
在軍事方面圖像處理和識別主要用于導彈的精確末制導,各種偵察照片的判讀,具有圖像傳輸、存儲和顯示的軍事自動化指揮系統(tǒng),飛機、坦克和軍艦模擬訓練系統(tǒng)等;公安業(yè)務圖片的判讀分析,指紋識別,人臉鑒別,不完整圖片的復原,以及交通監(jiān)控、事故分析等。目前已投入運行的高速公路不停車自動收費系統(tǒng)中的車輛和車牌的自動識別都是圖像處理技術成功應用的例子。
6、文化藝術方面的應用
目前這類應用有電視畫面的數字編輯,動畫的制作,電子圖像游戲,紡織工藝品設計,服裝設計與制作,發(fā)型設計,文物資料照片的復制和修復,運動員動作分析和評分等等,現在已逐漸形成一門新的藝術——計算機美術。
參考文獻:
[1]孫即祥 圖像壓縮與投影重建 北京:科學出版社;2005.7:第一章:1~2,63~64.
[2]韓金姝.基于分形的植物形態(tài)模擬與圖像壓縮技術研究:[碩士論文]. 青島:中國海洋大學信號與信息處理專業(yè),2005.
篇3
1 圖像處理技術
1.1 數字圖象處理的特點
隨著計算機科學的發(fā)展與工控程度的提高,圖像處理技術被越來越廣泛的運用。在顆粒檢測識別領域,圖像處理技術有著得天獨厚的優(yōu)勢。它減少了單純的人工操作量,降低了測量過程中的粗糙性。提供了對復雜細微顆粒處理的可行性,加快了分析處理速度并且可以直接或間接的獲取人們所需要的信息。實現過程的實時監(jiān)測和控制。
1.2 煤堆顆粒的圖像識別系統(tǒng)框架
圖像識別系統(tǒng)主要包括圖像采集和圖像處理兩部分。圖像采集主要由圖像傳感器來完成,圖像處理主要由計算機和相應的系統(tǒng)軟件來完成。框架如圖1。
在煤堆里取樣,用粉碎機磨制好煤粒粗樣后得到煤的顆粒樣本如圖2。然后通過CCD圖像傳感器采集到圖像,lunwen. 1KEJI AN. COMlunwen. 1KEJI AN. COM提供寫作論文和發(fā)表服務,歡迎您的光臨進行數字化處理后存入計算機,獲取煤粒原始圖像。再利用軟件對數字圖像進行相應處理得到相關圖像參數,最后根據所得參數數據分析得出煤粒特性結論。
這里選用CCD傳感器來獲取數字圖像如圖3所示。CCD圖像傳感器是一種特殊的半導體材料又名電荷耦合器[2]。它由大量按矩陣排列的獨立光敏元件構成??芍苯訉⒐庑盘栟D換為電信號,然后電信號經放大和模數轉換后,實現圖像的獲取、存儲、傳輸、處理和復現等操作。由CCD攝像設備采集的光學圖像轉成模擬信號經圖像模數轉換器進行數字化后,得到數字圖像交由計算機處理。它最顯著的優(yōu)點是噪聲低、響應速度快、像素分辨率高等。
1.3 煤堆顆粒圖像的數字化處理
在計算機中利用軟件對原始顆粒圖像(圖4)進行預處理。對于一張圖像來說,往往需要提取目標物,所以先作灰度變換減少圖像噪聲,保證圖像質量。每一副圖像相當于一個矩陣,矩陣的行和列確定圖像中的每一個點,矩陣中的元素值對應該點的灰度級。圖像矩陣中的每個元素就是像素。顆粒本體灰度值與背景圖層灰度值較為均勻,進行灰度變化后效果較好,灰度圖有無明顯的雙峰?;叶茸儞Q不足以達到最終效果,需要對圖像作二值化處理。手動改變圖像閾值,顆粒圖像二值化效果發(fā)生改變,當觀測圖像變化效果最為理想時停止改變,確定一個最佳的門限閾值。二值化處理后顆粒如圖5。另外也可以選擇自適應閾值分割,但是無法同步觀察變化過程,且計算量相對較大耗時長,無法達到背景圖層與顆粒本體二值化圖像最佳效果。
2 煤堆顆粒特性分析
2.1 顆粒的形態(tài)描述
從顆粒的形態(tài)學切入,分析顆粒粒度及形狀。粒度是顆粒在空間范圍所占大小的線性尺度。通常表面光滑的球體顆粒的粒度用直徑表示,立方體顆粒的粒度用邊長表示。對不規(guī)則的礦物顆粒,可將與礦物顆粒有相同行為的某一球體直徑作為該顆粒的等效直徑。對許多取向混亂的顆粒按一定方向測量平均線度的統(tǒng)計作為當量徑。由于獲取的是顆粒投影圖像,則可按二維投影規(guī)則對煤粒度進行定義[3]。
2.2 煤堆顆粒粒度相關參數
顆粒面積的計算,通過對圖像像素點的統(tǒng)計得到。統(tǒng)計獲得顆粒像素的個數后,還需要用一個標準單位來標定。通過比例換算得到目標顆粒實際面積大小。采用逐行掃描的方式對圖像中每一個顆粒進行標號確定單個顆粒參數。這樣每一個目標顆粒的參數都有一個歸屬,不容易產生混亂。
顆粒周長的計算可以通過對二值圖像中目標物的邊緣像素計算獲得。依然可以采用順序逐行掃描的方式對圖像進行掃描。對圖像邊緣像素跟蹤累加,統(tǒng)計像素個數可得周長。因此顆粒的當量直徑可以根據顆粒粒度定義由面積和周長求得。此外還可以利用計算機圖像系統(tǒng)對顆粒進行自定義多方向掃描,獲取每一個方向上的粒徑值再進行平均。用該平均值對粒徑大小作粗估計值,這里并沒有對此種方法加以詳細證明。
這樣就可以根據不同粒徑的顆粒物在顆粒總體中所含的百分比來確定粒度分布。此外還可以根據顆粒粒度來進lunwen. 1KEJI AN. COMlunwen. 1KEJI AN. COM提供寫作論文和發(fā)表服務,歡迎您的光臨行顆粒分級,明確顆粒的層次關系。
3 煤堆顆粒與分形理論
3.1 分形理論的定義
分形理論是時下非常流行的新理論。分形理論的最基本特點是用分形分維的數學工具來描述研究客觀事物。它跳出了一維的線、二維的面、三維的立體乃至四維時空的傳統(tǒng)藩籬[4],更加接近客觀事物和復雜系統(tǒng)的真實屬性。
3.2 顆粒粒度的分形分析
在顆粒的形態(tài)特征中,主要討論了分形分維的方法。把分形維數作為顆粒形態(tài)描述的一個重要角度。分形維數在一定程度上體現了顆粒的某些化學物理特性。實際測定分維的辦法有很多,如根據尺度、測度關系、相關函數等。針對顆粒的不同特征可以建立不同的分形模型。對于無規(guī)顆粒具有如下分形特征式:
①根據邊緣進行分形分析,顆粒的無歸邊緣曲線可利用盒維數[5]計算得分形維數。與邊緣線相交的正方形個數記為盒子數N(如圖6盒子數為16),盒子大小為k*k,k即盒子的邊長。存在推導關系式:-;D記為分形維數,B為常數。通過推導關系計算擬合數據可得到分形維數D。在對k取值時,k值越小所能取到的盒子數也越多,邊緣分形結果越精確。理論上顆粒邊緣復雜程度越大,分形維數值越大。邊緣分形維數體現顆粒的輪廓曲線特點。這里取了4個不同顆粒樣本進行了圖像處理后,經過計算分別得出4個樣本的分形維數,進行比較。
從表1中可以看出顆粒邊緣分形維數變化不是特別明顯,原因可能與所取的盒子邊長k有關。還需要結合其他形狀參數來進行特征描述。說明僅僅利用顆粒邊緣分形分維作為煤粉顆粒特性標準描述有待改進。
②根據顆粒粒徑分形有關系式:-。是粒徑分布分形維數,R是粒徑大小,為粒徑大于R的顆粒數。同樣可以通過擬合數據計算得到顆粒粒徑分布分形維數。在選取了3組顆粒圖像進行了顆粒粒徑分布分形維數計算后得到相關參數如表2。
從表2來看,粒徑分布分形很大程度上與顆粒數目有關。分形維數是根據統(tǒng)計粒徑R以及對應的顆粒數目N進行擬合后得到的直線斜率。盡可能的選取較多的顆粒圖進行計算,分形維數越準確粒徑分布分形偏差越小。顆粒粒徑與分布分形維數呈負相關關系,粒徑越小分布分形維數越大,粒徑分布隨粒徑減小呈現的分形特征越明顯,反映煤堆顆粒粒徑分布越復雜。
5 結語
對于煤堆顆粒的識別,采用數字圖象處理技術能夠提高識別檢測的速度,同時還可以減小大量人為干預造成的誤差,避免檢測重復性低等缺點。對于煤炭行業(yè)提高燃煤利用率和降低污染有著重要的意義。本文主要通過圖像灰度變換、圖像分割等方法對煤粒圖像做處理。同時結合分形理論進行分析,得到煤堆顆粒粒lunwen. 1KEJI AN. COMlunwen. 1KEJI AN. COM提供寫作論文和發(fā)表服務,歡迎您的光臨徑分布分形等參數,說明了顆粒分形的可行性并對煤的顆粒分形特征進行描述。但是在粒度形態(tài)識別中只是對二維投影圖顆粒粒徑做了說明,還可以從形狀因子等參數考慮,綜合描述顆粒特征。對顆粒分布分形也不完善,需要做進一步研究。此外,如何更好的提取顆粒的邊緣輪廓,找到顆粒新的參考特性以及分形與工業(yè)分析之間的關系是下一步探討的方向。
參考文獻
[1] 苗春衛(wèi),李玉祥,王克家,等.基于數字圖像處理的煤粉顆粒檢測[J].應用科技,2003(2):1-3.
[2] 青.基于分形理論的大氣懸浮顆粒物圖像識別[D].武漢:武漢理工大學,2006.
篇4
關鍵詞:高層結構;數字圖像測量;水平位移
Abstract:This paper describes the causes of high-level structure of lateral digital image measurement technology works and its advantages, and outlines how it works, and the actual construction of the horizontal displacement of the dynamic monitoring to prove that this new technologypracticality.
Key words: high-level structure; digital image measurement; horizontal displacement
中圖分類號:O4-34 文獻標識碼:A文章編號:2095-2104(2012)
一,引言
數字圖像測量技術是利用照相機、攝像機等對景物或者物體進行拍攝得到序列或者單幀數字圖像,再應用數字圖像處理分析等技術結合各種目標信息的求解和分析算法,對目標結構參數或者運動參數進行測量和估計的理論和技術[1]。近年來正在逐漸被人們所重視,并不斷的在工程變形監(jiān)測中進行嘗試,現有的圖像測量技術已經基本可實現對目標點的二維位移測量,而且測量精度高,對于大范圍變形的目標也能適用,且使用經濟,這種技術在橋梁變形測量應用較多[2],目前也逐漸往民用建筑上發(fā)展,在鋼結構變形監(jiān)測也有了一定進展[3]。
二、高層結構側移特性
高層結構在受到外荷載作用,結構在動荷載作用下水平方向的側移隨時間不停變化。隨著結構高度增加,水平荷載下結構的側向變形迅速增大,與結構高度四次方成正比。因此不僅要求結構具有足夠的強度,還要求具有足夠的抗推剛度,使結構在水平荷載下產生的側移被控制在某一限度之內[4],否則會產生以下情況:
1,側移變形過大會使人感覺不舒服,影響使用。
2,側向變形過大會使填充墻或建筑裝修出現裂縫或損壞,也會使電梯軌道變形。
3,側向變形過大會使主體結構出現裂縫,甚至損壞。
4,側向變形過大會使結構產生附加內力從而可能引起倒塌,建筑物上豎向荷載在側向變形時會產生附加彎矩,即P-效應。
因此對高層結構的側向變形進行監(jiān)測是非常有必要的。
三,數字圖像測量技術原理及特點
數字圖像測量技術是基于攝影測量學原理,通過對攝影成像系統(tǒng)拍攝的圖像分析計算,得到被測物體在三維空間中的幾何參數和運動參數。拍攝的影像是空間物體通過成像系統(tǒng)在像平面上的反映,即三維空間物體在像平面上的投影。數字影像每個像素的灰度反映了空間物體表面對應點的光強度,而該點的圖像位置對應了空間物體的表面的幾何位置。并且利用數字影像處理技術和數字影像匹配技術獲得同名像點的坐標,通過軟件自動計算得到對應物點的空間坐標,與初始位置進行比較,即可測量被測目標的變形位移量。通過的攝影測量系統(tǒng)的標定及采用先進的圖像處理算法,能夠實現亞像素級別的測量精度。目前常采用亞像素定位算法,一般情況下精度為0.1-0.5個像素,理想時可達到0.01個像素左右的精度[5]。
具有以下特性:①可瞬間得到被測物體的點位關系,作業(yè)方法有較大的靈活性;②采集的圖片信息豐富,顯示物體的客觀變化,對于規(guī)則或不規(guī)則的物體變形測量都可使用;③可用于物體外形和運動狀態(tài)的測定;④測量時,可以不接觸物體,不干擾被測物體的自然狀態(tài);⑤測量圖片利于保存,可隨時進行檢查,分析及對比;⑥基于嚴謹的理論知識和先進的硬件軟件設備,能提供相當高精度和可靠性的測量結果。
四、測量系統(tǒng)
基于數字圖像測量技術的高層結構動態(tài)測量系統(tǒng)主要由以下幾個部分組成:一、測量頭,主要由工業(yè)相機和鏡頭組成,用于實時采集被測目標圖像;二、PC平臺,帶有自主研發(fā)的圖像處理系統(tǒng),用于獲取測量頭采集的圖像并處理得到實時數據;三、標志板,放置在被測點處,提高被測目標的可視性;四、千兆網線,連接測量頭和PC平臺,傳遞圖像數據。這套測量系統(tǒng)的圖像采集頻率可達30Hz,完全可以滿足高層結構的實時動態(tài)測量要求。
五、測量方式
根據建筑結構在外界干擾及自身結構作用下變形位移的特點,通過測量關鍵點在平面內的二維坐標、通過測得得位移變化來描述結構的運動特征。例如高層建筑在外水平荷載作用下,豎直方向的位移非常小,主要是對其水平方向位移進行測量,因此主要任務是獲取結構不同高度在水平面內的二維坐標變化。
在需要監(jiān)測的關鍵點所在的平面內設置標志板,提高被測目標的可視度。將標志板用人工方式固定在監(jiān)測點處,保證它能代表監(jiān)測點的運動姿態(tài),將測量頭利用螺栓固定在不動點,對儀器的姿態(tài)不作要求,對準標志板,儀器鏡頭主光軸與標志板平面之間的幾何關系沒有嚴格的要求。坐標系統(tǒng)的標定是通過標志板成像的圖形和自身的幾何尺寸之間的變換將測量頭的像平面坐標歸算到目標所在的坐標系統(tǒng),經過圖像算法處理,就能得實際的物坐標系結果,即標志板平面上的二維坐標值,得到運動變形量是以儀器架設為基點的數值。測量參數設置、實施及測量數據的獲取可在遠處數據處理平臺上的數據軟件中進行操作處理,可直接獲取實時測量數據及變形曲線。
六、工程實測數據
該樓位于廣州市一住宅小高層,地下為一層地下室,地上為21層,標準層層高為3.3m,結構體系采用框架-剪力墻結構,該工程按7度抗震烈度設防。測量點選在20層一陽臺柱子處,高度為70m。自然條件非常適合測量,對測點進行了2分鐘左右的同步動態(tài)測量,對數據進行分析處理,得到測點的側移,換算出頻譜圖。測量得到X、Y方向的位移值和功率譜如下:
圖6-1O點X方向位移時程曲線
圖6-2O點X方向功率譜
圖6-3O點Y方向位移時程曲線
圖6-4O點Y方向位移功率譜圖
七、結論
這套數字圖像測量系統(tǒng)實現了對高層結構的水平位移的實時測量,并得到測量數據結果,測量過程完全可實現數據獲取自動化、圖表和結果輸出的可視化。隨著測量系統(tǒng)的進一步完善,其在結構健康監(jiān)測領域中應用將更加廣泛參考文獻。
參考文獻:
[1] 張祖勛,張劍清.數字攝影測量學[M ].武漢:武漢測繪科技大學出版社,1997.
[2] 梁菲.近景攝影測量在橋梁變形監(jiān)測中的應用,重慶交通大學,碩士學位論文,2010
[3] 于承新,滕永彪等.數字攝影與計算機技術在實時監(jiān)測結構變形中的應用。濟南大學學報(自然科學版),2001,3(15):232-234
[5] 于起峰,尚洋.攝像測量學原理與應用研究[M].北京:科學出版社,2009.
篇5
關鍵詞:DCT;數字圖像水??;離散余弦;魯棒性
中圖分類號:TP309
1 數字水印技術研究的意義
由于科學技術的發(fā)展,很多的數字化產品易于加工,非法的復制和拷貝也比較容易,這樣嚴重損壞了數字產品的完整性以及數字產品作者的版權。為了解決這一問題,因而提出了數字水印技術。
數字水印技術,從1993年Caronni正式提出數字水印到現在,無論國內還是國外對數字水印的研究都引起了人們的關注。在國外方面,由于有大公司的介入和美國軍方及財政部的支持,雖然在數字水印方面的研究剛起步不久,但該技術研究的發(fā)展速度非常快。1998年以來,《IEEE圖像處理》、《IEEE會報》、《IEEE通信選題》、《IEEE消費電子學》等許多國際重要期刊都組織了數字水印的技術??驅n}新聞報道,SPIE和IEEE的一些重要國際會議也開辟了相關的專題。IBM公司、日立公司、NEC公司、Pioneer電子公司和Sony公司等五家公司還宣布聯合研究基于信息隱藏的電子水印。國內方面,我國的數字水印技術,也已經取得了一定的研究成果,而且從學術領域的研究成果來看,我國的研究與世界水平相差的并不遠,并且有自己的獨特研究思路。
數字水印的主要用途可以分為以下幾類:(1)版權標識水印。數字水印將各種信息放在各種需要保護的數字產品中,即使經過噪聲干擾、濾波、剪切、壓縮、旋轉等攻擊,水印仍可以繼續(xù)存在。例如Adobe公司在其著名的PS軟件Corel Draw圖像處理軟件中集成了Digimarc公司的數字水印插件。(2)篡改提示水印。檢測數字產品是否被修改、偽造等的處理的過程。(3)隱蔽標識水印。在一些數字產品中,可以將數字水印嵌入作一些隱式注釋。(4)票據防偽水印。隨著現代各種先進輸出設備的發(fā)展,使得各種票據的偽造變得更加容易,數字水印技術可以增加偽造的難度。因此,研究數字技術非常有必要性。
2 基于DCT數字圖像水印技術的研究
2.1 數字水印的概念
數字水印技術是指用信號處理的方法在多媒體數據中嵌入某些能證明版權歸屬或跟蹤侵權行為的隱蔽的信息,這些信息通常是不可見的,不容易被人的知覺系統(tǒng)覺察或注意到,這些隱藏在多媒體內容中的信息只有通過專用的監(jiān)測器或閱讀器才能提取。通過這些隱藏在多媒體內容中的信息,可以達到確認內容創(chuàng)建者,購買者或判斷內容是否真實完整的目的。水印系統(tǒng)所隱藏的信息總是與被保護的數字對象或它的所有者有關。
2.2 DCT數字圖像水印的基本理論
其中圖像二維DCT變換(M取8或16)有許多優(yōu)點:
圖像信號經過變換后,變換系數幾乎不相關,經過反變換重構圖像信道誤差和量化誤差將像隨機噪聲一樣分散到塊中的各個像素中去,不會造成誤差累積,并且變換能將數據塊中的能量壓縮到為數不多的部分低頻系數中去(即DCT矩陣的左上角)。對于給定圖像f(m,n)存在兩種DCT變換方法:一種是把圖像f(m,n)看成一個二維矩陣直接對其進行DCT變換,然后嵌入水印,Cox[3]采用此種方法;另一種方法是與JPEG壓縮標準相統(tǒng)一,先把圖像分成8*8的不同小塊,再分別對每一塊進行DCT變換,進而嵌入水印,本文采用后一種方法嵌入水印。
一般數字水印應具有如下的特征:無論經過怎樣復雜的操作處理,通過水印算法仍能檢測到數字水印作品中的水印能力。即所謂的穩(wěn)健性;通過水印算法,嵌入水印后不能最終導致圖像的質量在視覺上發(fā)生明顯變化,即視覺的不可感知性;通過數字水印算法能夠抵御非授權人的攻擊,同時檢測可以檢測到水印的概率,具有較高的安全性及有效性。
3 基于DCT的數字圖像水印算法系統(tǒng)的設計與實現
3.1 MATLAB軟件的介紹
MATLAB是目前最強大的編程工具之一,本文將利用MATLAB7.0軟件進行基于DCT的數字水印算法的系統(tǒng)的設計和實現。
MATLAB語言簡潔緊湊,庫函數豐富,程序書寫形式自由,運算符豐富,使用方便靈活。MATLAB具有結構化的面向對象編程的特性,可移植性好,且具有較強的圖形編輯界面和功能強大的工具箱。同時,MATLAB中的源程序具有開放性,可以通過對其的修改使其變成新的程序。不足之處是,MATLAB的程序執(zhí)行速度較慢。利用MATLAB研究數字水印技術集成了DCT等函數,方便了研究人員編寫源程序,易實現。使用了MATLAB中很多的工具箱。
3.2 基于DCT的數字圖像水印算法系統(tǒng)的設計與實現
3.2.1 需求分析
離散余弦變換(Discrete Cosine Transform)簡稱DCT,基于DCT域的數字水印算法,可以分為兩大類,一類是直接對整幅圖像進行DCT整體計算,然后嵌入水印。另一類是先將整幅圖像分成塊,對每一塊分別進行DCT計算,最后再嵌入水印。由于分塊DCT計算速度比整體DCT計算速度快得多,因此目前DCT域的水印方法大多數是采用的分塊DCT方法。
基于DCT的數字圖像水印算法系統(tǒng)的設計與實現,可以提供用戶一個良好的交互手段,用戶可以利用本系統(tǒng)進行水印的嵌入、提取、攻擊等,本系統(tǒng)的可交互的,可視化的特點為用戶研究基于DCT的數字圖像水印算法提供了方便。
3.2.2 系統(tǒng)功能模塊設計
(1)水印生成。通常是通過偽隨機數發(fā)生器或混沌系統(tǒng)來產生水印信號,通常需要對水印進行預處理來適應水印嵌入算法。
(2)水印嵌入。水印嵌入的準則常用的有三種,分別為加法準則、乘法準則、加法乘法混合準則,混合準則近年來引起了人們的廣泛關注。
(3)水印提取。指水印被提取出來的過程。
(4)水印檢測。水印檢測是指判斷數字產品中是否存在水印的過程。
3.2.3 系統(tǒng)實現
一個完整水印系統(tǒng)的設計通常包括水印的生成、嵌入、提取和檢測四個部分。
通過選取實驗圖片,點擊導入圖片,然后進行水印的嵌入,再對嵌入水印的圖片進行高斯噪聲、濾波、剪切、旋轉等攻擊實驗后,可以繼續(xù)提取水印,進行水印信號的檢測。
(1)嵌入水印的過程。論文采用的是分塊DCT算法,水印嵌入步驟如下:
1)將灰度宿主圖像分成互不覆蓋的8×8的塊,然后對每一塊都進行DCT變換,得到與宿主圖像相同尺寸的DCT域;
2)我們用密鑰生成長度為NW的Gaussian白噪聲作為水印信號:W~N(0,1);
3)將每個8×8的DCT系數矩陣從每一塊的中頻段取出((64×Nw)/(M×N))個系數CK(i,j),k=1,2,…Bnum;
4)根據公式W′=W(1+alfa*mark)嵌入水印,其中alfa為尺度因子,mark為水印信息,W為原圖象的分塊DCT系數。
5)用得到的新的DCT系數對原來位置的DCT系數進行置換。
6)對新的DCT系數矩陣進行DCT反變換,得到了嵌入水印信號后的圖像。
4 結束語
本論文是在應用了MATLAB7.0軟件,設計和實現了完整的數字圖像水印處理系統(tǒng),包括水印的嵌入、提取與驗證過程。所提出的方案均在該系統(tǒng)中進行了驗證。
數字水印技術的發(fā)展時間雖然不長,但其在版權保護、內容的完整性以及認證方面都做出了一定的貢獻。未來,數字水印在知識產權的保護、內容認證等方面會有一個更好的應用前景。我們應該抓住信息時代對于數字版權保護的迫切需求,開發(fā)出自己的水印產品。
參考文獻:
[1]孫銳,孫洪,姚天任.多媒體水印技術的研究進展與應用[J].系統(tǒng)工程與電子技術,2003,25(6):772-776.
[2]王丙錫,陳琦,鄧峰森.數字水印技術[M].西安:西安電子科技大學出版社,2003.
[3]余成波,楊菁,楊如民,周登義.數字信號處理及MATLAB實現[M].北京:清華大學出版社,2005.
[4]王家文,李仰軍.MATLAB7.0圖形圖像處理[M].北京:國防工業(yè)出版社,2006.
[5]張問銀,梁永全.基于DCT的一種數字圖像水印策略[J].山東:山東科技大學學報,2002.
[6]肖力.一種基于DCT域的數字水印的實現[J].鄂州大學學報,2005.
[7]Rafael C.Gonzalez,Richad E.Woods.阮秋琦,阮宇智譯.數字圖像處理[M].北京:電子工業(yè)出版社,2003.
[8]耿永軍,朱雪芹.基于離散余弦變換的數字水印算法[J].鄭州大學學報,2005.
[9]M.jiang,Z.jiang.A New Searchless Fractal Image Encoding Method Based on Wavelet Decomposition.Proceedings of the 6th World Congress on Intelligent Control and automatiaon,(2006):83-86.
篇6
關鍵詞:隸屬度函數 直方圖統(tǒng)計量 圖像增強
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2015)09-0000-00
1 引言
數字圖像增強的主要目的就是采用某種技術手段,要改善圖像的視覺效果,將圖像轉化為更適合于人眼觀察和機器分析的形式,以便從圖像中獲取更有用的信息。根據圖像增強技術處理過程所在的空間不同,可分為基于空域的算法和基于頻域的算法兩大類?;诳沼虻乃惴ㄌ幚頃r直接對圖像灰度級做運算,基于頻域的算法是在圖像的某種變換域內對圖像的變換系數值進行某種修正。本文基于空域的運算,設計一種直方圖統(tǒng)計量與模糊集合結合的算法。
模糊集合的概念首次提出于1965年美國加利福尼亞大學扎德教授發(fā)表的論文。模糊數學在短短三十多年的時間里已取得了迅速的發(fā)展,并日益顯示其理論價值和應用價值。尤其在信息處理方面,由于涉及到大量的模糊因素和模糊信息處理問題,模糊數學作為描述和處理具有不確定性的現象和事物的一種數學手段 ,已成功應用于自動控制、圖像處理、模式識別、機器視覺等領域。近年來,不少學者致力于把模糊集理論引入圖像處理和識別技術的研究中,已取得了顯著成果;且實驗表明:基于模糊集理論的處理和識別技術,在某些場合應用效果比傳統(tǒng)方法更好。
2 基于直方圖統(tǒng)計及模糊集合的圖像增強算法
2.1 預備知識
80年代中期,Pal等提出了一種圖像邊緣檢測模糊算法(簡稱 Pal算法),首次將模糊集理論引入到圖像的邊緣檢測算法中。其具體做法是:第一步,利用模糊集理論將圖像從灰度數據空間轉換為模糊空間,即把圖像看成一個模糊點集陣列。一個 , 具有級灰度 的二維圖像可表示為:
其中 表示圖像象素 具有某種性質的程度為 ,規(guī)定 (當 時表示不具有該性質,當 表示絕對地具有該性質),稱函數 為該性質的隸屬度函數。Pal采用下式作為隸屬度函數:
式中 分別稱為指數型和倒數型模糊因子。完成了待處理圖像到模糊矩陣的映射后,第二步是在模糊空間中通過模糊增強算子對圖像做模糊增強處理,以增強邊緣兩側象素灰度的對比度,減少圖像灰度層次;第三步,將處理結果由模糊空間變換回數據空間,并提取邊界。Pal算法的處理效果明顯優(yōu)于傳統(tǒng)方法,但該算法在將圖像由灰度數據空間轉換為模糊空間時,采用復雜的冪函數作為模糊隸屬度函數,存在著運算量大、耗時多的缺點。因此,目前對算法的改進應集中在研究如何選取新的、簡單的模糊隸屬度函數來實現灰度空間到模糊空間的合理轉換,以及設計效果更佳的模糊增強算子和快速實現模糊增強過程的方法,以簡化計算、提高速度。
因而,構造隸屬度函數是用模糊方法處理圖像的關鍵一步,我們將結合圖像的直方圖統(tǒng)計量進行構造。
設 為一個 ,灰度級為 的數字圖像,將 的直方圖從0到 排列,分別計算出上四分位數 ,中位數 ,下四分位數 ,并記 表示為四分位距。由統(tǒng)計學知識,處于 及 之間的點稱為正常用點,這個區(qū)域之外的點稱為異常值。我會將利用這些統(tǒng)計量構造隸屬度函數。
2.2 算法
Step1: 統(tǒng)計原始圖像直方圖的相關的統(tǒng)計量。引入兩個變量作為暗、亮的臨界值,稱為暗區(qū)上限和亮區(qū)下限,分別記以:
(1)
基中 、 分別表示圖像 的最小像素和最大像素。在step2中我們將對這兩個變量加以說明。
Step2:根據模糊法則。設計出隸屬度函數,我們用如下規(guī)則說明了灰度級圖像對比增強的過程:
(2)
此IF-THEN規(guī)則描述了圖像增強的總體思路,它們的條件是確定項,結論是模糊項,我們必須用合適的隸屬度函數來表示暗、灰和亮這些概念。為此,我們需要確立一個隸屬度函數,從而來判斷一個像素對于三個條件的隸屬度。我們將用 、 和 分別表示暗隸屬度、灰隸屬度和明隸屬度。實際上,隸屬度函數的確定是很復雜的,正如Pal所構造的函數計算太大,這里我們則盡量想得簡單一點。首先,一個像素 若小于 時,則由定義 小于等于 或 。對于前者,由統(tǒng)計學知識可知 是奇異點,即已經處于暗區(qū)(甚至更暗)的范圍;對于后者,則說明 為圖像 中像素最低的值。由 定義的規(guī)則,其隸屬度函數必需滿足:在低于 的時候域隸屬度為1,在灰度越過某一個值(我們取定這個值為 )之后,其隸屬度為0,介于這兩個值之間,我們進行二次函數插值。因而,我們確定了 規(guī)則的隸屬度函數 。其次,一個像素如果處于圖像中所有像素的中位數,則這個像素的灰度級對于 的隸屬度為1,即 ,處于這個值的前后,我們進行線性插值,并由 規(guī)定,當處于區(qū)間 之外時,得到其隸屬度為0。從而,我們確定了 。 的構造的原理與 是相仿。
根據以上討論,我們所確定的隸屬度函數如下所示:
(3)
(4)
(5)
Step3:根據隸屬函數變換圖像。我們沿襲《Digital Image Processing》中的方法,將隸屬函數加權平均,得到如下變換:
(6)
其中 分別表示暗、灰、亮的灰度值,我們可以采用最小灰度值、灰度級中值及最大灰度值代入。
經過上面三個步驟,原圖像將“智能”地增強可視效果。我們將在下面的實驗中行到驗證。
3 實驗與小結
下面以Matlab自帶的圖片pout.tif為例進行實驗。為了方便分析該算法的特點,我們將其與傳統(tǒng)的直方圖均衡化做比較。
Step1:求得 , , ,從而 , ;Step2:將上述結果代入(3)-(5)式,得到隸屬度函數 、 、 ;Step3:由于圖片灰度級 為,因而可取 ,將其代入(6)式,得到最終的圖像變換。利用Matlab編程最終得到如圖1圖像及對應的直方圖:
圖1 實驗結果及其直方圖
從圖1 直方圖及圖像表現可知:原圖像主要集中在灰色區(qū)域,因而需要增強對比度。對該類型的圖像對比度增強,傳統(tǒng)的算法是直方圖均衡化(在Matlab中有相應的命令histeq()可進行操作)。直方圖均衡化具有運算快速、自動化等優(yōu)點,均衡化的結果是直方圖得到最大程度的“分散”,但它的不足是信息量的減少。圖像的信息量是用信息熵反映的,其計算由下面公式給出:
其中 表示第 個灰度級在圖像中出現的頻率。通過實驗,我們可以得出新算法的優(yōu)勢:
(1)直方圖均衡化是對圖像直方圖進行“平均”,使其畫片各灰度值分布“均勻”,而本算法不僅增強了圖像的對比度,而且這種增強是“模糊智能”的:當圖像暗區(qū)較大(曝光不足)時, 主導發(fā)生抑制作用,使圖像趨于亮;當圖像亮區(qū)較大(曝光過足)時, 主導發(fā)生抑制作用,使圖像趨于暗;當圖像灰區(qū)較大(對比度不足)時, 主導發(fā)生抑制作用,使圖像趨于兩端(正如本實驗所示結果)。
(2)均衡化將失去部分細節(jié),而新算法對信息熵基本保持。對比兩種算法的信息熵表1所示:
表1 對比兩種算法的信息熵
算法 原圖 均衡化 本文算法
信息熵 3.9925 3.7840 3.9921
(3)均衡過的圖像雖然也增強了對比圖,但直方圖的特征發(fā)生了變化。對于本算法,從灰度直方圖來看,處理后的圖像的直方圖的動態(tài)范圍得到了擴展,所得的圖像也比原圖更加的明亮清晰,圖片的一些細節(jié)處理的較為妥當,并且最重要的是,保留了原圖像直方圖的相同的基本特征。
(4)從處理速度上看,該算法自動化,且運算速度較快。傳統(tǒng)的模糊圖像處理的計算量較大,當處理速度和圖像吞吐量是重點考慮的問題時,該模糊算法的體現這一優(yōu)越性。
參考文獻
[1] 岡薩雷斯.數字圖像處理[M].北京:電子工業(yè)出版社,2003.
[2] 王家文,李仰軍.MATLAB7.0圖形圖像處理[M].北京:國防工業(yè)出版社,2003.
[3] 李開端,李樹軍.基于直方圖統(tǒng)計學的圖像增強算法研究[J].科學技術與工程,2011(8).
[4] 吳薇.圖像處理中的模糊技術[J].現代電子技術,2010(3).
[5] 林海濤.基于模糊關聯集合的圖像去噪方法[J].軟件導刊,2014(8)
收稿日期:2015-08-28
篇7
關鍵詞:圖像超分辨率;頻域;空域;學習
中圖分類號:TP391
由于超分辨率重構技術是采用軟件方法來提高圖像的空間分辨率,而不需要更換原有的成像設備,使它成為一種有效而又經濟的提高圖像分辨率的方法。自開始提出到現在,已具有廣泛的應用領域,如在計算機視覺、衛(wèi)星圖像中軍事目標識別、視頻監(jiān)控系統(tǒng)、生物醫(yī)學圖像處理和視頻壓縮、民用安防等領域中具有重要的實際應用價值,近年來得到許多學者廣泛的關注。
國外超分辨率圖像重構研究較為活躍,國內對于超分辨率重建構的研究近年來也逐步引起重視,但主要是對國外超分辨率方法的改進及部分領域的應用,如汪雪林等[1]提出了基于小波域局部高斯模型的圖像超分辨率算法;姚振杰等提出一種用于車牌識別的圖像超分辨算法[2]等。
1 圖像超分辨率重構算法分類
目前,單幀圖像的超分辨率研究較少,而多幀圖像比單幀圖像所含的可利用的信息量大,已經成為目前研究的熱點。其重構按實現的具體方法主要可分為頻域算法和空域算法
1.1 基于頻域的超分辨率重構算法
頻域方法是在變換域中解決圖像的插值問題,1984年,Tsai和Huang[3]開創(chuàng)性地提出一種基于Fourier變換域的對多幀衛(wèi)星圖像進行超分辨率重構的算法,從本質上解決了高分辨率圖像重構無唯一解的問題。Kaltenbacher和Hardie[4]在Tsai的基礎上提出一種估計圖像整體平移參數的計算方法,在計算整體平移方面的性能比Tsai的方法更為有效。郝鵬威[5]給出了多次欠采樣圖像在頻域混疊的更一般的公式,這一改進具有很強的抗噪能力和收斂性。隨后還出現了許多改進算法,但都是基于整體平移運動模型。
頻域算法受限于傅立葉變換理論,難以包含先驗信息,圖像的運動只能是整體平移運動,而且觀測模型也不能隨意改變,因此頻域算法的發(fā)展受到了極大地限制。
1.2 基于空域的超分辨率重構算法
空域算法是對影響低分辨率圖像成像效果的空域因素(如光學模糊、運動模糊)進行數學建模??沼蛩惴梢园鼮殪`活的觀測模型和先驗知識,更接近于實際應用領域。
(1)基于插值的方法——非均勻采樣插值算法
非均勻采樣值算法首先是對多幀低分辨率圖像進行運動估計,即圖像配準。將配準后的低分辨率像素投放到高分辨率柵格上,低分辨率像素在高分辨率網格中是非均勻分布的無序采樣值,對這些采樣值進行內插,即可得到高分辨率像素值。
非均勻采樣值算法優(yōu)點是算法快速易行,基本可以滿足實時要求,但因為不能引入更多有用的高頻信息,沒有充分的使用先驗知識,降質模型有限,所以無法重構出好的高分辨率圖像。
(2)迭代反投影(IBP)算法
Irani和Peleg[6]提出了迭代反向投影法。其基本思想是先估計出一幀高分辨率圖像,并將此高分辨率圖像代入到觀測模型;然后經過一系列的降質過程生成低分辨率圖像,計算出與輸入的低分辨率圖像之間的差值并投影到高分辨率圖像上,同時根據差值不斷更新當前輸出圖像;再經過多次迭代,誤差得到收斂,便可得到相應的高分辨率圖像。
IBP算法運算量小,收斂速度較快,不足點是重構結果不唯一,且與凸集投影(POCS)算法比較,難以包含先驗知識,實際應用較少。
(3)集合論的方法——凸集投影(POCS)算法
POCS算法最早是Stark[7]從集合投影理論出發(fā)提出的超分辨率重構算法,它利用有效的空間觀測模型,將成像系統(tǒng)每個先驗信息視為對圖像重構的結果的一個約束條件,加入這些先驗信息,在這些信息的交集內得到一個可行解。POCS算法也是一個迭代過程,只需給定高分辨率圖像空間上的任意一點,通過把初始估計迭影到每個凸集 ,最終得到一個能夠滿足所有集合的解,即重構的高分辨率圖像。早在90年代,國外就將POCS算法應用到生物醫(yī)學圖像和視頻序列的超分辨率重構模型,并取得了較好的重構效果。
POCS算法可以很便利的加入先驗知識,具有較好的圖像邊緣及細節(jié)保持能力,應用較廣泛,但是它的解不唯一,收斂速度較慢且不穩(wěn)定。
(4)統(tǒng)計學方法——最大后驗概率(MAP)算法
統(tǒng)計學算法是把高分辨率圖像和低分率圖像之間的運動都看成是隨機的變量。MAP算法中的先驗模型非常重要,大多數MAP算法的差別就在于先驗模型的選擇。如高斯馬爾科夫隨機場(GMRF)有很多優(yōu)點,但是用這種方法進行超分辨率重構得到的結果過度平滑,邊緣得不到銳化;胡貝爾隨機場(HMRF)可以分段平滑,能很好地保持邊緣等?;谶@些原理,Jin Chen[8]提出了基于GMRF的視頻超分辨率重構;Hefnawy等[9]將正則化的MAP算法應用到核磁共振成像上。
最大后驗概率算法優(yōu)勢在于可以在解中直接加入先驗約束、能確保解的唯一性、降噪能力強和收斂穩(wěn)定性高等,但是收斂慢、運算量大。另外,MAP算法的邊緣保持能力不如POCS算法好,所獲得的高分辨率圖像上的細節(jié)容易被平滑掉。
(5)混合MAP/POCS算法
容易發(fā)現,POCS算法與MAP算法可以彌補彼此的缺點,繼而出現了MAP/POCS算法。其算法本質是在MAP算法的迭代優(yōu)化過程中加入一些先驗知識,這樣可以把全部先驗知識有效地結合起來,并且確保唯一解。理論證明,采用梯度下降最優(yōu)化算法能保證收斂到全局最優(yōu)解?;旌螾OCS/MAP算法在視頻壓縮方面應用較多。
混合MAP/POCS算法結合了各自算法的優(yōu)點,充分利用先驗信息,收斂性和穩(wěn)定性也比較好,是目前重構算法較為理想的算法。
(6)自適應濾波算法
Elad和Feuer[10]把自適應濾波理論用于超分辨率重構。他們[11]還把R-SD和R-LMS算法近似地看作是Kat-rnan濾波,對兩者的性能進行了分析,得出兩種算法的實用性。自適應濾波方法的缺點是最優(yōu)濾波方法不能包含先驗知識,而且該方法不能包含非線性先驗知識。
(7)其他算法
除上面介紹的較為成熟的算法外,還有一些算法在近幾年也備受關注。如將規(guī)整化算法改進應用到了彩色圖象,取得了很好的重構效果[12];小波算法也應用到了視頻超分辨率[13,14]、醫(yī)學核磁共振成像[15]等領域;基于偏微分方程的超分辨率重構算法[16,17]等也在一些領域得到很好地應用。
1.3 基于學習的重構算法
基于學習的超分辨算法目的在于從低頻和中頻分量信息中恢復高頻信息。與前面頻域和空域算法相比,基于學習的重構算法更注重對圖像的內容和結構的把握,它充分利用與圖像本身相關的先驗知識,在不增加輸入圖像樣本數量的情況下,提供更強的約束并產生新的高頻細節(jié),從而獲得更好的重構效果。但是,基于學習的重構算法也有一定的局限性。這種算法所使用的樣本圖像對放大倍數都是固定的,在實際情況下能達到的放大倍數有限,且基于學習的重構算法的性能訓練樣本庫有極大的依賴性,然而目前還沒有相關理論指導樣本的選擇。
2 結束與展望
全文對超分辨率圖像重構算法做了簡單分類與比較,系統(tǒng)地分析了超分辨率圖像重構算法。目前,超分辨率重構技術在理論和實際應用中都具有重大的意義,因而對超分辨率重構技術的要求越來越高。學者們將不斷地迎接新的問題與挑戰(zhàn),如亞像素配準精確性、算法效率的提高、任意倍數的重構以及應用領域的擴展等,這些方面都是未來研究的重點和難點。
參考文獻:
[1]汪雪林,文偉,彭思龍,基于小波域局部高斯模型的圖像超分辨率[J].中國圖象圖形學報,2004.
[2]姚振杰,易衛(wèi)東.一種用于車牌識別的超分辨率算法[J].中國科學院研究生院學報,2013.
[3]R.Y.Tsai and T.S.Huang.Multipleframe image restoration and puter Vision and Image Processing,1984:317-339.
[4]Irani M,Peleg S.Motion analysis for image enhancement.resolution,conclusion,and transparency[J].Journal of Visual Communication and Image Representation,1993,4(4):324-336.
[5]郝鵬威,數字圖像空間分辨率改善的方法研究[D].中國科學院遙感應用研究所博士學位論文,1997,9.
[6]Irani M,Peleg S.Improving resolution by image registration.GraphicalModels and Image Proc,1991,53(1):231-239.
[7]Stark H,Oskoui P.High-resolution image recovery from image-plane arrays,Using convex projection[J].Journal of the Optical Society of America,1989,6(11):1715-1726.2012,849-852
[8]Jin Chen,Nunez-Yanez J Achim,A.Video Super-Resolution Using Generalized Gaussian Markov Random Fields.IEEE Signal Processing Society,2012:63-66.
[9]AA Hefnawy.An efficient super-resolution approach for obtaining isotropic 3-D imaging using 2-D multi-slice MRI,Egyptian Informatics Journal,2013.
[10]Elad M,Feuer.Super-resolution restoration of an image Sequence:adaptive filtering appmach[J].IEEE Trans.Image Processing,1999,8(3):387-395.
[11]Elad M.Feuer Super-resolution reconstruction of image sequences[J].IEEE Trans.Pattern Analysis&Machine Intelligence,1999,21(9):817-834.
[12]S.Farsiu,M.Elad,P.Milanfar.Multiframe Demosicing and Super-resolution of color Image.IEEE Trans.Signal Processing,2006,15:141-159.
[13]Chang-Ming Lee,Chien-Jung Lee,Chia-Yung Hsieh,Wen-Nung Lie.Super-resolution reconstruction of video sequences based on wavelet-domain spatial and temporal processing.IEEE,Pattern Recognition (ICPR),2012:194-197.
[14]S.Izadpanahi,H.Demirel.Motion based video super resolution using edge directed interpolation and complex wavelet transform.Signal Processing,2013.
[15]Islam,R.Lambert,A.J.Pickering,M.R.Super resolution OF 3D MRI images using a Gaussian scale mixture model constraint.IEEE,Acoustics,Speech and Signal Processing,2012:849-852.
[16]Shuying Huang,Yong Yang,Guoyu Wang.An Improved PDE Based Super-Resolution Reconstruction Algorithm.Procedia Engineering,2012,29:2838-2842.
[17]Niang O,Thioune A,Gueirea M.C.E,Delechelle E.Partial Differential Equation-Based Approach for Empirical Mode Decomposition:Application on Image Analsis.IEEE Trans,Image Processing,2012,21:3391-4001.
作者簡介:孫小霞(1987-),女,安徽蕪湖人,研究生,主要研究方向為:數字圖像處理;王彥欽,男,博士,研究方向:細微加工,為納光學和表面等離子體等;羅先剛,男,博士生導師,研究方向:細微加工,為納光學和表面等離子體等;汪慧蘭(1978-),女(通訊作者),副教授,研究方向:數字圖像處理。
篇8
中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2012)12-2882-04
Threshold Citrusimage Segmentation Research and Analysis
WANG Jun, ZHOU Li-juan
(Collegeof Information Science and Technology, Hunan Agricultural University, Changsha 410128, China)
Abstract:Image segmentation is an important and primary problem in the field of computer vision. The thesis puts forward a full set of cit? rus image segmentation algorithm, which adopts improved genetic algorithm combining with improved threshold method. The thesis, through simulation experiment, brings forward threshold scope which is more stable, and makes the image segmentation edges more dedi? cated.
Key words: navel orange; threshold segmentation; classes distance; improved genetic algorithm
圖像分割是計算機視覺領域的一個重要而且基本的問題。它在農產品無損檢測方面得到了廣泛的應用。圖像分割算法好壞會直接影響檢測系統(tǒng)的準確度。它是從圖像處理到圖像分析的一個關鍵步驟。對它的研究一直都是圖像技術研究中的熱點和焦點之一。但由于圖像的特殊性,針對具體圖像,針對具體問題,分割算法就不一樣,至今還沒有找到通用的分割理論,也沒有找到對所有圖像都適合的通用分割算法。
近幾年來,基于遺傳算法的圖像分割方法得到了很多學者的研究。由于遺傳算法在搜索方面具有很強的優(yōu)勢,而圖像分割的實質是在眾多的參量中去尋找一個最優(yōu)參量,以此作為分隔的依據。于是如果在圖像分割中引入遺傳算法去求取最佳閾值,將會大大提高分割效率。
本論文重點對基于傳統(tǒng)遺傳算法的圖像分割算法進行了比較系統(tǒng)的研究。針對傳統(tǒng)遺傳算法的不足,提出了一些改進措施,并且設計新的閾值確定方法——類類距離法,將兩者結合共同運用到臍橙圖像分割中,得到了比較好的效果。在最大程度上避免基本遺傳算法收斂性差,容易早熟等問題。
1臍橙圖像分割
對于臍橙出產大省湖南省,每年臍橙收獲完后的分類,分等級進行銷售是一項工作量龐大的任務。臍橙表面破損自動檢測系統(tǒng)就是基于計算機視覺技術研發(fā)而成,其檢測的精度較人工挑選有很大提高。該系統(tǒng)中臍橙圖像分割算法好壞會直接影響系統(tǒng)檢測臍橙表面是否破損的準確度。
通過特定裝置獲得比較清晰的彩色臍橙圖像后,對于表面有破損的臍橙,要進行篩選清理。進行破損部分比對前,要對彩色臍橙圖像先進行分割處理。把整幅圖像分成臍橙和背景兩部分,再提取臍橙部分的圖像進行破損分析。這要求將臍橙的邊緣和破損部分處理得非常清晰,最大可能的避免將破損區(qū)域誤分割成圖像背景。
2改進的遺傳算法
2.1控制參數改進
在遺傳算法中,直接影響到算法的收斂性的關鍵參數是:交叉概率與變異概率,它們的選取會影響到算法行為和性能。在適應度值變換的情況下將交叉概率與變異概率隨之調整,以達到保證算法收斂性的目的。于是我們對交叉概率和變異概率按照如下公式進行自動調整:
圖5本文提出的算法分割效果圖
從表1,圖2至圖5可以得出以下結論:
1)臍橙圖像利用遺傳算法來分割,每次運行所得閾值都在變化,但變化的范圍不是很大,只是在一定區(qū)域做細微波動。這種情況是正常的,也是完全可以接受的,其原因是由于遺傳算法隨機生產初始種群,這種隨機性就帶來了閾值的波動性。這也是遺傳算法不穩(wěn)定性的體現。但從表中數據看出采用本文所設計的改進的遺傳算法,即交叉概率和變異概率隨適應度自動調整,那么分割的圖像所得到的閾值,其波動會限制在一個很小的范圍以內(穩(wěn)定在4個像素以內,閾值最大為60,最小為57),這樣既保持了群體多樣性,又保證了遺傳算法的收斂性。同時其穩(wěn)定性也明顯地優(yōu)于其他算法。
2)利用本文所設計的類類距離遺傳算法進行圖像分割可以極大減少閾值計算時間,平均運算時間比起其他幾個常用方法都縮短了不少,平均僅在2.3s左右。在進化代數相同的條件下,本論文提出的圖像分割算法較其他算法更有優(yōu)勢,收斂速度更快。
3)從圖2至圖5這幾個圖像分割結果圖來看,本文所設計的分割方法中對臍橙圖像中的破損部分,邊緣輪廓等細節(jié)都有非常好的體現,可見結合遺傳算法和類類距離法所設計出的圖像分割新算法比其他常用算法有很大的優(yōu)勢。
本文通過改變的遺傳控制參數結合類類距離法,把改進后的遺傳算法應用到臍橙圖像分割中去。仿真實驗結果表明,此圖像分割算法由于所設計的尋找最優(yōu)閾值的方案比較合理,閾值的計算時間縮短了,使得最終圖像分割所用時間明顯減少了。同時此方法還做到了將閾值范圍穩(wěn)定在4個像素以內,大大提高了算法全局收斂的穩(wěn)定性。而且從視覺角度來看,其分割效果更明顯,圖像邊緣處理很細致、清晰。實驗證明本論文設計的算法分割圖像不僅快速準確,而且還能滿足各種圖像的實時處理、分析的需求。具有較高的通用性和實用性。
[1]姚敏.數字圖像處理[M].北京:機械工業(yè)出版社,2006.
[2]孫艷歌,邵罕.基于改進遺傳算法的最優(yōu)閾值圖像分割算法[J].信息系統(tǒng)工程,2010,10(6),26-27.
[3]童小念,劉娜.一種基于遺傳算法的最優(yōu)閾值圖像分割算法[J].武漢理工大學學報:交通科學與工程版,2008,32(02),301-304.
[4]王強.圖像分割中閾值的選取研究及算法實現[J].計算機與現代化.2006(10).54-56.
[5]左奇,史忠科.基于模糊理論的圖像分割方法[J].西北工業(yè)大學學報,2003,(03):313-316.
[6]勞麗,吳效明,朱學峰.模糊集理論在圖像分割中的應用綜述[J].中國體視學與圖像分析,2006,11(3):200-205.
[7]曹芳,吳迪.基于可見-近紅外反射光譜技術的葡萄品種鑒別方法的研究[J].光學學報,2009,29(2),537-540.
篇9
本文所討論的基于遺傳算法的圖像分割算法,采用標準遺傳算法作為計算流程,但對其中的選擇算子進行了改變,用高級選擇函數select代替了傳統(tǒng)的單一選擇算子,使得在每次選擇運算后所得的父輩更為健壯,更好的保持了第一代父輩的表現型,使得分割更加精確。通過設計變異概率,使得每次迭代遺傳運算后,子代的表現型略有改變,從而更以獲得最優(yōu)的表現型(即最優(yōu)閾值),減少了迭代尋優(yōu)次數,降低了程序運行時間。同時考慮到過多迭代不利于降低程序運行時間,以及在尋優(yōu)過程中的最佳值收斂問題,指定迭代次數為50次時即跳出整個程序,通過反編碼求得最優(yōu)閾值,并通過變量調用,直接應用于下面的分割程序,達到了整個算法的自動完成。
相對于灰度直方圖雙峰法,本方法對圖像的先驗信息要求不高,不需要像灰度直方圖法那樣,先通過獲得圖像的灰度直方圖取得分割閾值后再對圖像處理,整個程序的自動化程度高,且對于那些灰度直方圖不呈雙峰分布的圖像,本算法程序一樣可以處理,這就擴大了本算法程序的靈活性,從而更具有實際意義。而且,由于灰度直方圖雙峰法的閾值是通過人眼觀察獲得,其誤差必然大于機器迭代運算所取得的最優(yōu)閾值,而普通的閾值分割法,如ostu法,雖然實現了閾值的自動選擇,但其運算時間與本算法相比偏長,實時性差于本算法。因此,在圖像分割算法中,基于遺傳算法的圖像分割算法更優(yōu)于其它傳統(tǒng)的圖像分割算法。
通過上述討論,以及兩種方法的處理結果圖片的對比,基于遺傳算法的最大類間方差法分割后圖像與直方圖雙峰法分割后的圖像像比,效果更明顯,且無須事先測量圖像的灰度直方圖,更加靈活,更加精確。
其相關試驗結論列于下表:
基于遺傳算法的圖象分割實驗結論總表:
分割方法
自動化程度
閾值
灰度直方圖
計算時間
分割結果
灰度直方圖法
無法自動完成
——
基于遺傳算法的Ostu法
高
閾值自動指定,閾值M=162,
短于普通Ostu法
普通Ostu法
高
閾值自動指定
偏長
參見參考文章[25]
參 考 文 獻
[1]張兆禮,趙春暉,梅曉丹.現代圖像處理技術及MAThAB實現.北京:人民郵電出版社,2001.1
[2]陳傳波,金先級.數字圖像處理[M].北京:機械工業(yè)出版社,2004.
[3]夏德深,傅德勝等.現代圖象處理技術與應用[M].南京:東南大學出版社,1997.
[4]章毓晉.圖象工程(上冊)圖象處理和分析.北京:清華大學出版社,1999.
[5]王小平,曹立明.遺傳算法理論、應用與軟件實現.西安:西安交大出版社,2002.
[6]徐立中,數字圖像的智能信息處理。北京:國防工業(yè)出版社,2001
[7]王耀南,李樹濤,毛建旭,計算機圖像處理與識別技術,北京:高等教育出版社,2001
[8]雷英杰,張善文,李緒武,周創(chuàng)明.MATLAB遺傳算法工具箱及應用,西安:西安電子科技大學出版社
[9]何新貴.模糊知識處理的理論與計算,國防工業(yè)出版社,1999
[10]徐建華.圖像處理與分析,北京:科學出版,1992.
[11]阮秋琦.數字圖象處理學,電子工業(yè)出版社,2001
[12]王博等.圖像平滑與邊緣檢測的模糊向量描述,小型微型計算機統(tǒng),Vol. 20(3), 1999
[13]吳謹,李娟,劉成云,基于最大熵的灰度閾值選取方法,武漢科技大學學報(自然科學版),Vol. 27, No. 1, Mar, 2004
[14]李鑒慶,左坤隆,圖像閾值選取的一種快速算法.計算機與現代化,2001年第6期
[15]魏寶剛,魯東明,潘云鶴等.多顏色空間上的互式圖像分割[J].計算機學報,2001, 24 (7):770-775
[16]杜亞勤,基于模糊集的圖像邊緣檢測技術研究:[碩士學位論文].西安:西安工業(yè)學院,2004年4月
[17]王保平,基于模糊技術的圖像處理方法研究[博士學位論文],西安:西安電子科技大學,2004, 9
[18]杜亞娟,潘泉,周德龍等,圖像多級灰度非線性模糊增強算法研究,數據采集與處Vo1.14 No.2
[19]Russ J C, The image processing handbook. New York:CRC Press,1994
[20]L A Zadeh.Fuzzy Sets[J].Information and Contro1,1965, (8):338-353
[21]Lotfi A.Zadeh,A fuzzy-set-theoretic interpretation of linguistic hedges, Journal of Cybernetic, 1972, 64(2):4-34
[22]S. K. Pal, R. A. King. Image Enhancement Using Fuzzy Sets. Electron. Let t.,1980 16 (9):376-378.
[23]S. K. PaI, R. :A. King, On Edge Detection of R-Ray Images Using Fuzzy Sets. IEEE Trans.Patt. Anal and MachineIntell.1983,PAMI-5 (1):69-77.
[24]Otsu N. A Threshold Selection Method From Gray Level Histograms. IEEE Trans on Syst Man Cybernet, 1979, SMC-9:62-66
附 錄 附錄 一
灰度直方圖雙峰法分割源代碼
clear, close all
B=imread('2.jpg');
%讀入原始jpg格式圖像
figure(1);
imshow(B),title('原始jpg格式圖像');
I1=rgb2gray(B);
%將原圖像轉化為灰度圖象
figure(2);
imshow(I1),title('灰度格式圖像');
[I1,map1]=gray2ind(I1,255);
%將灰度圖像轉化為索引圖像
figure(3), imhist(I1)
%畫出灰度直方圖,以判斷域值
I1=double(I1);
%將unit8數組轉化為double型數組
Z=I1
%將double型數組I1轉存到Z中
[m, n]=size(Z);
for i=1:m
for j=1:n
if Z(i,j)>240
%灰度值大于域值時是白色
Z(i,j)=256;
end
end
end
figure(4)
%畫出分割后目標圖像
image(Z),title('分割后圖像');colormap(map1);
圖像I圖像格式轉化及灰度直方圖雙峰法分割源代碼
clear, close all
B=imread('she.jpg');
%讀入原始jpg格式圖像she
figure(1);
imshow(B),title('原始jpg格式圖像');
I1=rgb2gray(B);
%將原圖像轉化為灰度圖象
figure(2);
imshow(I1),title('灰度格式圖像');
[I1,map1]=gray2ind(I1,255);
%將灰度圖像轉化為索引圖像
figure(3), imhist(I1)
%畫出灰度直方圖,以判斷域值
I1=double(I1);
%將unit8數組轉化為double型數組
Z=I1
%將double型數組I1轉存到Z中
[m, n]=size(Z);
for i=1:m
for j=1:n
if Z(i,j)>240
%灰度值大于域值時是白色
Z(i,j)=256;
end
end
end
figure(4)
%畫出分割后目標圖像
image(Z),title('分割后圖像');colormap(map1);
圖像II圖像格式轉化及灰度直方圖雙峰法分割源代碼
clear, close all
B=imread('she.jpg');
%讀入原始jpg格式圖像月亮
figure(1);
imshow(B),title('原始jpg格式圖像');
I1=rgb2gray(B);
%將原圖像轉化為灰度圖象
figure(2);
imshow(I1),title('灰度格式圖像');
[I1,map1]=gray2ind(I1,255);
%將灰度圖像轉化為索引圖像
figure(3), imhist(I1)
%畫出灰度直方圖,以判斷域值
I1=double(I1);
%將unit8數組轉化為double型數組
Z=I1
%將double型數組I1轉存到Z中
[m, n]=size(Z);
for i=1:m
for j=1:n
if Z(i,j)>240
%灰度值大于域值時是白色
Z(i,j)=256;
end
end
end
figure(4)
%畫出分割后目標圖像
image(Z),title('分割后圖像');colormap(map1);
附錄 二
Crtbp 函數源代碼:(由謝菲爾德大學Andrew Chipperfield編寫)
% CRTBP.m - Create an initial population%
% This function creates a binary population of given size and structure.
%
% Syntax: [Chrom Lind BaseV] = crtbp(Nind, Lind, Base)
%
% Input Parameters:
%
%
Nind
- Either a scalar containing the number of inpiduals
%
in the new population or a row vector of length two
%
containing the number of inpiduals and their length.
%
%
Lind
- A scalar containing the length of the inpidual
%
chromosomes.
%
%
Base
- A scalar containing the base of the chromosome
%
elements or a row vector containing the base(s)
%
of the loci of the chromosomes.
%
% Output Parameter
s:
%
%
Chrom
- A matrix containing the random valued chromosomes
%
row wise.
%
%
Lind - A scalar containing the length of the chromosome.
%
%
BaseV
- A row vector containing the base of the
%
chromosome loci.
% Author: Andrew Chipperfield
% Date: 19-Jan-94
function [Chrom, Lind, BaseV] = crtbp(Nind, Lind, Base)
nargs = nargin ;
% Check parameter consistency
if nargs >= 1, [mN, nN] = size(Nind) ; end
if nargs >= 2, [mL, nL] = size(Lind) ; end
if nargs == 3, [mB, nB] = size(Base) ; end
if nN == 2
if (nargs == 1)
Lind = Nind(2) ; Nind = Nind(1) ; BaseV = crtbase(Lind) ;
elseif (nargs == 2 & nL == 1)
BaseV = crtbase(Nind(2),Lind) ; Lind = Nind(2) ; Nind = Nind(1) ;
elseif (nargs == 2 & nL > 1)
if Lind ~= length(Lind), error('Lind and Base disagree'); end
BaseV = Lind ; Lind = Nind(2) ; Nind = Nind(1) ;
end
elseif nN == 1
if nargs == 2
if nL == 1, BaseV = crtbase(Lind) ;
else, BaseV = Lind ; Lind = nL ; end
elseif nargs == 3
if nB == 1, BaseV = crtbase(Lind,Base) ;
elseif nB ~= Lind, error('Lind and Base disagree') ;
else BaseV = Base ; end
end
else
error('Input parameters inconsistent') ;
end
% Create a structure of random chromosomes in row wise order, dimensions
% Nind by Lind. The base of each chromosomes loci is given by the value
% of the corresponding element of the row vector base.
Chrom = floor(rand(Nind,Lind).*BaseV(ones(Nind,1),:)) ;
% End of file
附錄 三
Bs2rv函數源代碼: (由謝菲爾德大學Andrew Chipperfield編寫)
% BS2RV.m - Binary string to real vector
%
% This function decodes binary chromosomes into vectors of reals. The
% chromosomes are seen as the concatenation of binary strings of given
% length, and decoded into real numbers in a specified interval using
% either standard binary or Gray decoding.
%
% Syntax:
Phen = bs2rv(Chrom,FieldD)
%
% Input parameters:
%
%
Chrom
- Matrix containing the chromosomes of the current
%
population. Each line corresponds to one
%
inpidual's concatenated binary string
%
representation. Leftmost bits are MSb and
%
rightmost are LSb.
%
%
FieldD - Matrix describing the length and how to decode
%
each substring in the chromosome. It has the
%
following structure:
%
%
[len;
(num)
%
lb;
(num)
%
ub;
(num)
%
code;
(0=binary
| 1=gray)
%
scale;
(0=arithmetic | 1=logarithmic)
%
lbin;
(0=excluded | 1=included)
%
ubin];
(0=excluded | 1=included)
%
%
where
%
len - row vector containing the length of
%
each substring in Chrom. sum(len)
%
should equal the inpidual length.
%
lb,
%
ub
- Lower and upper bounds for each
%
variable.
%
code - binary row vector indicating how each
%
substring is to be decoded.
%
scale - binary row vector indicating where to
%
use arithmetic and/or logarithmic
%
scaling.
%
lbin,
%
ubin - binary row vectors indicating whether
%
or not to include each bound in the
%
representation range
%
% Output parameter:
%
%
Phen
- Real matrix containing the population phenotypes.
%
% Author: Carlos Fonseca, Updated: Andrew Chipperfield
% Date: 08/06/93,
Date: 26-Jan-94
function Phen = bs2rv(Chrom,FieldD)
% Identify the population size (Nind)
%
and the chromosome length (Lind)
[Nind,Lind] = size(Chrom);
% Identify the number of decision variables (Nvar)
[seven,Nvar] = size(FieldD);
if seven ~= 7
error('FieldD must have 7 rows.');
end
% Get substring properties
len = FieldD(1,:);
lb = FieldD(2,:);
ub = FieldD(3,:);
code = ~(~FieldD(4,:));
scale = ~(~FieldD(5,:));
lin = ~(~FieldD(6,:));
uin = ~(~FieldD(7,:));
% Check substring properties for consistency
if sum(len) ~= Lind,
error('Data in FieldD must agree with chromosome length');
end
if ~all(lb(scale).*ub(scale)>0)
error('Log-scaled variables must not include 0 in their range');
end
% Decode chromosomes
Phen = zeros(Nind,Nvar);
lf = cumsum(len);
li = cumsum([1 len]);
Prec = .5 .^ len;
logsgn = sign(lb
(scale)); lb(scale) = log( abs(lb(scale)) );
ub(scale) = log( abs(ub(scale)) );
delta = ub - lb;
Prec = .5 .^ len;
num = (~lin) .* Prec;
den = (lin + uin - 1) .* Prec;
for i = 1:Nvar,
idx = li(i):lf(i);
if code(i) % Gray decoding
Chrom(:,idx)=rem(cumsum(Chrom(:,idx)')',2);
end
Phen(:,i) = Chrom(:,idx) * [ (.5).^(1:len(i))' ];
Phen(:,i) = lb(i) + delta(i) * (Phen(:,i) + num(i)) ./ (1 - den(i));
end
expand = ones(Nind,1);
if any(scale)
Phen(:,scale) = logsgn(expand,:) .* exp(Phen(:,scale));
end
附錄 四
適應度函數target源代碼:
function f=target(T,M)
%適應度函數,T為待處理圖像,M為域值序列
[U, V]=size(T);
W=, , length(M);
f=zeros(W,1);
for k=1:W
I=0;s1=0;J=0;s2=0;
%統(tǒng)計目標圖像和背景圖像的像素數及像素之和
for i=1:U
for j=1:V
if T(i,j)
s1=s1+T(i,j);I=I+1;
end
if T(i,j)>M(k)
s2=s2+T(i,j);J=J+1;
end
end
end
if I==0, p1=0; else p1=s1/I; end
if J==0, p2=0; else p2=s2/J; end
f(k)=I*J*(p1-p2)*(p1-p2)/(256*256);
end
附錄 五
選擇函數Select源代碼:(由謝菲爾德大學Hartmut Pohlheim編寫)
% SELECT.M
(universal SELECTion)
%
% This function performs universal selection. The function handles
% multiple populations and calls the low level selection function
% for the actual selection process.
%
% Syntax: SelCh = select(SEL_F, Chrom, FitnV, GGAP, SUBPOP)
%
% Input parameters:
%
SEL_F
- Name of the selection function
%
Chrom
- Matrix containing the inpiduals (parents) of the current
%
population. Each row corresponds to one inpidual.
%
FitnV
- Column vector containing the fitness values of the
%
inpiduals in the population.
%
GGAP
- (optional) Rate of inpiduals to be selected
%
if omitted 1.0 is assumed
%
SUBPOP
- (optional) Number of subpopulations
%
if omitted 1 subpopulation is assumed
%
% Output parameters:
%
SelCh
- Matrix containing the selected inpiduals.
% Author:
Hartmut Pohlheim
% History:
10.03.94
file created
function SelCh = select(SEL_F, Chrom, FitnV, GGAP, SUBPOP);
% Check parameter consistency
if nargin < 3, error('Not enough input parameter'); end
% Identify the population size (Nind)
[NindCh,Nvar] = size(Chrom);
[NindF,VarF] = size(FitnV);
if NindCh ~= NindF, error('Chrom and FitnV disagree'); end
if VarF ~= 1, error('FitnV must be a column vector'); end
if nargin < 5, SUBPOP = 1; end
if nargin > 4,
if isempty(SUBPOP), SUBPOP = 1;
elseif isnan(SUBPOP), SUBPOP = 1;
elseif length(SUBPOP) ~= 1, error('SUBPOP must be a scalar'); end
end
if (NindCh/SUBPOP) ~= fix(NindCh/SUBPOP), error('Chrom and SUBPOP disagree'); end
Nind = NindCh/SUBPOP; % Compute number of inpiduals per subpopulation
if nargin < 4, GGAP = 1; end
if nargin > 3,
if isempty(GGAP), GGAP = 1;
elseif isnan(GGAP), GGAP = 1;
elseif length(GGAP) ~= 1, error('GGAP must be a scalar');
elseif (GGAP < 0), error('GGAP must be a scalar bigger than 0'); end
end
% Compute number of new inpiduals (to select)
NSel=max(floor(Nind*GGAP+.5),2);
% Select inpiduals from population
SelCh = [];
for irun = 1:SUBPOP,
FitnVSub = FitnV((irun-1)*Nind+1:irun*Nind);
ChrIx=feval(SEL_F, FitnVSub, NSel)+(irun-1)*Nind;
SelCh=[SelCh; Chrom(ChrIx,:)];
end
% End of function
附錄 六
交叉函數recombin的源代碼:(由謝菲爾德大學Hartmut Pohlheim編寫)
% RECOMBIN.M
(RECOMBINation high-level function)
%
% This function performs recombination between pairs of inpiduals
% and returns the new inpiduals after mating. The function handles
% multiple populations and calls the low-level recombination function
% for the actual recombination process.
%
% Syntax: NewChrom = recombin(REC_F, OldChrom, RecOpt, SUBPOP)
%
% Input parameters:
%
REC_F
- String containing the name of the recombination or
%
crossover function
%
Chrom
- Matrix containing the chromosomes of the old
%
population. Each line corresponds to one inpidual
%
RecOpt
- (optional) Scalar containing the probability of
%
recombination/crossover occurring between pairs
%
of inpiduals.
%
if omitted or NaN, 1 is assumed
%
SUBPOP
- (optional) Number of subpopulations
%
if omitted or NaN, 1 subpopulation is assumed
%
% Output parameter:
%
NewChrom - Matrix containing the chromosomes of the population
%
after recombination in the same format as OldChrom.
% Author:
Hartmut Pohlheim
% History: 18.03.94
file created
function NewChrom = recombin(REC_F, Chrom, RecOpt, SUBPOP);
% Check parameter consistency
if nargin < 2, error('Not enough input parameter'); end
% Identify the population size (Nind)
[Nind,Nvar] = size(Chrom);
if nargin < 4, SUBPOP = 1; end
if nargin > 3,
if isempty(SUBPOP), SUBPOP = 1;
elseif isnan(SUBPOP), SUBPOP = 1;
elseif length(SUBPOP) ~= 1, error('SUBPOP must be a scalar'); end
end
if (Nind/SUBPOP) ~= fix(Nind/SUBPOP), error('Chrom and SUBPOP disagree'); end
Nind = Nind/SUBPOP; % Compute number of inpiduals per subpopulation
if nargin < 3, RecOpt = 0.7; end
if nargin > 2,
if isempty(RecOpt), RecOpt = 0.7;
elseif isnan(RecOpt), RecOpt = 0.7;
elseif length(RecOpt) ~= 1, error('RecOpt must be a scalar');
elseif (RecOpt < 0 | RecOpt > 1), error('RecOpt must be a scalar in [0, 1]'); end
end
% Select inpiduals of one subpopulation and call low level function
NewChrom = [];
for irun = 1:SUBPOP,
ChromSub = Chrom((irun-1)*Nind+1:irun*Nind,:);
NewChromSub = feval(REC_F, ChromSub, RecOpt);
NewChrom=[NewChrom; NewChromSub];
end
% End of function
附錄 七
變異函數mut源代碼 :(由謝菲爾德大學Andrew Chipperfield編寫)
% MUT.m
%
% This function takes the representation of the current population,
% mutates each element with given probability and returns the resulting
% population.
%
% Syntax:
NewChrom = mut(OldChrom,Pm,BaseV)
%
% Input parameters:
%
%
OldChrom - A matrix containing the chromosomes of the
%
current population. Each row corresponds to
%
an inpiduals string representation.
%
%
Pm - Mutation probability (scalar). Default value
%
of Pm = 0.7/Lind, where Lind is the chromosome
%
length is assumed if omitted.
%
%
BaseV
- Optional row vector of the same length as the
%
chromosome structure defining the base of the
%
inpidual elements of the chromosome. Binary
%
representation is assumed if omitted.
%
% Output parameter:
%
%
NewChrom - A Matrix containing a mutated version of
%
OldChrom.
%
% Author: Andrew Chipperfield
% Date: 25-Jan-94
function NewChrom = mut(OldChrom,Pm,BaseV)
% get population size (Nind) and chromosome length (Lind)
[Nind, Lind] = size(OldChrom) ;
% check input parameters
if nargin < 2, Pm = 0.7/Lind ; end
if isnan(Pm), Pm = 0.7/Lind; end
if (nargin < 3), BaseV = crtbase(Lind); end
if (isnan(BaseV)), BaseV = crtbase(Lind); end
if (isempty(BaseV)), BaseV = crtbase(Lind); end
if (nargin == 3) & (Lind ~= length(BaseV))
error('OldChrom and BaseV are incompatible'), end
% create mutation mask matrix
BaseM = BaseV(ones(Nind,1),:) ;
% perform mutation on chromosome structure
NewChrom = rem(OldChrom+(rand(Nind,Lind)
附錄 八
基于遺傳算法的最大類間方差法對JPG格式圖像分割的程序源代碼:
clear, close all
B=imread('she.jpg');
%讀入原始jpg格式圖像
figure(1);
imshow(B),title('原始jpg格式圖像');
I1=rgb2gray(B);
%將原圖像轉化為灰度圖象
figure(2);
imshow(I1),title('灰度格式圖像');
BW1 = edge(I1,'sobel');
BW2 = edge(I1,'canny');
figure(6),imshow(BW1),title('邊緣檢測1');
%邊緣檢測
figure(5), imshow(BW2),title('邊緣檢測2');
[I1,map1]=gray2ind(I1,255);
%將灰度圖像轉化為索引圖像
I1=double(I1);
%將unit8數組轉化為double型數組
Z=I1
%將double型數組I1轉存到Z中
figure(3)
%畫出未進行分割的原始圖像
image(Z),title('未進行分割的原始圖像');colormap(map1);
NIND=40;
%個體
數目(Number of inpiduals)
MAXGEN=50;
%最大遺傳代數(Maximum number of generations)
PRECI=8;
%變量的二進制位數(Precision of variables)
GGAP=0.9;
%代溝(Generation gap)
FieldD=[8;1;256;1;0;1;1];
%建立區(qū)域描述器(Build field descriptor)
Chrom=crtbp(NIND,PRECI);
%創(chuàng)建初始種群
gen=0;
phen=bs2rv(Chrom,FieldD);
%初始種群十進制轉換
ObjV=target(Z,phen);
%計算種群適應度值
while gen
%代溝(Generation gap)
FitnV=ranking(-ObjV);
%分配適應度值(Assign fitness values)
SelCh=select('sus',Chrom,FitnV,GGAP);
%選擇
SelCh=recombin('xovsp',SelCh,0.7);
%重組
SelCh=mut(SelCh);
%變異
phenSel=bs2rv(SelCh,FieldD);
%子代十進制轉換
ObjVSel=target(Z,phenSel);
[Chrom ObjV]=reins(Chrom,SelCh,1,1,ObjV,ObjVSel);
%重插入
gen=gen+1;
end
[Y, I]=max(ObjV);
M=bs2rv(Chrom(I,:),FieldD);
%估計域值
[m, n]=size(Z);
for i=1:m
for j=1:n
if Z(i,j)>M
%灰度值大于域值時是白色
Z(i,j)=256;
end
end
end
figure(4)
%畫出分割后目標圖像
image(Z),title('分割后圖像');colormap(map1);
target求適應度函數代碼:
function f=target(T,M)
%適應度函數,T為待處理圖像,M為域值序列
[U, V]=size(T);
W=length(M);
f=zeros(W,1);
for k=1:W
I=0;s1=0;J=0;s2=0;
%統(tǒng)計目標圖像和背景圖像的像素數及像素之和
for i=1:U
for j=1:V
if T(i,j)
s1=s1+T(i,j);I=I+1;
end
if T(i,j)>M(k)
s2=s2+T(i,j);J=J+1;
end
end
end
if I==0, p1=0; else p1=s1/I; end
if J==0, p2=0; else p2=s2/J; end
篇10
高校開展大學生領導力教育的分析和思考
基于熵的高校大學生畢業(yè)論文(設計)質量的模糊綜合評價法
基于CDIO理論的工程教育模式探討——以車輛工程專業(yè)為例
基于產業(yè)發(fā)展的高校學科結構優(yōu)化設計
高校雙語教學評價體系的建構探索
社會主義核心價值視域下的高校思想政治理論課教學
技術站能力查定數據處理與計算的實驗教學平臺的構建
微機原理與接口技術課程教學方法探討
本科生班導師工作探索與實踐
道路運輸組織課程教學中存在的問題及改進措施
高校教學評價的內容構成與評價方法探討
無機化學教學改革初探
基于自制遠程測控實驗系統(tǒng)的“智能儀器”課程實驗教學探索
如何有效發(fā)揮漢語言文學在理工類大學人文通識課程教學中的作用
現代測試技術及應用課程教學改革探索
大學二年級建筑設計課程教學改革探討——以建筑系館設計課程為例
熱能與動力工程專業(yè)課的教學改革探討
高職院校人才培養(yǎng)應體現區(qū)域特色
競技啦啦隊教學與訓練中的運動損傷調查及預防研究
教育經濟學研究的理論拓展及其進一步發(fā)展
屬性識別理論在高校貧困生困難等級評價認定中的應用
國際科技學術論文與國內碩博論文英文摘要主位結構的對比研究
淺談虛擬學習環(huán)境及其在當代教育中的應用
分享資源共贏發(fā)展——麻省理工學院“公開課程材料”計劃對我國英語教育資源共享的啟示
大學生就業(yè)能力解析及就業(yè)能力提升策略——基于SWOT理論的視角
高校畢業(yè)生就業(yè)見習制度的實證調查與法律分析
中介組織參與高校畢業(yè)生就業(yè)統(tǒng)計的必要性及相關問題探討
對高校輔導員兼職承擔思想政治理論課教學工作的思考
本科計量經濟學課程教學改革探討
中美法學教育教學方法比較
提高經管類本科專業(yè)經濟法課程教學質量的幾點建議
應用化學專業(yè)化工基礎課程教學改革的探索
關于強化高校金融類課程實踐教學的思考——基于西華大學經濟與貿易學院“外匯交易模擬實習”課程教學經驗
基于日語新聞廣播語體特點談日語新聞聽力教學策略
關于在機械類專業(yè)課程中實施有效教學的若干探討
比較教學法在“給水工程”教學中的應用
從Sturm-Liouville問題談分離變量法的教學改進
法理學本科教學的困境與出路
工程管理專業(yè)工程施工課程教學改革的探索
加強課程建設提高教學質量
四川民辦高等教育的回顧與展望
論四川高等教育改革發(fā)展的歷史成就及主要問題
民辦高校產權歸屬的國際比較及對我國的啟示
美國聯邦政府大學生資助理念探究
思想政治教育內容的文化解讀
高校校園網應成為校風學風建設的前沿陣地
大學生和諧人格建構的德育機制分析
財經類專業(yè)型高層次人才應用能力培養(yǎng)的探索
“3+1”:一種先進的人才培養(yǎng)模式
地方高校教學質量監(jiān)控體系的探索與實踐
高校教師教學質量評價與監(jiān)控保障機制優(yōu)化
本科論文教學質量評價指標體系研究
我校與東汽合作的重點科技攻關項目獲省科技進步二等獎
中國近代文化史公選課教學改革的思考
市場調研課程教學改革初探:面向實踐導向
基于應用型人才培養(yǎng)目標的財務管理教學改革的探討
基于MATLAB的數字圖像處理課程的教學實驗設計