計算機視覺教程范文

時間:2023-12-18 17:57:40

導語:如何才能寫好一篇計算機視覺教程,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

篇1

關(guān)鍵詞:計算機視覺;教學應(yīng)用;教學改革

計算機視覺是人工智能學科中的一門重要課程。隨著相關(guān)應(yīng)用在多個領(lǐng)域中的出現(xiàn),越來越多的學生開始對這門課產(chǎn)生了濃厚的興趣。如何讓學生能夠在整個課程中保持盎然的興趣,并為有志于深入研究計算機視覺的學生指明方向,成為我們教師首先應(yīng)注重的問題。

在實際的教學工作中,通過不斷摸索總結(jié),我們認為,以實際應(yīng)用引導學生的學習興趣,既滿足了學生想了解計算機視覺實際應(yīng)用的需求,又加深了學生對于算法的理解,把算法放在一個實際應(yīng)用中,學生可以理解怎么用,為什么這么用。在這樣的目標導引下,我們從選擇教材開始,準備教學內(nèi)容(包括合理的應(yīng)用實例的選擇)、制作PPT、探索教學方法,形成了目前以實際應(yīng)用為主導的創(chuàng)新教學體系,非常受學生歡迎。在此,我們對這期間遇到的問題,解決方法、心得體會做一個總結(jié)和思考,希望能對同行有些許參考作用。

1選擇教材

在我們這個專業(yè),每年的上研率基本都保持在50%左右。在本專業(yè)的研究生階段,也開設(shè)了雙語教學的計算機視覺課程。另外,畢業(yè)后選擇參加工作的同學也基本都進入和本專業(yè)非常相關(guān)的一些單位,所從事的工作,都是和在學校學習的知識密切相關(guān)。

因此,如何讓這門課程的教學既兼顧本科畢業(yè)就參加工作的那部分同學,又兼顧繼續(xù)深造的學生的需求,也是在這門課程講授的過程中,需要特別注意的一個問題。對于本科畢業(yè)就要參加工作的同學而言,需要“廣度”,需要了解計算機視覺這門課在各個領(lǐng)域中的應(yīng)用,在實際中接觸到相關(guān)的項目或工作時,能夠知道去哪里可以找到自己需要的參考資料;而對于要進一步深造的同學而言,則需要一定的“深度”,為研究生階段的研究打下基礎(chǔ)。

全盤考慮到這些學生畢業(yè)之后的去向,我們選擇了兩本教材。一本是賈云得教授編著,科學出版社于 2000年出版的《機器學習》[2],這是一部順應(yīng)了時代與教學發(fā)展要求的教材,對計算機視覺中的基本概念、基本算法、基本算法的應(yīng)用、經(jīng)典應(yīng)用進行了由淺入深的介紹。內(nèi)容涵蓋了所有經(jīng)典的數(shù)字圖像處理與機器視覺方法,也對一些已經(jīng)得到非常好實際應(yīng)用的方法,如光流法等作了簡要介紹。另外還選擇了一本英文原版的計算機視覺的經(jīng)典著作,Ramesh Jain 教授等所著的《Machine Vision》[3],機械工業(yè)出版社于2003年出版。這是國內(nèi)外非常推崇的一本計算機視覺著作,該教材條理清晰,深入淺出,對計算機視覺的基本原理、算法、應(yīng)用的介紹非常詳盡。

在教學中,我們采用了英文的PPT,但主要用的教材是賈云得教授的《機器視覺》,這樣中英文對照講解,一方面加深學生對教學內(nèi)容的理解,另一方面也為學生今后閱讀專業(yè)的英文論了相應(yīng)準備。

2教學內(nèi)容和工程實例的選取

2.1選取教學內(nèi)容

本課程之前,大學二年級的本科生已開設(shè)數(shù)字圖像處理課程,但所講的基本原理和算法都非常淺顯,所以在教學內(nèi)容的安排上,分為兩大部分:數(shù)字圖像處理部分和視覺部分。數(shù)字信號處理部分主要講解在視覺部分會用到的一些基本算法,為后面進入計算機視覺部分打基礎(chǔ)。這部分約占總課時的1/3。視覺部分的課時也分為兩部分:算法講解與實例講解。在算法講解部分,對計算機視覺的基本算法、經(jīng)典算法都做了深入淺出的講解。實例部分則選擇了經(jīng)典的工業(yè)應(yīng)用,讓學生能夠?qū)λ鶎W算法進一步加以理解。

2.2選取適當?shù)墓こ虒嵗?/p>

就計算機視覺的教學內(nèi)容而言,各個孤立的算法和方法對本科生來講,有些抽象不好理解。如果在教學上僅僅通過老師在課堂上的講解,很難讓學生深入地理解相關(guān)的教學內(nèi)容,而選擇一個觸手可及且簡單好理解的工程實例往往就會達到意想不到的教學結(jié)果,學生可以把課堂上所學的枯燥理論與現(xiàn)實中活生生的事物聯(lián)系起來,從而加深對教學內(nèi)容的理解。

通過反復(fù)比對、反復(fù)論證,我們選擇了在講解基本原理和算法之后,在課程結(jié)束前,專門留出課時講解手機制造這個例子。手機現(xiàn)在是人手一部,是這些年青學子再熟悉不過的事物了,通過對手機主板、手機鍵盤的制造過程的講解,把所學的算法都融合進來,學生在覺得有趣的同時,不知不覺就加深了對所學算法的理解。

另外,在教學的過程中,我們還不斷穿插其他學生耳熟能詳?shù)膶嵗?如數(shù)碼相機原理中的一些算法的講解,我們和學生一起探討應(yīng)該怎么選擇數(shù)碼相機。再有,濾波器算法、在課堂上對Photoshop功能的演示,與所學算法關(guān)聯(lián)起來,學生都很容易理解接受。

3教學點滴

3.1點睛之筆

在第一節(jié)課的講述中,我們的重點不在于Marr理論,而是告訴學生:

人工智能就是要讓計算機像人一樣,能夠會聽、會看……

我們這門課程就是要讓計算機“會看”,要像人一樣會看。進而展示給學生一些我們精心挑選的圖片,讓學生自己判斷,是不是自己的眼睛“騙了”自己,人眼和計算機看到的到底有什么不一樣。

每次講到這里,學生都會進行熱烈的討論,每個人都有不同的看法,每個人都有自己的堅持,不知不覺中,對這門課就產(chǎn)生了濃厚的興趣,有了繼續(xù)深入學習下去的愿望。在課堂討論的最后,比較人眼對圖片的判斷以及計算機的判斷后,讓學生自己總結(jié)歸納,我們這門課到底要研究些什么,都有可能應(yīng)用在哪些方面,然后對爭議比較大的提議一一探討。每到這個時候,大家的積極性就都被激發(fā)出來,在不斷的爭論與思想碰撞中找出正確的結(jié)論。

3.2拿身邊的事物說“事”

計算機視覺課程的前半部分,多涉及到圖像處理的一些常見算法。在講授各種各樣的濾波器和算子時,并沒有針對各個濾波器和算子擺出一堆示例圖片,讓學生比較濾波前后的差異,從而很生硬地理解濾波器與算子的功能。取而代之的,我們首先以現(xiàn)在人手一臺的數(shù)碼相機為例提出問題,你為什么要選擇你手里的這臺數(shù)碼相機?當初選這個品牌和型號時,你的考慮是什么?歷年學生的回答幾乎都是看網(wǎng)上測評,或者在網(wǎng)上看別人怎么說。這時列出我們收集到的各個品牌相機的測評報告,列出它們的優(yōu)缺點,然后引導學生去思考,例如這個品牌的相機的缺點是照片發(fā)灰,不是很鮮亮,而另一個品牌的相機則綠的特別綠,紅的特別紅,為什么?那么有可能是哪部分的算法不夠完善,為什么?

通過如此簡單的對比,學生的積極性被完全激發(fā)。原來,數(shù)碼相機這個幾乎人人都有,大家都熟悉的“玩具”竟然和自己在課堂上學到的知識這么密切相關(guān)。

再有,就是利用學生們都熟悉的PS(Photoshop),演示現(xiàn)在所謂的“完美證件照”是怎么來的。為什么可以把疙疙瘩瘩的臉部皮膚變得光滑?在PS中,你就是點了一下鼠標,其實在后臺,是加入了一個濾波器進行了濾波。各種這樣的演示,學生都非常喜聞樂見。因為他們突然發(fā)現(xiàn),原來那些事物,和我自己接觸到這些看似枯燥的理論之間,還有這么深刻的聯(lián)系。

還有一個很受學生歡迎的例子就是對于“鼓形失真”的講解。我們的老師每次講到這里,都不會簡單告訴學生“鼓形失真”發(fā)生的原因是什么,應(yīng)該怎么解決?老師都會問學生,明星為什么都一窩蜂去減肥?現(xiàn)在的女明星為什么都要去弄個“錐子臉”?課堂上就會出現(xiàn)一個小,男同學和女同學的看法各異,彼此之間開始爭論不休。此時再趁熱打鐵地問學生,如果拿著相機,離自己的鼻子一公分,會拍出什么樣的效果?有學生開始拿出手機對著自己和別人開拍,有的學生開始頭頭是道地分析。每到這種學生都開始熱烈討論的時候,就可以適時引導學生往正確的方向去,讓他們自己找到正確的分析解決方法,往往這個時候,學生都會頗有成就感,對于問題的理解也會特別的深刻。

3.3選擇合適的實際應(yīng)用

在所有理論講解結(jié)束后,我們會留出2~4次課講述計算機視覺在工業(yè)上的應(yīng)用。這些年來,對于手機制造這樣一個工業(yè)應(yīng)用,非常受學生歡迎。正如“數(shù)碼相機”這個例子一樣,現(xiàn)在學生都是人手一部手機,是大家再熟悉不過的東西。這個例子涉及到了在前面理論講述中的大部分算法,如二值圖像的處理、模板匹配、高斯濾波器等。學生通過對這個工業(yè)應(yīng)用的理解,更進一步加深了對算法的理解。

以講解手機鍵盤的制造過程為例,向?qū)W生提出和前面所講內(nèi)容相關(guān)的問題,引導學生自發(fā)思考,如為什么選擇模板匹配法,而不是采用其他更復(fù)雜更精確的方法等等。每到這個時候,課堂氣氛總是分外熱烈,學生各抒己見,在不斷爭論中,更進一步加深對課本上枯燥理論的認識。

在這里需要注意的問題是一定要一步一步提出問題,循循善誘,引導學生一層一層地深入思考。如果問題的答案過于“深藏不露”,則有可能觸發(fā)學生的抵觸情緒,無法繼續(xù)深入地思考。

4結(jié)語

通過多年的教學摸索,我們認為,在計算機視覺課程的講述中,以實際應(yīng)用引導學生這樣的教學方法非??扇?而且也收到了很好的效果。另外,除了制定好的教學大綱,并選擇合適的教材外,根據(jù)學?,F(xiàn)在的時間情況,我們選擇了多媒體手段輔助教學,充分利用Matlab和大屏幕投影等方方面面的優(yōu)勢,結(jié)合多種方法進行教學,對講好計算機視覺這門課,非常有益。

參考文獻:

[1] 林堯瑞,馬少萍. 人工智能導論[M]. 北京:清華大學出版社,1989.

[2] 賈云得. 機器視覺[M]. 北京:科學出版社,2000.

[3] Ramesh Jain. Machine Vision[M]. 北京:機械工業(yè)出版社,2003.

[4] 蔡自興. 智能控制原理與應(yīng)用[M]. 北京:清華大學出版社,2007.

Innovation in the Course of Computer Vision

HAN Hong, JIAO Li-cheng

(School of Electronic Engineering, Xidian University, Xi’an 710071, China)

篇2

關(guān)鍵詞:知識規(guī)則挖掘;城市公共交通;服務(wù)質(zhì)量評價;遺傳算法

中圖分類號:TP301.6 文獻標識碼:A

1引言

知識規(guī)則挖掘就是從大量的、不完全的、有噪聲的知識規(guī)則中,提取隱含在其中的、人們事先不知道的有用的知識規(guī)則的過程。知識規(guī)則挖掘方法[1,2,3]有多種,如機器學習、決策樹、神經(jīng)網(wǎng)絡(luò)、粗糙集方法、遺傳算法等。在這些方法中,遺傳算法由于具有高度的魯棒性和極佳的全局搜索能力而倍受眾多學者的青睞。在城市公共交通服務(wù)質(zhì)量評價知識規(guī)則體系中,由于評價指標較多,在進行知識規(guī)則挖掘時,使用遺傳算法尤為有效。利用遺傳算法進行城市公共交通服務(wù)質(zhì)量評價知識規(guī)則挖掘,就是在已有的知識規(guī)則的基礎(chǔ)上進一步進行優(yōu)化,得到隱含在知識規(guī)則庫中的、更為滿意的、新的知識規(guī)則。

2城市公共交通服務(wù)質(zhì)量評價指標體系構(gòu)建

城市公共交通服務(wù)質(zhì)量可以從硬件和軟件兩個大的方面進行評價。硬件方面包括道路公共交通網(wǎng)絡(luò)和公交企業(yè)本身的設(shè)施投入;軟件方面則主要指道路交通通行的實際水平與公交企業(yè)的軟。上述方面還可以進一步細分,直至一些基礎(chǔ)性的指標。結(jié)合綜合評價加指標體系建立的方法,建立城市公共交通服務(wù)質(zhì)量評價指標體系[4-6]。評價指標體系包括四個方面:公共交通網(wǎng)絡(luò)、公交企業(yè)硬性投入、公共交通通行服務(wù)水平、公交企業(yè)軟,具體評價指標有15個,如圖1所示。

遺傳算法是模擬生物界自然選擇和自然遺傳機制進化過程來求解復(fù)雜問題的全局隨機搜索算法[7,8],它以編碼空間代替問題空間,以適應(yīng)度函數(shù)為評價依據(jù),以編碼群體為進化基礎(chǔ),以對群體中個串的遺傳操作實現(xiàn)選擇和遺傳機制,建立起一個迭代過程。在這一過程中,通過隨機重組編碼位串中重要的基因,使新一代的位串集合優(yōu)于老一代的位串集合,群體的個體不斷進化,逐漸接近最優(yōu)解,最終達到求解問題的目的。

由于傳統(tǒng)遺傳算法存在收斂速度慢、容易出現(xiàn)早熟收斂等缺點[9],本文采用文獻[10]中的改進遺傳算法(IGA),這種改進遺傳算法的工作流程如圖2所示。

4.3遺傳算子

在本文使用的改進遺傳算法中,遺傳算子包括選擇算子、助長算子、交叉算子和變異算子。選擇算子采用兩代競爭排序的選擇方法來對遺傳個體進行優(yōu)選,遺傳個體被區(qū)分為雄性和雌性兩種不同的性別,把父代與子代的所有雄性個體與雌性個體分別進行重新排序,再按群體規(guī)模N分別從排序后的雄性個體集與雌性個體集中截取前N/2個優(yōu)秀的個體進入匹配池,作為交叉操作的對象。助長算子用來對種群中的個體進行一定概率下的助長,助長操作在選擇操作之后及配對操作之前進行,本文是采用基于個體適應(yīng)度的助長。在交叉操作中,同性別個體之間是不能進行配對的,雄性個體只能同雌性個體進行配對,配對是按個體優(yōu)劣順序進行的,個體配對之后還要進行親緣關(guān)系的檢測,以保證個體之間的繁殖屬于嚴格的遠緣繁殖。在二進制編碼方式下,變異操作就是以很小的變異概率從群體中隨機選取若干個體,對于選中的個體又隨機選取表現(xiàn)型編碼中的某一位或多位進行數(shù)碼翻轉(zhuǎn),即將1變?yōu)?或0變?yōu)?。

4.4新知識規(guī)則的檢驗

遺傳算法運行結(jié)束后,要對挖掘出的新知識規(guī)則的有效性進行檢驗。一方面要檢驗新知識規(guī)則是否被知識規(guī)則庫中已有的規(guī)則所包含,如果被已有的規(guī)則所包含,則新知識規(guī)則無效;另一方面是檢驗新知識規(guī)則是否與知識規(guī)則庫中已有的規(guī)則相矛盾,如果與已有的規(guī)則相矛盾,則新知識規(guī)則同樣無效。無效的新知識規(guī)則將被剔除,有效地新知識規(guī)則將被加入知識規(guī)則庫中。

5實例

一城市公共交通服務(wù)質(zhì)量評價知識規(guī)則庫(部分知識規(guī)則)如表1所示,這個知識規(guī)則庫即為測試數(shù)據(jù)集。表1的知識規(guī)則編碼及適應(yīng)度值如表2所示。

這二條新的有效的知識規(guī)則將被加入到城市公共交通服務(wù)質(zhì)量評價知識規(guī)則庫中,使知識規(guī)則庫得以更新。

6結(jié)論

本文將一種改進的遺傳算法用于城市公共交通服務(wù)質(zhì)量評價的知識規(guī)則挖掘,提出了一種基于遺傳算法的城市公共交通服務(wù)質(zhì)量評價知識規(guī)則挖掘方法。實例表明,遺傳算法在進行知識規(guī)則挖掘時是完全有效的,能夠得到比知識規(guī)則庫中已有的一些知識規(guī)則更優(yōu)的知識規(guī)則。這為知識規(guī)則挖掘提供了一種重要途徑。

參考文獻

[1]刁力力. 數(shù)據(jù)挖掘與組合學習[J].計算機科學,2001, 28(7):73-78.

[2]Dasarathy, B.V Nearest Neighbor(NN)Norms. NN Pattern Classification Techniques[M]. Washington, D.C.: IEEE Computer Society, 1991.

[3]ZIARKO W. Rough sets, Fuzzy Sets and Knowledge Discovery[J]. New York: Springer-Verlag, 1994.

[4]邵祖峰. 基于神經(jīng)網(wǎng)絡(luò)的城市公共交通服務(wù)質(zhì)量評價[J]. 城市交通,2005,7(4):178-180.

[5]張麗花, 張好智, 楊小寶. 基于乘客出行鏈的公共交通服務(wù)質(zhì)量評價研究[J]. 公路與汽車,2011,7(4):48-51.

[6]邵祖峰. 城市公共交通服務(wù)質(zhì)量評價神經(jīng)網(wǎng)絡(luò)模型[J]. 城市交通,2006,4(6):38-41.

[7]雷英杰,張善文,李續(xù)武,等. MATLAB遺傳算法工具箱及應(yīng)用[M].西安:西安電子科技大學出版社,2005.

[8]王小平,曹立明. 遺傳算法——理論、應(yīng)用與軟件實現(xiàn)[M].西安:西安交通大學出版社,2002.

篇3

關(guān)鍵詞:ARM OPENCV AdaBoost

近年來,功能各異的視頻監(jiān)控設(shè)備越來越多,但是,大多只能簡單記錄視頻畫面,將監(jiān)控到的視頻信息存儲起來,而不能對所監(jiān)控到的視頻做一定的處理分析和預(yù)測?;贏RM的人臉檢測系統(tǒng),為我們的視頻監(jiān)控設(shè)備提供了一個視頻處理的參考解決方案,在一定基礎(chǔ)上加以擴充,可以完成人物識別,危險行為檢測與報警等,使視頻監(jiān)控設(shè)備更加智能化。

1、視頻監(jiān)控的幾項關(guān)鍵技術(shù)及發(fā)展方向

視頻監(jiān)控的關(guān)鍵技術(shù)主要有視頻采集壓縮算法、視頻信號可靠地傳輸、信息存儲調(diào)用的智能化與系統(tǒng)的集中管理等。視頻監(jiān)控技術(shù)發(fā)展方向為分布采集集中管理、高品質(zhì)圖象壓縮處理、開放標準統(tǒng)一接口、統(tǒng)一認證以確保安全、操作人性化以及功能集成化、結(jié)構(gòu)模塊化和傳輸多樣化。隨著不斷發(fā)展的網(wǎng)絡(luò)技術(shù),基于嵌入式技術(shù)的網(wǎng)絡(luò)數(shù)字監(jiān)控系統(tǒng)不再是處理模擬視頻信號,而是把攝像機輸出的模擬視頻信號通過視頻編碼器直接轉(zhuǎn)換為IP數(shù)字信號。

2、平臺的搭建

ARM之所以應(yīng)用廣泛,是因為有較快得運算速度,較低的價格,開發(fā)人員也比較容易接觸,程序較易移植過來等特點。EmbeddedLinux也是Linux家族的成員,支持廣泛的硬件平臺,如PPC、ARM、MIPS等,也繼承了Linux的優(yōu)點——開源、免費,同時也有廣泛的應(yīng)用軟件支持,能夠比較方便的移植操作系統(tǒng)與應(yīng)用軟件。

3、OPENCV簡介

OpenCV是一個開源的計算機視覺庫,采用C/C++語言進行編寫,可以運行在Linux/Windows/Mac等操作系統(tǒng)上,同時還提供了Python、Ruby以及其他語言的接口。其設(shè)計目標就是執(zhí)行速度盡量快,它采用優(yōu)化的C語言編寫,能夠充分利用多核處理器的優(yōu)勢。除此之外,另外一個目標就是構(gòu)建一個簡單易用的計算機視覺框架,開發(fā)人員可以利用它更便捷地設(shè)計復(fù)雜的計算機視覺相關(guān)應(yīng)用程序。其中包含的函數(shù)有500多個,覆蓋了計算機視覺的許多應(yīng)用領(lǐng)域,如工廠產(chǎn)品檢測、醫(yī)學成像、信息安全、攝像機標定、立體視覺和機器人等。

4、人臉檢測的原理

人臉檢測技術(shù)的研究要追溯到20世紀70年代,早期的研究主要致力于模板匹配、子空間方法、變形模板匹配等,近幾年,集中研究基于數(shù)據(jù)驅(qū)動的學習方法,如統(tǒng)計模型方法,神經(jīng)網(wǎng)絡(luò)學習方法,統(tǒng)計知識理論和支持向量計算方法,基于馬爾可夫[1]隨機域的方法,以及基于膚色的人臉檢測等。目前在實際中應(yīng)用的人臉檢測方法多為基于Adaboost[2]學習算法的方法。

Viola是AdaBoost算法的一種,主要基于積分圖和級聯(lián)檢測器,其方法框架可大至分為以下三大部分:第一部分,使用Harr-like特征來表示人臉,并且使用“積分圖”實現(xiàn)特征數(shù)值的快速計算;第二部分,使用Adaboost算法挑選出一些最能代表人臉的矩形特征,用弱分類器按照加權(quán)投票的方式,構(gòu)造為一個強分類器;第三部分,為有效的提高檢測速度,將訓練得到的若干強分類器串聯(lián)組成一個級聯(lián)結(jié)構(gòu)的層疊分類器。

人臉檢測的目的就是從圖片之中找出所有包含人臉的子窗口,對人臉的子窗口與非人臉的子窗口進行區(qū)分。第一步,在一個20*20的圖片中提取出一些簡單的特征(Harr特征),將白色區(qū)域內(nèi)的像素減去黑色區(qū)域,因此在人臉與非人臉圖片的相同位置上,有著大小不一樣的數(shù)值,這些特征就是區(qū)分人臉和非人臉的依據(jù)。第二步,使用上萬張切割好的人臉圖片和上萬張背景圖片作為訓練樣本。訓練圖片一般都調(diào)到到20*20的大小。在這樣大小的圖片中,可供haar使用的特征數(shù)大概有1萬個左右,然后通過機器學習算法也就是Adaboost算法挑選數(shù)千個有效的haar特征,用來組成人臉檢測器。第三步,學習算法訓練出一個人臉檢測器后,便可以在各種各樣的場合使用了。使用時,依次縮放圖像比例,最后在縮放后的圖片20*20的子窗口中依次判別是否是人臉。

人臉檢測技術(shù)在門禁系統(tǒng)、智能監(jiān)控系統(tǒng)中已經(jīng)得到了很好的應(yīng)用。另外,目前的筆記本電腦登錄時,也陸續(xù)使用人臉識別技術(shù)作為憑證。同時,人臉檢測算法也在數(shù)碼相機和手機中起作用,作為一個新新的功能提供用戶使用。

5、結(jié)語

ARM上進行圖像處理以及人臉檢測與識別等是可行的方案,可以減少硬件成本。 采用Linux+Qt4+OpenCv+Arm是一個方案合理、技術(shù)成熟、成本低廉、應(yīng)用廣泛的人臉檢測與圖像處理的解決方案。

參考文獻

篇4

關(guān)鍵詞:模板匹配 特征值 細化 二值化

中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2013)06-0134-02

1 模板匹配算法的描述

在機器識別事物的過程中,常需把不同傳感器或同一傳感器在不同時間、不同成像條件下對同一景物獲取的兩幅或多幅圖像在空間上對準,或根據(jù)己知模式到另一幅圖中尋找相應(yīng)的模式,這就叫做匹配。因為只有當同一場景的兩幅圖像在同一坐標系下時,才能進行相似性比較,所以模板匹配的過程實際上也就是把一幅圖像變換到另一幅圖像的坐標系過程。圖像的模板匹配就是先給定一幅圖像,然后到另一幅圖像中去查找這幅圖像,如果找到了,則匹配成功。這看起來好像很簡單,因為我們一眼就能看出一幅圖中是否包含另一幅圖像,遺憾的是電腦并不具有人眼的強大的視覺的功能,因而需要電腦去判定一幅圖片中是否包含另一幅圖片是件不容易的事情。對于機器視覺系統(tǒng)而言,實現(xiàn)匹配首先要對圖像進行預(yù)處理。先計算模板圖片的特征值,并存儲到計算機中。然后計算待測試樣板圖片的特征值,與計算機中模板進行比較,運用匹配算法實現(xiàn)匹配。整個過程如圖1所示。

在基于圖像處理的應(yīng)用領(lǐng)域中,對于圖像匹配的研究可以說一直都是數(shù)字圖像處理技術(shù)和計算機視覺理解的重要研究內(nèi)容。圖像匹配在機器視覺、工業(yè)自動模式識別、醫(yī)學圖像的定位等方面都有著重要意義。

2 圖像匹配的數(shù)學描述

3 算法的改進及圖示

根據(jù)以上對模板匹配的介紹,可以對字符圖像進行識別。但是求相似性度量函數(shù),求待匹配圖像和模板之間的相似性映射關(guān)系均比較復(fù)雜。上一節(jié)知識的介紹中,也看到了其過程比較麻煩。本系統(tǒng)中識別的圖像均為20×36大小的。即模板圖像和待測圖像大小相同。即會從圖像的左下角一直順著搜索一直至全圖結(jié)束。而且映射關(guān)系及相似性函數(shù)均比較復(fù)雜,不是數(shù)量級上的關(guān)系。此時識別效率就不明顯。顯得木訥不靈巧。并非像前面介紹的在待測圖片中搜索,并返回得到匹配點。因此需要基于此模板匹配算法原理的基礎(chǔ)上,對算法進行改進,才能更有效的去完成識別的功能及簡化其識別的過程。提高識別速度。即將圖片區(qū)域化。算法改進的思想:將圖片(3×4)分為12塊區(qū)域,具體區(qū)域的劃分如圖3所示。再加上5條交線。共記有17個特征值。

模板訓練時,將數(shù)字模板圖片17個特征值的信息記下并存儲在數(shù)組中。當進行樣本訓練的時候,用同樣的算法計算圖片中數(shù)字的17個特征值,并到計算機存儲區(qū)中去匹配,直接利用象素灰度值的差異,找到特征值最接近的一個圖片數(shù)字,便完成匹配識別的過程,到匹配的結(jié)果。這樣便簡單多。

4 結(jié)語

本系統(tǒng)通過對圖片進行區(qū)域化處理基本能完成對數(shù)字圖像的識別功能。雖然有一定的誤識率。將圖片區(qū)域化后再進行模板匹配可以很輕松的實現(xiàn)數(shù)字的識別,這是一次對模板匹配算法的新的嘗試。通過對數(shù)字圖片的研究,可以推廣到英文字符的識別,甚至可以識別手寫或打印的漢字字符。研究識別率達到100%是我們的理想,通過我們的研究可以不斷地將字符識別技術(shù)推向前進。

參考文獻

[1]鐘志光,盧君,劉偉榮編著.《Visual C++.NET 數(shù)字圖象處理實例與解析》[M].北京:清華大學出版社,2003年6月.

[2]何斌,馬天予,王運堅,朱紅蓮編著.《Visual C++ 數(shù)字圖象處理》第二版[M].北京:人民郵電出版社,2002.

[3]夏良正編著.《數(shù)字圖象處理》[M].南京:東南大學出版社,1999年9月.

[4]葛亮.Visual C++從入門到實踐[M].北京:清華大學出版社,2009.

篇5

關(guān)鍵詞:OpenCV;視覺模塊;圖像處理

中圖分類號:TP23 文獻標識碼:A

1 引 言

對于世界葡萄種植來說,切根蟲(一種夜蛾的幼蟲)是危害葡萄樹生長的主要害蟲之一。精準對靶施藥系統(tǒng)可在葡萄樹干上施加一個均勻的、寬度大于等于20cm的“障礙藥帶”,可有效的阻止切根蟲夜晚從樹根爬到樹冠啃食新芽。由于在實際葡萄園中,每隔幾棵葡萄樹就會立一根樹樁拉著鐵絲牽引葡萄藤,所以在施藥時需要區(qū)分筆直的樹樁和彎曲的葡萄樹干,避免不必要的施藥。因此本文基于OpenCV的圖像處理方法進行精準對靶施藥系統(tǒng)視覺模塊設(shè)計。

2 基于OpenCV的圖像處理

OpenCV軟件由C函數(shù)以及C++函數(shù)組成,可以進行例如特征檢測、目標分割、三維重建等圖像分析。在圖像處理、計算機視覺等方面,OpenCV起到了無可取代的重要作用。在不遠的將來,OpenCV對工業(yè)、航天、軍事、人機對話等領(lǐng)域都起到了及其關(guān)鍵的作用。隨著圖像分析、視覺技術(shù)的發(fā)展,OpenCV將逐漸適用于更多的場合[1]。本文研究中采用計算機視覺技術(shù),通過CCD攝像頭采集圖片,使用OpenCV來檢測采集到的葡萄樹干和木樁圖片的外輪廓線,從而判斷噴藥設(shè)備前方的物體是彎曲的葡萄樹干還是筆直的木樁,若判定為彎曲的葡萄樹干則噴藥,若判定為筆直的木樁,則發(fā)出信號,讓拖車繼續(xù)前行。

2.1 圖像預(yù)處理

在進行輪廓檢測前,首先要對采集到的葡萄樹干和木樁的圖片進行預(yù)處理,主要是進行形態(tài)學去噪以及圖像平滑處理[2]。

2.1.1 形態(tài)學去噪

數(shù)學形態(tài)學,其本質(zhì)是通過一些方法實現(xiàn)圖像處理,比如:利用結(jié)構(gòu)元素提取圖像形狀等。數(shù)學形態(tài)學的基本操作有兩種:膨脹和腐蝕。膨脹使圖像區(qū)域變大,可以實現(xiàn)小空間和縫隙的填充。腐蝕使圖像區(qū)域變小,可以用來去掉圖像菱角。膨脹和腐蝕兩者沒有互為逆運算,可以結(jié)合使用,對圖像先膨脹再腐蝕,或者先腐蝕再膨脹。前一種運算稱為閉運算,后一種稱為開運算。兩種運算在數(shù)學形態(tài)學中都很重要。閉運算可以彌補裂縫、填補孔洞,開運算可以去除毛刺和孤立小點,兩種運算對物體的形狀和位置不造成改變。本文中先用CCD相機拍攝照片,然后對照片進行閉運算和開運算,使輪廓平滑,沒有毛刺和缺口。

2.1.2 利用中值濾波進行圖像平滑處理

圖像平滑處理多用于減少圖像噪聲,是數(shù)字圖像處理技術(shù)的一種。對于在葡萄種植園中采集到的葡萄樹干或者木樁的圖片,由于場地等的原因,不可避免的存在許多噪聲,進行平滑處理時最重要的是要保持葡萄樹干或者木樁輪廓的清晰,還可以去除高頻噪聲,綜合考慮,我們選擇中值濾波。

中值濾波屬于非線性濾波,它可以抑制圖像噪聲和脈沖干擾,保護圖像,使圖像的邊緣不變模糊。也可以將圖像的灰度信息保留的更多,提高對圖像輪廓檢測的質(zhì)量[3]。

2.2 基于mean shift 的圖像分割

mean shift 是通過迭代,運用非參數(shù)進行概率密度估算的方法?;谠砗唵?、參數(shù)少、不需要預(yù)處理等特點,mean shift 主要被運用在追蹤目標、分割圖像等方向[4]。使用mean shift 進行圖像分割可以被當作特征空間聚類問題處理,因為被選取的空間的色彩、灰度、梯度不同,概率密度函數(shù)將會梯度上升,mean shift 沿著該方向找到局部最大值,可是將具特征類似的向量分割開來,歸為一類。

2.3 邊緣檢測

邊緣檢測多是指檢測圖像中灰度或者亮度變化最大的部位,一般是指前景、背景的交界處,這些部位會導致數(shù)學算法模型中的一階導數(shù)不連續(xù),所以需要利用圖像的階梯函數(shù),以此來求圖像的邊緣[5]。用的最多的方法有:Roberts 算子、Sobel 算子、Prewitt 算子和Canny 算子。

由于Canny 算子既用到了一階導數(shù),也用到了二階導數(shù),所以它的結(jié)果更加精確,因此本文運用Canny 算子對圖像邊緣進行檢測。對于圖像處理,先對原圖進行灰度處理,然后通過Canny 算子就可以將圖片中的物體輪廓較為精準的找出。

運用Canny 算子進行邊緣檢測,需要符合2個要求:①信噪比;②單位邊緣響應(yīng)。計算算子的零交叉點的平均距離,若該距離滿足式①,則單位邊緣只存在一個響應(yīng)[6]。

3 圖像處理試驗及結(jié)果

本文利用OpenCV 提供的圖像處理函數(shù)來對獲得的靶標圖像進行處理,先基于mean shift 進行圖像分割,然后通過Canny 算子進行邊緣檢測,得到靶標外輪廓線,最后運用直線檢測的方式來分析靶標的曲直,其工作流程如圖1所示。

圖1 工作流程圖

計算技術(shù)與自動化2016年6月

第35卷第2期李梅竹等:基于OpenCV精準對靶施藥系統(tǒng)視覺模塊設(shè)計

3.1 基于mean shift 的圖像結(jié)果

一般而言一副圖像的特征點至少可以提取出5 維,即(x,y,r,g,b),眾所周知,mean shift 經(jīng)常用來尋找模態(tài)點,即密度最大的點。所以這里同樣可以用它來尋找這5 維空間的模態(tài)點,由于不同的點最終會收斂到不同的峰值,所以這些點就形成了一類,這樣就完成了圖像分割的目的,有點聚類的意思在里面。

需要注意的是圖像像素的變化范圍和坐標的變化范圍是不同的,所以在使用窗口對這些數(shù)據(jù)點進行模態(tài)檢測時,需要使用不同的窗口半徑。因此在OpenCV自帶的mean shift分割函數(shù)pyrMeanShiftFiltering( )函數(shù)中,就專門有2個參數(shù)供選擇空間搜索窗口半徑和顏色窗口搜索半徑的。 由函數(shù)名pyrMeanShiftFiltering可知,這里是將mean shift算法和圖像金字塔相結(jié)合用來分割的,所以其參數(shù)列表中就有一個專門定義所需金字塔層數(shù)的變量。本次試驗的主要過程是,首先設(shè)置好參數(shù),然后用函數(shù)pyrMeanShiftFiltering( )對輸入的圖像進行分割。分割后的結(jié)果保存在該函數(shù)的第二個參數(shù)即輸出圖像中,最后根據(jù)該分割圖像的特點用floodFill( )函數(shù)對其分割的結(jié)果用不同的顏色進行填充。試驗中選取的樹干原圖如圖2(a)、1(b)所示,圖像分割后的結(jié)果如圖3(a)、2(b)所示。

3.2 邊緣檢測結(jié)果

對圖像基于mean shift的圖像分割后,采用Canny算子進行邊緣檢測。Canny算法的步驟是①降噪,任何邊緣檢測算法不可能在未經(jīng)處理的原始數(shù)據(jù)上工作,第一步是對原始數(shù)據(jù)與高斯mask作卷積,得到的圖像與原始圖像相比有些輕微的模糊。②尋找圖像中的亮度梯度。圖像中的邊緣可能會指向不同的方向,所以Canny算法使用了4個mask檢測水平、數(shù)值以及對角線方向的邊緣。③在圖像中跟蹤邊緣。較高的亮度梯度比較有可能是邊緣,但是沒有一個確定的值來限定多大的亮度梯度是邊緣,所以Canny使用了滯后閾值。上述過程完成可得到一個二值圖像。通過Canny算子就可以將圖片中樹干的輪廓找出,其試驗結(jié)果如圖4所示。從圖中可以看出采用OpenCV的Canny算子進行邊緣檢測可以較為完整的將前景區(qū)從背景區(qū)域中分離出來,得到比較理想的樹干輪廓線,為進一步判斷輪廓線的曲直打下基礎(chǔ)。3.3 直線檢測結(jié)果

OpenCV使用霍夫變換函數(shù)來進行直線檢測。該變換利用點與線的對偶性,通過曲線表達形式,將空間中的曲線轉(zhuǎn)變?yōu)橐粋€點,于是,對于原圖的曲線檢測問題變?yōu)樵趨?shù)空間內(nèi)尋找峰值的問題。 具體的說,利用直線的參數(shù)方程ρ=xcosθ+ysinθ將(x,y)空間中的一個點變成了一條正弦曲線,如果若干個點在一條直線上,那么它們對應(yīng)的正弦曲線也會交于同一個點。所以檢測直線的問題,就轉(zhuǎn)化為了判斷交點峰值的問題。設(shè)置一個峰值,大于這個值,就判為直線。

需要注意以下幾點:首先,HoughLines檢測出來的不是線段,而是(ρ,θ)對,使用std vectorlines來存放。其次,由于上面的原因,畫線的時候是選一個y(最小為0),求一個x,得到一個點;再選一個y(選為圖像的高度)再求一個x得到另一個點,水平方向的線采用同樣的方法。這樣畫出的線貫穿整個圖像。

4 結(jié)束語

由于在實際葡萄園中,每隔幾棵葡萄樹就會立一根樹樁拉著鐵絲牽引葡萄藤,所以在施藥時需要區(qū)分筆直的樹樁和彎曲的葡萄樹干。本文主要介紹了基于OpenCV的圖像處理方法,并給出了對一棵彎曲的樹和一棵筆直的樹的基于mean shift的圖像分割結(jié)果、邊緣檢測結(jié)果以及直線檢測結(jié)果。實驗結(jié)果證明該模塊設(shè)計可有效的區(qū)別出葡萄園中彎曲的葡萄樹干和筆直的樹樁。

參考文獻

[1] 于仕琪,劉瑞禎.OpenCV教程(基礎(chǔ)篇)[M].北京:北京航空航天出版社,2007.

[2] 景曉軍.圖像處理技術(shù)及其應(yīng)用[M].北京:國防工業(yè)出版社,2005.

[3] 劉慧英,王小波.基于OpenCV的車輛輪廓檢測[J].科學技術(shù)與工程,2010(12): 2987-2991.

[4] SONG N, GU I Y H, CAO Z, et al. Enhanced spatial-range mean shift color image segmentation by using convergence frequency and position[C]//Prof. of 14th European Signal Processing Conference (EUSIPCO 2006), Florence, Italy. 2006.

篇6

關(guān)鍵詞:嵌入式Linux;OpenCV;教室人數(shù)統(tǒng)計;橢圓擬合

中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2016)28-0187-02

Abstract: in order to let the students understand the remote study room number, starting from the student head characteristics, analysing the characteristics of classroom identification number of technology and shortcomings, based on embedded Linux and OpenCV as soft hardware system. The system adopts the vertical view shooting mode, take the contour extraction and recognition method of ellipse fitting and the number of personnel arrangement of the seating area, seating area. The experiment shows that the system can effectively identify the number of the classroom and analyze the behavior of the students. It has the characteristics of high speed and high accuracy.

Key words: embedded Linux; OpenCV; classroom population statistics; ellipse fitting

隨著我國高水平大學的招生人數(shù)進一步增加,學生對自習室是否有空位及其排布情況無法便捷獲取。隨著計算機技術(shù)的發(fā)展,圖像處理技術(shù)在解決這個問題越來越顯示出它的優(yōu)點。

文獻[1]提取了一種基于網(wǎng)格的模板匹配方法,使用背景減除算法得到運動區(qū)域,提取幀圖像進行預(yù)處理,然后提取特征統(tǒng)計人數(shù)。但人體間的相互遮擋而降低了檢測精度。文獻[2]利用人頭和非人頭統(tǒng)計特征提出了結(jié)合擴展的Haar特征和SVM分類器來檢測行人,此方法需花費大量時間收集人頭圖像樣本和訓練分類器;

分析總結(jié)現(xiàn)有技術(shù)的不足,系統(tǒng)采用垂直俯視拍攝方式,使用OpenCV作為函數(shù)庫,可方便移植于Linux系統(tǒng),算法簡單、魯棒性強。

1 系統(tǒng)整體架構(gòu)設(shè)計

嵌入式Linux是以Linux內(nèi)核為基礎(chǔ),根據(jù)需要對軟、硬件進行裁剪的專用嵌入式系統(tǒng) [3]。

OpenCV是一個開放源代碼的計算機視覺庫,使非專業(yè)圖像處理的工程技術(shù)人員應(yīng)用于圖像分割、運動檢測等方面[4]。

系統(tǒng)框架分為應(yīng)用層、庫層、Linux內(nèi)核、硬件層。應(yīng)用層為教室人數(shù)檢測應(yīng)用程序,為C/C++語言編寫,包含文中所提的算法。庫層上下分別為OpenCV視覺庫、OpenCV依賴庫、基本c庫三層。Linux內(nèi)核以官網(wǎng)下載的Linux3.4.2內(nèi)核基礎(chǔ)上經(jīng)過裁剪,加載攝像頭、觸摸屏、無線網(wǎng)絡(luò)等模塊。系統(tǒng)使用三星四核Cortex-A9構(gòu)架處理器Exynos 4412,主頻為1.5GHZ,內(nèi)存為1GB DDR3、閃存4GB eMMC,圖像處理能力強大。I2C接口連接CMOS攝像頭OV7740。

2 人員特征的分析及檢測

系統(tǒng)以教室為應(yīng)用背景,在教室正中心架設(shè)攝像頭,將整個教室攝入。系統(tǒng)的整體工作流程如圖2所示。教室中心正上方的攝像頭攝入當前教室圖像,從視頻中提取視頻幀,對視頻幀圖像經(jīng)過灰度化、二值化處理、提取輪廓,由于俯視情況下人頭部輪廓圖可近視為一圓形,通過橢圓擬合,可找到圖像中的疑似人頭部,再根據(jù)擬合橢圓的面積等條件判斷是不是頭部。由于學生坐在相鄰位置時,在進行交談時頭部圖像可能發(fā)生一部分重疊,當兩個人頭部圖像重疊,提取的頭部輪廓將存在拐點。如果橢圓面積大于一個人頭部面積的閾值,再進行輪廓有無拐點判斷。以拐點為分界點,隨機選取疑似頭部輪廓起始點到拐點、拐點到疑似頭部輪廓終止點至少6個點做橢圓擬合,再根據(jù)擬合橢圓面積閾值進行判斷是否為人頭部。

(1) 圖像獲取并預(yù)處理

系統(tǒng)通過CMOS攝像頭模塊OV7740攝取當前教室圖像。OpenCV通過cvCaptureFromCAM 函數(shù)初始化攝像頭并從中捕獲視頻,再調(diào)用cvQueyrFrame函數(shù)從攝像頭捕獲的視頻中獲取并返回一幀圖像。系統(tǒng)充分利用教室為應(yīng)用背景的優(yōu)勢,將教室圖像根據(jù)桌椅分布進行分塊處理,使用cvGetSubRect函數(shù)分塊圖像,保證每一塊圖像中保留完整的座位。

(2) 圖像二值化處理

圖像的二值化有利于圖像的進一步處理,使圖像簡單化,而且數(shù)據(jù)量減小,能凸顯出感興趣的目標的輪廓。其中cvThreshold參數(shù)使用最大熵值法求得的最佳閾值。該分割閾值使得圖像目標和背景兩類的信息熵之和最大[5]。

(3) 橢圓擬合

在進行橢圓擬合時,最常用的方法是最小二乘法。最小二乘法只需6個輪廓點即可擬合橢圓。以下是橢圓方程式:

A+C=1為沒有零解的約束條件,用上述方程對邊緣檢測后的點進行最小二乘法處理

得到一個線性方程組,使用高斯消元法,得到方程式的解[6]。通過OpenCV 中cvFitEllipse函數(shù),對cvFindContours函數(shù)提取出storage存儲輪廓數(shù)據(jù)矩陣作橢圓的最佳擬合。圖2為橢圓擬合的結(jié)果圖,在程序中設(shè)定橢圓的長軸、短軸及面積的范圍,去除不滿足條件的橢圓,結(jié)果為圖b。

圖3 (a)為兩學生在座位上交談的情景。針對這種情況,擬合橢圓設(shè)定面積為單頭像擬合橢圓面積的1.7~2.0倍。當滿足此條件時遍歷此輪廓數(shù)據(jù)矩陣(如圖3(c)),找到x軸坐標相差不大,y軸坐標相差最小的A、B,這兩點為此輪廓的拐點,再分別于輪廓起點、終點二次橢圓擬合。則可確定為兩人頭像遮蓋的情況。

3 實驗結(jié)果及分析

系統(tǒng)以某一實驗樓大廳為實驗對象進行試驗,在二樓用攝像頭垂直錄制行人在大廳行走的場景,與安裝在教室中心拍攝學生圖像情況基本一致。圖4為檢測圖。

座位區(qū)實驗結(jié)果如表1所示,通過大量實驗表明,對比其他方法,垂直俯視拍攝減小了人頭部相互遮擋的情況,具有較高的準確性。程序檢測及統(tǒng)計響應(yīng)時間迅速,完全符合實時應(yīng)用的要求。

4 結(jié)束語

論文在OpenCV圖像處理函數(shù)庫的基礎(chǔ)上運用圖像二值化、輪廓提取和橢圓擬合等圖像處理技術(shù),結(jié)合嵌入式Linux技術(shù)和視頻采集技術(shù),以自習室為應(yīng)用背景,識別自習室學生人數(shù)、坐標和活動情況??偨Y(jié)系統(tǒng)特點,主要有以下3個方面:基于嵌入式Linux,具有較強的實用性、實時性;以自習室為應(yīng)用背景且采用垂直俯視方式采集圖像,最大限度地減小了學生之間相互遮擋的情況,能準確獲取學生信息;使用OpenCV中函數(shù)對圖像進行預(yù)處理、二值化和橢圓擬合,大大減小程序的復(fù)雜度和工作量。

參考文獻 :

[1]Jun Wei Hsieh, Cheng Shuang Peng,Kao Chin Fan.Grid-based Template Matching for People Counting[C].Multimedia Signal Processing,2007. MMSP 2007. IEEE 9th Workshop,1-3 Oct. 2007: 316-319.

[2]Celik T,Seyin O H,Demirel H.Fire pixel classification using fuzzy logic and statistical color model[C]//IC2007.New York:IEEE,2007:1207-1208.

[3]毛德操,胡希明.嵌入式系統(tǒng)[M].浙江大學出版社,2003.

[4]劉瑞禎,于仕琪.OpenCV教程一基礎(chǔ)篇[M].北京航空航天大學出版社,2007.

[5]楊召君.基于視頻人數(shù)統(tǒng)計與跟蹤改進算法的研究與實現(xiàn)[D].南京郵電大學,2013.

[6]蘇娟. 基于視頻監(jiān)控的教室人數(shù)統(tǒng)計[D].安徽大學,2014.

篇7

關(guān)鍵詞:三維重構(gòu);鉆孔數(shù)據(jù);輪廓線;三維礦體模型;礦體體積

中圖分類號:TP274文獻標識碼:A文章編號:1009-3044(2011)14-3352-05

Design and Implementation on the 3D Orebody Reconstruction System Based on the Drilling Data

LIU Gang, YUAN Ji-wu, LI Lei

(SINOPEC Research Institute of Safety Engineering, Qingdao 266071, China)

Abstract: Through studying the technical characteristics of the 3D orebody reconstruction, the thesis puts forward the design methods for constructing the system of 3D orebody reconstruction based on the drilling data. The paper emphatically discussed several questions, including the methods disposing 2D drilling data, data structure of the 3D orebody model and the calculational methods for orebody volume, etc. It also presents the algorithm flow of the 3D orebody reconstruction. Finally, the program on the 3D orebody reconstruction is completed.

Key words: 3D reconstruction; drilling data; contour lines; 3D orebody model; orebody volume

隨著計算機技術(shù)在采礦業(yè)的不斷應(yīng)用,采礦業(yè)正由經(jīng)驗型、傳統(tǒng)型向科學型、定量分析與處理、自動化方向發(fā)展。礦業(yè)圖件的生成與處理是礦山設(shè)計工作的重要內(nèi)容,傳統(tǒng)手工繪制的以及國內(nèi)應(yīng)用CAD系統(tǒng)繪制的圖形大部分是二維平面圖,用二維的圖件來描述三維空間的礦體,可視性差且缺乏立體感,容易產(chǎn)生誤解,并且難于向非專業(yè)技術(shù)人員展示自己的設(shè)計結(jié)果[1]。因此,以二維化的剖面采樣數(shù)據(jù)為基礎(chǔ),通過三維重構(gòu)技術(shù)來構(gòu)建礦體的三維可視化模型并對其進行可視化的定量分析與處理,已經(jīng)成為礦業(yè)數(shù)字化的一個重要發(fā)展方向。重構(gòu)后的礦體三維可視化模型不但能夠很好地模擬礦體形態(tài),用于計算體積、品味等重要數(shù)據(jù),而且可視化模型一旦形成,便可以對其進行任意剖切、投影以及瀏覽,并可隨時根據(jù)需要制作相應(yīng)的三維工程圖,從而極大地提高礦山設(shè)計的速度與質(zhì)量[2]。

1 基本問題描述

1.1 三維重構(gòu)的意義

許多學科領(lǐng)域都需要收集和使用各種海量數(shù)據(jù)信息,如衛(wèi)星發(fā)回的地球資源數(shù)據(jù)、氣象數(shù)據(jù)、海洋和地殼板塊及地震監(jiān)測數(shù)據(jù)、醫(yī)學掃描圖象數(shù)據(jù)等。在通過各種測量方法獲得這些海量數(shù)據(jù)之后,人們更期望能將這些數(shù)據(jù)以三維圖形或圖象的方式表示出來,以使那些原本抽象、難以理解的原理和規(guī)律變得更加直觀。三維重構(gòu)技術(shù)就是一種能將原始的海量數(shù)據(jù)以三維圖形的方式表示出來的技術(shù)。

通過使用各種測量設(shè)備(如傳感器),計算機能夠獲得外部世界中物體的各種信息,這些信息被稱之為采樣數(shù)據(jù),三維重構(gòu)的任務(wù)就是從獲取的采樣數(shù)據(jù)中恢復(fù)物體的三維結(jié)構(gòu),即物體的原型。不同領(lǐng)域中所用的測量設(shè)備不同,所得的數(shù)據(jù)種類也不同并且重構(gòu)的目標也不一樣,因此重構(gòu)的方法也多種多樣。在立體視覺中通過攝像機可以獲得周圍環(huán)境的光強信號,重構(gòu)的含義是從不同角度拍攝的圖像重構(gòu)三維物體[3],重構(gòu)的關(guān)鍵在于解決好圖像匹配問題。從激光掃描測距儀獲取的是景物的深度信息[4],從距離圖像重構(gòu)三維物體關(guān)鍵在于確定三維點之間的拓撲關(guān)系,然后選擇適當?shù)臄?shù)學描述工具如參數(shù)曲面、三角面片、多面體等擬和這組點。在醫(yī)學領(lǐng)域,通過各種醫(yī)學設(shè)備可以得到人體內(nèi)部的一組斷層圖像,其灰度代表生物組織的某種物理屬性,不同的生物組織或器官具有不同的物理屬性,所以在圖像中表現(xiàn)為灰度,因此要從圖像重構(gòu)器官或者生物組織的三維結(jié)構(gòu)首先要確定它們的邊界,即對原始圖像進行分割[5],然后用三角形或者多邊形來擬和生物組織或者器官的表面[6]。盡管上述方法各有不同,但是都是試圖從有限離散采樣點中恢復(fù)完整連續(xù)的物體模型。只有通過重構(gòu)物體的三維模型,才能夠?qū)λ鼈冞M行定性或者定量的分析,才能夠區(qū)別離散數(shù)據(jù)中的各個物體。因此,三維重構(gòu)在可視化、計算機視覺、模式識別中占有重要的地位,也是模擬仿真和決策系統(tǒng)中必不可少的組成部分。

1.2 三維重構(gòu)技術(shù)概述

在實際應(yīng)用中,人們面對的往往并不是直接的體數(shù)據(jù)信息,而是一序列的二維輪廓線數(shù)據(jù)。由序列二維輪廓數(shù)據(jù)重構(gòu)三維形體是當前三維重構(gòu)技術(shù)研究的一個大的方向。在這里,輪廓線代表著一個物體對象表面與一系列切平面的交線,該方法首先獲取輪廓線數(shù)據(jù),然后再進行3D曲面重構(gòu),如圖1所示。

一個斷層上的輪廓組可以來自一個物體對象或多個物體對象,一個非凸的物體對象在某個斷層截面上可以有多個輪廓。在此情況下,相鄰兩個斷層之間的輪廓線便會出現(xiàn)一對一、一對多、多對多、末端以及連通分叉五種連接方式[7]。其中,一對一連接僅需解決相鄰兩層輪廓線之間的拼接問題;一對多連接首先需要解決輪廓線之間的分支問題,將一對多連接簡化為多個一對一連接,然后再進行一對一輪廓線之間的拼接;多對多連接則首先需要解決輪廓線之間的對應(yīng)問題,將多對多連接簡化為多個一對一與多個一對多連接的組合,然后再進行相應(yīng)的分支處理,最后進行輪廓線之間的拼接。

綜上所述,基于輪廓的三維形體重構(gòu)過程可以分解為四個子問題,即輪廓拼接問題、輪廓分支問題、輪廓對應(yīng)問題和曲面擬合問題[8],如圖2所示[9]。

1.3 礦體三維重構(gòu)的技術(shù)特點

與目前三維重構(gòu)技術(shù)應(yīng)用較完善的醫(yī)學圖形等應(yīng)用領(lǐng)域不同,礦體三維重構(gòu)具有許多自身特點。首先,真實礦體的地質(zhì)形態(tài)往往復(fù)雜多變且隨意性較大,無明顯規(guī)律可尋;其次,礦體重構(gòu)以剖面圖、中段平面圖、鉆孔及坑道等測量數(shù)據(jù)為采樣數(shù)據(jù),這些數(shù)據(jù)在不經(jīng)過特殊處理的情況下將無法直接用于礦體重構(gòu);再次,真實礦體地質(zhì)形態(tài)的復(fù)雜性,決定了由此產(chǎn)生的平行輪廓線之間的重合度往往非常??;最后,由于地質(zhì)測量的特殊性,由鉆孔剖面數(shù)據(jù)得出的平行輪廓線之間的距離往往非常大,導致兩條輪廓線之間的礦體形態(tài)難以準確表達。

2 礦體二維剖面數(shù)據(jù)的處理

用于三維礦體重構(gòu)的原始數(shù)據(jù)主要來自礦山提供的各類剖面圖、中段平面圖、鉆孔及坑道測量編錄資料,在對這些勘測線以及各類剖面圖進行單層的二維圈礦處理后便可以得到人們所需要的斷層輪廓數(shù)據(jù)。然而,由此得出的數(shù)據(jù)仍然與真正意義上的斷層輪廓數(shù)據(jù)有很大的出入。首先,礦體的鉆孔剖面具有很大的空間隨意性,它可能不平行于X-Y平面、X-Z平面與Y-Z平面中的任何一個,也就是說,這些剖面的法向量可能指向空間的任何位置,且各個剖面的法向量所指方向也可能各不相同。其次,同一個輪廓線上的各個頂點往往并不在同一個平面上。再次,礦體剖面數(shù)據(jù)中的X、Y值通常代表大地物理坐標值,其數(shù)值往往很大,而Z值則代表深度值,與X、Y值相比可能要小得多。由于礦體剖面數(shù)據(jù)的上述特點,決定了在進行礦體三維重構(gòu)之前必須對這些不規(guī)范的數(shù)據(jù)進行嚴格處理,將其轉(zhuǎn)化為真正意義上的斷層輪廓數(shù)據(jù)。

處理不規(guī)范的礦體剖面數(shù)據(jù)的過程包括平移、旋轉(zhuǎn)等[10-11],圖3所示,具體過程如下:

1) 平移坐標軸:求出礦體中心點的坐標值,平移三維坐標軸使原點與礦體中心點重合,將礦體中心點定義為新的坐標原點;

2) 旋轉(zhuǎn)坐標軸:求出礦體各個剖面的法向量并由此計算礦體的平均法向量,求出該法向量與X、Y、Z軸的夾角大小,繞X軸將該法向量旋轉(zhuǎn)至X-Z平面上,再繞Y軸將該法向量旋轉(zhuǎn)至Z-Y平面上,最終使其與Z軸重合。

3 系統(tǒng)設(shè)計與實現(xiàn)

3.1 模型數(shù)據(jù)結(jié)構(gòu)的設(shè)計

構(gòu)建礦體的三維可視化模型,首先應(yīng)建立礦體的表面模型,再在表面模型的基礎(chǔ)上建立礦體的體塊模型和品位模型。針對上述模型構(gòu)建過程,礦體三維重構(gòu)系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)應(yīng)包括如下內(nèi)容:

1) 在建立礦體表面模型之前,需要對斷層數(shù)據(jù)、輪廓數(shù)據(jù)以及輪廓線頂點數(shù)據(jù)進行相應(yīng)處理。其中,斷層數(shù)據(jù)包括斷層總數(shù)、斷層內(nèi)的輪廓線索引值以及斷層Z坐標值等內(nèi)容;輪廓數(shù)據(jù)包括輪廓總數(shù)、輪廓頂點總數(shù)、頂點索引值以及其他與處理輪廓密切相關(guān)的數(shù)據(jù);輪廓線頂點數(shù)據(jù)則包括頂點的X、Y、Z坐標值等信息。

2) 在表面模型的構(gòu)建過程中,則需要對三角面片數(shù)據(jù)、連接邊數(shù)據(jù)進行處理。其中,三角面片數(shù)據(jù)包括三角面三個頂點的索引值等內(nèi)容;連接邊數(shù)據(jù)則包括邊的兩個頂點的索引值、共享該邊的兩個三角面的索引值等,邊數(shù)據(jù)主要應(yīng)用于表面模型構(gòu)建完成后的局部信息的人工修改。

3) 在體塊模型的構(gòu)建過程中,需要對體數(shù)據(jù)進行處理,體數(shù)據(jù)包括組成該體塊的三角面片數(shù)據(jù)等。

3.2 礦體三維重構(gòu)的算法流程

通過對礦體三維重構(gòu)處理過程進行分析,可將其劃分為5個處理階段,分別是:二維礦體數(shù)據(jù)讀取階段、三維礦體表面重構(gòu)階段、礦體體數(shù)據(jù)生成階段、數(shù)據(jù)處理階段與礦體三維數(shù)據(jù)保存階段,其具體的算法流程如圖4所示。

3.3 礦體體積計算

礦體經(jīng)過三維重構(gòu)首先生成以三角面為基礎(chǔ)的表面模型,然后再在表面模型的基礎(chǔ)上生成體數(shù)據(jù),體數(shù)據(jù)生成后,便可以對礦體體積進行計算。本文參考三角區(qū)域累加計算的方法求取體積[12-13]。

首先,將不規(guī)則的形體分解為若干個較小的規(guī)則體元;然后,分別計算各個小體元的體積;最后,將所有體元的體積累加起來便得到整個形體的體積。這里所指的規(guī)則體元如圖5所示。三種規(guī)則體元的體積計算公式分別為:1) V=s×h;2) V=(s×h)/3;3) V= 2×(s×h)/3。其中,s為底面三角形的面積,h為體元的高。

規(guī)則體元的生成原則是:

1) 上斷層平面上的表面三角形向下斷層投影,在下斷層上生成一個投影三角形,兩個三角形對應(yīng)頂點連線即生成圖5中的(a)體元;

2) 上、下斷層之間的表面三角形由位于上斷層上的頂點向下斷層投影,在下斷層上生成一個投影三角形。如果上斷層含有1個頂點,連接該頂點及其投影頂點便可生成圖5中的(b)體元;如果上斷層含有2個頂點,分別連接這兩個頂點及其投影頂點則生成圖5中的(c)體元。

求取規(guī)則體元的體積也應(yīng)遵循一定的規(guī)則,即如果三角形的法線方向與投影方向相反,則由該三角形生成的規(guī)則體元的體積為正,否則,相應(yīng)的規(guī)則體元的體積為負。如圖6所示,三角形P3P4A是上輪廓多邊形進行平面三角剖分后得出的一個三角形,它的平面法向量為S1,其在下輪廓平面上的投影三角形為P’3P’4A’,兩個三角形之間的部分為規(guī)則體元T1;三角形Q6Q7B是下輪廓多邊形進行平面三角剖分后得出的一個三角形,它的平面法向量為S2,投影高度為0;三角形P2Q2Q3是連接上、下兩條輪廓線的一個三角面片,它的平面法向量為S3,其在下輪廓平面上的投影三角形為P’2Q2Q3,兩個三角形之間的部分為規(guī)則體元T2;三角形P6Q8Q9也是連接上、下輪廓線的一個三角面片,它的平面法向量為S4,其在下輪廓平面上的投影三角形為P6 Q’8Q’9,兩個三角形之間的部分為規(guī)則體元T3。由于S1方向向上(與投影方向相反),故規(guī)則體元T1的體積為正;因三角形Q6Q7B的投影高度為0,故體積為0;因S3方向向上(與投影方向相反),故規(guī)則體元T2的體積為正;S4方向向下(與投影方向相同),故規(guī)則體元T4的體積為負。綜上所述,四個規(guī)則體元的體積之和為V=VT1+VT2-VT3。

經(jīng)過上述各步處理,最終可求得各個規(guī)則體元的體積,將這些規(guī)則體元的體積加在一起,其和即為所求形體(礦體)的體積。

4 實驗結(jié)果

本文以Visual Basic 6.0、OpenGL等作為開發(fā)工具,完成了礦體三維重構(gòu)系統(tǒng)的設(shè)計工作,圖7給出了系統(tǒng)設(shè)計界面,并以兩層剖面圖為例生成礦體表面模型。圖8給出了某鐵礦的應(yīng)用實例,該鐵礦屬鞍山式貧磁鐵礦(沉積變質(zhì)類型),礦體比較復(fù)雜。圖9給出了某金礦的應(yīng)用實例,該金礦為蝕變巖型大型金礦床,主要工業(yè)礦體隱伏于地下,埋藏深、品位低、水平厚度大,一般水平厚度達20m以上,最厚達100m以上,但礦體連續(xù)性好,局部有分枝復(fù)合現(xiàn)象,礦體呈緩傾斜產(chǎn)出,傾角18°~51°。通過與已知的實際礦體結(jié)構(gòu)比較,圖8、圖9中生成的三維礦體模型基本反映了上述區(qū)域內(nèi)礦體的分布情況。

5 結(jié)束語

從一組采樣數(shù)據(jù)中重建物體的三維實體是人類觀察和分析客觀事物的重要手段。以三維重構(gòu)技術(shù)為載體,通過二維化的剖面采樣數(shù)據(jù)來構(gòu)建礦體的三維可視化模型并對其進行可視化的定量分析與處理,早已成為礦業(yè)數(shù)字化的一個重要發(fā)展方向。在不遠的將來,隨著鉆孔采樣、中間插值、拼接算法等相關(guān)技術(shù)的不斷發(fā)展,礦體三維重構(gòu)也必將在礦業(yè)數(shù)字化的道路上愈行愈遠。

參考文獻:

[1] 吳立新.論21世紀的礦山――數(shù)字礦山[J].煤炭學報,2000(4).

[2] 南格利.礦體線框模型及其建立方法[J].有色礦山,2001(5).

[3] Ballard D H,Brown C puter Vision[M].Prentice-Hall,1982.

[4] Schmitt F,Chen X,Du W H.Geometric modeling from range image data[J].EROGRAPHICS,1991:57-62.

[5] Liang Z.Tissue classification and segmentation of MR images[J].IEEE Engineer in Medicine and Biology,1993,12(1):81-85.

[6] Fuchs H,Kedem Z M,Uselton S P.Optimal Surface Reconstruction from Planar Contour[J].Communication of the ACM,1977,20(10):693-702.

[7] Oliva J M,Perrin M,Coquillart S.3D reconstruction of complex polyhedral shapes from contours using a simplified generalized Voronoi diagram[J].EUROGRAPHICS,1996,15(3):397-408.

[8] Meyers D,Skinner S,Sloan K.Surface from contours[J].ACM Transaction on Graphics,1992,2(3):228-258.

[9] Meyers D.Reconstruction of Surfaces from Planar Contours[D].PhD.Thesis,University of Washington,1994.

[10] 孫家廣.計算機圖形學[M].3版.北京:清華大學出版社,1998.

[11] 唐榮錫,汪嘉業(yè),彭群生,等.計算機圖形學教程[M].北京:科學出版社,2000.

[12] 王賢文,王秀美,洪源,等.計算機輔助測量料堆體積的三角區(qū)域法[J].北京科技大學學報,2002,24(3):369-371.

篇8

信息化是形成注冊會計師行業(yè)發(fā)展新動能的重要力量,是實現(xiàn)行業(yè)跨越式發(fā)展的重要引領(lǐng)。自“十二五”期間將信息化確定為行業(yè)發(fā)展戰(zhàn)略以來,在《中國注冊會計師行業(yè)信息化建設(shè)總體方案》《注冊會計師行業(yè)信息化建設(shè)規(guī)劃(2016-2020年)》《注冊會計師行業(yè)信息化建設(shè)規(guī)劃(2021-2025年)》等宏觀政策的引領(lǐng)下,注冊會計師行業(yè)信息化建設(shè)取得了顯著成效。隨著行業(yè)信息化建設(shè)的不斷深入,大數(shù)據(jù)、人工智能、移動互聯(lián)、云計算、物聯(lián)網(wǎng)和區(qū)塊鏈等新興技術(shù)不斷應(yīng)用到審計實務(wù)中(舒惠好等,2021),注冊會計師的信息化專業(yè)能力短板卻日益突顯(張敏,2020;應(yīng)里孟和陽杰,2020;舒惠好等,2021),這顯著降低了行業(yè)信息化建設(shè)的成效。雖然中國注冊會計師協(xié)會于2007年印發(fā)的《中國注冊會計師勝任能力指南》明確了信息技術(shù)在注冊會計師勝任能力框架中的重要地位,但《中國注冊會計師勝任能力指南》僅僅是導向性的,在信息化層面缺乏可操作性?;诖?本文重點探討在行業(yè)信息化背景下注冊會計師需要具備的各種素質(zhì)和能力,揭示當前注冊會計師信息化專業(yè)能力存在的主要短板,探討如何提高注冊會計師信息化執(zhí)業(yè)能力,以期彌合期望差距,提高審計質(zhì)量,促進行業(yè)高質(zhì)量發(fā)展。深入研究注冊會計師信息化專業(yè)能力具有重大意義。(1)深入研究注冊會計師信息化專業(yè)能力是貫徹落實〔2021〕30號文件的重要舉措。2021年7月30日,國務(wù)院辦公廳印發(fā)《關(guān)于進一步規(guī)范財務(wù)審計秩序促進注冊會計師行業(yè)健康發(fā)展的意見》(〔2021〕30號),明確提出“加強注冊會計師專業(yè)培訓教育。創(chuàng)新繼續(xù)教育方式,圍繞專業(yè)勝任能力、職業(yè)技能、職業(yè)價值、職業(yè)道德等重點,豐富完善教育內(nèi)容。”深入研究注冊會計師信息化專業(yè)能力建設(shè)相關(guān)問題,有助于豐富完善專業(yè)勝任能力、職業(yè)技能、職業(yè)價值、職業(yè)道德等重點的教育內(nèi)容,可以為加強注冊會計師專業(yè)培訓教育指明方向和明確路徑。(2)深入研究注冊會計師信息化專業(yè)能力是提高審計質(zhì)量的必由之路。根據(jù)DeAngelo(1980)對審計質(zhì)量的經(jīng)典定義,即審計質(zhì)量是市場評估的注冊會計師發(fā)現(xiàn)并報告財務(wù)報告存在錯報或漏報的聯(lián)合概率,審計質(zhì)量取決于注冊會計師的專業(yè)勝任能力和獨立性,在信息化環(huán)境下,注冊會計師的信息化專業(yè)能力是影響審計質(zhì)量的關(guān)鍵因素,深入研究注冊會計師信息化專業(yè)能力有助于提高信息化環(huán)境下的審計質(zhì)量。(3)深入研究注冊會計師信息化專業(yè)能力是塑造會計師事務(wù)所品牌的重要基礎(chǔ)?!蹲詴嫀熜袠I(yè)發(fā)展規(guī)劃(2021—2025年)》明確提出將“行業(yè)品牌化建設(shè)取得新成效”作為今后五年行業(yè)發(fā)展要努力實現(xiàn)的主要目標之一。眾所周知,審計質(zhì)量塑造事務(wù)所品牌,行業(yè)品牌化建設(shè)的關(guān)鍵是提高審計質(zhì)量,提高審計質(zhì)量的基礎(chǔ)是提高注冊會計師的專業(yè)勝任能力和獨立性,深入研究探討注冊會計師信息化專業(yè)能力的框架、短板、提升路徑和策略有助于提高注冊會計師的專業(yè)勝任能力,為實現(xiàn)“行業(yè)品牌化建設(shè)取得新成效”的奮斗目標打下堅實的基礎(chǔ)。

二、當前注冊會計師信息化專業(yè)能力的現(xiàn)狀分析

(一)注冊會計師信息技術(shù)專業(yè)知識比較薄弱

根據(jù)作者對所在單位注冊會計師信息技術(shù)專業(yè)知識情況的調(diào)查研究,目前的注冊會計師普遍存在信息技術(shù)專業(yè)知識比較薄弱的問題,具體表現(xiàn)為注冊會計師所掌握的專業(yè)知識主要局限于Office辦公軟件等傳統(tǒng)信息技術(shù)知識,而對“大智移云物區(qū)”等新興信息技術(shù)專業(yè)知識“知其然,而不知其所以然”,缺乏必要的理論知識儲備。目前注冊會計師獲取信息技術(shù)專業(yè)知識的渠道主要來自職業(yè)繼續(xù)教育。雖然行業(yè)協(xié)會和大部分會計師事務(wù)所的繼續(xù)教育培訓對新興信息技術(shù)專業(yè)知識有所涉及,但仍主要停留在電子表格使用培訓,面對高度信息化環(huán)境下的海量數(shù)據(jù)采集,注冊會計師普遍缺乏必要的知識儲備。

(二)注冊會計師信息技術(shù)職業(yè)技能有待提升

注冊會計師普遍存在信息技術(shù)職業(yè)技能有待提升的問題,具體表現(xiàn)為注冊會計師的新興信息技術(shù)職業(yè)技能不熟練,對新興信息技術(shù)應(yīng)用的參與度較低。一方面,作為一個人員流動性比較高的行業(yè),會計師事務(wù)所除了每年通過校園招聘大批量的畢業(yè)生外,還會通過社會招聘從其他相關(guān)機構(gòu)招聘一批專業(yè)人員。這些新入職的員工沒有使用本所審計系統(tǒng)的經(jīng)驗。新員工學習軟件過程除了觀看視頻培訓教程,主要依靠項目實戰(zhàn)摸索,這大大降低了員工使用軟件的效率。同時較高的員工流動率導致審計作業(yè)系統(tǒng)用戶一直都有一定比例的新用戶,降低了審計軟件使用效率。另一方面,每年審計作業(yè)系統(tǒng)改造需求主要來自于信息化部門運維收集到的用戶問題修復(fù)、專業(yè)標準部分和質(zhì)量控制部門每年修訂質(zhì)量控制制度的管理需要,以及業(yè)務(wù)部門的員工訪談。但每次訪談業(yè)務(wù)部員工使用需求,收到建設(shè)性建議較少。審計人員或者對信息化建設(shè)缺乏參與熱情,或者是缺乏足夠的信息化能力,提不出建設(shè)性意見,這使得軟件改進成效存在一定的折扣。

(三)注冊會計師信息技術(shù)職業(yè)道德意識不強

注冊會計師普遍存在信息技術(shù)職業(yè)道德意識不強的問題,具體表現(xiàn)為對信息系統(tǒng)相關(guān)道德困境、數(shù)據(jù)管理相關(guān)道德困境和職業(yè)道德物化困境了解不足、重視不夠。其中,信息系統(tǒng)相關(guān)道德困境是指注冊會計師在信息系統(tǒng)設(shè)計和運行中的違規(guī)違法操作行為或其他不道德行為,導致數(shù)據(jù)保密和數(shù)據(jù)安全責任不能履行以及其他不道德行為的發(fā)生。數(shù)據(jù)管理相關(guān)道德困境是指注冊會計師的數(shù)據(jù)采集、存儲、分析以及輸出行為危機客戶的數(shù)據(jù)保密和數(shù)據(jù)安全,或?qū)е缕渌坏赖滦袨榈陌l(fā)生。職業(yè)道德物化困境是指擁有自由意志或自主能力的信息化系統(tǒng)違反審計職業(yè)道德規(guī)范的行為,或?qū)е缕渌坏赖滦袨榈陌l(fā)生。新興信息技術(shù)在審計領(lǐng)域的廣泛應(yīng)用,使得注冊會計師從基礎(chǔ)工作中解放出來,也讓注冊會計師面臨更加復(fù)雜的道德困境。然而,大部分會計師事務(wù)所在聚焦新興信息技術(shù)的應(yīng)用問題時,忽視了相關(guān)的職業(yè)道德教育,使得注冊會計師普遍表現(xiàn)出信息技術(shù)職業(yè)道德意識不強。

三、提升注冊會計師信息化專業(yè)能力的對策建議

(一)構(gòu)建注冊會計師信息化專業(yè)能力框架

根據(jù)中國注冊會計師協(xié)會2019年6-12月對注冊會計師行業(yè)信息化建設(shè)的最新調(diào)研結(jié)果,會計師事務(wù)所認為將對行業(yè)發(fā)展產(chǎn)生重大影響的信息技術(shù)依次是大數(shù)據(jù)(41.6%)、人工智能(39.3%)、云計算(18.1%)、物聯(lián)網(wǎng)(4.9%)、區(qū)塊鏈(3.5%)和其他(0.4%)。其中,大數(shù)據(jù)和人工智能在注冊會計師審計領(lǐng)域的應(yīng)用最為廣泛?;趯徲媽崉?wù)的調(diào)研和相關(guān)學術(shù)研究,大數(shù)據(jù)審計技術(shù)大體上可以分為大數(shù)據(jù)智能分析技術(shù)、大數(shù)據(jù)可視化分析技術(shù)和大數(shù)據(jù)多數(shù)據(jù)源綜合分析技術(shù)三類。其中,大數(shù)據(jù)智能分析技術(shù)包括自然語言處理技術(shù)、社會網(wǎng)絡(luò)分析技術(shù)和圖形數(shù)據(jù)庫技術(shù)等。大數(shù)據(jù)可視化分析技術(shù)包括標簽云分析、散點圖分析、條形圖分析、折線圖分析、直方圖分析、氣泡圖分析、小提琴圖分析和熱力圖分析等。大數(shù)據(jù)多數(shù)據(jù)源綜合分析技術(shù)是通過采集各種可獲取的數(shù)據(jù),采用大數(shù)據(jù)技術(shù)方法進行數(shù)據(jù)分析,從而發(fā)現(xiàn)審計線索的技術(shù)。常用的大數(shù)據(jù)審計工具有R語言、Python和Tableau。基于對審計實務(wù)的調(diào)研和相關(guān)學術(shù)研究,人工智能審計技術(shù)大體上可以分為機器學習、計算機視覺、虛擬、自然語言處理和認知計算等(吳勇等,2021)。在率先應(yīng)用人工智能審計的領(lǐng)域,四大會計師事務(wù)所都是與專業(yè)機構(gòu)合作推出可供注冊會計師應(yīng)用的審計產(chǎn)品,注冊會計師通常無需參與審計產(chǎn)品的開發(fā)設(shè)計。因此,人工智能審計對注冊會計師信息化專業(yè)能力要求相對較低。相比而言,注冊會計師在大數(shù)據(jù)審計中不僅需要具備大數(shù)據(jù)審計思維,還需要掌握一定的大數(shù)據(jù)審計技術(shù)。因此,大數(shù)據(jù)審計對注冊會計師信息化專業(yè)能力要求更高?;诖?本文主要基于大數(shù)據(jù)審計技術(shù)探討注冊會計師信息化專業(yè)能力框架?;凇吨袊詴嫀焺偃文芰χ改稀窐?gòu)建的中國注冊會計師勝任能力框架,本文將從信息技術(shù)專業(yè)知識、信息技術(shù)職業(yè)技能和信息技術(shù)職業(yè)道德三個方面構(gòu)建注冊會計師的信息化專業(yè)能力框架,如圖1所示。其中,信息技術(shù)專業(yè)知識應(yīng)當在原有學科領(lǐng)域的基礎(chǔ)上增加新興技術(shù)學科領(lǐng)域,比如大數(shù)據(jù)、人工智能、移圖1注冊會計師信息化專業(yè)能力框架圖動互聯(lián)網(wǎng)、云計算、物聯(lián)網(wǎng)和區(qū)塊鏈等相關(guān)的知識。信息技術(shù)職業(yè)技能應(yīng)當在原有技術(shù)和應(yīng)用技能的基礎(chǔ)上增加新興技術(shù)學科領(lǐng)域的應(yīng)用技術(shù)和應(yīng)用技能,比如注冊會計師應(yīng)當掌握大數(shù)據(jù)審計常用的R語言、Python和Tableau等信息化工具。信息技術(shù)職業(yè)道德應(yīng)當在原有職業(yè)價值觀、道德和態(tài)度的基礎(chǔ)上增加信息系統(tǒng)、數(shù)據(jù)管理和職業(yè)道德物化等方面的職業(yè)道德教育。

(二)改革創(chuàng)新學歷教育

1.改革創(chuàng)新學歷教育的課程體系。目前的學歷教育課程體系難以培養(yǎng)出行業(yè)信息化建設(shè)所需的人才。目前會計專業(yè)開設(shè)的相關(guān)信息技術(shù)知識、技術(shù)和道德已經(jīng)無法滿足新時代審計工作的需要。具體表現(xiàn)為:一是信息技術(shù)專業(yè)知識較為陳舊,并未新增大數(shù)據(jù)審計、人工智能審計等新興技術(shù);二是課程所涉及的信息技術(shù)職業(yè)技能較為落后,仍局限于Office辦公軟件等傳統(tǒng)信息技術(shù);三是新興信息技術(shù)職業(yè)道德教育缺失,并不涉及新興技術(shù)相關(guān)的職業(yè)道德教育,仍局限于傳統(tǒng)的審計職業(yè)道德教育。學歷教育階段應(yīng)當遵循科學的課程體系設(shè)計邏輯,可以從以下三個方面改革創(chuàng)新學歷教育的課程體系:首先要更新信息技術(shù)專業(yè)知識,新增大數(shù)據(jù)審計、人工智能審計等新興技術(shù)專業(yè)知識;其次要開設(shè)信息技術(shù)職業(yè)技能課程,比如R語言、Python和Tableau等信息化工具應(yīng)用課程;最后要加強新興信息技術(shù)職業(yè)道德教育,在審計職業(yè)道德相關(guān)的課程中新增新興技術(shù)相關(guān)的職業(yè)道德教育內(nèi)容。2.改革創(chuàng)新學歷教育的培養(yǎng)模式。目前的學歷教育培養(yǎng)模式幾乎全部依賴自有師資力量、自編課堂教材,普遍存在理論與實務(wù)脫鉤的現(xiàn)象,人才培養(yǎng)不能滿足行業(yè)信息化建設(shè)的需求。建議采用產(chǎn)學研相結(jié)合的培養(yǎng)模式,遵循“理論源于實務(wù),理論指導實務(wù),理論高于實務(wù)”的科學理念,將理論與實務(wù)融合在一起。具體而言,高等院??梢栽趯W歷教育的人才培養(yǎng)過程中引入信息化實務(wù)導師,可以與會計師事務(wù)所開展聯(lián)合培養(yǎng),根據(jù)學生的擇業(yè)選擇以及會計師事務(wù)所的用人需求開展有針對性的學歷教育。

(三)完善職業(yè)繼續(xù)教育

1.完善會計師事務(wù)所內(nèi)部職業(yè)繼續(xù)教育。會計師事務(wù)所是高智力的學習型組織,每年均會對員工開展財務(wù)會計審計等各種專業(yè)知識的培訓,為提升審計人員的信息化水平和使用能力,應(yīng)加強和改進培訓工作,如:在內(nèi)部培訓中增加有關(guān)信息化方面的培訓內(nèi)容;從外部聘請信息化方面的專家開展培訓工作;從現(xiàn)有員工中選拔更多優(yōu)秀的、具有培養(yǎng)前途的員工參加外部各種信息化培訓、學歷教育和信息化審計項目實務(wù)鍛煉等。同時,對現(xiàn)有的信息化審計人員也要開展財務(wù)會計審計相關(guān)知識的培訓,使目前的信息化審計人員理解和掌握更多財務(wù)審計知識,成為精通財務(wù)的信息化審計人才。2.完善注冊會計師行業(yè)的職業(yè)繼續(xù)教育。行業(yè)協(xié)會要創(chuàng)新職業(yè)繼續(xù)教育的方式和方法,圍繞信息化專業(yè)能力的專業(yè)知識、職業(yè)技能和職業(yè)道德等重點,豐富完善相關(guān)教育內(nèi)容。充分利用信息技術(shù)手段,上線職業(yè)繼續(xù)教育相關(guān)應(yīng)用,切實提高職業(yè)繼續(xù)教育的培訓效果,持續(xù)保持和強化注冊會計師信息化專業(yè)能力和職業(yè)道德操守。

(四)深化行業(yè)監(jiān)管改革