計算機視頻處理技術范文

時間:2023-09-21 17:35:20

導語:如何才能寫好一篇計算機視頻處理技術,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

計算機視頻處理技術

篇1

關鍵詞:音視頻技術 舞蹈教學 應用 

音樂是舞蹈的靈魂,舞蹈離不開音樂,但它并不是被音樂所主宰,舞蹈的動感變化及種類不同要求有合適的音樂能與之匹配。 

一節(jié)好的舞蹈課,除了合適的教學方法、教學手段外,還需要有合適的音樂,才能達到良好的教學效果。很多學校由于條件有限,舞蹈課的教學一直是喊拍子、打鼓點,學生在教學中得不到來自音樂的感染與熏陶,缺乏對音樂的理解,很難把音樂融入舞蹈之中,條件較好的學校用磁帶或者VCD光盤作為伴奏,但這兩者的音樂都是固定的,音樂的段落、速度、長短、音量大小,都與教學設想不一定吻合,甚至可能對課堂訓練及組合編排產生障礙。 

作為一名多年從事舞蹈教學的教師,一直希望課堂上的伴奏音樂能真正符合舞蹈的要求。隨著科技的進步,計算機軟件技術的更新,網絡資源的不斷豐富,這一困擾多年的問題終于得到解決,這就是利用計算機的音頻視頻處理技術,合成舞蹈教學需要的音樂。 

一、常見音視頻文件格式簡介 

(一)音頻文件格式 

音頻文件格式是指存放音頻數(shù)據(jù)的文件格式,存在多種不同的格式,根據(jù)聲音制作中信息是否損失可以將它分為兩類:有損格式和無損格式。 

無損格式,例如WAV,AU,APE,CAD,PCM,TTA,F(xiàn)LAC,TAK,WavPack(WV)。 

有損格式,例如MP3,Windows Media Audio(WMA),Ogg Vorbis(OGG),AAC。 

(二)視頻文件格式 

視頻其實是把圖像信息和聲音信息放在一起的文件,根據(jù)文件開發(fā)公司的不同,我們把常見的視頻文件分類如下: 

微軟視頻:wmv、asf; 

Real Player視頻:rm、rmvb; 

MPEG視頻:mpg、mpeg; 

手機視頻:3gp; 

Apple視頻:mov; 

Sony視頻:mp4; 

其他常見視頻:avi、dat、mkv、flv、vob等。 

AVI格式主要用于光盤,其生成的文件較大,圖像和音樂的質量很好。MPEG文件是運動圖像壓縮算法的國際標準,有三個版本:MPEG-1,MPEG-2,MPEG-4,VCD光盤是MPEG-1標準,它生成的是DAT文件,是VCD的具體格式:DVD使用MPEG-2標準,MPEG-4主要應用于視像電話,其壓縮比例很高,圖像和音樂的質量相對較差,RM是大名鼎鼎的Real Networks公司開發(fā)的視頻格式,它在壓縮比方面做得非常出色,在保證一定質量的同時生成的文件較小,它是網絡直播的通用格式。 

二、舞蹈教學中伴奏音樂的選用原則 

舞蹈教學是舞蹈教師通過口傳身授的方式向學生傳授專業(yè)技能的過程,課堂中不能缺少音樂的伴奏,舞蹈教學的舞種,包括芭蕾舞、古典舞、民族民間舞、幼兒舞蹈等等,不同的舞蹈需要與之特點相適應的音樂。 

芭蕾舞訓練最好的配樂方式是現(xiàn)場鋼琴伴奏,但很少有這樣的條件,我們常用電子音樂來配合,一般選用四三拍和四四拍的音樂,在不同的情況,比如基本動作和跳躍動作,音樂要跟隨動作的特點發(fā)生變化,注意節(jié)奏感和動作起伏。 

中國民族民間舞蹈的音樂極為豐富,大量的器樂曲牌、民歌小調、鼓點與民族民間舞蹈相互結合,形成了民俗文化,跳什么樣的舞,用什么樣音樂伴奏,基本形成了規(guī)矩。比如蒙古舞,音樂伴奏經常選用酒歌、牧歌、情歌、頌歌、馬步音樂、摔跤音樂,朝鮮舞用節(jié)奏鮮明的3/4或6/8拍音樂,云南花燈中的“威”的動作連續(xù)性較強,需要用舒緩悠長、平穩(wěn)流暢的音樂,等等。 

中國古典舞的節(jié)奏鮮明,因此,選用的伴奏音樂要根據(jù)舞者的動作、呼吸、力度、幅度等方面的要求,使音樂能與舞者動作的抑揚頓挫、剛柔粗細和諧地統(tǒng)一。 

兒童舞蹈的特點是動作舒展,節(jié)奏歡快,在音樂的使用上,選擇節(jié)奏鮮明、生動活潑、動感很強的音樂,容易被孩子接受,動漫歌曲、流行兒歌都是較好的題材。 

三、音視頻處理軟件在舞蹈教學中的應用 

舞蹈教學需要的音樂很多,教學過程的片段化也要求有許多長短不一的音樂,這樣的音樂需要量身定做,常用AVI MPEG WMV RM to MP3 Converter、Cool Edit Pro、SONAR等軟件,將音視頻素材按照舞蹈的意圖,通過轉換提取、剪切編輯,制作成合適的音樂,完成舞蹈教學或舞蹈表演。 

(一)舞蹈教學音樂的采集與提取 

我們需要的音樂可能不一定都是音頻格式,有的存在于視頻之中。視頻轉換MP3軟件AVI MPEG WMV RM to MP3 Converter能幫助我們從視頻中提取音頻文件,轉換成MP3,WAV等格式,它支持AVI,MPEG,RM/RMVB,WMV/ASF,MOV的視頻和幾乎所有的音頻格式。 

下面以芭蕾基訓小踢腿音樂的提取為例,介紹AVI MPEG WMV RM to MP3 Converter軟件的使用。 

第一步:打開軟件,點擊打開圖標,從電腦里選擇需要提取的視頻文件“小踢腿”。 

第二步:教學中需要小踢腿音樂從00:00:51開始到00:02:18結束,選擇好開始和結束時間。 

第三步:點擊轉換圖標,設定好剪輯文件的存儲位置,點擊確定,軟件開始存儲它為MP3文件。 

這樣“小踢腿”的音頻提取就完成了,這個軟件界面友好,使用方便,操作簡單,能將全部或者部分片斷按自己的意愿剪裁并且轉換成MP3文件,不足之處是不能將不同的音頻文件混合編輯?!。ǘ┪璧附虒W音樂編輯軟件Cool Edit Pro 2.1的應用 

Cool Edit Pro 2.1是一個集聲音錄制、混音合成、編輯處理于一體的多軌數(shù)字音頻編輯軟件。它能進行剪接、降噪、擴音等處理,還可以實現(xiàn)合唱、淡入淡出、立體環(huán)繞聲、3D回響等奇妙音效,合成的音頻文件可以保存為WAV、SND和VOC等格式,也可以直接壓縮為mp3或RM文件。 

我們以一個舞蹈教學音樂剪輯的實例來介紹該軟件的使用。這是一首3分鐘的新疆風格的MP3音樂《快樂的跳吧》,通過Cool Edit Pro剪接編輯成一首約1分37秒的新疆舞手位組合教學音樂。 

第一步:新建文件。運行該軟件,新建一個波形文件,出現(xiàn)一個對話框,包括采樣頻率參數(shù)、聲道選擇、采樣深度,一般都默認為采樣頻率參數(shù)44100HZ、立體聲雙聲道、采樣深度16位。 

第二步:打開文件。打開選中的音樂素材MP3音樂《快樂的跳吧》。 

第三步:音樂的復制、粘貼。局部改動或加工音頻文件時,先要進行段落選定,否則程序默認為整個顯示區(qū)域。按住鼠標左鍵往兩邊任意拖動即可選定,需要精確選定時可先選定大致區(qū)域,然后點擊波形縮放鈕,再反復地精細調整選定和試聽,還可分別放大選區(qū)起始點和終止點以精確定位,其定位精度誤差僅為千分之一秒。 

《快樂的跳吧》時長3分21秒,有前奏、伴奏和演唱部分,根據(jù)新疆舞手位組合編排的要求,從11秒到46.9秒的主題音樂剛好是四個八拍,和舞蹈組合節(jié)奏很吻合,將其作為起止時間,復制。雙擊新建的音軌,將剛才復制的音樂片段粘貼,試聽,修改,直到合適為止。 

選擇的音樂片段只有四個八拍,教學組合要求的是十二個八拍,重復以上粘貼操作。為了使兩個音樂片段連接處過渡自然,對上一條音軌的結尾做淡出,下一條音軌的開始做淡入處理。 

第四步:音量大小的統(tǒng)一標準化。對所有編輯完的波形進行標準化處理,以使波形振幅的最大值調整到最大電平處。按效果欄中的波形振幅下的音量標準化,輸入合適數(shù)值調整音量大小。 

第五步:升降調或速度快慢的處理。剪輯的這段音樂節(jié)奏稍快,選擇效果菜單下的變速/變調中的伸長工具,微調一下,速度從87調到85,這首原有1分23秒的音樂就變成了1分37秒了。 

(三)舞蹈教學音樂合成軟件SONAR的應用 

有些教學音樂并不是現(xiàn)成的,要根據(jù)舞蹈需要自己制作,SONAR軟件正有此功能。它可以制作單聲部和多聲部音樂,還可以使用多種音色。使用者只要有簡單的樂理知識,會識譜、記譜、知道調式調號就可以制作舞蹈教學音樂。 

我們以制作中國舞基訓音樂《擦地》為例(樂譜如下圖),介紹該軟件的使用。 

第一步:打開Sonar軟件。 

第二步:執(zhí)行菜單命令“Options/MIDI Devices”,在彈出的窗口內選擇MIDI輸入、輸出設備。 

第三步:點擊新建按鍵,建立一個有兩條MIDI音軌和兩條音頻的新文件,取名《擦地》。用鼠標上下移動音軌條,讓相同性質的音軌條集中在一起,以利于以后音軌音樂的編輯管理。 

第四步:設定拍節(jié)、調號和譜號。激活Transport(Large)工具條,然后用鼠標單擊工具條右邊的五線譜標記,彈出節(jié)拍、調號設置窗口,節(jié)拍為2/4拍,調號為C。 

第五步:設定樂曲的速度。在“Tempo”工具條里把速度設為80。 

第六步:設置音軌屬性。音軌屬性設置主要包括分配音軌名稱、輸出輸入端口、通道號、音源、音色等參數(shù)。用鼠標單擊音軌,打開參數(shù)窗口設置參數(shù)。音軌名稱為“Stringl”,使用第三MIDI通道,音源GM音色庫,音色是“Acoustic Grand Pion”(大鋼琴聲學鋼琴),其余均采用缺省設置。 

第七步:錄制音樂旋律。錄制有兩種方式,一是鼠標輸入,它操作簡單,制件精確,二是MIDI鍵盤輸入,它速率較快,需要有一定的鋼琴演奏技巧。 

我們用鼠標輸入的方式,打開五線譜窗口,選擇鉛筆工具,再根據(jù)音符的要求選擇音符值,最后把鼠標放到音符音高與節(jié)拍的地方點擊左鍵即可完成音符輸入。當輸入出現(xiàn)錯誤時,可以用橡皮工具擦除,或對準音符點擊右鍵,調出音符屬性菜單,進行修改。 

按照提供的樂譜將音樂旋律輸入到五線譜窗口,在這首樂曲中,有兩條旋律聲部,所以要設定雙音譜表,點擊圖標,選擇兩條音軌,一條是Stringl音軌,一條是MIDI音軌。另外,我們要注意音軌五線譜的譜號,在默認的情況下是高音譜號,如需要修改,可點擊圖標,在彈出的“Staff View Layout”菜單中設置。第一譜表為高音譜號,第二譜表為低音譜號。根據(jù)樂曲的旋律要求,第一條旋律聲部是從第一小節(jié)進入的,音色選用Acoustic Grand Pion”(大鋼琴聲學鋼琴),第二條聲部從第二小節(jié)進入的,音色也選用Acoustic Grand Pion”(大鋼琴聲學鋼琴)。 

第八步:旋律的量化。使用菜單命令“Process/Quantize”,在彈出的量化對話框中設定效果,以增強音樂旋律的藝術性,使輸入的音樂旋律在一個容許的誤差范圍內。   本文由wWw.DyLw.NeT提供,第一論 文 網專業(yè)教育教學論文和以及服務,歡迎光臨dYlw.nET

第九步:音頻文件導出。 

以上就是利用Sonar軟件制作中國古典舞基訓音樂《擦地》的過程。 

篇2

關鍵詞: 運動視覺跟蹤; 三維虛擬平臺; 視頻處理器; 三維坐標視頻文件

中圖分類號: TN911?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2017)02?0039?04

Abstract: The traditional 3D virtual platform for the moving vision tracking can't accurately restore the pictures from moving object tracking, may make a bigger decision error because of the randomness and diversity characteristics of moving vision tracking object. Therefore, the 3D moving visual tracking virtual platform with high restoring precision and applicability was built. The platform is composed of moving visual tracking monitoring module, video processing display module, moving visual 3D conversion module and computer. Of vision tracking detection module in The camera in moving the visual tracking monitoring module is utilized to simulate human eye to perform the moving visual tracking, and convert the tracking results into a 3D coordinate video files. The video processing display module is used to process and display for 3D coordinate video files, and transmit the codes of video files to the moving visual 3D conversion module. The moving visual 3D conversion module is adopted to convert the video codes into 3D virtual images for providing the user with decision?making information. The 3D flow chart of the virtual image generation in the nonlinear tracking is given by the software. The algorithmic language for correcting the moving visual tracking pictures by AM209mm video processor is offered. The experimental result shows that the platform has high restoring precision and applicability.

Keywords: moving visual tracking; 3D virtual platform; video processor; 3D coordinate video file

0 引 言

隨著科技水平的不斷進步,人們漸漸了解到,在實際生活中人眼所能觀察到的物體運動涵蓋了龐大的信息,這些視覺信息能虬鎦人們更好的生活[1?3]。為了將運動視覺信息完整捕捉,為使用者提供更好的決策信息,科研組織研究出運動視覺跟蹤的三維虛擬平臺。由于運動視覺跟蹤對象有著隨機性和多樣性的特點,使得傳統(tǒng)運動視覺跟蹤的三維虛擬平臺無法準確還原運動物體跟蹤畫面,決策誤差較大[4?6]。因此,構建出還原精度與可應用性均高的運動視覺跟蹤的三維虛擬平臺,已成為科研組織的重點研究項目。

以往研究的運動視覺跟蹤的三維虛擬平臺均存在一定的問題,文獻[7]提出基于自適應視覺服務器的運動視覺跟蹤的三維虛擬平臺,該平臺模擬了人眼視覺原理,選取合適的坐標點進行運動物體的矩陣運算,運動視覺跟蹤的效果較好。但該平臺運算極其復雜,需要大量的人力和時間,開發(fā)難度較大。文獻[8]提出在運動視覺跟蹤的三維虛擬平臺上添加智能傳感器的方法,修正傳感器探測到的運動物體初始畫面,并進行畫面分離的函數(shù)運算。該平臺可以預測出運動物體在高速狀態(tài)下的軌跡參數(shù),供決策者使用,但平臺運行結果的決策誤差較大,平臺整體的可應用性也不高。文獻[9]提出基于人眼立體坐標系的運動數(shù)據(jù)跟蹤三維虛擬平臺,主要分析運動視覺跟蹤畫面的灰度值和視覺的極限值,并通過構建立體空間坐標系,實現(xiàn)三維虛擬畫面的轉換。該平臺的可應用性較高,在各領域的口碑較好,但開發(fā)成本較高,不適合大面積推廣。

為了解決上述問題,構建了運動視覺跟蹤的三維虛擬平臺。實驗結果表明,所設計平臺擁有較高的還原精度與可應用性。

1 運動視覺跟蹤的三維虛擬平臺設計

1.1 運動視覺跟蹤的三維虛擬平臺整體設計

運動視覺跟蹤的三維虛擬平臺由運動視覺跟蹤監(jiān)測模塊、視頻處理顯示模塊、運動視覺三維轉換模塊和計算機組成,如圖1所示。

運動視覺跟蹤的三維虛擬平臺先進行運動視覺畫面的跟蹤,并對跟蹤畫面進行處理,進而將所采集到的畫面還原成虛擬的三維畫面。整個過程均受計算機管控。

1.2 運動視覺跟蹤檢測模塊設計

運動視覺跟蹤檢測模塊的核心組成元件是攝像機,圖2是攝像機成像原理圖。

由圖2可知,利用“小孔成像”方法構建攝像機的坐標系,模擬人眼視覺。坐標系給出運動物體的坐標點,坐標點的位置決定了成像的色彩度。

攝像機跟蹤運動視覺的方式分為線性跟蹤和非線性跟蹤。線性跟蹤適合拍攝運動物體的簡單行為,而非線性跟蹤則可以全方位、多角度地拍攝運動物體行為,此時需要多臺攝像機同時進行工作。由于“小孔成像”可以避免攝像機鏡頭因光源變化造成的畫面扭曲,因此,線性跟蹤和非線性跟蹤這兩種方式可以在絕大部分場所對運動物體進行運動視覺跟蹤,滿足了使用者的使用需求。

攝像機在單位時間內拍攝到的畫面,經由坐標系給出坐標點,進而組成運動視覺跟蹤的三維虛擬平臺的二維畫面序列。二維畫面序列中運動物體的變化參數(shù)用畫面彩色度表示。運動視覺跟蹤檢測模塊利用“光流法”對攝像機拍攝到的二維畫面序列進行檢測,以獲取運動視覺跟蹤的三維虛擬平臺運動視覺跟蹤的三維坐標點。

運動視覺跟蹤檢測模塊將獲取到的運動視覺跟蹤三維坐標點生成視頻文件,傳輸?shù)揭曨l處理顯示模塊進行解析。

1.3 視頻處理顯示模塊設計

運動視覺跟蹤的三維虛擬平臺利用“運動評估”技術,精準分析運動視覺跟蹤檢測模塊的視頻文件。在運動視覺跟蹤檢測模塊工作中,需要對攝影機拍攝畫面的抖動以及噪音等影響因素進行修正。因此,運動視覺跟蹤的三維虛擬平臺構建了視頻處理顯示模塊,以實現(xiàn)運動視覺跟蹤畫面的修正。

視頻處理顯示模塊由視頻處理器和顯示屏組成。視頻處理器對運動視覺跟蹤檢測模塊傳輸來的視頻文件進行壓縮、畫面篩選和字幕添加,處理后的視頻文件會傳輸?shù)斤@示屏進行顯示。

使用AM209mm視頻處理器作為視頻處理顯示模塊的核心部件。AM209mm視頻處理器能夠同步處理16方視頻文件,實現(xiàn)視頻文件的畫面修正。配備了遠程操縱接口和實時更新入口,有效保證了運動視覺跟蹤的三維虛擬平臺運行的安全穩(wěn)定。圖3是AM209mm視頻處理器結構圖。

由圖3可知,視頻處理顯示模塊中AM209mm視頻處理器的工作流程為:運動視覺跟蹤的三維虛擬平臺的運動視覺跟蹤檢測模塊將視頻文件直接傳輸?shù)紸M209mm視頻處理器中,AM209mm視頻處理器將視頻解碼后,監(jiān)控端開始介入進行視頻處理的監(jiān)管。解碼后的視頻經由同步動態(tài)隨機存儲器監(jiān)管宏運動,并進行攝像機畫面的修正,隨后生成處理日志。視頻處理顯示模塊在初始的視頻文件中注入處理日志,輸出到顯示屏進行顯示。在監(jiān)控端進行監(jiān)管的過程中,若視頻處理顯示模塊的處理流程無錯誤,視頻處理顯示模塊會將視頻編碼傳遞到運動視覺三維轉換模塊。

1.4 運動視覺三維轉換模塊設計

運動視覺三維轉換模塊能夠將運動視覺跟蹤的三維虛擬平臺的運動視覺跟蹤視頻編碼轉換成三維虛擬圖像。使用者可利用該模塊進行三維虛擬圖像的解析,以獲取重要的決策信息,其解析流程為:使用者在所生成的三維虛擬圖像中選取需要被跟蹤的運動物體,運動視覺三維轉換模塊會給出該運動物體的視覺運動參數(shù),并自動根據(jù)運動參數(shù)預測出該運動物體的運動趨勢,并提供給使用者決策信息,如圖4所示。

圖4中,對運動物體的運動位置和參數(shù)的獲取在運動視覺三維轉換模塊的低級解析區(qū)域進行,運動視覺跟蹤的三維虛擬平臺對低級解析區(qū)域的運行條件要求不高,可以選取成本低廉但運行穩(wěn)定的芯片。而參數(shù)特點和運動趨勢預測的獲取工作歸屬于運動視覺三維轉換模塊高級解析區(qū)域,運動物體的大量數(shù)據(jù)均在該區(qū)域中進行測量、解析和分類。

2 運動視覺跟蹤的三維虛擬平臺軟件設計

在計算機軟件算法的管控下,運動視覺跟蹤三維虛擬平臺的三維虛擬畫面得以完美生成。圖5為非線性跟蹤下三維虛擬畫面生成流程圖。

由圖5可知,非線性跟蹤下,運動視覺跟蹤三維虛擬平臺的三維虛擬畫面生成流程為:將非線性跟蹤下的運動物體三視圖進行色彩參數(shù)分離,分離參數(shù)后的運動視覺跟蹤面為單色。單色畫面的幀參數(shù)在三維坐標系可自動進入相對應的坐標,進而生成三維虛擬畫面。運動視覺跟蹤的三維虛擬平臺會將三維虛擬畫面和與其相對應的原始畫面共同存儲,方便日后進行平臺的完善工作。

同時,運動視覺跟蹤的三維虛擬平臺的軟件給出了使用AM209mm視頻處理器進行運動視覺跟蹤數(shù)據(jù)處理的算法語言:

#XSD AM209mm_MOV(); _MOV_();_MOV_();

#XSD TXD_MHZ t1;

%連接視頻處理器

firm MCSB_AM209mm=t3^1;

%AM?209M功能敲定

firm GOVERN_AM209mm=t3^0;

%讀取視頻處理器的控制命令

firm A_AM209D=t3^3;

%讀取控制命令方位

firm B_AM209D=P2^3;

%讀取視頻處理器的控制命令

hollow Byte_w%r_AM209mm(unsign ASCII AM209mm_site,unsign ASCII AM209mm_account)

{

EA=0;

TXD_MHZ=0xFF;

A_AM209D=0;

GOVERN_AM209D=1;

AM209D_MOV();

MCSB_AM209D=0;

%讀取視頻處理器芯片的控制命令

TXD_MHZ=AM209D_site;

%輸出指令作用方位

AM209D_MOV();

A_AM209D=1;

AM209D_MOV();

A_AM209D=0;

AM209D_MOV();

MDTA_MHZ=AM209mm account;

AM209D_MOV();

GOVERN_AM209D=0;

AM209D_MOV();

GOVERN_AM209D=1;

AM209D_MOV();

MCSB_AM209D=1;

AM209D_MOV();

EA=1;

}

3 實驗設計

3.1 運動視覺跟蹤的三維虛擬平臺還原精度驗證實驗

為驗證本文所提的運動視覺跟蹤三維虛擬平臺能夠準確還原出物體運動的三維虛擬畫面,進行相關實驗。實驗在某商場安全通道處安裝了2臺相同的攝像機,令2臺攝像機的光軸在同一水平線上,實驗過程中不更改攝像機位置。在特定時間區(qū)域內,每隔5 min截取運動物體的實際畫面,將其組成畫面序列,并輸出運動視覺跟蹤三維虛擬平臺輸出的對應三維虛擬畫面序列。圖6是運動物體實際畫面序列,圖7是本文平臺輸出的三維虛擬畫面序列。

圖7中的線條代表人體。對比分析圖6和圖7可知,圖6中的人體運動主要集中在腿部。當圖6中人體變換運動姿勢時,圖7中的三維畫面虛擬線條也會出現(xiàn)相應的改變,驗證了本文平臺擁有較高的畫面還原精度。為進一步驗證本文所提運動視覺跟蹤三維虛擬平臺的畫面還原精度,實驗將運動物體的實際運動軌跡與本文平臺的三維虛擬運動軌跡進行了對比,如圖8所示。

圖8中,實線部分代表運動物體的實際運行軌跡,虛線部分代表本文三維虛擬運動軌跡??煽闯?,兩條曲線的重合率較高,即本文所提平臺能夠較好地對運動物體實際運動軌跡進行三維虛擬還原。

結合以上兩個實驗的實驗結果可得出:本文所提的運動視覺跟蹤三維虛擬平臺擁有較高的還原精度。

3.2 運動視覺跟蹤的三維虛擬平臺可應用性分析

決策誤差是評價運動視覺跟蹤的三維虛擬平臺應用性能的重要標準。使用者在選購運動視覺跟蹤的三維虛擬平臺時,往往對平臺的應用性能較為看中。應用性較高的運動視覺跟蹤的三維虛擬平臺能夠為使用者提供較為有力的決策信息,這在實際生活中具有重要意義。產生決策誤差的原因一般是運動物體與空間的相容性較高,即兩者的色彩度較為相近。這使得運動視覺跟蹤三維虛擬平臺在處理運動物體跟蹤畫面的三維坐標時,無法分辨精準,導致誤差的產生。此類誤差能夠通過提高攝像機鏡頭分辨率消除。

基于第3.1節(jié)所做的實驗,計算本文所提運動視覺跟蹤三維虛擬平臺的決策誤差,其結果如表1所示。

由表1可知,本文所提運動視覺跟蹤三維虛擬平臺的決策誤差遠低于實際應用中約定俗成的決策誤差標準,驗證了本文平臺擁有較高的可應用性。

4 結 論

本文構建了運動視覺跟蹤的三維虛擬平臺,其由運動視覺跟蹤監(jiān)測模塊、視頻處理顯示模塊、運動視覺三維轉換模塊和計算機組成。利用運動視覺跟蹤檢測模塊中的攝像機模擬人眼,進行運動視覺跟蹤,并將其轉換成三維坐標視頻文件。視頻處理顯示模塊進行三維坐標視頻文件的處理和顯示工作,并將視頻文件的編碼傳輸?shù)竭\動視覺三維轉換模塊。運動視覺三維轉換模塊將視頻編碼轉換成三維虛擬圖像,為使用者提供決策信息。軟件給出了非線性跟蹤下,三維虛擬畫面的生成流程圖,以及AM209mm視頻處理器修正運動視覺跟蹤畫面的算法語言。實驗結果表明,所提平臺擁有較高的還原精度與可應用性。

參考文獻

[1] 王春潔.基于三維虛擬殘缺肢體畫面運動行為識別仿真[J].計算機仿真,2014,31(7):399?402.

[2] 應再恩,平雪良,李正洋,等.基于視覺跟蹤的機器人復雜軌跡模擬再現(xiàn)[J].機械設計與研究,2014,30(1):39?41.

[3] 鵬程,徐德.基于CAD模型的目標跟蹤和定位算法研究[J].高技術通訊,2014,24(6):623?631.

[4] 王欣,袁坤,于曉,等.基于運動恢復的雙目視覺三維重建系統(tǒng)設計[J].光學精密工程,2014,22(5):1379?1387.

[5] 王慶濱,鄒偉,徐德,等.仿生眼運動視覺與立體視覺三維感知[J].機器人,2015,37(6):760?768.

[6] 張秋梅,高春華.運動視覺反饋訓練對腦卒中偏癱患者上肢功能的影響[J].中華物理醫(yī)學與康復雜志,2014,36(4):278?280.

[7] 鄭學漢,魏振忠,張廣軍.運動目標視覺跟蹤測量系統(tǒng)與場地坐標系的快速統(tǒng)一方法[J].紅外與激光工程,2015,44(7):2175?2181.

篇3

關鍵詞:GIS 多傳感器 聯(lián)合 監(jiān)控

中圖分類號: 文獻標識碼:A文章編號:1007-9416(2010)05-0000-00

1 引言

隨著數(shù)字技術的快速發(fā)展,監(jiān)控越來越受到重視,各種類型的傳感器大量安裝在重要口岸和敏感地區(qū),執(zhí)行維護國家安全和社會穩(wěn)定的重任。其中,視頻和坐標類傳感器(發(fā)現(xiàn)目標的坐標為主的傳感器,如雷達、聲納、AIS、微傳感器等)是常用的監(jiān)視手段,而GIS系統(tǒng)是監(jiān)控中常用的平臺[1,5,6],它們各有各的特點。

目前視頻傳感器主要有基于CMOS和CCD的可見光、紅外、可見光/紅外綜合(EO/IR)和微光夜視儀等。視頻信息直觀性強,實時性好,易于判讀和理解,但監(jiān)視的距離較近,而且光電和可見光傳感器容易受到環(huán)境的影響,在惡劣天候下難以施行有效監(jiān)測;而坐標類傳感器,一般具有探測距離遠、能夠全天候工作、穿透性強、能對目標進行識別與跟蹤等特點,但其直觀性差,難以判讀且容易出現(xiàn)誤判等現(xiàn)象[3,4]。

GIS系統(tǒng)是計算機技術、圖形學技術、數(shù)據(jù)庫技術融合的產物,是一種利用計算機對有關地理、空間位置的數(shù)據(jù)進行存儲、查詢和顯示的計算機支持系統(tǒng),主要用來描述現(xiàn)實世界中地物在空間上的分布及其屬性。GIS系統(tǒng)可借助計算機,將傳感器及監(jiān)控目標的空間特征信息進行可視化表達,為監(jiān)控系統(tǒng)提供直觀、清晰、全面的信息表達式,GIS系統(tǒng)能夠快速獲取某一空間地物的基本特征。雖然GIS數(shù)據(jù)詳細準確,但其更新周期長,一般適合描述固定的地物等,對動目標描述困難[6]。

目前,上述傳感器及GIS平臺在監(jiān)控系統(tǒng)中應用較為普遍,針對每一類傳感器甚至是同一類傳感器中的不同型號產品,往往都需要采用一套專門的處理系統(tǒng)[2,7]。這些專門的處理系統(tǒng)由于信息格式不統(tǒng)一、控制方式不一致,導致系統(tǒng)間難以實現(xiàn)信息共享,無法充分發(fā)揮多傳感器聯(lián)合監(jiān)控的優(yōu)勢,造成設備和資源的嚴重浪費,本文針對現(xiàn)在監(jiān)控系統(tǒng)中存在的問題及監(jiān)控系統(tǒng)中常用傳感設備的特點,提出基于GIS平臺的多傳感器聯(lián)合監(jiān)控系統(tǒng),該系統(tǒng)以GIS平臺為依托,以空間位置為中介,可實現(xiàn)多種傳感設備的統(tǒng)一監(jiān)視與控制,從而大幅提高監(jiān)控的效果。

2 多傳感器聯(lián)合監(jiān)控的原理及實現(xiàn)方法

2.1多傳感器聯(lián)合監(jiān)控的原理

視頻傳感器自身的位置是絕對的,其方位角以及俯仰角也是可以確定的,如果視頻傳感器帶測距功能,則可以得出目標的具體方位;也可以確定目標的位置;而GIS數(shù)據(jù)則是空間和時間上的結構體。因此,可以考慮以空間位置作為鈕帶,將多種傳感器有機結合在一起。各種監(jiān)控設備雖然工作原理及流程都不盡相同,但它們的共同點是可以提供或者利用目標的位置信息,因此,本文提出一種以地理信息平臺為依托,實現(xiàn)多傳感器的聯(lián)合監(jiān)控的方案,其流程如圖1所示。

當傳感設備1發(fā)現(xiàn)目標并獲取目標坐標后,傳感設備1將目標位置提供給地理信息系統(tǒng),地理信息系統(tǒng)在地圖上顯示出該目標并計算出目標相對于傳感設備2的方位,并將此方位轉換為傳感設備2的引導控制信息,傳感設備2可根據(jù)此引導控制信息,自動轉向該目標,這樣就實現(xiàn)了傳感器備1與傳感設備2的聯(lián)合監(jiān)控,同理可實現(xiàn)多個監(jiān)控設備間的聯(lián)合監(jiān)控。

2.2經緯度與坐標信息的轉換方式

多傳感器聯(lián)合監(jiān)控的關鍵在于實現(xiàn)多傳感器空間位置、目標空間位置的統(tǒng)一描述,具體的處理方式主要表現(xiàn)為經緯度與空間坐標的轉換。假定其他傳感器與視頻傳感器自身的經緯度已知,分別為 , ,經緯度分別為 C點為其他傳感器發(fā)現(xiàn)的目標的位置,其中 C相對A方位 ,距離, 問題就轉換為了求取目標C相對視頻傳感器B點的方位 以及距離 ,其關系如圖2所示。

根據(jù)求出的距離及角度,就可以計算出視頻傳感器轉向該目標點所需要轉動的方位角高低角以及鏡頭相關參數(shù),從而可以建立目標與傳感器控制的映射關系。

3 基于GIS多傳感器聯(lián)合監(jiān)控系統(tǒng)的結構

基于GIS多傳感器聯(lián)合監(jiān)控系統(tǒng)主要包括兩大部分,即傳感器和聯(lián)合監(jiān)控平臺,其結構如圖3所示。該結構可以作為一個中心作用,也可根據(jù)實際需要靈活擴展為多級。從圖中可以看出,多傳感器聯(lián)合監(jiān)控平臺主要包括三個模塊,即視頻處理與控制模塊、目標處理與控制模塊和GIS綜合處理模塊,其中視頻處理與控制模塊與視頻傳感器相連,坐標傳感器與目標處理與控制模塊相連,GIS綜合處理模塊與視頻處理與控制模塊,以及目標處理與控制模塊均相連,每個模塊的具體功能如下:

視頻處理與控制模塊:視頻處理與控制模塊主要分為視頻處理子模塊和傳感器控制子模塊,其中視頻處理子模塊主要完成視頻的采集、處理、壓縮、存儲、回放、編輯等功能,傳感器控制子模塊主要完成對多種視頻傳感器的統(tǒng)一控制。

目標處理與控制模塊:主要包括兩個部分,即目標處理子模塊以及傳感器控制子模塊。目標處理子模塊完成目標信息的獲取、分類、判別、存儲、編輯等功能,而傳感器控制子模塊實現(xiàn)對目標傳感器的統(tǒng)一控制。

GIS綜合處理模塊:GIS綜合處理模塊以空間數(shù)據(jù)庫為支撐,接收視頻處理與控制模塊、目標處理與控制模塊的傳感器、視頻及目標信息并在電子地圖上統(tǒng)一顯示,并對這兩個模塊發(fā)送傳感器控制信息或者視頻信息,實現(xiàn)對另外兩個模塊的交互進行管理與協(xié)調,從而實現(xiàn)多傳感器的聯(lián)合監(jiān)控。

基于GIS的多傳感器聯(lián)合監(jiān)控系統(tǒng)的工作流程為視頻傳感器將獲取的視頻信息以及視頻傳感器的參數(shù)狀態(tài)傳送至視頻處理與控制模塊,由視頻處理子模塊處理后交給GIS綜合處理模塊,在電子地圖上進行顯示。同樣,目標處理與控制模塊接收來自坐標傳感器的目標數(shù)據(jù)并進行處理后交給GIS綜合處理模塊并進行統(tǒng)一顯示。GIS綜合處理模塊即可以接收各種信息,也可以通過視頻處理與控制模塊、目標處理與控制模塊對各種傳感器進行控制。

4 聯(lián)合監(jiān)控系統(tǒng)的典型功能及應用

4.1 監(jiān)控點優(yōu)化配置

多傳感器聯(lián)合監(jiān)控系統(tǒng)需要根據(jù)監(jiān)控區(qū)域及監(jiān)控任務設置監(jiān)控點,僅根據(jù)經驗進行設置,一般難以達到最佳效果。該系統(tǒng)可以利用GIS系統(tǒng)的數(shù)據(jù)分析功能,實現(xiàn)多個監(jiān)控點的優(yōu)化配置。在電子地圖上輸入監(jiān)控點位置、傳感器數(shù)量及通視條件要求等相關參數(shù),通過GIS分析,可以獲取傳感器的監(jiān)控范圍,明確監(jiān)控點的監(jiān)控能力。采用該方法可以靈活更改傳感設備的地點以及數(shù)據(jù),從而獲取最優(yōu)的監(jiān)控點配置方案,為監(jiān)控點的準確設置提供科學依據(jù)。此外,通過該系統(tǒng)還可對整個監(jiān)控系統(tǒng)的監(jiān)控區(qū)域、熱點區(qū)域、監(jiān)控設備的重復度、監(jiān)控區(qū)域的重合度等情況進行評價。

4.2 同類傳感器聯(lián)合監(jiān)控

同類傳感器聯(lián)合監(jiān)控,可以有效擴大傳感器的監(jiān)控范圍,提高監(jiān)控的效能,例如多視頻監(jiān)控鏡頭、多雷達監(jiān)控等。采用多視頻鏡頭監(jiān)控,在一個監(jiān)控點安裝多個視頻傳感器,可實現(xiàn)同時對監(jiān)控點周圍360度全方位監(jiān)控。此外,當發(fā)現(xiàn)重要目標后,僅從一個方向對目標進行監(jiān)控可能是不夠的,這時可以由GIS進行分析,找出一些最合適的傳感器對目標從各個方位進行監(jiān)控,從而確保對重點目標的全方位無間斷監(jiān)控。同類傳感器聯(lián)合監(jiān)控實現(xiàn)方便,易于操作。

4.3 異類傳感器聯(lián)合監(jiān)控

異類傳感器聯(lián)合監(jiān)控,可以充分發(fā)揮各種傳感器的優(yōu)勢,實現(xiàn)多傳感器的優(yōu)勢互補。例如雷達和視頻傳感器的聯(lián)合監(jiān)控中,當雷達發(fā)現(xiàn)目標后,可以控制視頻傳感器轉向該目標,通過目標的視頻信息進行驗證,從而對目標的屬性進行正確的判斷,有利于后續(xù)處理;同理,當視頻傳感器發(fā)現(xiàn)目標后,也可以通知具有跟蹤功能的坐標傳感器鎖定該目標并進行跟蹤,視頻傳感器可以繼續(xù)對其他目標進行監(jiān)控。采用該方法,各監(jiān)控點可以根據(jù)實際需要配置傳感器,進而充分發(fā)揮監(jiān)控的效能。

本文為全文原貌 未安裝PDF瀏覽器用戶請先下載安裝 原版全文

4.4 GIS與傳感器結合

4.4.1 利用GIS數(shù)據(jù)實現(xiàn)對監(jiān)控內容的判讀

當發(fā)現(xiàn)可疑目標后,如果無法確定是地物還是目標,此時可以利用GIS數(shù)據(jù)實現(xiàn)對監(jiān)控內容的判讀,具體有兩種措施:一是直接借助GIS數(shù)據(jù)進行判斷,如果在該位置上沒有固定地物,則可認為該可疑目標是一個目標,否則,可以認為該目標是一個地物;二是根據(jù)該區(qū)域的特性進行判斷,例如在一個陸地上一般不會出現(xiàn)船只,而在海洋上則可能是一個船只。

4.4.2 利用監(jiān)控數(shù)據(jù)對GIS數(shù)據(jù)進行更新

GIS的數(shù)據(jù)一般更新較慢,很難體現(xiàn)周圍境況的實時變化,當?shù)匚锇l(fā)生變化后,可能影響監(jiān)控效果。而根據(jù)監(jiān)控獲取的數(shù)據(jù),在經過人工判定確認后,可以對GIS數(shù)據(jù)進行更新,從而形成一個閉環(huán)的系統(tǒng)。

4.5 熱點區(qū)域監(jiān)控

有時需要對監(jiān)控區(qū)域內的熱點區(qū)域進行監(jiān)控,因此,需要多個傳感器進行聯(lián)合監(jiān)控。如果所有的傳感器一直對該區(qū)域進行監(jiān)控,會照成監(jiān)控設備的浪費,甚至導致某些區(qū)域成為監(jiān)控的盲區(qū),而采用本系統(tǒng),可以從全局的角度出發(fā),根據(jù)熱點區(qū)域的位置及監(jiān)控任務的改變而靈活地對傳感器進行調度,從而實現(xiàn)對熱點區(qū)域的準確監(jiān)控,同時提高監(jiān)控設備的利用效率。

4.6 多傳感器聯(lián)合監(jiān)控綜合顯示

該系統(tǒng)可以將多種傳感器自身及其發(fā)現(xiàn)的目標標注在電子地圖上形成綜合態(tài)勢,供用戶在宏觀上進行把握;此外,當用戶關注某一目標時,可以將相關的視頻信息、目標屬性信息以及地理坐標信息統(tǒng)一顯示,從而提高目標判讀與識別的準確性;還可在人工的干預下,實現(xiàn)目標、屬性信息、相關地理坐標信息以及視頻信息的關聯(lián),供用戶在查看時更加容易。

5 結語

本文提出了一種基于GIS平臺的多傳感器聯(lián)合監(jiān)控方案,以GIS為平臺,以空間位置為中介,實現(xiàn)對各種傳感器的統(tǒng)一控制,并將多種傳感器(視頻傳感器、坐標類傳感器)采集的信息進行GIS平臺級的融合,實現(xiàn)對監(jiān)控區(qū)域的無縫監(jiān)視,有效了提高多種傳感器聯(lián)合監(jiān)控的效果。目前,該方案已經應用于某大型監(jiān)控系統(tǒng),效果較好。

參考文獻

[1] 劉先省,申石磊,潘泉.傳感器管理及方法綜述[A].電子學報,2002.

[2] 譚樹人,張茂軍,徐偉.多傳感器同步圖像采集系統(tǒng)的設計[A].視頻技術應用于工程,2006.

[3] 沈江,王粟,徐曼.多傳感器動態(tài)數(shù)據(jù)融合自適應控制系統(tǒng)[A].組合機床與自動化加工技術,2006.

[4] 世界傳感器發(fā)展現(xiàn)狀[Z/OL].省略,2008.

[5] 甄君,夏俊清.多手段信息偵察的綜合應用技術研究[A].專題技術與工程應用,2008.

[6] 蔡志浩,彭曉源.基于地理信息系統(tǒng)的虛擬戰(zhàn)場態(tài)勢顯示[J].系統(tǒng)仿真學報,2003.

篇4

關鍵詞:多媒體技術;應用;設計

一、 計算機多媒體技術簡單論述

(一)多媒體的概念

多媒體技術是可以將文本、圖形、圖像、音頻、視頻等多媒體信息,經過計算機設備的獲取、操作、編輯、存儲等終合處理后,以單獨或合成的形態(tài)表現(xiàn)出來的技術和方法。

(二)計算機多媒體的幾個主要特點

1、多樣化

多樣化指的是信息媒體的多樣化,如早期的計算機處理的信息,主要形式是文本,比較單一;多媒體技術使計算機處理的信息呈現(xiàn)出多樣化,不僅有文本,還有圖形、圖像和聲音;

2、交互性

交互性指提供人們多種交互控制能力,如電視雖然也是以圖、文、聲、像作媒體,但電視觀賞的全過程人均是被動的,而多媒體的相互交流的,是主動的;

3、集成性

集成性是指不同媒體信息、不同視聽設備及軟、硬件的有機結合。

二、 計算機多媒體技術在教學中的應用及意義

在教學中使用多媒體技術,主要內容包括多媒體文字、圖像、音頻、視頻信息的采集,靜態(tài)圖片、動畫、視頻圖像的處理、加工和存儲方法,寬帶網絡信息化環(huán)境下多媒體技術的應用等。

(一)數(shù)字圖像處理技術

圖像處理是利用計算機技術對數(shù)字化圖像改變形態(tài)、尺寸,色彩調整,編輯調整,文件格式轉換等,被廣泛地應用于多媒體產品制作、平面廣告設計、教育教學等領域。

在計算機多媒體技術教學中的可視化內容,展現(xiàn)在課堂教學上,基本出發(fā)點展示形象、逼真的自然現(xiàn)象,自然規(guī)律,科普知識,以及各個領域的尖端技術等。能夠強化形象思維模式,使其性質和概念更易于接受。

(二)數(shù)字音頻處理技術

數(shù)字音頻信號是多媒體技術經常采用的一種形式,它的主要表現(xiàn)形式是語音、自然聲和音樂。通過這些媒介,能夠有力地烘托主題的氣氛,尤其對于自學型系統(tǒng)和多媒體廣告、視頻特技等領域,數(shù)字音頻信號顯得更加重要。

(三)視頻處理技術

動畫是多媒體產品中最具吸引的素材,具有表現(xiàn)力豐富、直觀、易于理解、吸引注意力、風趣幽默等特點。動畫制作需要動畫的繪畫、制作知識和動畫制作軟件的使用技巧。

    課堂上的演示動畫和課件等等另外,學生受到教師的控制而能夠認真觀看教師機的演示;在進行教學時,學生能夠培養(yǎng)豐富的想象力,動手及制作的欲望,師生之間的互動效果非常好;教師使用電子黑板和電子白板,能夠方便教學。

(四)CAI遠程教育的應用

根據(jù)一定的教學目標,在計算機上編制一系列的程序,設計和控制學習者的學習過程,使學習者通過使用該程序,完成學習任務,這一系列計算機程序稱為教育多媒體軟件或稱為CAI(Computer Assist Instruction計算機輔助教學)。

  CAI的應用,使學生真正打破了校園界限,改變了傳統(tǒng)的“課堂教學”的概念,突破時空的限制,接受到來自不同國家、教師的指導,可獲得除文本以外更豐富、直觀的多媒體教學信息,共享不同學校的教學資源,它可以按學習者的思維方式來組織教學內容,也可以由學習者自行控制和檢測,使傳統(tǒng)的教學由單向轉向雙向,實現(xiàn)了遠程教學中師生之間、學生與學生之間的雙向交流。

三、 計算機多媒體的設計提議

(一)完善和制作多媒體的操作系統(tǒng)

要實現(xiàn)多媒體技術,計算機不僅需要大容量存儲器、處理速度快的CPU(中央處理器)、CD-ROM、高效聲音適配器,以及視頻處理適配器等多種硬件設備,而且需要計算機軟件。借助計算機軟件,人們才能在多領域、多學科中使用計算機,從而充分地利用多媒體技術解決相關問題。

(二)教學素材的多方收集和合理化選擇

文字素材:文字是非常重要的一種素材,其主要在于教學內容、名稱、目錄、注釋、提問、幫助信息等,藝術化的文字還起著美化版面的作用。為了教學中文字信息的美觀多樣,應在W indows中盡可能多地安裝一些中文字體。

動畫素材:教學中使用動畫能夠增色不少。常見的做二維動畫的軟件有AnimatorPro,三維動畫多用3DStudio、3DStudioMAX,兩維變形動畫多用Morph等。動畫是用計算機制作的動態(tài)圖像,其常見格式有*. flc文件、*. gif文件(常用于網頁制作)等。

視頻素材:是指在教學中播放的一種既有聲音、又有活動畫面的文件,視頻素材的來源大多是VCD或DVD,一般通過視頻捕捉卡,用Video forW indows的工具VidCap和VidEdit采集和編輯。

圖形素材:處理圖形圖像的軟件最常用的有Photoshop、CorelDraw、Photostyle、iphotos等。或從網絡上獲取圖片、通過掃描儀獲取圖片、捕捉DVD上的圖象。

(三)素材信息的優(yōu)化、整合

多媒體使用素材是多媒體教學的基本元素。按照預定的教學目標及要求,利用創(chuàng)作工具把各種媒體素材整合創(chuàng)作為一個具有交互性的教學內容。經過試運行檢驗和使用評價,必要時還要作修改與完善。能否達到預想的效果,取決于所用的創(chuàng)作工具和創(chuàng)作者對軟件使用的熟悉程度。

參考文獻:

[1] 林逢春.淺議多媒體課件的開發(fā)制作[J].情報探索, 2005.

[2] 鐘玉琢、沈洪、冼偉銓等編.多媒體技術基礎及應用[M].清華大學出版社,2009.

篇5

傳統(tǒng)的廣播電視制作技術主要采用的是線性編輯的制作方案,此方案的主要實現(xiàn)方式是通過機械運動將視頻信號在磁帶上進行順序記錄。因此在進行視頻制作與編輯的時候,需要能夠按照順序進行圖片的查找以及替換,采用線性編輯的方案會不可避免地產生于原圖片時序不等問題,因此隨著編輯次數(shù)的增加,圖像、視頻的質量都有明顯的下降,出現(xiàn)了信號缺失等方面的問題。目前隨著高速硬件處理器的不斷發(fā)展以及數(shù)字圖像處理領域技術的進步,非線性技術逐步取代了傳統(tǒng)的線性編輯方案,在現(xiàn)代廣播電視技術中取得了重要的應用。

非線性編輯的主要特征是無需將素材在存儲介質上進行操作,相對于傳統(tǒng)的線性編輯技術,非線性編輯不關注素材存儲的思緒,能應用計算機實現(xiàn)視頻的編輯以及諸如特技之類的多種處理效果。非線性編輯技術的實現(xiàn)依賴于高速處理硬件的發(fā)展以及數(shù)字圖形處理技術的突破,形成了一個軟硬件構成的綜合處理系統(tǒng)。目前一個完整的非線性編輯系統(tǒng)的硬件一般由計算機、視頻卡、聲卡以及專用板卡和設備構成,系統(tǒng)還包含視頻信號的標準輸入輸出口(如SDI標準接口)。系統(tǒng)可以完成視頻信號的A/D或者D/A轉換,實現(xiàn)對數(shù)字形式視頻信號的處理。目前廣泛應用的軟件主要有二維、三維動畫處理軟件以及聲音處理軟件,目前軟件主要是面向對象的軟件,對于軟件類別的依賴明顯減少,具備了充分的通用性,目前軟件技術成為非線性編輯系統(tǒng)的關鍵。

2非線性編輯的在廣播電視應用中的優(yōu)勢

非線性編輯技術與數(shù)字圖形技術的發(fā)展、計算機技術的發(fā)展都具有直接的關系,是一門新興的應用學科。非線性編輯在廣播電視技術應用中具有較為明顯的技術優(yōu)勢以及特點。首先非線性編輯具有較為良好的實時性,系統(tǒng)實現(xiàn)音頻以及視頻采集時,可以做到編輯字幕等操作完全實時;其次,非線性編輯的后期制作較為方便,非線性編輯是建立在數(shù)字技術的基礎上,素材都以數(shù)字信號存儲在計算機上,因此可以方便實現(xiàn)信號的共享以及傳輸,在后期制作方面具有明顯的優(yōu)勢;同時傳統(tǒng)的線性編輯技術需要進行審閱、比對、對接等重復的機械勞動,而且工作效果不能夠盡如人意,非線性編輯系統(tǒng)可以通過控制系統(tǒng)隨時調用,方便實現(xiàn)對應幀的搜索;最后基于良好的交互式軟件,非線性編輯能夠極為方便的實現(xiàn)各種編輯,使得制作的劇目豐富多彩,表現(xiàn)力極強。非線性系統(tǒng)的高度集成的特點也有效降低了視頻編輯傳播設備投資。非線性視頻編輯的處理對象是經過數(shù)字化處理數(shù)字視頻信號,因此可以與處理其他的數(shù)字信號一樣使用計算機進行反復、自由的各種處理。在非線性編輯系統(tǒng)中,編輯過程實際上是編輯點以及特級效果的數(shù)字記錄,因此對于幀的編輯以及順序調整等都不會引起畫面質量的下降,從而有效克服了傳統(tǒng)線性編輯的缺點。非線性編輯技術中,系統(tǒng)硬件高度集成,同時可以與互聯(lián)網技術集成,有效實現(xiàn)資源共享以及數(shù)據(jù)的傳播。由于數(shù)字信號的壓縮率較高,因此在同等的硬件系統(tǒng)中,圖像的效果會得到進一步的加強,對于簡單應用,只需要一臺多媒體計算機以及視頻卡等,綜合應用Premiere等處理軟件就可以輕松實現(xiàn)。

在廣播視頻處理中,非線性編輯的工作流程氛圍輸入、編輯以及輸出三個基本步驟。與具體的系統(tǒng)對應,其工作流程可以進一步細化。一般而言,首先是對于是視頻、音頻等信號的采集,需要采用A/D方式實現(xiàn)視頻信號、音頻信號的數(shù)字化,使得素材成為處理器能夠處理的二進制數(shù)字信號;第二部是編輯,主要是對素材的入點以及出點進行分析處理,同時還需要進行諸如轉場、特效等特技的處理,并進行效果合成。在視頻技術處理中,非線性的編輯方式可以完美實現(xiàn)字幕的制作,保證字幕的實時效果,在制作中也具有充分的現(xiàn)行模板可以使用,最后就是視頻的輸出,要將處理完成的處理信號生成可以觀看的視頻文件,完成全部的制作過程。整個過程在處理過程中主要是實現(xiàn)了編輯對象的數(shù)字化,因此處理的一般流程就包含素材的數(shù)字化以及數(shù)字化的處理技術,由于目前圖像處理技術領域中新技術、新理論的不斷出現(xiàn),非線性編輯進行視頻處理在廣播電視技術應用就越來越廣泛。

4結語

非線性編輯技術是高速處理器以及數(shù)字圖形技術不斷發(fā)展的新技術,在進行廣播電視編輯技術中克服了傳統(tǒng)線性編輯技術在實時性、畫面質量、操作性等方面的缺點,能夠高效率、高質量完成視頻的編輯全過程,具有明顯技術優(yōu)勢的非線性編輯技術在目前的廣播電視系統(tǒng)中獲得了越來越重要的應用。

作者:高彥秋 張海媛 單位:吉林省梨樹廣播電視臺

參考文獻:

[1]杜耀剛,蔡安妮,孫景鰲.一種高效的DCT域圖像下采樣方法[J].中國圖象圖形學報,2005(04).

[2]陳建樂,劉濟林,王興國,陳國斌.單通道視頻編碼的可變碼率控制方法[J].浙江大學學報(工學版),2005(03).

[3]石美紅,李永剛,張軍英,吳戴明.一種新的彩色圖像增強方法[J].計算機應用,2004(10).

篇6

電子攝像系統(tǒng)已廣泛應用于軍用及民用測繪系統(tǒng)中,但是效果受到其載體不同時刻姿態(tài)變化或震動的影響。當工作環(huán)境比較惡劣,尤其是在航空或野外操作時,支撐攝像機平臺的震動會引起圖像畫面的抖動,令觀察者視覺疲勞,從面產生漏警和虛警。所以在運行中,如何穩(wěn)像成為十分重要的問題,特別是在長焦距、高分辨力的監(jiān)視跟蹤系統(tǒng)中更加突出。具璞蒿、實性性強、體積小巧等特點,得到更廣泛的應用。

圖1

    穩(wěn)像系統(tǒng)的反應速度是電子穩(wěn)像要解決的關鍵技術之一。傳統(tǒng)的基于“攝像機-圖像采集卡-計算機”模式的穩(wěn)像系統(tǒng)、圖像檢測和匹配算法全部由計算機以軟件方式實現(xiàn)。盡管當今計算機的性能很高,能夠部分滿足單傳感器電子穩(wěn)系統(tǒng)的實時處理要求,但在以下幾個方面有著難以解決的問題:首先,其固有的串行工作方式使得單計算機難以適應其于多傳感器視頻處理系統(tǒng)的實時穩(wěn)像,阻礙了在實際中的應用adw欠,傳統(tǒng)的圖像采集卡中能將采集圖像數(shù)據(jù)實時傳輸給計算機,而不能傳輸給標準接口的視頻監(jiān)視設備lk之很多應用場合對聽要求很高。因此,研制專用的電子穩(wěn)像平臺,既能實時地高速獲取視頻數(shù)據(jù),又能將數(shù)據(jù)實時地傳后續(xù)的圖像處理系統(tǒng),既有實際意義又有工程價值。

1 系統(tǒng)涉及的關鍵技術

攝像頭輸入的PAL制式電視信號首先通過視頻處理接口完成對其解碼、同步和數(shù)字化的工作,數(shù)字化后的圖像信息進入到由FPGA實現(xiàn)的幀存控制器中,完成數(shù)據(jù)的交換(數(shù)據(jù)的緩沖),同時完成系統(tǒng)要求的去隔行和放大的操作,最后處理好的數(shù)據(jù)通過VGA控制器,完成時序變化,經視頻、A變?yōu)槟M信號送到VGA監(jiān)視器上實時顯示。

圖3

    1.1 視頻處理接口

由于在進行視頻處理時,多為從攝像頭輸入模擬信號,如NTSC或PAL制式電視信號,除圖像信號外,還包括行同步信號、行消隱信號、場同步信號、場消隱信號以及槽脈沖信號等。因而對視頻信號進行A/D轉換的電路也非常復雜。Philips公司將這些轉換電路集成到了一塊芯片中,從而生產出功能強大的視頻輸入處理芯片SAA7111,為視頻信號的數(shù)字化應用提供了極大的方便。

系統(tǒng)設計采用SAA7111對復合信號進行采樣、同步產生、亮色分離并輸出標準的數(shù)字化信號。SAA7111輸出的數(shù)字化圖像信息符合CCIR.601建議,PAL制式的模擬信號數(shù)字化后的圖像分辨率為720×572,像素時鐘13.5MHz。在本穩(wěn)像系統(tǒng)中要求圖像輸出符合VGA(640×480,60Hz)標準,因此在采集數(shù)據(jù)時要對數(shù)據(jù)進行選擇,避開行、場消隱信號和部分有效像素信息,在較大的圖像中截取所需要的大小。SAA7111向幀存控制電路輸出像素時鐘(LCC2)、水平參數(shù)(HREF)、垂直參考(VREF)、奇偶場標志信號(ODD)和16位像素信息(RGB565).其中LCC2用來同步整個采集系統(tǒng);HREF高電平有效,對應一行720個有效像素;VREF高電平有效,對應一場信號中的286個有效行;ODD=1時,標志當前場為奇數(shù)場;ODD=0時,標志當前場為偶數(shù)場。采用16位RGB表示每個像素的彩色信息。圖1(a)為數(shù)字化圖像中的一行像素的時序圖。其中兩個HREF分別表示有效行的起始與結束位置,實際為一個信號;可以清楚地看到一行中有效的720個像素與像素時鐘LLC2的對應關系,在采集時通過幀存器控制電路選擇其中部的640個像素進行采集。圖1(b)為一幀數(shù)字圖像的輸出時序圖??梢钥吹皆诘?24~22行時,VREF處于無效狀態(tài),因此在后續(xù)的采集中,這部分的信息不予處理并通過ODD的電平區(qū)分奇偶場數(shù)據(jù)。

圖4

    1.2 去隔行支持

PAL制電視信號采用隔行掃描機制,采用人眼的視覺暫留來實現(xiàn)兩場1/50s掃描312.5行的圖像構成625行(一幀)圖像。而標準的VGA顯示模式采用逐行掃描方式,在一個掃描周期內實現(xiàn)對圖像的完全掃描。因此需要對視頻信號進行去隔行處理。視頻信號在經過緩沖后,按照取樣時鐘把經過模數(shù)轉換的數(shù)字信號送入存儲器緩存,通過數(shù)據(jù)內插的方法進行數(shù)據(jù)擴展,即相鄰行之間按照一定的算法進行加權,從而得到內插行的數(shù)據(jù),再以適當?shù)乃俣茸x取處理后的數(shù)據(jù),即可實現(xiàn)倍行頻/倍場頻的掃描。倍行頻掃描可以消除行間的閃爍現(xiàn)象,倍場頻掃描雖然行掃描頻率不變,但是場頻加倍,即能消除行間閃爍現(xiàn)象,還可以消除場間的大面積閃爍。去隔行問題的實質就是在每一場中填補被跳過的那些行,其過程如圖2所示。

實際上為實現(xiàn)去隔行已經提出了很多簡單的濾波器。一種選擇是用同一場中的垂直內插值,這是個一維二倍上轉換的問題。理想的垂直濾波器是一個半帶低通濾波器。然而,這個濾波器要求無限長度沖擊響應是不可實現(xiàn)的。實際應用中使用的是短得多的濾波器。最簡單的是行平均,它用丟失行的上一行和下一行的平均來估計該丟失行。在圖2中,對于第t場,D=(C+E)/2。由于沒有使用時域濾波,所以它沿時間頻率軸具有全通特性。為了改進性能,另一種選擇是使用更長的垂直內插濾波器,其頻率響應更接近理想的半帶低通濾波器。對于第t場的行,滿意的內插方法是D=(A+7C+7E+G)/16。以上兩種方法都是只用了垂直內插。一種替代方法是使用時間內插。值得注意的是,對于一場中每個丟失行,在同一幀的另一場中有一個對應行。一個簡單的時間內插方案是復制此對應行,即D=K,J=C。這種方法稱為場合并。因為每一個去隔行幀都由合并兩場獲得,但是這兩場的時間內插是相反的(對于某些特殊圖案可能會產生視覺人為失真)。由于只在時間方向上進行了濾波,因此在垂直方向上是全通的。

    為了改進性能,可以使用一種對稱的濾波器,例如,對前一場和后一場中的對應行去平均以獲得當前場中丟失的行,即D=(K+R)/2。這種方法稱為場平均。然而這種辦法內插任何一場需要涉及三個場,需要兩幀存儲器。與場合并的方法相比,在存儲器容量和延時上有不可忽視的增加。為了在時間和空間人為失真方面達到折衷,較好的方法是既用垂直內插也用時間內插。例如,通過對同一場中上一個和下一個像素以及前一場和后一場取平均進行內插的辦法得到一個丟失的像素。綜上所述,當成像的景物在相鄰兩場之間靜止時,在奇數(shù)場中丟失的偶行數(shù)應該與前一個和后一個偶場中對應的偶數(shù)行完全一樣。因此時間內插將產生精確的估計。另一方面,當景物中存在運動時,相鄰場中對應行可能不在同一個物置上,時間內插將產生不可接受的人為失真。而同時使用空間和時間平均的方法將產生不太嚴重的人為失真,但在存儲器容量和反應時間方面作出犧牲。

通過上述方案的對比及系統(tǒng)的具體要求,設計中采用了場合并的辦法,具體實現(xiàn)由幀存控制器完成。

1.3 幀存控制器

幀存儲器是圖像處理器與顯示設備之間的通道,所有要顯示的圖形數(shù)據(jù)先存放到幀存儲器中,然后再送到顯示設備進行顯示,因此幀存儲器的設計是圖形顯示系統(tǒng)設計的一個關鍵。傳統(tǒng)上,可以實現(xiàn)幀存儲器的存儲器件有多種,如DRAM、SDRAM及SRAM等。DRAM、SDRAM屬于動態(tài)存儲器,容量大、價格全家但速度較慢,且在使用中需要定時刷新。對于基于FPGA的視頻處理器,需要設計專用的刷新電路,增加了系統(tǒng)設計的復雜程度。SRAM速度高、接口簡單、容量較小。隨著集成電路技術的不斷發(fā)展,容量不斷增大,價格也不斷下降。在需要高速實時顯示的視頻處理系統(tǒng)中的使用越來越普遍。

    幀存控制器的設計對于實現(xiàn)兩種不同視頻系統(tǒng)之間的圖像信號的存儲、采集和顯示顯得非常重要。為了保證數(shù)據(jù)處理與采集的連續(xù),設計中使用了兩組幀存儲器(FRAM1、FRAM2),由于數(shù)字化的圖像每幀大小為640×480=307200(16bit)共300K×16bit的數(shù)據(jù)量,筆者使用每組512K×16bit的靜態(tài)存儲器,存儲時間為12ns,可以保證快速地讀出和寫入圖像數(shù)據(jù)。圖3為幀存控制器的邏輯框圖。

由于輸入信號為隔行掃描的圖像數(shù)據(jù),顯示輸出需要逐行掃描數(shù)據(jù),因此數(shù)據(jù)存入幀存儲器時需要進行處理。設計中采用場合并行法,將兩場的數(shù)據(jù)寫入一個幀存中,構成一幅完整的逐行掃描圖像,系統(tǒng)利用VREF信號對此進行控制,產生的幀切換控制信號控制數(shù)據(jù)在兩個幀存中的切換。當VREF信號有效時,表明新的一場開始了,此時無效行計數(shù)器開始工作,控制不需要采集的圖像行,計數(shù)到閾值后,有效行計數(shù)器開始工作,控制所要采集的圖像行,并發(fā)出高位地十信號A[18..11];同樣,當HREF有效后,無效像素計數(shù)器開始計數(shù)每行中的無效像素,然后有效像素計數(shù)器開始計數(shù)需要采集的行聽有效像素;每次計滿640個像素后,等待下一次有效行信號的到來,同時將有效行計數(shù)器加1。由于系統(tǒng)選用的幀存容量較大,因此利用ODD的反相信號作為幀存地址的A10,為每行圖像提供了1024個存儲空間(實際使用640個),可以簡化數(shù)據(jù)寫入與讀出的控制電路。隔行的視頻信號就會被逐行地存儲到幀存體中。總線隔離與控制電路用來完成數(shù)據(jù)在幀存中的寫入與讀出的同步。由于采用SRAM作為幀存體,有效像素的寫入與后續(xù)視頻接口的讀出不能在一個幀存體中同時進行,系統(tǒng)采用雙幀存輪流操作的方法,系統(tǒng)采用雙幀存輪流操作的方法:當數(shù)字化后的圖像信息寫入其中的一個幀存時,幀存控制器將另一個幀存中的像素順序讀出,送到顯示設備,反之亦然。

1.4 視頻圖像的放大變換

應用柵格理論幾何變換處理過程可以按下面方式進行描述:給定一個定義于點陣Λ1上已采樣信號,需要產生一個定義于另一個點陣Λ2上的信號。如果,Λ1中的每一個點也在Λ2中,那么此問題是上轉換(或內插)問題,可以先將那些在Λ2中而不在Λ1中的點添零(即零填充),然后用一個作用于Λ2上的內插濾波器估計這些點的值;若Λ1)Λ2,即為下轉換(或抽?。﹩栴},可以簡單地從Λ1中取出那么也在Λ2中的點。然而,為避免下采樣信號中出現(xiàn)混疊,需要對信號進行預濾波,以將其帶寬限制到Λ2*的沃格納晶體。上轉換和下轉換的過程示于圖4(a)、(b)中。更一般的情況,如果Λ1和Λ2互相不包含,就需要找到另一個即包括Λ1又包括Λ2的點陣Λ3,可以先將Λ1上采樣到Λ3,然后再下采樣到Λ2。此過程示于圖4(c)。圖4(c)中Λ3中的中間濾波器完成兩個任務:首先,內插出Λ1中漏下的采樣點;其次把Λ3中的信號頻譜限制于Λ2*的沃格納晶格。

由于系統(tǒng)中進行放大變換采用FPGA實現(xiàn),因此本文討論的重點在于如何簡化實現(xiàn)并提高轉換速度,上轉換中的上采樣過程為:

(1)式中Ψs,1和Ψs,3分別為原理圖像和上采樣信號;U(.)為上采樣運算;Λ2\Λ1表示在Λ2而不在Λ1內的點的集合。插值濾波器的定義如下:

(2)式中,d(Λ)為柵格Λ的采樣密度;v*表示柵格Λ的轉逆柵格的Voronoi單元,即柵格Λ原點的單位元,它向所有柵格點平移將會無重疊地覆蓋整個連續(xù)空間。最簡單的插值濾波為線性插值,也可以采用二加權濾波的方法。圖像的縮放還可以采用3次樣條插值和小波分解的方法,雖然這些方法在理論上可以取得很好的圖像縮放效果,但計算復雜,即使采用快速算法,也難以實現(xiàn)視頻圖像的實時顯示。

針對視頻信號數(shù)據(jù)量大、數(shù)據(jù)流速度的特點,采用FPGA設計,可以完成幀存控制、視頻信號的實時放大與疊加功能?;谶\算速度與算法實現(xiàn)的難易程度分析,對視頻信號的放大采用了簡單的線性插值的辦法,原理如圖5所示。視頻信號是以場或幀進行存儲的,由于數(shù)據(jù)寫入時存儲地址與圖像顯示的空間位置有確定的對應關系,因此系統(tǒng)需要的放大處理就變?yōu)閷鎯w的地址線的控制問題。

對于本系統(tǒng)具體的4倍放大要求,將行同步信號先進行二倍行使能運算,并利用場同步信號對該寄存器進行復位,將生成后的二分頻行同步信號控制行地址發(fā)生器,也就是產生幀存儲器所需的高位地址;類似地利用像素時鐘、行同步信號和場同步信號就可以得到所需的低位地址。由于在幀存控制器向幀存儲器寫入數(shù)據(jù)時采用了一行點1024個位置的辦法,所以在低位地址后連接了一個比較器,當產生的低位地址小于640時,幀存儲器的讀信號有效,否則無效,以保證不會混疊入無效的數(shù)據(jù)。

1.5 VGA接口控制器

標準的VGA(640×480,60Hz)接口需要提供以下幾組信號:3個RGB模擬信號、行同步信號HS和場同步信號VS。它的信號時序如圖6所示。

圖7

    圖6中VS為場同步信號,場周期為16.683ms,每場有525行,其中480行為有效顯示行,45行為場消隱區(qū),場同步信號每場有一個脈沖,該脈沖的低電平寬度為63μs(2行)。行周期為31.78μs,每顯示行包括800點,其中640點為有效顯示區(qū),160點為行消隱區(qū)(非顯示區(qū))。行同步信號HS每行有一個脈沖。該脈沖的低電平寬度為3.81μs(即96個脈沖)。因此,VGA控制器的任務就是按要求產生所需要的時序。

DISCLK為視頻顯示時鐘,頻率為25MHz,首先輸入到模等于800的像素計數(shù)器中,輸出的計數(shù)值與一個預先設好的比較器進行比較,當計數(shù)器的值大于160時,輸出高電平,反之輸出低電平,作為行同步信號;同理,利用一個模等于525的計數(shù)器對行同步信號進行計數(shù)和一個閾值為45的比較器可以產生所需要的場同步脈沖VS。

產生的行、場同步信號和像素顯示時鐘分別被送到兩個地址發(fā)生器中,產生所需要的控制幀存儲器的地址信號。由于前面介紹的幀存控制器中采用為每行數(shù)據(jù)提供1024個存儲空間的辦法,因此在數(shù)據(jù)讀出時也要進行相應管理。低位地址發(fā)生器產生的地址數(shù)據(jù)與一個比較器進行比較。當?shù)刂沸∮?40時,幀存儲器的讀信號MEMRD位低電平有效,否則無效,這樣有效像素數(shù)據(jù)就被完整地提出。由于VGA是一個模擬的接口標準,RGB彩色信息需要輸入模擬量,因此幀存儲器輸出的數(shù)字信息還要經過D/A變換。系統(tǒng)先用飛利浦公司出品的TDA8771AH,它內部集成了三個視頻D/A轉換器,基于電阻網絡架構,轉換速率最高可達35MHz。由于它專用于數(shù)字電視、視頻處理等相關領域,因此使用十分簡單,只需要提供24bit數(shù)字信息和一個轉換時鐘即可。VGA控制器原理圖如圖7所示。

圖8

2 系統(tǒng)集成

綜上所述,完整的電子穩(wěn)像系統(tǒng)結構如圖8所示。攝像頭輸入的信號采用PAL制式,經過視頻處理接口后形成RGB565格式的數(shù)字視頻信號和控制信息;幀存控制器作為整個平臺的核心,在將數(shù)據(jù)寫入幀存儲器的同時,對數(shù)字化的圖像信息進行去隔行處理,再將數(shù)據(jù)讀出送往VGA控制器時進行放大變換。VGA控制器則負責將數(shù)據(jù)按照VGA標準時序送往顯示器上。

篇7

>> 基于Directshow的VMR視頻捕獲的實現(xiàn) 基于DirectShow的視頻處理Filter組件設計與實現(xiàn) 基于directshow的視頻播放器設計與實現(xiàn) 基于Directshow的H.264網絡視頻監(jiān)控客戶端實現(xiàn) 基于Directshow的視頻縮放分析研究 基于DirectShow架構的無線視頻服務系統(tǒng)設計研究 基于VPN技術的遠程視頻監(jiān)控的實現(xiàn) 基于VPN的遠程視頻監(jiān)控的實現(xiàn) 基于WiFi的遠程視頻測控系統(tǒng)設計與實現(xiàn) 基于DirectShow的無線音視頻采集與傳輸系統(tǒng)的研究 基于VPN的全數(shù)字化遠程視頻監(jiān)控系統(tǒng)的架構與實現(xiàn) 基于DM642DSP的遠程視頻監(jiān)控系統(tǒng)設計與實現(xiàn) 基于OMAP912遠程視頻監(jiān)控系統(tǒng)的設計與實現(xiàn) 基于DirectShow的目標識別系統(tǒng)研究 基于DirectShow技術的網絡媒體點播系統(tǒng) 建筑施工現(xiàn)場中基于3G技術遠程視頻監(jiān)控系統(tǒng)的研究與實現(xiàn) 遠程移動視頻接訪的設計與實現(xiàn) 基于簡易視頻展示臺的教學設計案例 基于Linux的遠程訪問VPN實現(xiàn) 基于Android的SIP遠程視頻監(jiān)控系統(tǒng)的設計 常見問題解答 當前所在位置:l.

[2] 王安,仲麗媛,孫加軍. 基于DirectShow和UDP協(xié)議的網絡視頻監(jiān)控系統(tǒng)[J].計算機工程與設計,2010,31(12).

[3] 張振.基于DirectShow的P2P視頻會議系統(tǒng)研究與設計[D].武漢:武漢理工大學,2009.

[4] 曾華山,宋鈺.基于DirectShow的VMR視頻捕獲的實現(xiàn)[J].電腦知識與技術,2010,9(25):7110-7111.

篇8

一、背景

當前,高校的計算機基礎課主要面向非計算機專業(yè)的大學一年級新生,教學以提升大學生信息素養(yǎng)為目標。隨著電腦的普及和信息技術的發(fā)展,高校的計算機基礎課不斷面臨新的挑戰(zhàn),計算機基礎課的改革也在不斷的探索中前行。為提升高校大學生的信息素養(yǎng)和應用能力,2012年教育部啟動了大學計算機課程改革項目,批準了“以計算思維為導向的大學計算機基礎課程研究”等22個項目,推動以能力培養(yǎng)為重點的大學計算機課程改革。當前,各大高校計算機基礎課改革主要圍繞計算思維和創(chuàng)新思維展開[1,2]。

二、體育系課程教學中存在的問題

在國外,計算機基礎課實行不分級的差異型教學。教師可以開設各類計算機個性化課程以滿足學生的各種需求,且課程內容可以由學生與教師商定,每門課設以若干學分,班級主要為10人左右的小班。然而,在我國,由于初等教育中的信息技術基礎教學水平極為不平衡,高校生源復雜,以及目前高校的學生人數(shù)眾多等的情況,如何有效地開展計算機基礎教學改革則是一個亟待解決的難題[3]。

以筆者所在的學校為例,近兩年來大學計算機基礎課不斷改革,取消了以往的分級教學,各專業(yè)初步建立了1+3的學習模式,第一學期各專業(yè)統(tǒng)一學習計算機基礎的內容包括:PPT、Excel、圖像處理、網絡基礎與網頁制作;第二學期分為3個模塊:多媒體技術應用、程序設計、數(shù)據(jù)處理。體育系通常選擇多媒體技術應用模塊,主要包括圖像處理、動畫設計、音頻編輯與視頻處理。

經過兩年的教學實踐,筆者發(fā)現(xiàn)體育系的計算機基礎課程教學仍存在以下三個方面的不足。

1.學生剛入學時的計算機水平和計算機應用能力差異大。我校體育系的生源面向全國,其中東南沿海省市的同學在初中或高中就已學過計算機,對計算機知識有一定的了解,而有些偏遠地區(qū)的同學可能極少接觸過電腦,學生計算機水平存在嚴重的不平衡給教學帶來了很大的困難。例如,若教學內容選擇較為簡單的內容,則對于那些基礎較好的同學來說,所學的東西太簡單,學習積極性降低;這部分內容若不講,對于基礎差的同學來說,他們很難跟上教學進度,也會挫傷他們的學習積極性,對后面的學習產生抵觸情緒。因此,如何選擇教學內容,對學生提高對這門課程的學習興趣和積極性起著很重要的作用。

2.傳統(tǒng)授課模式由教師在講臺前根據(jù)PPT逐條進行講解或示范,學生在各自電腦前按照教師講解的步驟一步一步地跟著學習或者操作,教學過程比較簡單機械。對于一個半小時的課堂教學內容,學生往往難以消化,也很難一直集中注意力,容易被網絡、手機等轉移注意力,學習興趣較低;同時,整個教學過程中學生缺乏自己思考的過程,得不到計算思維能力的訓練。

3.在學習主動性和自學能力方面,體育系的同學與其他專業(yè)同學相比,有一定的差距。例如,目前Windows和Word部分,不再進行課堂講授,而是開設自選的網絡課程讓學生自學,由于體育系的課程設置及體育系同學的學習習慣等因素,學生的學習自覺主動性沒有其他專業(yè)好,因此,體育系的同學在網絡課程中的受益程度很有限。

三、基于任務的教學新模式的探索

總結多年給體育系學生的授課經驗,作者發(fā)現(xiàn)與其他專業(yè)的同學相比較,體育系的同學性格活潑好動,有很好的團隊合作精神,圍繞任務進行教學和學習基于任務驅動的教學模式更加適合體育系學生。為激發(fā)學生的學習興趣和熱情,可以根據(jù)教學內容設計針對性強、難度適中并融入計算思維的任務,引導學生利用已有知識來解決問題、完成任務,并啟發(fā)學生運用計算思維的相關概念方法解決專業(yè)中的現(xiàn)實問題;在設計和實施任務時,注意培養(yǎng)學生間的團隊協(xié)作,設立2~3人的學習小組,共同完成任務,引導小組成員在交流中探究解決問題的思路;任務完成后,按小組進行成果展示和評價,交流心得。在明確任務、完成任務、合作交流等教學過程中,引導學生主動學習,鞏固已有知識,拓展新知識,培養(yǎng)計算思維能力,培養(yǎng)解決問題和實踐創(chuàng)新的能力[4]。

基于以上模式,針對體育系教學中的現(xiàn)存問題,本文在教學方法、教學內容與考核三個方面提出了一些改進建議,并在實際教學中開始初步的探索。

(一)教學內容

目前兩個學期的教學內容涉及的軟件較多,每種軟件的教學時間較短,學生還沒來得及深入其中具有實用性的知識,就要開始學習下一個軟件,經過一年的學習,學生對于每一種軟件的掌握都很膚淺,即便在日常生活中需要使用某一種軟件,也無法靈活使用。因此,建議每一學期的教學內容中只講授兩到三種軟件,比如第一學期講授Word、PPT、Excel,刪除網頁設計部分;第二學期講授Photoshop、Flash以及簡單的音頻、視頻處理知識,同時,加深現(xiàn)有的學習深度,結合實際應用設計案例,基于案例的任務來開展學習內容。例如:Word部分,開展簡歷制作、畢業(yè)論文編排等案例;Excel部分,設計與體育專業(yè)相關的“體育比賽成績管理與分析”等案例,要求學生充分利用Excel的功能來解決與現(xiàn)實生活相關的信息管理、數(shù)據(jù)處理與分析等問題;在PowerPoint中,設計制作“自我介紹”或者制作體育課講義等案例;PhotoShop中設計運動會海報制作等案例;音頻處理中設計錄制歌曲等案例;視頻處理中設計電子相冊制作等案例;Flash部分設計體育課件制作等案例。

(二)教學方法

傳統(tǒng)授課模式由教師在屏幕前講解或示范,學生跟著學習或者操作,教學以教師為中心,而學生只是被動接受知識。為提高學生學習積極性和主動性,需要改變這一傳統(tǒng)模式。今后教學要以學生為主體,教師設計與教學內容相關的生動案例,引導學生在完成案例任務的同時,進行自主學習;同時,積極與學生保持良好的交流,充分了解體育專業(yè)對計算機的需求點來改進教學內容,將計算機知識與專業(yè)知識有機結合[5]。

采用案例教學法,教師組織學生對教學案例進行思考、分析,促進學生對概念和操作的理解。以PPT為例,為某知名運動品牌公司制作一個PPT宣傳作品,學生需要首先確立設計理念,為作品立意,根據(jù)立意收集相關素材,在制作過程中,學生會主動學習并使用PPT制作技巧。通過該案例,首先,可以讓學生了解PPT作品的制作流程;其次,可以引導學生分析思考、展開討論,培養(yǎng)學生分析問題和解決問題的能力;最后,可以讓學生知道用如何用計算機知識解決與自己專業(yè)相關的實際問題,提高學生學習興趣,拓寬學生解決問題的思路。

發(fā)揮學生主觀能動性進行教學。例如,針對某一教學內容,可以請對這部分知識掌握得較好的同學來講解。一方面,基礎好的學生為了能講好這部分教學內容,通常要在課下學習更多的知識,從而也不再認為這部分教學內容太簡單而對上課產生消極的情緒;另一方面,也讓基礎差的學生了解到自己和好同學之間的差距,需要更加努力的學習才能迎頭趕上,這樣,整個班級的學習積極性就能很好得被調動起來。

建立學習小組并以小組的形式完成作業(yè)、課堂演示或答辯。將完成的出色的學生作業(yè)進行展示并表揚,良好的獎勵機制對學生學習興趣的激發(fā)起著不可忽視的作用。

(三)考核

好的考核方式對學生有激勵和導向作用。目前,大學計算機基礎課上下兩個學期的最終成績以期末考試成績?yōu)橹?,通常期末?0%,平時成績占40%。建議今后成績的組成分散在整個學期的教學過程中,將學生平時的學習活動和實際操作都劃入有效的評定范圍內。例如,整個學期中,根據(jù)教學內容設計一些具體實用的文字處理、課件制作、數(shù)據(jù)統(tǒng)計等作業(yè),最終的總成績由平時成績(包括學習態(tài)度、考勤等)、筆試和作業(yè)成績組成,在作業(yè)成績和平時成績中,加入對學生參與的態(tài)度以及解決問題能力的考核,引導學生對計算機學習形成認真負責的學習態(tài)度,并逐漸養(yǎng)成良好的學習習慣、培養(yǎng)其自學能力等,從而提升學生各方面的綜合素質。

四、結語

篇9

關鍵字:數(shù)字媒體 數(shù)字媒體應用 數(shù)字技術

數(shù)字媒體藝術專業(yè)是當代科技和藝術高度結合并涉及多學科交叉,它包含了計算機、藝術、文化、教育、科技、現(xiàn)代經營管理等廣泛內容。隨著計算機技術以及應用的發(fā)展,在世界信息化、國際化的背景下,數(shù)字影像、數(shù)字圖書等數(shù)字出版、網絡信息和文化傳播、網絡教育、網絡推廣等數(shù)字媒體應用在商業(yè)和教育中的應用日益增強。與此同時,動漫開發(fā)與設計、游戲開發(fā)與設計、影視特效等數(shù)字媒體藝術中的應用也得到了前所未有的發(fā)展。

1、數(shù)字媒體與數(shù)字媒體藝術

1.1數(shù)字媒體定義

有國家科技部組織863專家制定的《2005中國數(shù)字媒體藝術發(fā)展白皮書》在2005年12月份,白皮書中從新定義了“數(shù)字媒體”的概念。數(shù)字媒體是以信息科學和數(shù)字技術為主導,以大眾傳播理論為依據(jù),以現(xiàn)代藝術為指導,將信息傳播技術應用到文化、藝術、商業(yè)、教育和管理領域的科學與藝術高度融合的綜合交叉學科。數(shù)字媒體包含了圖像、文字以及音頻、視頻等各種形式,以及傳播形式和傳播內容中采用數(shù)字化,即信息的采集、存取、加工和分發(fā)的數(shù)字化過程。數(shù)字媒體已經成為繼語言、文字和電子技術之后的最新的信息載體。

1.2數(shù)字媒體藝術

數(shù)字媒體藝術主要包括研究數(shù)字媒體的表示,處理、顯示、記錄、存儲、傳輸、管理等各個環(huán)節(jié)的軟件與藝術相結合的一門學科,融合計算機技術、數(shù)字信息處理、網絡技術數(shù)和字通信等現(xiàn)代計算和通信手段,綜合處理聲音、圖形、圖像、文字等信息,使抽象的信息變成可感知、管理和交互的信息的軟硬件技術。

2、數(shù)字媒體藝術研究的主要方向

數(shù)字化、信息化時代不斷深入也迫使了媒體傳播方式的本質的改革,誕生了包括數(shù)字圖像、數(shù)字音頻、數(shù)字影像、網絡媒體和移動媒體等在內的多種數(shù)字傳播媒介形式。這種變革給現(xiàn)代社會經濟、文化、生活也帶來了極大的促進,使之成為科學與藝術、媒體與設計、各媒體形式學科間交叉與綜合的新的藝術形式,數(shù)字媒體藝術的出現(xiàn)打破了傳統(tǒng)學科專業(yè)的劃分,使得諸如動畫、DV、電影、電視、因特網和流媒體等“技術的藝術”首次有了統(tǒng)一的技術形態(tài)和視覺藝術語言。

2.1數(shù)字圖像處理技術

圖像處理就是將圖像轉化為數(shù)字矩陣存放在計算機存儲設備中,并采用一定的算法對其加工處理。圖像處理技術的根本是數(shù)學,其核心不費為各種算法的設計和實現(xiàn)。圖像處理技術涉及眾多領域。如計算機科學、醫(yī)療、教育、科技、各業(yè)等領域。因各領域對數(shù)字圖像處理的應用方向不一,大致分為:圖像數(shù)字化:通過計算機采樣和量化將圖像變成能夠為計算機處理的數(shù)字形式;圖像的增強和復原:是指放大圖像中的需要的信息,剔除圖像中不需要的部分,讓圖像更接近所需;圖像編碼:在滿足一定的保真條件下,對圖像進行編碼處理,達到壓縮圖像信息量,簡化圖像的目的。以便于存儲和傳輸;圖像重建:實現(xiàn)從新采樣來構建圖像。圖像重建有代數(shù)法、傅立葉反投影法和使用廣泛的卷積反投影法等算法;模式識別:用于圖像的識別。例如:人臉鑒別、指紋識別等是模式識別的內容。目前主流的模式識別方法有:統(tǒng)計識別法、句法結構模式識別法和模糊識別法。

2.2數(shù)字音頻處理技術

數(shù)字音頻處理技術主要是指通過計算機對音頻的采樣、量化、編碼將音頻轉化為數(shù)字方式存儲在計算機中,數(shù)字音頻編碼壓縮技術主要包括:基于音頻數(shù)據(jù)的統(tǒng)計特性的編碼技術;基于音頻的聲學參數(shù)的編碼技術;基于人的聽覺特性的編碼技術。數(shù)字語音處理同樣也是數(shù)字音頻目前研究和應用的主要領域,主要包括語音識別、處理技術。

2.3數(shù)字圖形技術

計算機圖形就是指使用數(shù)學算法將二維或三維圖形轉化為計算機顯示器的柵格形式的技術。主要研究內容就是研究如何在計算機中表示圖形、以及利用計算機進行圖形的計算、處理和顯示的相關原理與算法。目前應用領域非常廣泛,如曲線曲面造型、、實體造型、圖形硬件、光柵圖形生成算法、圖形標準、圖形交互技術真實感圖形計算與顯示算法,以及計算機動畫、虛擬現(xiàn)實、科學計算、可視化自然景物仿真等。

2.4數(shù)字視頻處理技術

數(shù)字視頻是以數(shù)字形式記錄的視頻,和模擬視頻相對的。數(shù)字視頻有不同的產生方式,存儲方式和播出方式。比如通過數(shù)字攝像機直接產生數(shù)字視頻信號,存儲在數(shù)字帶,P2卡,藍光盤或者磁盤上,從而得到不同格式的數(shù)字視頻。然后通過PC,特定的播放器等播放出來。它視頻壓縮壓縮技術分為有損、無損兩種??梢杂枚喾N不同的方法和策略壓縮數(shù)字視頻文件,使之達到便于管理的大小。下面是幾種最常用的方法:心理聲學音頻壓縮、心理視覺視頻壓縮等方法。

2.5數(shù)字媒體存儲技術

數(shù)字媒體存儲對計算機性能較高,經過處理后圖形、圖像、語音、視頻等通過數(shù)據(jù)量較大,同時具備實時性和并發(fā)性,所以在考慮數(shù)據(jù)存儲技術不僅僅要考慮存儲介質,還需考慮存儲算法。正是數(shù)字媒體對數(shù)據(jù)的傳輸、讀取有高標準和高要求,這也使得計算機媒介相關控制接口、技術等方面得到了快速的發(fā)展,各種快捷的接口、高速大容量的存儲設備不斷出現(xiàn)并得到了大量的使用,這也恰恰促進了數(shù)字媒體藝術的發(fā)展。

3、數(shù)字媒體藝術未來發(fā)展趨勢

目前3億多中國網民常常觀看在線視頻的現(xiàn)狀,預示著在線視頻即將成為產生數(shù)字媒體廣告預算的主力引擎之一。在我國社交網站(SNS)注冊用戶已經超過1.5億人次,大約1/3的網民都在使用SNS;各大主流互聯(lián)網媒體紛紛向社交化轉型,眾多SNS新平臺和產品競相登場。社交媒體和視頻類平臺成為數(shù)字媒體藝術未來發(fā)展的新方向。將數(shù)字媒體的產品服務和創(chuàng)新技術融入品牌的市場推廣體系,最大化數(shù)字媒體的營銷效果;現(xiàn)有廣告主、商、媒體主以及其他各方角色如何在新媒體市場中迅速找準定位,利用現(xiàn)有業(yè)務的優(yōu)勢拓展新市場,成為當前數(shù)字媒體行業(yè)持續(xù)發(fā)展亟需回答的問題。

參考文獻:

篇10

1 引言

在現(xiàn)代教學尤其是高等教育過程中?多媒體教學因其交互性強、高效靈活而逐漸成為一種普及的教學方式。

為方便多媒體教學的開展,筆者選用AIT2139視頻轉換芯片設計了一個VGA—TV視頻轉換器。該轉換器可將計算機的VGA信號轉換為廣播質量的NTSC制或PAL制視頻信號輸出到大屏幕電視機上,從而實現(xiàn)畫面的凍結、縮放和平移等輔助功能。同時,其視頻信號也可通過轉換器提供的接口輸出到計算機顯示器上。

2 AIT2139芯片簡介

AIT2139是一種單片、晶控、全數(shù)字視頻信號處理器,可以支持多種輸入格式(如640×480、85 Hz,800×600、85 Hz,1024×768、60 Hz等).AIT2139具有3通道、8-Bit ADC輸入和16.7M 色彩轉換功能;其內部有專門的存儲壓縮電路,外部有 EDO ?256k×16Bit? 存儲器接口和 SDRAM ?1M ×16Bit? 存儲器接口;AIT2139 控制方式簡單,可采用HOST接口或I2 C總線進行控制。該芯片可自動檢測輸入模式和當前的TV模式,輸出格式則可從合成、S-視頻、 YCbCr 或 RGB/SCART中選擇;所有的視頻處理都可在數(shù)字域內完成,因而不需要轉換電路,其數(shù)字編碼器采用過采樣技術,并以AITech 算法進行濾波,因而能輸出高質量的NTSC和PAL制式信號。AIT2139芯片的內部功能框圖如圖1所示。

3 系統(tǒng)工作原理

該VGA-TV視頻轉換器主要由視頻轉換、視頻轉換控制和遙控三部分組成。其系統(tǒng)結構如圖2所示。

VGA-TV視頻轉換器的組成核心是視頻信號轉換和視頻轉換控制部分,因此?設計的核心是對視頻信號的處理和對視頻轉換芯片的控制。筆者采用AIT2139視頻信號處理器,并配以當前成熟的外圍電路設計了一種視頻信號轉換電路來完成視頻前端的處理和信號轉換;同時以八位單片機EM78P156EP 為核心,再配以鍵盤檢測、I2C通信、遙控接收等電路組成了轉換控制部分。該系統(tǒng)是典型的模擬數(shù)字混合系統(tǒng),電源質量對視頻信號的輸出影響較大,為此,設計時采用單獨的電源板卡并以背板的形式嵌入到系統(tǒng)中,從而取得了較好的效果。

4 系統(tǒng)設計

4.1 視頻轉換部分設計

作為系統(tǒng)核心的視頻轉換部分的主要功能是把計算機輸出的RGB信號轉換為電視的標準輸入信號。視頻前端的RGB放大信號采用門電路處理后,送到AIT2139進行轉換,并輸出兩種格式的電視信號:一個是經過轉換、選頻和濾波得到的全電視信號,另一個是亮度和色度分離的電視信號,即S端子信號。因此,計算機輸出的RGB信號經過耦合、緩沖、放大可直接接計算機顯示器,從而使操作者能夠方便的對畫面進行監(jiān)控。而對全電視信號輸出則加入了完整的選頻和濾波電路,可以增加電視信號的穩(wěn)定性。圖3是視頻轉換部分電路的方框圖。

(1)視頻前端處理

輸入端通過AIT2139的三個8-bit A/D 轉換器來對R、G、B信號的每一個通道按48MHz的采樣率進行A/D 轉換。其水平同步(HSYNC) 和垂直同步( VSYNC) 由施密特觸發(fā)器門緩沖。AIT2139的AD轉換相當靈活,內部的AD轉換參考電壓可自己設定。本設計中的RGB信號的電平范圍是0~0.85V,給定的外部參考電壓為Vk,需要注意的是,Vk必須不低于RGB信號電平的最大值。

數(shù)字視頻處理可以利用YUV 色彩分量來進行,因此,可利用AIT2139芯片中RGB-YUV矩陣將輸入的RGB信號轉換為4:2:2 格式的YUV分量信號,每分量輸出8位,總的輸出信號在數(shù)據(jù)總線上以24位工作。實際設計發(fā)現(xiàn):YUV輸出閃爍較大,為此,筆者利用了芯片內部AITech算法構造的有限脈沖響應數(shù)字濾波器,從而有效地降低了輸出閃爍。

(2)工作模式設定

AIT2139有兩種工作模式,主模式和從模式。本設計選擇主模式。AIT2139可產生所有的時鐘和同步信號,并可以給外部的存儲設備提供水平同步、垂直同步以及內部像素數(shù)據(jù)時鐘。外部的多路同步輸入、FIFO和存儲器將嚴格遵循AIT2139提供的這些時鐘和同步信息。在設計中發(fā)現(xiàn),VGA的數(shù)據(jù)讀入時間可以不與處理器的寫入時鐘同步。

(3)數(shù)字視頻編碼

AIT2139的核心是其處理器部分,主要用于從外部存儲設備讀入4:2:2格式的YUV數(shù)字視頻數(shù)據(jù),并進行編碼處理。因為輸入信號分為亮度和色度分量,色度信號將通過復合數(shù)字副載波調制。亮度分量和色度分量信號分別插值為象素速率的兩倍,并通過兩個10-bit的D/A轉換器轉換為模擬 S-視頻信號,模擬合成視頻信號在通過第三個通道的10-bit轉換器輸出后,可調整AIT2139處理器的格式控制腳以選擇不同的時鐘參數(shù),從而將視頻轉換器的輸出設置為NTSC、PAL等電視標準信號。

4.2 視頻轉換控制部分的設計

該VGA-TV轉換器主控板是對視頻轉換部分進行控制的主要部分。該板不但可為視頻轉換提供電源,同時也可發(fā)送操作控制信號。主控板的核心是八位單片機EM78P156EP,同時配以鍵盤檢測、I2C通信、遙控接收等電路組成轉換控制部分。主控板的原理框圖如圖4所示。其控制解碼子程序流程如圖5所示。