信息檢索范文

時間:2023-03-20 13:02:22

導(dǎo)語:如何才能寫好一篇信息檢索,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

篇1

2、選擇信息檢索系統(tǒng),確定檢索途徑。

3、選擇信息檢索系統(tǒng)的方法:(1)在信息檢索系統(tǒng)齊全的情況下,首先使用信息檢索工具指南來指導(dǎo)選擇;(2)在沒有信息檢索工具指南的情況下,可以采用瀏覽圖書館、信息所的信息檢索工具室所陳列的信息檢索工具的方式進(jìn)行選擇;(3)從所熟悉的信息檢索工具中選擇;(4)主動向工作人員請教;(5)通過網(wǎng)絡(luò)在線幫助選擇。

4、選擇信息檢索系統(tǒng)的原則:(1)收錄的文獻(xiàn)信息需含蓋檢索課題的主題內(nèi)容;(2)就近原則,方便查閱;(3)盡可能質(zhì)量較高、收錄文獻(xiàn)信息量大、報道及時、索引齊全、使用方便;(4)記錄來源,文獻(xiàn)類型,文種盡量滿足檢索課題的要求;(5)數(shù)據(jù)庫是否有對應(yīng)的印刷型版本;(6)根據(jù)經(jīng)濟(jì)條件選擇信息檢索系統(tǒng);(7)根據(jù)對檢索信息熟悉的程度選擇;(8)選擇查出的信息相關(guān)度高的網(wǎng)絡(luò)搜索引擎。

5、選擇檢索詞。確定檢索詞的基本方法:選擇規(guī)范化的檢索詞;使用各學(xué)科在國際上通用的、國外文獻(xiàn)中出現(xiàn)過的術(shù)語作檢索詞;找出課題涉及的隱性主題概念作檢索詞;選擇課題核心概念作檢索詞;注意檢索詞的縮寫詞、詞形變化以及英美的不同拼法;聯(lián)機(jī)方式確定檢索詞。

6、、制定檢索策略,查閱檢索工具。(1)制定檢索策略的前提條件是要了解信息檢索系統(tǒng)的基本性能,基礎(chǔ)是要明確檢索課題的內(nèi)容要求和檢索目的,關(guān)鍵是要正確選擇檢索詞和合理使用邏輯組配。(2)產(chǎn)生誤檢的原因可能有:一詞多義的檢索詞的使用;檢索詞與英美人的姓名、地址名稱、期刊名稱相同;不嚴(yán)格的位置算符的運(yùn)用;檢索式中沒有使用邏輯非運(yùn)算;截詞運(yùn)算不恰當(dāng);組號前忘記輸入指令“s”;邏輯運(yùn)算符號前后未空格;括號使用不正確;從錯誤的組號中打印檢索結(jié)果;檢索式中檢索概念太少。(3)產(chǎn)生漏檢的原因或檢索結(jié)果為零的原因可能有:沒有使用足夠的同義詞和近義詞或隱含概念;位置算符用得過嚴(yán)、過多;邏輯“與”用得太多;后綴代碼限制得太嚴(yán);檢索工具選擇不恰當(dāng);截詞運(yùn)算不恰當(dāng);單詞拼寫錯誤、文檔號錯誤、組號錯誤、括號不匹配等。(4)提高查準(zhǔn)率的方法有:使用下位概念檢索;將檢索詞的檢索范圍限在篇名、敘詞和文摘字段;使用邏輯“與”或邏輯“非”;運(yùn)用限制選擇功能;進(jìn)行進(jìn)階檢或高級檢索。(5)提高查全率的方法有:選擇全字段中檢索;減少對文獻(xiàn)外表特征的限定;使用邏輯“或”;利用截詞檢索;使用檢索詞的上位概念進(jìn)行檢索;把(W)算符改成(1N),(2N);進(jìn)入更合適的數(shù)據(jù)庫查找。

7、、處理檢索結(jié)果。將所獲得的檢索結(jié)果加以系統(tǒng)整理,篩選出符合課題要求的相關(guān)文獻(xiàn)信息,選擇檢索結(jié)果的著錄格式,辨認(rèn)文獻(xiàn)類型、文種、著者、篇名、內(nèi)容、出處等項(xiàng)記錄內(nèi)容,輸出檢索結(jié)果。

篇2

桶排序法,先把被排數(shù)據(jù)所分布的區(qū)間[Dmin,Dmax](在這里Dmax,Dmin分別為被排數(shù)據(jù)的最大,最小值)劃分成N個大小相等的子區(qū)間,稱子為“桶”,然后將N個數(shù)據(jù)根據(jù)其大小分配入相應(yīng)的“桶”內(nèi)(桶[1],桶[2],…,桶[N])。借簽桶排序中將數(shù)據(jù)根據(jù)其大小分配入相應(yīng)“桶”的思想,我們在檢索時將已排好序的數(shù)據(jù)也根據(jù)其大小將其分配入相應(yīng)的“桶”內(nèi),然后再在“桶”內(nèi)進(jìn)行二分檢索。假設(shè)按升序排列的N個數(shù)據(jù)已存放在data數(shù)組的元素data[0]~data[N-1]中,構(gòu)造一個HASH函數(shù)為:

(式中Dmax=data[N-1],Dmin=data[0],N為數(shù)據(jù)個數(shù))

二、基于HASH函數(shù)的二分檢索算法HS

算法HS使用二個數(shù)組,data數(shù)組的元素data[0]~data[N-1]中存放按升序排列的N個數(shù)據(jù),address數(shù)組的元素address[1]~address[N]中用來存貯經(jīng)HASH函數(shù)轉(zhuǎn)換后得到相同地址的數(shù)據(jù)個數(shù)。

算法HS

HS1[清address數(shù)組]將ddress[1]~address[N]都置0

HS2[Dmax中置最大值、Dmin中置最小值]Dmaxdata[N-1],Dmindata[0]

HS3[i置初始值]i0

HS4[求數(shù)據(jù)data[i]的HASH變換后的地址ad]ad

HS5[地址“碰撞”記數(shù)器address[ad]加1]address[ad]address[ad]+1

HS6[修改i]ii+1

HS7[比較i與N-1]若i<=N-1,則轉(zhuǎn)HS4,否則轉(zhuǎn)HS8。

HS8[address[0]置初值1]address[0]1

HS9[j置初始值]j1

HS10[求地址發(fā)生“碰撞”的數(shù)據(jù)在DATA數(shù)組中的首地址]address[j]=address[j]+address[j-1]

HS11[修改j]jj+1

HS12[比較j與N]若j<=N則轉(zhuǎn)HS10,否則轉(zhuǎn)HS13。

HS13[輸入一個被檢索的數(shù)據(jù)X]

HS14[對被檢索數(shù)據(jù)X用HASH函數(shù)得地址ad]

HS15[確定“塊”的下界low,上界high的值]lowaddress[ad-1],highaddress[ad]-1

HS16[在“塊”內(nèi)進(jìn)行二分檢索]在給定的下界與上界之間進(jìn)行二分檢索,若找到,則返“檢索成功”信息,否則返加回“檢索失敗”信息。

HS17[本算法結(jié)束]

三、平均檢索長度的分析

在本檢索算法中,首先將被檢索數(shù)據(jù)X經(jīng)HASH函數(shù)轉(zhuǎn)換出一個地址,根據(jù)這個地址將被檢索的數(shù)據(jù)直接定位到相應(yīng)的“塊”中,然后在“塊”中進(jìn)行二分檢索。因此通過對所有“塊”內(nèi)二分檢索法的平均檢索長度的計算就可求出本算法的平均檢索長度。二分檢索法的平均檢索長度為:

下面我們來求本算法的平均檢索長度。假設(shè)在N個數(shù)據(jù)均勻分布的情況下,經(jīng)過本檢索算法中HASH函數(shù)轉(zhuǎn)換,每一個地址出現(xiàn)的概率相同,都等于1/N,因此,有m個數(shù)據(jù)轉(zhuǎn)換得到相同地址的概率為:

(m=1,2,…,N)

參考文獻(xiàn)[1]的附錄中已證明:(1)

所以本檢索算法的平均檢索長度為(2)

由上式(1)和式(2)兩個公式即可求得本算法的平均檢索長度,其平均檢索長度小于1.352(當(dāng)N>100時)。

四、算法分析與實(shí)驗(yàn)結(jié)果

1.本算法的創(chuàng)新之處在于通過HASH函數(shù)可將被檢索的數(shù)據(jù)X直接位置定位到相應(yīng)的“塊”(通過HASH函數(shù)轉(zhuǎn)換后的地址相同的數(shù)據(jù)區(qū)間)中,再在“塊”中進(jìn)行二分檢索。從而不再需要建立索引順?biāo)鞅頇z索算法中的索引表,也就省去了索引順?biāo)鞅頇z索算法中查找索引表確定所在“塊”的平均檢索長度。

2.此方法突破了HASH表的平均檢索長度是裝填因子(=(表中填人的記錄數(shù))/(哈希表的長度)的函數(shù),而不是N的函數(shù)的弱點(diǎn)。

3.在理想情況下,即數(shù)據(jù)完全是均勻分布的情況下,本算法的平均檢索長度可達(dá)理論極限值A(chǔ)SL=1。即使是在最壞的情況下,當(dāng)N個數(shù)據(jù)經(jīng)HASH函數(shù)轉(zhuǎn)換后的地址均相同,所有數(shù)據(jù)均落在同一個“塊”中,其平均檢索長度ASL也只會下降到二分檢索法時的平均檢索長度。

4.本算法對于均勻分布的數(shù)據(jù)是極為有效的,通過計算得出其平均檢索長度小于1.352(N>100時),因此檢索效率很高。

5.本算法中的步驟HS1~HS12僅僅是為檢索作的準(zhǔn)備工作,相當(dāng)于初始化的工作,只需在檢索開始時做一次即可。

6.實(shí)驗(yàn)結(jié)果。為了對本檢索算法的檢索效率進(jìn)行驗(yàn)證,我們用VB6.0編寫了本算法以及二分檢索法的程序,將二種檢索算法的平均檢索長度進(jìn)行實(shí)際測定,實(shí)驗(yàn)中所用的數(shù)據(jù)由VB6.0的隨時函數(shù)產(chǎn)生,數(shù)據(jù)的范圍為(0~10000),實(shí)驗(yàn)結(jié)果如下表所示:

VB6.0程序二種檢索算法平均檢索長度對比表

我們在實(shí)驗(yàn)中測定平均檢索長度時,通過程序?qū)λ袛?shù)據(jù)逐個檢索,統(tǒng)計出檢索完所有數(shù)據(jù)需進(jìn)行比較的總次數(shù)再除以數(shù)據(jù)總數(shù)后得出。上表中當(dāng)N=100時,本算法實(shí)際測定的值(1.38)與理論計算(1.352)略有誤差,原因是我們用VB6.0中的隨機(jī)函數(shù)產(chǎn)生的隨機(jī)數(shù)在數(shù)據(jù)量較小時分布不一定很均勻。從表1中可以看到:當(dāng)數(shù)據(jù)量稍大一些(N>100),本算法的平均檢索長度的實(shí)測結(jié)果完全與理論分析一對致,并且遠(yuǎn)小于二分檢索法的平均檢索長度。本算法的平均檢索長度隨著數(shù)據(jù)量N的增加幾乎不變。

篇3

科學(xué)文化素質(zhì),它是指個體學(xué)習(xí)和掌握系統(tǒng)的科學(xué)文化基礎(chǔ)知識,尤其是現(xiàn)代科學(xué)文化的最新成果,形成合理的知識結(jié)構(gòu);獲得基本技能、發(fā)展智能和能力(具備觀察能力、記憶能力、想象能力、思維能力、自學(xué)能力、表達(dá)能力、組織協(xié)調(diào)能力,尤其是創(chuàng)造能力和動手操作能力),不僅樂于學(xué)習(xí),而且形成會學(xué)習(xí),具有求知欲望和勇于探索的精神。通過信息檢索課程教育,授予“魚”與“漁”,使其具有獨(dú)立的思考能力與創(chuàng)新能力。努力全面培養(yǎng)受教育者的科學(xué)精神與人文精神,使二者密切結(jié)合,相互促進(jìn)。[5]在著眼于基本素質(zhì)的整體培養(yǎng)和發(fā)展,立足于更加綜合、多元、全面的教育因素的同時注重共性和個性的辯證統(tǒng)一。

我國在2010年的《國家中長期教育與改革發(fā)展綱要(2010-2020年)》中強(qiáng)調(diào)了因材施教,鼓勵個性發(fā)展,不拘一格培養(yǎng)人才,強(qiáng)調(diào)素質(zhì)教育。提高受教育者的個性素質(zhì)是素質(zhì)教育的重要內(nèi)容,培養(yǎng)個性素質(zhì)的最佳途徑是實(shí)施主體性教育,開展個別化教學(xué)。通過信息檢索課程教學(xué)的差別化引導(dǎo),促使個性由量變到質(zhì)變的突破,與思想道德素質(zhì)、科學(xué)文化素質(zhì)并舉。

圖書館信息檢索課是獲取和培養(yǎng)全面的信息素養(yǎng)的重要途徑。使信息檢索課程教育從輔、零重視到普遍性、基礎(chǔ)剛性需求地位的轉(zhuǎn)變;以教師為主到以學(xué)生自主、教師為輔的教學(xué)互動的模式的轉(zhuǎn)變;從枯燥的技術(shù)技能教學(xué)向多元的教學(xué)內(nèi)容轉(zhuǎn)變;力爭使接受教育者從被動學(xué)習(xí)到主動學(xué)習(xí)、創(chuàng)造性學(xué)習(xí)的態(tài)度的轉(zhuǎn)變。受教育者每個人都是獨(dú)立的個體,在身體和心理素質(zhì)、遺傳、興趣等方面都各不相同,所表現(xiàn)出來的接受能力、學(xué)習(xí)能力也不盡相同,因此要注意學(xué)生間的個體差異。在教學(xué)中,應(yīng)堅持“以人為本,因材施教”,避免“一刀切”的傳統(tǒng)教育模式,進(jìn)而引導(dǎo)受教育者的興趣、激發(fā)學(xué)習(xí)和創(chuàng)造熱情,從而充分發(fā)揮各自潛在能力與特長。

信息檢索課程教學(xué)是培養(yǎng)學(xué)生掌握一定的信息檢索知識、技術(shù)與方法,以及利用計算機(jī)解決本專業(yè)領(lǐng)域中問題的能力。它是促進(jìn)國家科技進(jìn)步的動力和源泉,是社會和諧穩(wěn)定的基石。在信息檢索課程學(xué)習(xí)中不僅要掌握知識、技術(shù)和方法,同時要帶著興趣學(xué)習(xí),更重要的是使受課者具備在自己相關(guān)領(lǐng)域中發(fā)現(xiàn)問題、解決問題的能力,同時具有敏銳的信息嗅覺的能力和信心,從而推動社會的進(jìn)步??茖W(xué)技術(shù)是第一生產(chǎn)力,人類的勞動分為兩種:一種為創(chuàng)造性勞動,一種為重復(fù)性勞動。在21世紀(jì),我們置身于競爭日益激烈的市場經(jīng)濟(jì)環(huán)境中,歸根結(jié)底是人才素質(zhì)的競爭,是創(chuàng)造性的競爭。在提高學(xué)生全面素質(zhì)中,要重視培養(yǎng)學(xué)生的創(chuàng)新精神和創(chuàng)造才能,以及獨(dú)立獲取知識并運(yùn)用知識解決實(shí)際問題的能力。信息檢索課程教育體系是一個開放性強(qiáng),具有良好的發(fā)展空間的體系,創(chuàng)新是計算機(jī)教育的本質(zhì)特征。信息檢索課程體系的確立,要充分注重對受教育者興趣的引導(dǎo),通過對外部信息的感知和判斷,形成內(nèi)化的創(chuàng)造力。通過在教學(xué)中運(yùn)用發(fā)現(xiàn)法和對非智力因素的引導(dǎo),進(jìn)而培養(yǎng)學(xué)生的創(chuàng)新能力和創(chuàng)新素質(zhì)。

篇4

>> 化學(xué)化工科技查新信息檢索新形勢及策略研究 科技查新報告檢索策略撰寫格式探討 淺析利用網(wǎng)絡(luò)信息資源如何加強(qiáng)科技查新檢索工作 試論科技查新中專利文獻(xiàn)及檢索 醫(yī)學(xué)科技查新與文獻(xiàn)檢索 化學(xué)化工課題科技查新質(zhì)量的控制 淺談STN系統(tǒng)應(yīng)用于化學(xué)化工查新檢索 淺談科技查新與文獻(xiàn)檢索之間的關(guān)系 基于SOA架構(gòu)的交通科技項(xiàng)目查新檢索系統(tǒng)的設(shè)計 科技查新檢索服務(wù)工作的優(yōu)化問題探討 科技查新中專利文獻(xiàn)的檢索與對比分析 國防科技查新質(zhì)量優(yōu)化策略研究 科技查新質(zhì)量的優(yōu)化策略探究 工程碩士文獻(xiàn)檢索課與科技查新相結(jié)合的案例教學(xué)探索與實(shí)踐 化工科技成果簡介 化工科技成果介紹 化工科技創(chuàng)新成果簡介 科技檢索查新工作若干問題研究 從科技查新信息解讀其地方科技創(chuàng)新的特點(diǎn) 科技信息檢索的技巧 常見問題解答 當(dāng)前所在位置:)、《化工品物性數(shù)據(jù)庫》(http://.cn/search/template/chemcalwx-tmpl_index.htm)、《化工產(chǎn)品物性辭典》等。再次是進(jìn)行項(xiàng)目分類分析。若是化工產(chǎn)品,初步判定是屬于無機(jī)化工、石油化工、化肥與農(nóng)藥、涂料與油漆、聚合物、化學(xué)試劑、染料及顏料、食品和飼料添加劑、中間體、醫(yī)藥與生物化工、日用化工、香精與香料、催化劑及助劑、化工設(shè)備等產(chǎn)品類別中的哪一類?;ろ?xiàng)目類別范疇相當(dāng)廣泛,其學(xué)科、專業(yè)分類方法很多,有針對各種文獻(xiàn)管理的《中國圖書館分類法》、《國際標(biāo)準(zhǔn)分類法》、《國際專利分類法》,有用于政府部門和行業(yè)協(xié)會經(jīng)濟(jì)管理的《國民經(jīng)濟(jì)行業(yè)分類與代碼》,有針對教育、科技統(tǒng)計、學(xué)科建設(shè)制定的《學(xué)科分類與代碼》,有針對化工行業(yè)產(chǎn)品分類管理的《中國化工產(chǎn)品目錄》,等等。對于化工類產(chǎn)品,可以利用《中國化工產(chǎn)品目錄》了解分類,從中還可以了解某產(chǎn)品的名稱、商品名、英文名稱、產(chǎn)品代碼、CAS登記號、類屬名稱號、產(chǎn)品用途、產(chǎn)品類別等。通過項(xiàng)目分類分析,可以知道研發(fā)項(xiàng)目主題范疇,還可以知道是側(cè)重于產(chǎn)品還是方法,是產(chǎn)品性能的提高,還是產(chǎn)品工藝的改進(jìn)。三是進(jìn)行項(xiàng)目技術(shù)新穎性分析。根據(jù)項(xiàng)目資料,結(jié)合檢索到的研究綜述,可以初步了解研發(fā)項(xiàng)目的技術(shù)進(jìn)展,國內(nèi)外同類項(xiàng)目技術(shù)水平,進(jìn)而了解其技術(shù)特點(diǎn)、技術(shù)創(chuàng)新。項(xiàng)目技術(shù)新穎性分析伴隨著查新檢索全過程,直至完成查新報告。

2 檢索用信息源選擇

隨著計算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)字化的信息源越來越多。為防止密切相關(guān)文獻(xiàn)信息的漏查,也避免盲目搜索的勞命傷財,必須確定最基本、最低限度的科技查新檢索用信息源。這些信息源范疇除了有科技、教育、醫(yī)療衛(wèi)生等管理部門相關(guān)政策規(guī)定外,國內(nèi)各科技查新機(jī)構(gòu)都有自定的必檢系統(tǒng)要求。查新員要針對具體化工科技查新項(xiàng)目做出判斷,考慮其相關(guān)文獻(xiàn)、相關(guān)信息主要貯存于何信息空間,選擇合適的檢索用數(shù)據(jù)庫、信息源。

對于基礎(chǔ)理論、工藝研發(fā)類化工科技查新項(xiàng)目,可以選擇以期刊、專利文獻(xiàn)數(shù)據(jù)庫為主的檢索系統(tǒng)。因?yàn)槔碚撗芯俊⒐に嚰夹g(shù)研究成果大多于期刊論文、會議論文、專利說明書上。筆者近日受理了一項(xiàng)題為“2-氯煙酸閉環(huán)法生產(chǎn)工藝”的科技查新委托項(xiàng)目。通過咨詢項(xiàng)目委托人、閱讀項(xiàng)目研制報告書、檢索《化工辭典》等數(shù)據(jù)庫后,分析判定,該項(xiàng)目是屬于化工領(lǐng)域的工藝技術(shù)研發(fā)項(xiàng)目,并了解到項(xiàng)目產(chǎn)品屬醫(yī)藥和農(nóng)藥中間體??梢猿醪竭x擇CNKI、維普、萬方期刊文獻(xiàn)型數(shù)據(jù)庫,會議論文數(shù)據(jù)庫,專利文獻(xiàn)數(shù)據(jù)庫,科技成果類數(shù)據(jù)庫等信息源。

對于查找以產(chǎn)品自身特征信息為主的化工產(chǎn)品,則應(yīng)以Web搜索引擎和Web產(chǎn)品數(shù)據(jù)庫為主,前者包括通用搜索引擎、專業(yè)搜索引擎、站內(nèi)搜索引擎。因?yàn)榫W(wǎng)上產(chǎn)品信息大多以網(wǎng)頁HTML文件形式貯存于各產(chǎn)品生產(chǎn)經(jīng)營企業(yè)網(wǎng)站W(wǎng)eb服務(wù)器中,作為網(wǎng)上產(chǎn)品廣告和產(chǎn)品說明書,而這些網(wǎng)頁HTML信息大多被Web搜索引擎索引。此外,還要充分利用網(wǎng)上Web產(chǎn)品數(shù)據(jù)庫。

3 檢索策略制定

檢索策略的制定是理解課題內(nèi)容、選擇檢索系統(tǒng)、設(shè)計檢索結(jié)構(gòu)式、考量檢索結(jié)果相關(guān)性這一過程的反復(fù)循環(huán)過程,是不斷調(diào)整檢索式的檢索過程。檢索策略的具體體現(xiàn)是檢索式,它控制著檢索過程,關(guān)系到能否檢索到最相關(guān)的信息,關(guān)系到查全率和查準(zhǔn)率,還關(guān)系到信息查詢速度和工作效率。設(shè)計合理的檢索式成為控制和提高檢索質(zhì)量的關(guān)鍵。

在基礎(chǔ)理論類、工藝研發(fā)類化工科技查新中,主要使用文獻(xiàn)型數(shù)據(jù)庫檢索系統(tǒng)。由于大型期刊文獻(xiàn)數(shù)據(jù)庫有完善的檢索功能,應(yīng)充分應(yīng)用布爾邏輯檢索方法,選擇利用各種檢索入口,設(shè)計合理完善的檢索式。例如,上述“2-氯煙酸閉環(huán)法生產(chǎn)工藝”項(xiàng)目,其查新點(diǎn):(1)以煙酸為起始原料,閉環(huán)法生產(chǎn)2-氯煙酸;(2)采用專用閉環(huán)催化劑;(3)廢水封閉循環(huán)使用,實(shí)現(xiàn)廢水零排放;(4)產(chǎn)品總收率≥90%。分析項(xiàng)目內(nèi)容認(rèn)為,這是工藝方法類項(xiàng)目,應(yīng)主要采用期刊文獻(xiàn)、專利文獻(xiàn)和科技成果類數(shù)據(jù)庫等信息源作為主要檢索系統(tǒng)。在試查中發(fā)現(xiàn)同類研究少,相關(guān)文獻(xiàn)少。因此決定重點(diǎn)使用CNKI的《中國期刊全文數(shù)據(jù)庫》,因?yàn)樵搸煊腥淖侄?,特別適用于難檢和要求查全率高的檢索項(xiàng)目。設(shè)計檢索式:

#1.(2-氯煙酸+2-氯尼酸+2-氯-3-吡啶甲酸)

#2.#1*煙酸*閉環(huán)法

#3.#1*閉環(huán)催化劑

#4.#1*(廢水零排放+廢水封閉循環(huán))

上述檢索式的設(shè)計,針對了三個查新點(diǎn)。其中,第一檢索式采用題名字段檢索入口,其余采用全文字段,應(yīng)用復(fù)合檢索方式,即快又準(zhǔn)又全。結(jié)果找到了幾篇相關(guān)文獻(xiàn),其檢索結(jié)果很滿意。最后給出查新結(jié)論:

檢索結(jié)果表明,河北亞諾化工有限公司等生產(chǎn)廠家、大學(xué)研究機(jī)構(gòu)進(jìn)行了2-氯煙酸合成工藝研究。其中,河北亞諾化工有限公司以2-氯-3-甲基吡啶為原料,通過高錳酸鉀的氧化來制備2-氯煙酸,產(chǎn)率提高到65%。西安近代化學(xué)研究所、陜西師范大學(xué)用煙酸經(jīng)雙氧水氧化后再用POCl3/PCl5氯化得到2-氯煙酸。氯化時不加水,先加入POCl3,于100℃~110℃反應(yīng)1h后再加入PCl5回流反應(yīng),收率95%,總收率87.5%。

綜合分析相關(guān)文獻(xiàn)可知,目前國內(nèi)主要氯煙酸生產(chǎn)方法:氰基乙酸乙酯氯化后,與丙烯醛邁克爾加成,成環(huán)后水解制得;煙酸氮氧化-氯化-水解法;氰基吡啶氮氧化-氯化-水解法等。與國內(nèi)同類項(xiàng)目相比,本項(xiàng)目技術(shù)特點(diǎn)是:采用閉環(huán)法生產(chǎn)2-氯煙酸;以氰基乙酸乙酯計,總收率≥90%;廢水封閉循環(huán)使用,實(shí)現(xiàn)廢水零排放。上述采用閉環(huán)法實(shí)現(xiàn)廢水零排放的2-氯煙酸生產(chǎn)工藝技術(shù),國內(nèi)未見有文獻(xiàn)報道。

在化工產(chǎn)品類項(xiàng)目的科技查新中,除了使用期刊、專利文獻(xiàn)數(shù)據(jù)庫外,還要重點(diǎn)使用Web搜索引擎等檢索系統(tǒng)。譬如,筆者在接受查新委托項(xiàng)目“電子級異氰脲酸三縮水甘油酯(TGIC)”時,首先考慮項(xiàng)目產(chǎn)品屬性,是強(qiáng)調(diào)工藝方法還是產(chǎn)品技術(shù)參數(shù),具體的查新點(diǎn),以及國內(nèi)有無專利等問題。因此首先選用文獻(xiàn)型數(shù)據(jù)庫,設(shè)計檢索式:

#1.(異氰脲酸三縮水甘油酯+異氰尿酸三縮水甘油酯+異氰酸三甘油脂二聚物+三異氰尿酸酯+TGIC)

#2.#1*(電子級+99%純度+超細(xì)+氯含量)

#3.#1*(粉末超細(xì)比+深冷粉碎)

采用上述檢索式首先在期刊、專利文獻(xiàn)數(shù)據(jù)庫中檢索查詢;再在諸如化工產(chǎn)品搜索、中國化工搜索、中國化工網(wǎng)、中國化工信息網(wǎng)、中國商品網(wǎng)等網(wǎng)站上的產(chǎn)品數(shù)據(jù)庫中查詢;最后用google、百度WEB搜索引擎查詢,設(shè)計檢索式:(“異氰脲酸三縮水甘油酯”O(jiān)R“三異氰尿酸酯”)intitle:“有限公司”。最終檢索篩選獲得數(shù)篇相關(guān)文獻(xiàn),檢索結(jié)果滿意。

總之,國內(nèi)有生產(chǎn)廠家研制生產(chǎn)出異氰脲酸三縮水甘油酯,但多為普通級TGIC。而本項(xiàng)目通過改進(jìn)合成、環(huán)化工藝,采用深冷粉碎、無水工藝分離鹽等技術(shù),實(shí)現(xiàn)了電子級TGIC;產(chǎn)品純度提高到99%以上,氯含量小于650ppm,粉末超細(xì)比≤10μm。目前,除本項(xiàng)目產(chǎn)品外,國內(nèi)尚未見有生產(chǎn)廠家研制生產(chǎn)出電子級異氰脲酸三縮水甘油酯產(chǎn)品的文獻(xiàn)報道。

4 結(jié)語

綜上所述,制定化工科技查新信息檢索策略,需要對化工科技查新項(xiàng)目進(jìn)行技術(shù)分析,理解項(xiàng)目主要概念、分類歸屬、技術(shù)特點(diǎn)、技術(shù)創(chuàng)新等。據(jù)此,考量選擇相應(yīng)信息檢索系統(tǒng),進(jìn)而統(tǒng)籌考慮檢索步驟,應(yīng)用所掌握的檢索技巧,設(shè)計出科學(xué)合理的一系列檢索式,并不斷在信息檢索過程中加以調(diào)整,直至查詢獲取滿意的檢索結(jié)果為止。

參考文獻(xiàn)

[1] 謝新洲,等.科技查新手冊[M].科學(xué)技術(shù)文獻(xiàn)出版社,2004.

篇5

【關(guān)鍵詞】 GPU 信息檢索 CUDA

前言

多媒體技術(shù)與多媒體網(wǎng)絡(luò),為當(dāng)前信息時代提供文字、數(shù)據(jù)、語音、圖形、圖像和音樂等多種信息方式,計算機(jī)在處理信息時所面臨的主要問題是如何合理提高檢索速度,實(shí)現(xiàn)多媒體信息流的結(jié)構(gòu)化,方便檢索。人們曾經(jīng)將圖形、視頻等需要大量運(yùn)算的功能都交與CPU完成,但用戶對圖形計算方面的需求不斷的超出了CPU在計算能力方面的發(fā)展速度,需要一個專門的圖形的核心處理器。GPU的出現(xiàn)填補(bǔ)這一空缺,它是相對于CPU的一個概念,GPU英文全稱Graphic Processing Unit, “圖形處理器”。 GPU是顯示卡的“大腦”, GPU具有強(qiáng)大的計算能力,它將能處理的問題由圖形領(lǐng)域擴(kuò)展到了通用計算領(lǐng)域[1]。使可編程圖像處理器發(fā)展成為計算技術(shù)領(lǐng)域的主力,與CPU上的串行算法相比,采用基于GPU平臺檢索算法最高可獲得百倍以上的性能提升。已經(jīng)沖擊并超越CPU獨(dú)霸的地位。

1. GPU的計算方法

在繪制圖像時,GPU首先接收宿主系統(tǒng)以三角頂點(diǎn)形式發(fā)送的幾何數(shù)據(jù)。這些數(shù)據(jù)由一個可編程的頂點(diǎn)處理器進(jìn)行處理,該處理器進(jìn)行幾何變換、亮度計算等任何三角形計算。然后,這些三角形由光柵器轉(zhuǎn)換成能夠顯示在屏幕上的單獨(dú)“碎片”,所有碎片都通過可編程碎片處理器計算最終顏色值[2]。由于GPU具有高效的并行性和靈活的可編程性等特點(diǎn),越來越多的研究人員和商業(yè)組織開始利用GPU完成一些非圖形繪制方面的計算,并開創(chuàng)了新的研究領(lǐng)域:GPGPU(通用計算圖形處理單元),實(shí)現(xiàn)如何利用GPU進(jìn)行更為廣泛的科學(xué)計算[4]。借助這些軟件和GPU,軟件開發(fā)人員可以基于CUDA平臺開發(fā)計算軟件,用戶可以用比以往少得多的時間完成很多計算任務(wù)。能夠基于GPU平臺排序及線性方程組求解,實(shí)現(xiàn)并行的搜索算法[5],離散優(yōu)化等科學(xué)計算。GPU在處理大尺寸圖像時具有絕對的優(yōu)勢。例如在8192×8192尺寸圖像的直方圖生成中,排除內(nèi)存分配、讀回的時間和數(shù)據(jù)加載后,GPU的核心時間消耗僅為19ms左右,計算效率是CPU的17倍還多。

2. 基于關(guān)鍵詞的Web圖像搜索

信息檢索技術(shù)是現(xiàn)在計算機(jī)領(lǐng)域的重要內(nèi)容,而圖像檢索技術(shù)又是其中的重要內(nèi)容之一。圖像搜索是通過抽取網(wǎng)頁中存在的圖像信息并建立索引供用戶查詢的技術(shù)。基于關(guān)鍵詞的圖像搜索是指從信息頁中抽取出圖像的文字性語義描述,利用分類器進(jìn)行計算所述圖像集合中每幅圖像與所述待檢索語義之間的相關(guān)度,并進(jìn)行加工整理和建立索引的搜索方式。

3. 基于GPU平臺的檢索方法

GPU作為一種加速工具不但應(yīng)用到高性能通用計算領(lǐng)域,也可應(yīng)用于Web圖像搜索領(lǐng)域。 在文本索引中兩有個關(guān)鍵算法:排序和查找。GPU上都能實(shí)現(xiàn)。對于排序算法,首先通過CPU的快速排序方法把等待排序的數(shù)據(jù)分成多個子序列,然后根據(jù)文本索引中數(shù)據(jù)結(jié)構(gòu)的特點(diǎn),在GPU上對子序列進(jìn)行局部排序。完成在共享存儲器和顯存上的歸并過程。GPU上的查詢主要利用GPU的SIMT的特點(diǎn)實(shí)現(xiàn)多數(shù)據(jù)并行查詢。 基于GPU平臺的信息檢索過程為:一 通過分析圖像搜索系統(tǒng)中模塊的執(zhí)行流程,在CPU-GPU集群服務(wù)器上可以構(gòu)建基于內(nèi)容的圖像搜索系統(tǒng)。 二 利用GPU上的圖像文本語義抽取功能把信息分成多個塊, 利用信息子塊的視覺局部特征和屬性提示來進(jìn)一步精確提取圖像的文本語義信息。三 對GPU上數(shù)據(jù)處理流程及編程模型在顯存中構(gòu)建層次型數(shù)據(jù)。四 以數(shù)據(jù)流控制降低CPU相對GPU的數(shù)據(jù)處理速度的落差。五 利用GPU的優(yōu)化特性,采用自適應(yīng)線程分配的方法完成由線程到數(shù)據(jù)的映射。基于GPU的信息抽取算法方法,能夠使圖像的文本語義信息描述更加細(xì)致完整,系統(tǒng)的功能和性能獲得很大提升。

4. 結(jié)論與展望

GPU已經(jīng)突破了很多技術(shù)屏障,在信息檢索、數(shù)據(jù)挖掘計算機(jī)病毒碼匹配和生物基因技術(shù)領(lǐng)域中都有應(yīng)用。相對于CPU,以同樣的市場價格選用更高計算能力的GPU是可行的。支持CUDA的GPU可以成為是由若干個向量處理器組成的超級計算機(jī)。GPU 的架構(gòu)還會不斷優(yōu)化,被越來越多的大型計算采用,在以后的研究中還要對GPU的分支預(yù)測能力進(jìn)行分析,建立簡單的GPU性能模型,對于復(fù)雜的分支預(yù)測、控制流、數(shù)據(jù)流等方面,開發(fā)適合GPU的算法,以此來充分發(fā)揮GPU在圖像搜索領(lǐng)域的檢索能力。

基金項(xiàng)目:吉林省教育廳“十二五”科學(xué)技術(shù)研究基金資助項(xiàng)目(吉教科合字[2012]第371號)

參考文獻(xiàn):

[1] Macedonia M. The GPU Enters Computing's Mainstream[C]. IEEE Computer. Michael Macedonia,2003, 36(10):106~108.

[2] 吳恩華.圖形處理器用于通用計算的技術(shù)、現(xiàn)狀及其挑戰(zhàn)[J].軟件學(xué)報,2004,15(10):1493-1504.

[3] Mark W R,Glanville R S,Akeley K.A system for Programming Graphics Hardware in a C-like Language[J].ACM Trans Graph,2003,22(3):896-907.

[4] John D. Owens1, David Luebke, et al. A Survey of General-Purpose Computation on Graphics Hardware [J].Computer Graphics ,2007,26 (2) : 80-113.

篇6

一、前言

計算機(jī)的日益普及和計算機(jī)技術(shù)日益成熟,使得計算機(jī)在工業(yè)控制監(jiān)測中的應(yīng)用漸漸深入。但工業(yè)應(yīng)用不同于其它方面,它要求有較強(qiáng)的實(shí)時性?,F(xiàn)在有很多的DOS軟件在運(yùn)行過程中通過掛接外部中斷方式實(shí)現(xiàn)DOS應(yīng)用軟件與外設(shè)的實(shí)時通信,這種方法實(shí)現(xiàn)起來十分簡單。而在Windows中應(yīng)用程序能否也能夠利用外部硬中斷實(shí)現(xiàn)外設(shè)與Windows應(yīng)用程序的實(shí)時通信呢?答案是肯定的。這里的關(guān)鍵是要解決好中斷代碼與Windows應(yīng)用程序相互之間交換信息的問題。

從外設(shè)發(fā)送異步的硬中斷,通過中斷處理程序傳遞一條信息給Windows應(yīng)用程序。這時可以初始化相關(guān)端口,準(zhǔn)備好數(shù)據(jù),然后進(jìn)行數(shù)據(jù)傳送,從而做到實(shí)時通信。

實(shí)現(xiàn)Windows應(yīng)用程序響應(yīng)外部中斷的方法有很多,如Microsoft公司自己開發(fā)的SDK、DDK軟件包,使用嵌入式匯編等等。本文將介紹一種在BC++3.1的基礎(chǔ)上利用Windows3.1擁有的一些功能實(shí)現(xiàn)Windows實(shí)時通信的實(shí)例。

二、中斷代碼的位置

在Windows中,幾乎所有的異步事件都是由中斷處理程序來管理的。中斷處理程序包含在設(shè)備驅(qū)動程序中,由Windows在環(huán)境初始化中安裝。例如,KEYBOARD.DRV、MOUSE.DRV和COMM.DRV均含有中斷處理程序,以處理相應(yīng)的鍵盤、鼠標(biāo)和串行口的異步中斷??梢苑抡諛?biāo)準(zhǔn)設(shè)備驅(qū)動程序,編寫中斷處理代碼,以響應(yīng)外設(shè)的通信請求,從而完成一次實(shí)時通信。

中斷代碼既可以包含在應(yīng)用程序的可執(zhí)行代碼中,也可以包含在動態(tài)連接庫(DLL)中。包含在應(yīng)用程序中的代碼只能在一個程序中使用,而在動態(tài)連接庫中的代碼則可以在Windows系統(tǒng)中所有的應(yīng)用程序所共享。這樣不僅在整個Windows系統(tǒng)中只有一個中斷代碼的副本,提高了內(nèi)存的使用效率,更重要的是可以防止由于同時存在多個中斷代碼的副本而發(fā)生沖突。本文將在DLL中編制中斷處理程序。

當(dāng)動態(tài)連接庫被裝入時,要調(diào)用DLL庫的入口點(diǎn)LibMain(),利用這一點(diǎn)可以執(zhí)行一些初始化工作,可以分配一些內(nèi)存塊,可以初始化一些全局變量或者靜態(tài)變量,可以安裝中斷服務(wù)程序的代碼等等。例如:

voidinterrupt(oldIsr)(--CPPARGS)

/*舊的中斷服務(wù)程序地址*/

LibMain(HANDLEhInstance,WORDwDataSeg,WORDcbHeapSize,L

PSTR

lpszCmdLine)

{

oldIsr=getvect(IRQNum);

/*IRQNum指中斷號*/

setvect(IRQNum,newIsr);

/*newIsr指新中斷服務(wù)程序代碼*/

return(1);

}

函數(shù)setvect()既可在實(shí)模式下,也可在保護(hù)模式下設(shè)置中斷處理向量。

上述代碼也可以放在一個由用戶設(shè)置的引出(export)函數(shù)中,在應(yīng)用程序中用戶可以調(diào)用此引出函數(shù)來安裝中斷服務(wù)程序代碼。

由于中斷可以在任何時刻發(fā)生,中斷代碼必須駐留在內(nèi)存中,并且在應(yīng)用程序運(yùn)行的過程中一直處于某一固定內(nèi)存中。這一點(diǎn)無論是在實(shí)模式還是在保護(hù)模式下都是一致的。

在DLL的模塊定義文件中應(yīng)注意:

1.CODE語句為固定代碼段,即FIXED;

2.EXPORTS語句要引出被應(yīng)用程序和其它DLL用作入口點(diǎn)的函數(shù)。

三、通信機(jī)制

編寫實(shí)時通信例程關(guān)鍵在于必須認(rèn)識到,異步事件對應(yīng)用程序的觸發(fā)是異步發(fā)生的,不在Windows的消息處理機(jī)制和多任務(wù)范圍內(nèi)。為了使通信例程能夠正確地工作,通信例程必須通知Windows有異步事件發(fā)生,且不能打斷應(yīng)用程序的任務(wù)管理或消息流。要作到這一點(diǎn),通信例程必須通過調(diào)用PostMessage或PostAppMessage函數(shù)向應(yīng)用程序的消息隊(duì)列中加入一條消息。

需要注意的是,在DLL中調(diào)用PostMessage(HWNDhwnd,…)時,必須先確定hwnd的實(shí)際值,可以通過使用引出函數(shù)的辦法來實(shí)現(xiàn),如下所示:

staticHWNDhWndApp;

voidFARPASCALSetIsrWin(HWNDhwnd)

{

hWndApp=hwnd;

}

然后在應(yīng)用程序的窗口函數(shù)中,對WM-CREATE消息進(jìn)行處理時調(diào)用此函數(shù)來初始化DLL中的靜態(tài)變量hWndApp:

CASEWM-CREATE:

SetIsrWin(hwnd);/*hwnd指應(yīng)用程序窗口句柄*/

定義一個在應(yīng)用程序中使用的消息:

#defineISRM-RUPTWM-USER+255最后在DLL中的中斷服務(wù)程序代碼中,調(diào)用PostMessage即可完成Windows應(yīng)用程序和中斷服務(wù)程序代碼相互的信息交流:

voidinterruptnewIsr(--CPPARGS)

{

PostMessage(hWndApp,WM-RUPT,wParam,lParam);

}

四、程序?qū)嵗?/p>

篇7

關(guān)鍵詞:高校圖書館信息檢索檢索服務(wù)

0引言

隨著網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,通過互聯(lián)網(wǎng)提供的數(shù)據(jù)庫及種類日漸增多。使得人們對于文獻(xiàn)信息的查詢、加工、存儲、利用等方面有了更新的要求。作為高校圖書館以組織加工數(shù)字化信息及技術(shù)為廣大讀者提供有效信息服務(wù),信息檢索服務(wù)一向是高校圖書館重要工作的組成部分,尤以為教學(xué)科研課題的檢索服務(wù)尤其顯得重要,提供的文獻(xiàn)信息對保障科研工作順利進(jìn)行起到不可忽視的作用。信息檢索服務(wù)就是把圖書館的館藏資源和網(wǎng)絡(luò)資源通過整合和有序化,進(jìn)行全方位、多途徑為教學(xué)科研及廣大讀者提供快、精、準(zhǔn)的信息服務(wù)和信息導(dǎo)航服務(wù),來滿足廣大用戶的信息需求。

1信息檢索服務(wù)對教學(xué)科研的保障作用

圖書館作為教學(xué)科研的重要基地以及文獻(xiàn)信息中心,是高校辦學(xué)的重要支柱。高校圖書館信息檢索的服務(wù)對象是教師和學(xué)生兩大用戶群。而高校圖書館的文獻(xiàn)資源建設(shè)要依據(jù)高校的教學(xué)任務(wù)、教師和學(xué)生的信息需求,以及設(shè)置的專業(yè)學(xué)科和所承擔(dān)的教學(xué)科研任務(wù)相適應(yīng),滿足特色專業(yè)、教學(xué)科研建設(shè)的需要。信息檢索是科研創(chuàng)新的基礎(chǔ)。科研工作者要想進(jìn)行某項(xiàng)科學(xué)研究,必須了解國內(nèi)外科技發(fā)展水平的新技術(shù)、新動向。隨著科學(xué)技術(shù)的高度發(fā)展,學(xué)科之間出現(xiàn)的交叉滲透越來越多,只有深入了解研究科學(xué)發(fā)展規(guī)律與相互作用,才能提高科研工作的知識創(chuàng)新點(diǎn),才能更好得為教學(xué)科研提供保障服務(wù)。

當(dāng)今網(wǎng)絡(luò)技術(shù)的發(fā)展。通過互聯(lián)網(wǎng)提供服務(wù)的數(shù)據(jù)庫種類日漸豐富。信息量大、分布廣、信息的自由性強(qiáng),而用戶面對浩如煙海的信息海洋,感到茫然無措,對網(wǎng)絡(luò)與數(shù)字資源利用能力準(zhǔn)備的不足,這就需要圖書館館員通過信息服務(wù)為讀者進(jìn)行信息導(dǎo)航,為讀者提供細(xì)致、周到、全方位的信息檢索服務(wù)。由于教學(xué)科研工作者的精力相對有限,對學(xué)術(shù)研究的規(guī)范性要求較高,而獲取準(zhǔn)確、有用的信息需占用大量時間和精力,這將成為制約網(wǎng)絡(luò)信息有效利用的瓶頸。高校圖書館開展信息檢索服務(wù)正是為教學(xué)科研工作者了解各國同行的研究現(xiàn)狀,進(jìn)行科技追蹤起到導(dǎo)航作用。

2信息檢索的基本方法

高校圖書館信息檢索的服務(wù)對象是教師和學(xué)生兩大用戶群。要為用戶提供高效、準(zhǔn)確、權(quán)威的信息資源,圖書館館員需要充分利用自已的專業(yè)知識和長期積累的實(shí)踐經(jīng)驗(yàn),依靠豐富的信息資源和強(qiáng)大的搜索引擎,靈活運(yùn)用各種檢索方式、技巧,來滿足用戶對信息的需求。針對用戶需求進(jìn)行分析是開展信息檢索服務(wù)的基礎(chǔ)。當(dāng)圖書館館員接到檢索課題時,首先要和課題人進(jìn)行交流探討,對檢索課題的主題結(jié)構(gòu)、專業(yè)范圍進(jìn)行全面、正確的分析,弄清課題的內(nèi)容實(shí)質(zhì)及所涉及的主要概念及用戶需要信息的具體內(nèi)容。如用戶需要的是文摘、索引還是全文等,以此來確定檢索的范圍。在掌握基本信息需求以后,還要對檢索信息進(jìn)行深度確定,只有這樣才能確保檢索信息的質(zhì)量精準(zhǔn)、到位。同時也是檢索信息服務(wù)能否取得成功的關(guān)鍵。只有真正理解和把握用戶的需求,信息檢索服務(wù)與用戶需求才能達(dá)到完整同一。

通過借助于網(wǎng)絡(luò)檢索工具查找信息,如較成熟的跨庫檢索系統(tǒng)CALIS統(tǒng)一檢索平臺、清華同方USP等重點(diǎn)學(xué)科導(dǎo)航庫。利用搜索引擎進(jìn)行信息檢索。搜索引擎作為主要的網(wǎng)絡(luò)檢索工具,在信息檢索中具有重要的地位。搜索引擎能提供用戶進(jìn)行關(guān)鍵詞、詞組或自然語言檢索的工具。用戶提出檢索要求,搜索引擎就代替用戶在數(shù)據(jù)庫中進(jìn)行檢索,并將檢索結(jié)果提供給用戶。利用搜索引擎查找信息省時省力,簡單方便,檢索速度快、范圍較廣,能及時獲取新增信息。但也存在不足,如利用計算機(jī)軟件對信息進(jìn)行加工、處理,其檢索軟件的智能性不高,檢索的準(zhǔn)確性不是很高,與人們的檢索需求及對檢索效率還存在一定偏差。通過在線數(shù)據(jù)庫查詢,利用在線進(jìn)行數(shù)據(jù)庫查詢。訪問網(wǎng)絡(luò)數(shù)據(jù)庫是用戶獲取學(xué)術(shù)性信息的最有效方法。網(wǎng)上數(shù)據(jù)庫有很多,比如:超星數(shù)字圖書館、萬方數(shù)據(jù)庫資源系統(tǒng)、中國期刊網(wǎng)、中國維普數(shù)據(jù)庫等。主題指南與搜索引擎結(jié)合使用,主題指南將信息系統(tǒng)地進(jìn)行歸類,使用戶能方便地查找到某一大類信息,它的搜索范圍要比搜索引擎小許多。搜索引擎查詢較為全面充分,提供最全面、最廣泛的搜索結(jié)果,但所提供的信息不如主題指南那樣層次結(jié)構(gòu)清晰,顯得繁多雜亂。由于主題指南與搜索引擎各有優(yōu)勢,各有特點(diǎn),通過對兩者合理運(yùn)用,取長補(bǔ)短以達(dá)到產(chǎn)生最佳結(jié)果??傊槍Σ煌康牡臋z索,選擇合適搜索引擎是至關(guān)重要的一步。通過縮小檢索的范圍,①采用恰當(dāng)?shù)臋z索表達(dá)式。就是采用把一個短語作為一整體進(jìn)行查詢的辦法。②限定檢索范圍,當(dāng)檢索的范圍過大時,可對檢索詞的年代、語種、數(shù)量等檢索范圍進(jìn)行限定。③采用進(jìn)階檢索功能,就是利用前一次檢索的結(jié)果作為后一次檢索的依據(jù),逐步縮小檢索范圍。④力求搜索具體化,在檢索時明確檢索課題的要求,限定查詢范圍,選擇確切的檢索詞,使其檢索要求具體化,有利于提高信息檢索的準(zhǔn)確率。還可通過其它方式如利用組合搜索關(guān)鍵詞,利用強(qiáng)制搜索通過添加英文雙引號來搜索短語詞,這對查找名言警句時顯得格外有用。模糊搜索即用*號通配符代替不確定的字或詞等方式對文獻(xiàn)進(jìn)行信息檢索??傊挥胁捎枚喾N方法的綜合使用,才能獲得較好的檢索結(jié)果,才能更好地為教學(xué)科研及廣大用戶提供滿意的服務(wù)。

3提高檢索技術(shù)向知識服務(wù)發(fā)展

隨著信息技術(shù)的發(fā)展網(wǎng)絡(luò)信息資源的劇增,其分布性、異構(gòu)性和動態(tài)性給信息檢索帶來了新的挑戰(zhàn)。傳統(tǒng)的檢索服務(wù)已不能滿足科研對文獻(xiàn)信息檢索日益增長需求,對新問題求解為目的的檢索已成一種趨勢,面對這種檢索需求的轉(zhuǎn)變。需要館員對信息檢索提供的深度要求有了更大幅度的提高。要求館員在信息檢索技術(shù)上進(jìn)行資源整合。采用局部資源整合、文獻(xiàn)資源深層次整合、數(shù)據(jù)庫存資源層次的整合、異構(gòu)數(shù)據(jù)庫的同構(gòu)化整合、基于文獻(xiàn)內(nèi)容層次的整合等。通過整合從而大大提高檢索效率和資源利用率。高校用戶在對信息內(nèi)容綜合性要求的同時,對所提供的文獻(xiàn)信息及信息服務(wù)的深度要求也有了更大提高,因此在對用戶提出的某一專業(yè)性較強(qiáng)課題時,這就要求館員積極參與到課題的研究中去,從課題所屬的專業(yè)角度出發(fā),對其進(jìn)行一系列的分析,并挖掘其深層含義,從而將分散在本領(lǐng)域和相關(guān)領(lǐng)域的專門知識與信息加以集中組織并有序化,從中提煉出有利于用戶需求,具有創(chuàng)新思路的“知識因素”。向用戶提供潛在內(nèi)容知識、預(yù)測分析具有超前性領(lǐng)域的知識和成果,這將有利于檢索質(zhì)量的提高,也是高校圖書館今后進(jìn)行信息檢索服務(wù)的發(fā)展趨勢。

總之,高校圖書館作為高校教學(xué)科研和讀者服務(wù)的部門,必須進(jìn)一步明確自身的定位,加強(qiáng)服務(wù)意識和創(chuàng)新服務(wù)舉措,憑借自身在文獻(xiàn)信息資源特有的行業(yè)優(yōu)勢,充分利用圖書館豐富的館藏文獻(xiàn)信息資源、特色數(shù)據(jù)庫等資源,為教學(xué)科研工作提供優(yōu)質(zhì)、周到的服務(wù),推動高校教學(xué)科研工作進(jìn)一步的向前發(fā)展。

參考文獻(xiàn):

[1]楊瑪萍.數(shù)字圖書館服務(wù)質(zhì)量初探[J].科技情報開發(fā)與經(jīng)濟(jì).2006(16).

[2]楊曉紅.高校圖書館文獻(xiàn)信息資源開發(fā)與服務(wù)創(chuàng)新[J].科技情報開發(fā)與經(jīng)濟(jì).2005(21).

[3]劉芳蘭.高校圖書館服務(wù)創(chuàng)新的探討[J].湘潭師范學(xué)院學(xué)報.社會科學(xué)版.2005.(2).

[4]張玉峰.論知識檢索與信息檢索[J].中國圖書館學(xué)報.2003(5).

篇8

關(guān)鍵詞:計算機(jī);信息檢索;應(yīng)用;研究

中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2011)27-6688-02

1 計算機(jī)信息檢索特點(diǎn)分析

隨著信息社會的到來,計算機(jī)的檢索在各方面得到了有效的應(yīng)用,信息服務(wù)行業(yè)已成為推動經(jīng)濟(jì)發(fā)展的重要行業(yè)和主要的組成部分,信息檢索作為利用信息資源的有效手段,為管理和決策提供了有效的依據(jù),與傳統(tǒng)的手工檢索相比,計算機(jī)信息檢索:

1)查找迅速,反饋及時,資源共享。計算機(jī)的信息檢索過程中,聯(lián)機(jī)系統(tǒng)中的中央主機(jī)采用分時技術(shù),系統(tǒng)對用戶的響應(yīng)只需要幾秒。檢索反饋較快,響應(yīng)的系統(tǒng)還能根據(jù)反饋信息,進(jìn)行檢索策略的調(diào)整,網(wǎng)絡(luò)檢索實(shí)現(xiàn)了信息資源的共享,用戶能通過互聯(lián)網(wǎng)與各種文獻(xiàn)信息進(jìn)行連接,從而獲取所需要的信息資料。

2)檢索全面,主題廣泛,實(shí)時性強(qiáng)。計算機(jī)的聯(lián)機(jī)檢索一般能提供數(shù)十個到數(shù)百個數(shù)據(jù)庫的檢索,涉及的范圍較廣,覆蓋了人們社會生活的各個領(lǐng)域和各方面。而互聯(lián)網(wǎng)的信息檢索則能通過數(shù)量龐大的、且處于不斷更新狀態(tài)下的信息資源的檢索獲得自身所需要的信息。計算機(jī)聯(lián)機(jī)系統(tǒng)的信息查詢中,大多數(shù)數(shù)據(jù)庫的更新為數(shù)周,而金融、科研、社會動態(tài)等方面的數(shù)據(jù)庫則能實(shí)現(xiàn)實(shí)時更新,從而滿足用戶多樣化的信息需求。

3) 檢索便利,功能完善,靈活組配。計算機(jī)的信息檢索采取了邏輯運(yùn)算模式,在信息檢索過程中,能通過不同類型檢索詞之間的組配實(shí)現(xiàn)多樣化的信息檢索。同時還能對檢索位置關(guān)系以及短語進(jìn)行全文查找,建立多途徑多樣化的信息檢索體系。通過使用網(wǎng)絡(luò)web瀏覽器以及搜索引擎的利用,從而快速查找了互聯(lián)網(wǎng)上的各種信息,檢索便利。計算機(jī)信息檢索過程中也存在不足,數(shù)據(jù)庫的回溯實(shí)踐段短,一般只回溯1970年以后的文獻(xiàn)。信息檢索系統(tǒng)的可靠性需要加強(qiáng),應(yīng)避免計算機(jī)信息檢索過程中由于設(shè)備故障造成的信息檢索過程中的障礙,造成時間上和經(jīng)濟(jì)上的損失。計算機(jī)信息檢索的費(fèi)用較高,檢索費(fèi)用高,對信息檢索人員的知識水平、語言表達(dá)能力以及數(shù)據(jù)庫的了解和掌握情況要求較高。檢索的適應(yīng)性在一定程度上不均衡。計算機(jī)信息的檢索在用戶能明確表示信息需求時具有較高的質(zhì)量和效果,然而當(dāng)用戶的信息需求不明朗或是表達(dá)不準(zhǔn)確時,則難以獲得較好的檢索效果?;ヂ?lián)網(wǎng)上的信息檢索,受到相應(yīng)檢索技術(shù)等各方面的影響,致使計算機(jī)檢索的質(zhì)量也不高。

2 計算機(jī)信息檢索的途徑

2.1 聯(lián)機(jī)信息檢索

聯(lián)機(jī)檢索服務(wù)是當(dāng)前信息產(chǎn)業(yè)的重要組成部分,目前已形成了新興發(fā)展的產(chǎn)業(yè),也就是聯(lián)機(jī)檢索工業(yè)。聯(lián)機(jī)檢索是指用戶通過終端設(shè)備的利用,實(shí)現(xiàn)信息需求按照一定的規(guī)范上的查詢語言和檢索語句進(jìn)行組織并投入信息檢索,并實(shí)現(xiàn)了檢索信息的有效反饋。實(shí)現(xiàn)人機(jī)之間的實(shí)時對話,從計算機(jī)系統(tǒng)的數(shù)據(jù)庫中查找出用戶所需要信息的過程。連接檢索系統(tǒng)通常由中央主機(jī)、數(shù)據(jù)庫和國際通訊網(wǎng)絡(luò)等部分構(gòu)成。聯(lián)機(jī)檢索系統(tǒng)開發(fā)與之配套的聯(lián)機(jī)檢索軟件,并利用中央主機(jī)對信息進(jìn)行儲存、處理和檢索,以及整個系統(tǒng)的運(yùn)行和管理。計算機(jī)的聯(lián)機(jī)系統(tǒng)具有多臺主機(jī),從而保障信息檢索的穩(wěn)定性。聯(lián)機(jī)數(shù)據(jù)庫則以特定的方式實(shí)現(xiàn)了信息是搜集、整理加工和存儲,并數(shù)據(jù)庫則以某一特定的方式對信息進(jìn)行收集、整理、加工和存儲, 含有多種紀(jì)錄類型的數(shù)據(jù)組合, 是聯(lián)機(jī)檢索操作的直接使用對象,聯(lián)機(jī)檢索系統(tǒng)是通過為用戶提供數(shù)據(jù)庫進(jìn)行信息的搜索服務(wù)。數(shù)據(jù)庫中的數(shù)據(jù)信息包括數(shù)據(jù)的記錄、聚合與數(shù)據(jù)項(xiàng)之間的關(guān)系。具有以下幾個特點(diǎn):

首先,存儲的數(shù)據(jù)之間存在著一定的邏輯關(guān)系,首先,聯(lián)機(jī)檢索中的數(shù)據(jù)庫之間的數(shù)據(jù)是相互關(guān)聯(lián)的,各數(shù)據(jù)集或數(shù)據(jù)項(xiàng)支架存在不同層次的邏輯聯(lián)系,由此,數(shù)據(jù)庫在信息的存儲過程中,不僅僅存儲了信息數(shù)據(jù)本身,同時記錄了各數(shù)據(jù)項(xiàng)之間的邏輯關(guān)系。其次,聯(lián)機(jī)系統(tǒng)中的數(shù)據(jù)具有獨(dú)立性,聯(lián)機(jī)檢索中的數(shù)據(jù)庫存儲了大量數(shù)據(jù)及其具有復(fù)雜邏輯關(guān)系的數(shù)據(jù)集合體,然而其存儲方式與應(yīng)用程序相比是獨(dú)立的。當(dāng)對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行修改時,不會對應(yīng)用程序造成影響。第三, 數(shù)據(jù)實(shí)現(xiàn)了集中化控制。數(shù)據(jù)庫可對數(shù)據(jù)的增加、刪除、修改、檢索進(jìn)行集中控制和管理, 去掉重復(fù)數(shù)據(jù), 提供多種保密性能。如可設(shè)置不同級別的通行字, 使機(jī)密數(shù)據(jù)庫或私人數(shù)據(jù)庫受到嚴(yán)格保護(hù)。聯(lián)機(jī)的檢索系統(tǒng)建立了與外界體系相隔的防護(hù)體系,從而在各企業(yè)的發(fā)展過程中起到了重要的作用。

2.2 網(wǎng)絡(luò)信息檢索

隨著計算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的迅速發(fā)展和廣泛推廣應(yīng)用,世界范圍內(nèi)的信息交流和知識資源共享成為了可能,同時也給圖書館信息組織、信息檢索以及信息 的獲取方式造成了較大的沖擊和影響。計算機(jī)互聯(lián)網(wǎng)成為了最大的信息獲取基地?;ヂ?lián)網(wǎng)不僅為人們提供了數(shù)量巨大且處于不斷更新發(fā)展中的信息資源,同時也提供了信息資源的搜索和服務(wù)的工具。據(jù)統(tǒng)計,全世界已有186 個國家和地區(qū)與互聯(lián)網(wǎng)相聯(lián),網(wǎng)上有數(shù)億網(wǎng)站和主頁,聯(lián)結(jié)了數(shù)千個大型圖書館、學(xué)術(shù)數(shù)據(jù)庫、100 萬個信息網(wǎng)和幾千萬主機(jī),上網(wǎng)人數(shù)達(dá)1 億。計算機(jī)互聯(lián)網(wǎng)信息共享模式也為電子商務(wù)的發(fā)展創(chuàng)造了良好的平臺,數(shù)字認(rèn)證、基于Web 的語言翻譯等技術(shù)的發(fā)展致使計算機(jī)互聯(lián)網(wǎng)上的網(wǎng)民迅速增加。相應(yīng)技術(shù)的發(fā)展為信息的檢索和發(fā)展模式提供了有效的技術(shù)支撐,為用戶提供可靠、簡單而快捷的信息服務(wù)。網(wǎng)絡(luò)信息資源的利用和檢索能有效地提高信息的利用和共享程度,通過多種方式的檢索實(shí)現(xiàn)了信息資源的有效交流和發(fā)展。

互聯(lián)網(wǎng)的發(fā)展在很大程度上改變了信息檢索、信息獲取的方式。網(wǎng)上動態(tài)信息,也就是結(jié)構(gòu)化信息,已成為互聯(lián)網(wǎng)上最為常見以及應(yīng)用最為廣泛的信息資源。用戶通過信息搜索,建立了滿足自身發(fā)展需要的信息資源。新的網(wǎng)絡(luò)信息檢索工具便應(yīng)運(yùn)而生?;ヂ?lián)網(wǎng)上信息檢索方法有幾種:

1)瀏覽,即在日常的網(wǎng)絡(luò)閱讀、漫游過程中,意外發(fā)現(xiàn)有用信息。瀏覽方式的信息獲取不具有較強(qiáng)的目的性,由此也難以獲得有效的信息檢索模式。

2)沿著超鏈接進(jìn)行瀏覽和檢索,也就是利用超文本文檔的鏈接從一網(wǎng)頁轉(zhuǎn)向另一相關(guān)網(wǎng)頁,在轉(zhuǎn)換網(wǎng)頁的過程中不斷擴(kuò)大信息檢索的范圍,但沿著超鏈接的檢索方式能在短期內(nèi)獲得與主題相關(guān)的信息,也可能偏離信息檢索的目標(biāo)。用戶可在信息的瀏覽過程中創(chuàng)建書簽或熱鍵記錄常用站點(diǎn)地址,建立常用的信息檢索目錄,縮小信息查找的范圍。

3)網(wǎng)絡(luò)資源指南, 專業(yè)人員對網(wǎng)絡(luò)信息資源進(jìn)行采集、整理、過濾控制等手段, 開發(fā)出可供瀏覽檢索的網(wǎng)絡(luò)資源主題指南,尤其是針對各學(xué)科專業(yè)的網(wǎng)絡(luò)信息資源的指南。

2.3 網(wǎng)絡(luò)信息檢索特點(diǎn)

網(wǎng)絡(luò)信息檢索有如下特點(diǎn):

1)擴(kuò)寬了信息檢索的空間。檢索范圍得到了有效的擴(kuò)展,網(wǎng)絡(luò)信息檢索以互聯(lián)網(wǎng)上是所有網(wǎng)絡(luò)資源為檢索范圍。具備了其他信息檢索方式不具有的優(yōu)勢。

2)實(shí)施交換式的作業(yè)方式。所有網(wǎng)絡(luò)信息檢索工具都具有交互式作業(yè)的特點(diǎn),能夠通過對用戶命令的分析中了解用戶的信息需求,反饋給用戶需要的信息,計算機(jī)的網(wǎng)絡(luò)檢索還具有良好的信息反饋的功能,用戶可以在檢索過程中及時調(diào)整檢索策略以獲得更好的檢索結(jié)果。

3)具有良好的用戶界面友好和便利的信息檢索和操作方式,網(wǎng)絡(luò)檢索采用交互式作業(yè),系統(tǒng)透明、通用的Windows 界面和符合大多數(shù)用戶檢索習(xí)慣的用戶接口都使檢索變得簡單易行,網(wǎng)絡(luò)用戶不需要太多培訓(xùn)就能上手操作,使用自己熟悉的方式輸入查詢提問,就可以實(shí)現(xiàn)對各種系統(tǒng)數(shù)據(jù)庫的訪問、檢索。而聯(lián)機(jī)檢索則需要學(xué)習(xí)和記憶一系列檢索指令和規(guī)則,一般用戶只能借助專業(yè)人員的幫助才能使用。

3 結(jié)束語

計算機(jī)信息檢索與傳統(tǒng)的手工檢索相比,具有良好的適應(yīng)性,實(shí)現(xiàn)了高效的信息檢索和利用模式,從而在企業(yè)、教育、政府的電子政務(wù)建設(shè)、電子商務(wù)的興起和發(fā)展過程中奠定了有效的發(fā)展基礎(chǔ)。計算機(jī)信息檢索在各方面的應(yīng)用反映了用戶的多樣化信息需求,而相應(yīng)計算機(jī)檢索的應(yīng)用則在一定程度上反映了政府、企業(yè)以及各行業(yè)的發(fā)展需求,計算機(jī)檢索體系為其發(fā)展創(chuàng)造了良好的技術(shù)支撐。

參考文獻(xiàn):

[1] 魏海霞.計算機(jī)信息檢索的方法、策略與技巧[J].情報探索,2009(5).

[2] 蔡妍.當(dāng)前高職院校圖書館讀者工作的問題與對策[J].桂林航天工業(yè)高等??茖W(xué)校學(xué)報,2010(2).

[3] 朱寧賢.計算機(jī)信息檢索技術(shù)與學(xué)生信息素養(yǎng)培養(yǎng)[J].科技信息:科學(xué)教研,2007(22).

篇9

[關(guān)鍵詞]多語言信息檢索 信息可視化 界面設(shè)計

[分類號]G354.4

1 引言

在網(wǎng)絡(luò)上收集不同語言的資料會面臨一些困難:在檢索不同語言資料時若將不同語言的檢索結(jié)果混合排列,很容易互相覆蓋檢索結(jié)果或造成混亂。多語言檢索的理想界面設(shè)計要能整合多語言檢索結(jié)果,并注重多語言檢索用戶的滿意度。如果嘗試在搜索引擎上查詢不同語言的信息,用戶常用的方法是在各語言的檢索界面中分別輸入不同語言的關(guān)鍵詞,在得到不同語言的檢索結(jié)果之后再自行整理與分類。這樣的步驟既復(fù)雜又沒有效率,研究者設(shè)計新的檢索界面要能針對用戶需求,設(shè)法解決目前使用上的不便。目前已經(jīng)有許多關(guān)于整合檢索信息、信息可視化系統(tǒng)以及不同語言檢索界面設(shè)計的研究,但是將多語言檢索與信息可視化概念相結(jié)合在搜索引擎的研究上還比較少見。多語言檢索是在網(wǎng)上搜索多種不同語言的資料,而信息可視化系統(tǒng)的運(yùn)用能幫助用戶分析資料并藉由和系統(tǒng)的互動得到更精確的檢索結(jié)果。若能將兩者結(jié)合并應(yīng)用于檢索系統(tǒng)界面的設(shè)計上,不但有助于讓用戶得到來自更多方面的信息,也能夠運(yùn)用圖像幫助讓檢索結(jié)果更易于了解。本文的研究目的主要是依據(jù)用戶的需要將多語言檢索和檢索可視化相結(jié)合,運(yùn)用可視化技巧協(xié)助多語言檢索的進(jìn)行,并系統(tǒng)化地顯示檢索結(jié)果,讓用戶能夠更有效率地得到需要的資料。

2 多語言信息可視化研究綜述

本文首先將與多語言檢索系統(tǒng)界面設(shè)計或可視化相關(guān)的研究文章進(jìn)行整理。Chung討論多語言檢索的盛行對于系統(tǒng)設(shè)計以及用戶行為的影響,文中檢視現(xiàn)存的中文,西班牙文及阿拉伯文搜索引擎,并依據(jù)各搜索引擎的特色、功能與設(shè)計做整理與比較。他的研究利用實(shí)驗(yàn)測試了各雙語檢索網(wǎng)站與用戶需要的檢索界面并做可用性比較,透過用戶測試發(fā)現(xiàn)網(wǎng)站設(shè)計理論是成立的。這篇文章中發(fā)表的網(wǎng)站設(shè)計概念包括了檢索頁、結(jié)果頁以及分類、摘要還有可視化的功能。研究者在這篇文章中多次提及多語言界面設(shè)計必須要符合用戶的使用習(xí)慣,也建議未來的研究能夠?qū)⑿畔⒖梢暬c檢索界面相結(jié)合。兒童數(shù)字圖書館(ICDL)是一個多國家多語言界面設(shè)計的范例,ICDL在設(shè)計界面時不做國際化或是地方化的設(shè)計,而主要依據(jù)網(wǎng)頁的呈現(xiàn)和功能需求。這個研究所帶來的啟發(fā)是:圖形的運(yùn)用能夠增加用戶對系統(tǒng)的了解,并且無論對于不同年紀(jì)或是不同國籍的用戶都有幫助。雖然本研究的系統(tǒng)用戶族群和ICDL并非完全相同,但同樣是提供不同語言用戶的界面設(shè)計,因此可以從他們的研究中獲得一點(diǎn)心得。

Zhang and Lin在發(fā)表的文章中做了三個搜索引擎的評鑒,并且列出了5個評鑒多語言檢索系統(tǒng)的標(biāo)準(zhǔn):搜索引擎的檢索語言數(shù)目、多語言支援功能、翻譯能力、協(xié)助功能和界面設(shè)計。他們設(shè)計出一套測試方式來檢驗(yàn)搜索引擎的多語言服務(wù),并做進(jìn)一步的分析和比較,從而找出不同搜索引擎的優(yōu)缺點(diǎn)。這個研究顯示,大部分的搜索引擎還沒有提供檢索翻譯功能,然而對于一個成功的多語言搜索引擎最重要的兩個要點(diǎn)就是提供檢索的語言數(shù)目以及翻譯質(zhì)量。Chau以及其他學(xué)者討論了非英語搜索引擎的使用,并將研究測試結(jié)果與英語搜索引擎相比較,發(fā)現(xiàn):有50%的檢索只使用一個關(guān)鍵詞,有90%的檢索使用小于七個的關(guān)鍵詞;因?yàn)樽衷~的組成方式不同,每個檢索詞的字?jǐn)?shù)會比英文檢索還要多;中文檢索中最常用的運(yùn)算子是邏輯與“+”。此外,他們也討論了中文檢索的字元使用以及運(yùn)算子運(yùn)用議題。這個研究結(jié)果提醒其他研究者,不同語言的區(qū)域?qū)τ脩舻木W(wǎng)絡(luò)檢索行為會產(chǎn)生影響,而信息可視化或許是一種可以用來消除語言隔閡的方法:在不同語言的檢索界面上可以利用圖標(biāo)和顏色來幫助用戶熟悉界面,再融入依照不同語言用戶習(xí)慣設(shè)計的可視化技術(shù)如分類、階層以及群聚。多語言檢索能夠藉由翻譯功能來幫助用戶查詢。何大慶和吳丹使用相關(guān)反饋(relevanee feedback)來輔助多語言信息獲取時的翻譯,這種方式不但能幫助系統(tǒng)在翻譯中摘錄相關(guān)文件并且也能將這種方法應(yīng)用在查詢的翻譯上。實(shí)驗(yàn)證明這是一種有效的方法,而翻譯技術(shù)的發(fā)展也有助于使多語言檢索系統(tǒng)在使用上更加便利與實(shí)用。

多語言檢索也能藉由用戶友好的界面設(shè)計來滿足用戶需要,Petrelli設(shè)計了一個以用戶為中心的多語言信息檢索系統(tǒng)(cross-lingual information retrieval sys-ten)模型,并要求用戶對模型提出更改建議,然后根據(jù)用戶的建議將檢索系統(tǒng)重新設(shè)計一次。通過這樣的使用測試他發(fā)現(xiàn)用戶的一些偏好,包括:①雖然顯示翻譯過程可以讓用戶更容易修改查詢詞,但是他們還是比較希望能直接看到檢索結(jié)果;②不同文化背景的用戶會用不同的檢索詞,對結(jié)果也有不一樣的期待;③對語言的了解可以增進(jìn)檢索結(jié)果的精確度。這個系統(tǒng)在設(shè)計時與用戶互動,透過結(jié)果可知道了解用戶需求對系統(tǒng)設(shè)計者來說是很重要的,而且除了文化背景、語言程度及用戶的其他特性之外,界面設(shè)計也能影響系統(tǒng)的好用與否。Petrelli的研究突顯出了解用戶意見的重要性,在沒計系統(tǒng)界面的同時也必須收集用戶資料、了解用戶習(xí)慣,并且在設(shè)計用戶界面時考慮這些信息,此外,其他研究者整理出的用戶需求也能作為系統(tǒng)設(shè)計的參考。下面總結(jié)以上幾種多語言搜索研究的成果,如表1所示:

3 多語言信息檢索系統(tǒng)可視化設(shè)計

本研究的系統(tǒng)設(shè)計結(jié)合信息可視化和多語言檢索。研究之中所運(yùn)用的理論包括信息可視化概念以及滿足不同語言檢索界面的設(shè)計需求。本研究的目標(biāo)包括:信息可視化;設(shè)計合適的用戶交互界面;支持雙語的呈現(xiàn)。

信息可視化是一種結(jié)合圖形、動態(tài)圖像以及用戶交互系統(tǒng)的信息表達(dá)方式,也是一種將對專業(yè)知識的了解與人類對電腦圖像的認(rèn)知結(jié)合的科技。所以在展示數(shù)量較多或是較為復(fù)雜的資料時,可以用信息可視化技術(shù)來協(xié)助用戶了解信息。Shneiderman把信息可視化的資料形態(tài)分類成一維、二維、三維、時間、多面向、樹狀以及網(wǎng)絡(luò)資料;并將信息可視化的功能分類為概觀、放大縮小、過濾、隨選詳細(xì)資料、相關(guān)、歷史資料、萃取信息。在檢索可視化上比較常用的功能包括樹狀以及網(wǎng)絡(luò)狀的資料呈現(xiàn),并搭配概觀、放大縮小以及隨選詳細(xì)資料這些功能來與用戶互動。信息可視化不僅能夠運(yùn)用圖像將資料用合適的方式呈現(xiàn),更可以將功能與資料呈現(xiàn)整合。許多搜索引擎都提供多語言檢索功能,但是現(xiàn)有搜索引擎執(zhí)行多語言檢索時常常發(fā)生以下幾種問題:多個語言的檢索結(jié)果可能因?yàn)闂l

列式的排序方式而分散在大量的檢索結(jié)果之中,或是因?yàn)椴煌Z言檢索結(jié)果交互出現(xiàn)而產(chǎn)生混亂。以谷歌檢索為例,就算在語言偏好處設(shè)定檢索結(jié)果的語言,和檢索詞相同語言的檢索結(jié)果還是會自動排序在靠前位置。如果將語言也當(dāng)做檢索結(jié)果排序或呈現(xiàn)的一種選項(xiàng),應(yīng)該能更符合用戶的需求。此外,對于不同語言的支持也是影響檢索結(jié)果的另一個重點(diǎn)。

本文的研究將檢索界面的設(shè)計加入信息可視化技術(shù),讓檢索結(jié)果能夠更有組織地呈現(xiàn)出來,也更能夠滿足多語言檢索的需要。而要達(dá)到這個目標(biāo)需要滿足下面三個要點(diǎn):①在界面設(shè)計上必須同時滿足多種語言的使用習(xí)慣,并且考慮到多種語言不同的使用特性。例如英文是一個詞一個詞分開,中文卻是每個字都有自己的意思,而且中文字的構(gòu)造比英文相對復(fù)雜,如果字型太小會難以辨識。②要提供翻譯或是語言選項(xiàng)來支援多語言服務(wù),讓用戶可以選擇查詢詞的語言和檢索結(jié)果的語言。③將檢索與合適的信息可視化系統(tǒng)結(jié)合,但要考慮到使用的便利性,不要過于復(fù)雜。此外,系統(tǒng)的信息檢索與分類功能也是很重要的一環(huán)。要完成這樣的研究必須將檢索引擎的多語言檢索結(jié)果使用圖形化展示,讓用戶能夠自行調(diào)整檢索結(jié)果,并且使簡潔的界面產(chǎn)生最大的功能。此外,未來也可在這樣的系統(tǒng)里結(jié)合翻譯以及檢索優(yōu)化的功能。

4 多語言信息檢索系統(tǒng)可視化界面原型

綜合以前學(xué)者所做的研究分析,并且依據(jù)多語言檢索和信息可視化的概念,多語言檢索要具備多語言使用的翻譯與協(xié)助功能,并結(jié)合圖像與資料,本文設(shè)計了一個多語言檢索可視化界面見圖1。

這個設(shè)計是以容易理解與使用便利性為優(yōu)先考量的界面,且擁有以下的特點(diǎn):①將不同語言的檢索結(jié)果呈現(xiàn)在同一個界面上;②能將檢索范圍依據(jù)檢索結(jié)果延伸或是縮小;③將檢索結(jié)果做簡易的整理;④引導(dǎo)用戶做進(jìn)階檢索。

4.1 將不同語言的檢索結(jié)果呈現(xiàn)在同一個界面上

本界面嘗試把中文和英文的檢索結(jié)果同時顯示,因此用戶可以同時得到中英檢索結(jié)果,將中英文的檢索結(jié)果互相比較,并依序?yàn)g覽或是從中選擇最適合的信息,節(jié)省了重復(fù)檢索的時間。

4.2 能將檢索范圍依據(jù)檢索結(jié)果延伸或是縮小

將檢索結(jié)果以信息可視化方式呈現(xiàn)也能將檢索結(jié)果延伸,并且在顯示關(guān)聯(lián)性的同時提供用戶可能需要的關(guān)鍵字,這種功能不但能協(xié)助用戶探索更大范圍中英文的相關(guān)資料,也能讓用戶將檢索范圍集中并提高檢索結(jié)果的相關(guān)性。

4.3 將檢索結(jié)果做簡易的整理

多語言檢索的結(jié)果資料筆數(shù)會更多,種類也會更繁雜,因此界面的簡潔與容易了解是很重要的。本界面設(shè)計不僅能清楚地列出中文和英文的檢索結(jié)果,也將檢索結(jié)果做了概略的分類,增加用戶瀏覽時的效率。

4.4 引導(dǎo)用戶做進(jìn)階檢索

在界面上可以看到關(guān)鍵字的翻譯,例如輸入檢索詞“春天”時也會同時顯示英語翻譯(spring)的檢索結(jié)果,因此用戶能夠把關(guān)鍵字修正得更符合他們的想法。例如用戶其實(shí)想知道關(guān)于春天酒店或是春天旅游的資料,也可以藉由可視化顯示看到各個檢索結(jié)果之間的關(guān)聯(lián)性,用戶可以借此讓檢索更符合他們的需求。

在使用上首先輸入英文或是中文關(guān)鍵詞,另一個語文也會自動進(jìn)行關(guān)鍵詞搜尋,并以圖像表現(xiàn)各個主題詞之間的關(guān)系,如果滑鼠按下與搜尋有關(guān)系的關(guān)鍵詞,便能將相關(guān)的搜尋結(jié)果展開。這個界面延續(xù)了其他多語言界面的特性,然而清爽的界面讓使用者更容易使用,圖像也能輔助使用者使用雙語思考,是其他雙語系統(tǒng)所沒有的設(shè)計。

5 未來發(fā)展方向

本研究為用戶設(shè)計了一個可以簡易整理與探索多語言檢索結(jié)果的界面,也提供用戶更多可以自行更改的選項(xiàng)。在將來的檢索系統(tǒng)界面以及信息可視化設(shè)計中,研究者還可以將此系統(tǒng)界面設(shè)計朝以下幾個方向發(fā)展:①將雙語可視化技巧應(yīng)用于不同檢索結(jié)果中;②與翻譯或是摘要功能相結(jié)合;③依據(jù)用戶研究結(jié)果改進(jìn)設(shè)計等。

5.1 將雙語可視化技巧應(yīng)用于不同檢索結(jié)果中

目前只將同一個檢索系統(tǒng)中的中英文檢索結(jié)果在同一個界面整合,并且使用信息可視化技巧呈現(xiàn)。這種做法不但可以幫助用戶整合檢索結(jié)果,也便于比較和深入了解檢索結(jié)果。未來更先進(jìn)的系統(tǒng)設(shè)計可以提供更多的語言選項(xiàng),也能與更多檢索系統(tǒng)合作,讓用戶能自訂檢索引擎,將多語言檢索界面應(yīng)用到符合他們需求的檢索結(jié)果之中。如此,不但可以擴(kuò)大多語言檢索界面的應(yīng)用范圍,讓檢索結(jié)果更符合用戶需求,也讓此設(shè)計的使用更具靈活性。

5.2 與翻譯或是摘要功能結(jié)合

將多語言檢索結(jié)果展示在同一個界面上之后,用戶能借此機(jī)會對比雙語檢索結(jié)果并修正關(guān)鍵字,不過對于非母語的多語言檢索不只需要展示和簡易的分類功能,更需要翻譯和語言方面的協(xié)助。此外,翻譯功能也能協(xié)助用戶了解不同語言的網(wǎng)頁內(nèi)容,進(jìn)而將檢索范圍做適當(dāng)?shù)难由旎蚩s小。多語言檢索在信息爆炸的現(xiàn)在是一種趨勢,然而用戶對于其他語言的了解可能無法滿足他們對于多語言信息的需求。因此翻譯或是簡易的摘要功能都會有所幫助。

篇10

>> 淺談網(wǎng)絡(luò)時代的信息安全 試論網(wǎng)絡(luò)時代多媒體技術(shù)在圖書館信息檢索中的應(yīng)用 網(wǎng)絡(luò)時代下的音樂檢索方法初探 信息時代醫(yī)學(xué)信息資源檢索的研究 淺談網(wǎng)絡(luò)時代的網(wǎng)絡(luò)閱讀 網(wǎng)絡(luò)時代的信息構(gòu)建 網(wǎng)絡(luò)時代的信息規(guī)則 網(wǎng)絡(luò)信息檢索淺談 淺談網(wǎng)絡(luò)時代的編輯素養(yǎng) 淺談網(wǎng)絡(luò)時代的學(xué)校建設(shè) 淺談網(wǎng)絡(luò)時代審計的變化 淺談網(wǎng)絡(luò)時代的作文訓(xùn)練 淺談網(wǎng)絡(luò)時代的營銷變革 淺談網(wǎng)絡(luò)時代的受眾觀 泛在網(wǎng)絡(luò)時代文獻(xiàn)檢索課如何培養(yǎng)學(xué)生的學(xué)習(xí)力 網(wǎng)絡(luò)時代文獻(xiàn)檢索課教學(xué)內(nèi)容的創(chuàng)新 淺談信息網(wǎng)絡(luò)時代的思想政治工作 淺談信息網(wǎng)絡(luò)時代城建檔案價值鑒定工作的發(fā)展 網(wǎng)絡(luò)時代的強(qiáng)制性信息傳播研究 網(wǎng)絡(luò)時代的信息與監(jiān)管 常見問題解答 當(dāng)前所在位置:l) GenBank是美國國立研究院(NIH)、美國國立圖書館(NLM)、美國國家生物技術(shù)中心(NCBI)于1982年建立的核酸序列數(shù)據(jù)庫,免費(fèi)提供所有公開發(fā)表的核酸和蛋白質(zhì)序列及其生物學(xué)注釋和書目文獻(xiàn)等信息。它與日本DNA數(shù)據(jù)庫(DDBJ)、歐洲分子生物實(shí)驗(yàn)室(EMBL)合作,形成國際核酸序列數(shù)據(jù)庫協(xié)作體,每天交換數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)共享?;驇斓臄?shù)據(jù)來源有:從科學(xué)出版物中搜集核酸序列;科學(xué)家直接發(fā)送數(shù)據(jù);測序中心以ESTs成批發(fā)送的數(shù)據(jù);與其他核酸序列數(shù)據(jù)庫之間的數(shù)據(jù)交換。GenBank提供了Entrez瀏覽器(Entrez Browser),用戶可以檢索GenBank、EMBL、PIR、SWISS-PORT、PDB等數(shù)據(jù)庫的序列信息以及Medline中與序列有關(guān)的文獻(xiàn)信息。

3因特網(wǎng)上查找醫(yī)學(xué)信息的其他途徑

目前常用的中文通用搜索引擎有:①百度搜索(http://)它是目前全球最優(yōu)秀、更新時間最快、數(shù)據(jù)量最大的中文搜索引擎。它擁有目前世界上最大的中文信息庫,總量超過8億頁以上,并且還在以每天幾十萬頁的速度快速增長。②Google搜索(http://)它是目前最優(yōu)秀的支持多語種的搜索引擎之一,也是萬維網(wǎng)上最大的搜索引擎,現(xiàn)能搜索80多億網(wǎng)頁,課用多種語言進(jìn)行搜索。③搜狐公司搜狗搜索(http://)到目前為止,搜狗搜索收錄的中文網(wǎng)頁近20億,并且實(shí)現(xiàn)了4~5d全部網(wǎng)頁更新,重要網(wǎng)站和鏈接每日更新,大大降低了死鏈接,空鏈接。④雅虎中國(http://.cn)曾是純粹的分類列表時搜索引擎的代表。目前已經(jīng)實(shí)現(xiàn)搜索全球38種語言網(wǎng)頁并抓取10億中文網(wǎng)頁。

通用搜索引擎提供的是包羅萬象的查詢,為了快速、準(zhǔn)備的獲得所需的醫(yī)學(xué)信息,需要選擇適當(dāng)?shù)臋z索策略。如選擇合適的關(guān)鍵詞,縮小或擴(kuò)大檢索范圍等。

網(wǎng)絡(luò)信息的多樣性、分散和無序,影響了網(wǎng)絡(luò)信息的檢索質(zhì)量。2001年出臺的MPEG-7國際標(biāo)準(zhǔn)解決了多媒體信息描述的標(biāo)準(zhǔn)問題,實(shí)現(xiàn)了快速有效的搜索。標(biāo)準(zhǔn)化是網(wǎng)絡(luò)信息檢索的根本性技術(shù)保證。[1]智能檢索是基于自然語言的檢索形式,它把現(xiàn)代人工智能的技術(shù)與方法引入信息檢索系統(tǒng),機(jī)器根據(jù)用戶提供的以自然語言表述的檢索要求進(jìn)行分析,而后形成檢索策略進(jìn)行搜索,使信息檢索系統(tǒng)具有一定程度的智能特征,在更高的層次上完成其功能。[2]因此,網(wǎng)絡(luò)醫(yī)學(xué)信息檢索將向著規(guī)范化、智能化的方向發(fā)展。

網(wǎng)絡(luò)與數(shù)據(jù)庫的應(yīng)用與發(fā)展,為醫(yī)學(xué)的快速發(fā)展提供了條件。在網(wǎng)絡(luò)時代,充分利用信息資源是實(shí)現(xiàn)醫(yī)學(xué)事業(yè)快速發(fā)展,提高醫(yī)療水平的關(guān)鍵因素之一。了解現(xiàn)存的信息獲得途徑,并掌握合適的醫(yī)學(xué)信息檢索方法,對醫(yī)務(wù)工作者具有重要意義。

參考文獻(xiàn):