卷積神經(jīng)網(wǎng)絡(luò)概述范文
時(shí)間:2024-03-29 18:16:54
導(dǎo)語(yǔ):如何才能寫(xiě)好一篇卷積神經(jīng)網(wǎng)絡(luò)概述,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
關(guān)鍵詞:深度學(xué)習(xí);機(jī)器學(xué)習(xí);卷積神經(jīng)網(wǎng)絡(luò)
1概述
深度學(xué)習(xí)(Deep Learning)是人工智能、圖像建模、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)、最優(yōu)化理論和信號(hào)處理等領(lǐng)域的交叉學(xué)科,主要構(gòu)建和模擬人腦進(jìn)行分析學(xué)習(xí),它屬于機(jī)器學(xué)習(xí)的新興領(lǐng)域。
2大數(shù)據(jù)與深度學(xué)習(xí)
目前,光學(xué)檢測(cè)、互聯(lián)網(wǎng)、用戶(hù)數(shù)據(jù)、互聯(lián)網(wǎng)、金融公司等許多領(lǐng)域都出現(xiàn)了海量數(shù)據(jù),采用BP算法對(duì)于訓(xùn)練神經(jīng)網(wǎng)絡(luò)出現(xiàn)了梯度越來(lái)越稀疏、收斂到局部最小值只能用有標(biāo)簽的數(shù)據(jù)來(lái)訓(xùn)練等缺點(diǎn)。Hinton于2006年提出了深度學(xué)習(xí)的概念,Lecun等人提出了卷積神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)利用空間關(guān)系減少參數(shù)數(shù)目以提高訓(xùn)練性能。
CPU和GPU計(jì)算能力大幅提升,為深度學(xué)習(xí)提供了硬件平臺(tái)和技術(shù)手段,在海量大數(shù)據(jù)處理技術(shù)上解決了早期神經(jīng)網(wǎng)絡(luò)訓(xùn)練不足出現(xiàn)的過(guò)擬合、泛化能力差等問(wèn)題。
大數(shù)據(jù)和深度學(xué)習(xí)必將互相支撐,推動(dòng)科技發(fā)展。
3深度學(xué)習(xí)模型
深度學(xué)習(xí)模型實(shí)際上是一個(gè)包含多個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò),目前主要有卷積神經(jīng)網(wǎng)絡(luò),深深度置信神經(jīng)網(wǎng)絡(luò),循環(huán)神經(jīng)網(wǎng)絡(luò)。
1)卷積神經(jīng)網(wǎng)絡(luò)
在機(jī)器學(xué)習(xí)領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)屬于前饋神經(jīng)網(wǎng)絡(luò)的一種,神經(jīng)元不再是全連接的模式,而是應(yīng)用了局部感受區(qū)域的策略。然而傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)使用神經(jīng)元間全連接的網(wǎng)絡(luò)結(jié)構(gòu)來(lái)處理圖像任務(wù),因此,出現(xiàn)了很多缺陷,導(dǎo)致模型⑹急劇增加,及其容易過(guò)擬合。
在卷積神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)中的神經(jīng)元只與前一層的部分神經(jīng)元連接,利用圖像數(shù)據(jù)的空間結(jié)構(gòu),鄰近像素間具有更強(qiáng)的相關(guān)性,單個(gè)神經(jīng)元僅對(duì)局部信息進(jìn)行響應(yīng),相鄰神經(jīng)元感受區(qū)域存在重疊,因此,綜合所有神經(jīng)元可以得到全局信息的感知。
另外,一個(gè)卷積層中的所有神經(jīng)元均由同一個(gè)卷積核對(duì)不同區(qū)域數(shù)據(jù)響應(yīng)而得到,即共享同一個(gè)卷積核,使得卷積層訓(xùn)練參數(shù)的數(shù)量急劇減少,提高了網(wǎng)絡(luò)的泛化能力。
一般在卷積層后面會(huì)進(jìn)行降采樣操作,對(duì)卷積層提取的特征進(jìn)行聚合統(tǒng)計(jì)。降采樣區(qū)域一般不存在重疊現(xiàn)象。降采樣簡(jiǎn)化了卷積層的輸出信息,進(jìn)一步減少了訓(xùn)練參數(shù)的數(shù)量,增強(qiáng)了網(wǎng)絡(luò)的泛化能力。
卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了局部特征的自動(dòng)提取,使得特征提取與模式分類(lèi)同步進(jìn)行,適用于處理高分辨率的圖像數(shù)據(jù)。目前,卷積神經(jīng)網(wǎng)絡(luò)在圖像分類(lèi)、自然語(yǔ)言處理等領(lǐng)域得到廣泛應(yīng)用。
2)深度置信網(wǎng)絡(luò)
深度置信網(wǎng)絡(luò)是一種生成模型,網(wǎng)絡(luò)中有若干隱藏層,同一隱藏層內(nèi)的神經(jīng)元沒(méi)有連接,隱藏層間的神經(jīng)元全連接。神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)“反向運(yùn)行”得到輸入數(shù)據(jù)。
深度置信網(wǎng)絡(luò)可以用做生成模型,通過(guò)前期的逐層無(wú)監(jiān)督學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)可以較好的對(duì)輸入數(shù)據(jù)進(jìn)行描述,然后把訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)看作深度神經(jīng)網(wǎng)絡(luò),最后得到分類(lèi)任務(wù)的深度神經(jīng)網(wǎng)絡(luò)。
深度置信網(wǎng)絡(luò)可以用于圖像識(shí)別、圖像生成等領(lǐng)域,深度置信網(wǎng)絡(luò)可以進(jìn)行無(wú)監(jiān)督或半監(jiān)督的學(xué)習(xí),利用無(wú)標(biāo)記數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,提高神經(jīng)網(wǎng)絡(luò)性能。但近幾年由于卷積神經(jīng)網(wǎng)絡(luò)的飛速發(fā)展,深度置信網(wǎng)絡(luò)已經(jīng)很少被提及。
3)循環(huán)神經(jīng)網(wǎng)絡(luò)
循環(huán)神經(jīng)網(wǎng)絡(luò)是一種專(zhuān)門(mén)用于處理時(shí)序數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),它與典型的前饋型神經(jīng)網(wǎng)絡(luò)最大區(qū)別在于網(wǎng)絡(luò)中存在環(huán)形結(jié)構(gòu),隱藏層內(nèi)部的神經(jīng)元是互相連接的,可以存儲(chǔ)網(wǎng)絡(luò)的內(nèi)部狀態(tài),其中包含序列輸入的歷史信息,實(shí)現(xiàn)了對(duì)時(shí)序動(dòng)態(tài)行為的描述。這里的時(shí)序并非僅僅指代時(shí)間概念上的順序,也可以理解為序列化數(shù)據(jù)間的相對(duì)位置。如語(yǔ)音中的發(fā)音順序,某個(gè)英語(yǔ)單詞的拼寫(xiě)順序等。序列化輸入的任務(wù)都可以用循環(huán)神經(jīng)網(wǎng)絡(luò)來(lái)處理。如語(yǔ)音、視頻、文本等。對(duì)于序列化數(shù)據(jù),每次處理時(shí)輸入為序列中的一個(gè)元素,比如單個(gè)字符、單詞、音節(jié),期望輸出為該輸入在序列數(shù)據(jù)中的后續(xù)元素。循環(huán)神經(jīng)網(wǎng)絡(luò)可以處理任意長(zhǎng)度的序列化數(shù)據(jù)。
循環(huán)神經(jīng)網(wǎng)絡(luò)可以用于機(jī)器翻譯、連寫(xiě)字識(shí)別、語(yǔ)音識(shí)別等。循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積網(wǎng)絡(luò)結(jié)合,將卷積神經(jīng)網(wǎng)絡(luò)用于檢測(cè)并識(shí)別圖像中的物體,循環(huán)神經(jīng)網(wǎng)絡(luò)用于識(shí)別出物體的名稱(chēng)為輸入,生成合理的語(yǔ)句,從而實(shí)現(xiàn)對(duì)圖像內(nèi)容的描述。
4深度學(xué)習(xí)應(yīng)用
1)語(yǔ)音識(shí)別
語(yǔ)音識(shí)別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面。其應(yīng)用領(lǐng)域主要有語(yǔ)音輸入系統(tǒng)、語(yǔ)音控制系統(tǒng)和智能對(duì)話(huà)查詢(xún)系統(tǒng),語(yǔ)音識(shí)別極大地推動(dòng)了人工智能的快速發(fā)展。1952年Davis等人研究了世界上第一個(gè)能識(shí)別10個(gè)英文數(shù)字發(fā)音的實(shí)驗(yàn)系統(tǒng)。大規(guī)模的語(yǔ)音識(shí)別研究是在20世紀(jì)70年代以后,在小詞匯量、孤立詞的識(shí)別方面取得了實(shí)質(zhì)性的進(jìn)展。2012年,微軟研究院使用深度神經(jīng)網(wǎng)絡(luò)應(yīng)用在語(yǔ)音識(shí)別上將識(shí)別錯(cuò)誤率降低了20%,取得了突破性的進(jìn)展。2015年11月17日,浪潮集團(tuán)聯(lián)合全球可編程芯片巨頭Altera,以及中國(guó)最大的智能語(yǔ)音技術(shù)提供商科大訊飛,共同了一套DNN語(yǔ)音識(shí)別方案。
2)圖像分析
圖像是深度學(xué)習(xí)最早嘗試的應(yīng)用領(lǐng)域。1989年,LeCun和他的同事們就發(fā)表了卷積神經(jīng)網(wǎng)絡(luò)的工作。2012年10月,Hinton和他的兩個(gè)學(xué)生用更深的CNN在ImageNet挑戰(zhàn)上獲得了第一名,使圖像識(shí)別向前躍進(jìn)了一大步。
自2012年以來(lái),深度學(xué)習(xí)應(yīng)用于圖像識(shí)別使得準(zhǔn)確率大大上升,避免了消耗人工特征抽取的時(shí)間,極大地提升了效率,目前逐漸成為主流的圖像識(shí)別與檢測(cè)方法。
篇2
關(guān)鍵詞:PCA算法;人臉識(shí)別;五級(jí)并行PCA模型;權(quán)重計(jì)算;均值濾波
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)19-0147-02
Research on Face Recognition System Based on Parallel PCA Algorithm
ZHAO Ya-peng
(College of Information Science and Engineering, Shandong University of Science and Technology, Qingdao 266590, China )
Abstract:In order to solve the problem of fast and accurate face recognition, a face recognition method based on parallel PCA algorithm is proposed. Using principal component analysis (PCA) method can reduce the dimension of features, easy to implement, training time is short, the design and implementation of a parallel algorithm for PCA, first of all according to the whole image to extract the 4 part of face images, then the whole image and 4 partial images at the same time by the same structure of the PCA model of learning, face feature vector extraction, the Euclidean distance for matching calculation of the test images and training images, finally through the test image with the five level parallel PCA model identification results are weighted decision, in order to achieve face recognition. Using the image data of the ORL face database , the simulation results in Matlab show that the method has a great degree of improvement in accuracy, the recognition speed is relatively fast, with a high degree of robustness.
Key words:PCA algorithm;Face recognition;Five level parallel PCA model;Weight calculation;Mean filter
1 概述
隨著智能終端設(shè)備(手機(jī)、Pad、門(mén)禁等)的不斷發(fā)展,身份識(shí)別已經(jīng)成為我們?nèi)粘I畹闹匾M成部分,身份驗(yàn)證技術(shù)被廣泛應(yīng)用于各個(gè)領(lǐng)域,特別是人們對(duì)于個(gè)人隱私信息的保護(hù),使得身份識(shí)別再次成為關(guān)注的焦點(diǎn)。人臉識(shí)別作為身份識(shí)別的重要手段之一,因其具有識(shí)別率高、采集性強(qiáng)、接受性高等特點(diǎn),在身份識(shí)別的各類(lèi)方法中具有獨(dú)特的優(yōu)勢(shì),成為了目前比較熱門(mén)的研究領(lǐng)域。
目前,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks)是圖像識(shí)別領(lǐng)域最重要的研究熱點(diǎn),而且在語(yǔ)音識(shí)別領(lǐng)域也取得了不錯(cuò)的效果,但是卷積神經(jīng)網(wǎng)絡(luò)的整個(gè)訓(xùn)練過(guò)程比較費(fèi)時(shí),而且實(shí)現(xiàn)相對(duì)復(fù)雜,而基于PCA算法的人臉識(shí)別技術(shù)因其自身存在的許多缺陷,一直沒(méi)有被廣泛應(yīng)用,但該方法實(shí)現(xiàn)簡(jiǎn)單、學(xué)習(xí)速度較快,因此,本文主要研究改進(jìn)的并行PCA算法,以彌補(bǔ)傳統(tǒng)PCA算法在人臉識(shí)別領(lǐng)域的不足。
本文提出的基于并行PCA算法的人臉識(shí)別技術(shù),首先對(duì)原始圖像進(jìn)行預(yù)處理,如灰度歸一化和中值濾波等操作,以消除圖像噪聲、光照等因素造成的影響,使得特征提取更加準(zhǔn)確可靠。然后,通過(guò)5級(jí)并行PCA模型獲取數(shù)據(jù)的不同特征矩陣,然后將訓(xùn)練圖像和測(cè)試圖像分別進(jìn)行子空間的投影,利用歐氏徑向基函數(shù)(Euclidean Radial Basis Function)進(jìn)行人臉的匹配,最后根據(jù)訓(xùn)練得到的權(quán)值向量進(jìn)行加權(quán)決策。本文通過(guò)ORL人臉數(shù)據(jù)庫(kù)的仿真實(shí)驗(yàn)證明,該算法的效果明顯好于PCA算法。
2 并行PCA算法
PCA(Principal Component Analysis)即主成分分析技術(shù),PCA是基于K-L變換的統(tǒng)計(jì)學(xué)分析方法,是多元分析中常用的方法,其基本思想是將高維數(shù)據(jù)投影到低維空間,主要過(guò)程在于特征值的計(jì)算和矩陣的降維。將PCA應(yīng)用于人臉識(shí)別時(shí),首先將圖像轉(zhuǎn)化成矩陣向量,然后進(jìn)行矩陣的奇異值分解(Singular Value Decomposition),將高維向量通過(guò)計(jì)算得到的特征向量矩陣投影到低維的向量空間,從而減少數(shù)據(jù)的計(jì)算量。
2.1 基于并行PCA算法的人臉識(shí)別流程
本文中提出的并行PCA算法,正是基于上述的PCA算法,通過(guò)建立5級(jí)的PCA算法模型同時(shí)進(jìn)行數(shù)據(jù)特征的學(xué)習(xí),使得最終的人臉識(shí)別準(zhǔn)確率得到進(jìn)一步的提高,具體的人臉識(shí)別流程如圖1所示。
2.2 并行PCA算法的實(shí)現(xiàn)的步驟
2.2.1 人臉圖像的預(yù)處理
首先,需要把ORL人臉數(shù)據(jù)數(shù)據(jù)庫(kù)的所有訓(xùn)練圖像大小進(jìn)行歸一化,并轉(zhuǎn)化為像素矩陣,矩陣大小記為,為矩陣的行數(shù),為矩陣的列數(shù)。之后利用均值濾波和灰度歸一化進(jìn)行圖像的去噪處理,以消除光線(xiàn)等問(wèn)題對(duì)圖像造成的影響,以方便后期的特征提取等操作。
2.2.2 人臉圖像的PCA降維
根據(jù)PCA的原理,可以將每一張圖像看成是一個(gè)高維的向量,所有的圖像可以看成是這個(gè)高維空間中的一點(diǎn),PCA要做的就是找出另外一個(gè)盡可能多的反應(yīng)圖像特征的低維空間。
假如樣本由n張大小為p*q的人臉圖像組成,那么每一張圖像可以保存為一列向量,向量維數(shù)是p*q,真?zhèn)€樣本可以看成是一個(gè)行數(shù)為n,列數(shù)為p*q的矩陣記為矩陣A。
根據(jù)上述過(guò)程,首先求出矩陣A的協(xié)方差矩陣,然后求出協(xié)方差矩陣的特征值,選取前m個(gè)最大的特征值,然后求出對(duì)應(yīng)的特征向量,組成一個(gè)特征矩陣。通常所說(shuō)的“特征臉”就是這些特征向量,而特種功能矩陣就是“特征臉”空間或者說(shuō)子空間。然后可以將每一張圖片投影到該子空間,得到了每一張圖像的投影矩陣(l*m)。
2.2.3 人臉圖像的識(shí)別
對(duì)于待識(shí)別的圖像,也可以看成是一列向量,投影到子空間得到一個(gè)投影矩陣,然后一一求出這個(gè)投影矩陣與樣本圖像投影矩陣最相似的。然而有可能該人臉不是人臉庫(kù)中的,所以最相似的人臉也不一定是同一個(gè)人臉,還需要設(shè)置一個(gè)閾值來(lái)判斷待識(shí)別人臉是否是人臉庫(kù)中的。
人臉識(shí)別部分正是基于上述的PCA算法,在本文所提出的并行PCA模型中,是由5級(jí)的PCA模型同時(shí)進(jìn)行人臉識(shí)別這一操作,最后根據(jù)訓(xùn)練得到的權(quán)值向量進(jìn)行決策,通過(guò)使用多個(gè)PCA模型,從而使得整個(gè)識(shí)別過(guò)程的準(zhǔn)確率得到進(jìn)一步的提升。
3 系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)
3.1 系統(tǒng)總體設(shè)計(jì)
本文中所提出的基于并行PCA算法的人臉識(shí)別系統(tǒng),包括人臉圖像采集模塊、圖像預(yù)處理模塊、識(shí)別模塊。人臉圖像采集模塊主要是采集訓(xùn)練圖像數(shù)據(jù)和測(cè)試圖像數(shù)據(jù),并由原始圖像提取出4幅與之對(duì)應(yīng)的部分圖像;圖像預(yù)處理模塊主要就是進(jìn)行圖像歸一化和圖像的去噪工作,圖像的歸一化包括大小歸一化和灰度歸一化,可以使用比較常見(jiàn)的直方圖均衡化等技術(shù),而圖像的去噪可以使用中值濾波技術(shù),以去除比較常見(jiàn)的高斯噪聲等;人臉識(shí)別模塊是基于5級(jí)相互獨(dú)立的PCA模型進(jìn)行特征值的學(xué)習(xí)和比對(duì),而且通過(guò)訓(xùn)練得到的權(quán)值向量進(jìn)行最終的是臉識(shí)別決策。整個(gè)系統(tǒng)的實(shí)現(xiàn)是基于Matlab進(jìn)行仿真實(shí)驗(yàn)的,實(shí)驗(yàn)數(shù)據(jù)來(lái)自劍橋大學(xué)AT&T實(shí)驗(yàn)室創(chuàng)建的ORL人臉數(shù)據(jù)庫(kù)。
3.2系統(tǒng)功能模塊實(shí)現(xiàn)
3.2.1人臉圖像采集實(shí)現(xiàn)
圖像采集模塊主要就是將存儲(chǔ)在本地的圖像文件通過(guò)Matlab的imread函數(shù)讀入矩陣中,以方便后期的PCA操作,其核心語(yǔ)句為Image{t}=imread([[filepath,F(xiàn)ilDir(ii).name],'\',ImDir{ii}(jj).name]);
使用上述語(yǔ)句即可讀入訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)文件。
3.2.2 圖像預(yù)處理模塊
該模塊的主要任務(wù)就是利用中值濾波和直方圖均衡化進(jìn)行圖像的去噪工作,以消除不同光照和圖像噪聲的影響,提高準(zhǔn)確率。其核心代碼為:
S1=zeros(1,256);
for i=1:256
for j=1:i
S1(i)=GP(j)+S1(i);
end
end
S2=round((S1*256)+0.5);
for i=1:256
GPeq(i)=sum(GP(find(S2==i)));
end
3.2.3 識(shí)別模塊
圖像經(jīng)過(guò)之前的預(yù)處理之后,需要將圖像矩陣轉(zhuǎn)化為列向量,一幅圖像就是一列向量,整個(gè)訓(xùn)練圖像構(gòu)成了整個(gè)特征空間矩陣,測(cè)試圖像也會(huì)轉(zhuǎn)化為一列向量,之后會(huì)利用矩陣之間的運(yùn)算進(jìn)行圖像的分析計(jì)算。識(shí)別模塊的工作就是根據(jù)測(cè)試圖像和之前所有的訓(xùn)練數(shù)據(jù)進(jìn)行對(duì)比,查找到與之最相似的圖像,實(shí)驗(yàn)的結(jié)果如圖2所示。
4 結(jié)論
PCA算法作為傳統(tǒng)的人臉識(shí)別算法,因其自身存在的許多缺陷而沒(méi)能發(fā)揮較好的作用,但是其自身具有其他算法所不具有的特點(diǎn),本文設(shè)計(jì)的并行PCA算法雖然是基于PCA算法,但是借鑒了卷積神經(jīng)網(wǎng)絡(luò)的多層結(jié)構(gòu),而且使用加權(quán)操作進(jìn)行最終人臉識(shí)別的決策?;贠RL人臉數(shù)據(jù)庫(kù)的測(cè)試結(jié)果表明,該并行PCA算法的準(zhǔn)確率和魯棒性均得到了進(jìn)一步的提升,與其他的單獨(dú)PCA算法具有十分明顯的優(yōu)勢(shì)。
參考文獻(xiàn):
[1] 張利芳. 基于PCA算法的人臉識(shí)別系統(tǒng)研究[D].太原:中北大學(xué),2015.
[2] 楊海燕,蔣新華. 基于并行卷積神經(jīng)網(wǎng)絡(luò)的人臉關(guān)鍵點(diǎn)定位方法研究[J]. 計(jì)算機(jī)應(yīng)用研究, 2015, 32(8): 2517-2519.
[3] 楊穎嫻. 基于PCA算法和小波變換的人臉識(shí)別技術(shù)[J]. 微電子與計(jì)算機(jī), 2011, 28(1): 92-94.
[4] 段寶彬,韓立新. 改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)及在碎紙拼接中的應(yīng)用[J]. 計(jì)算機(jī)工程與應(yīng)用, 2014, 50(9): 176-181.
篇3
關(guān)鍵詞:人工智能;科技情報(bào);自動(dòng)感知
中圖分類(lèi)號(hào):TP18文獻(xiàn)標(biāo)志碼:A文章編號(hào):2095-2945(2020)32-0057-02
Abstract:Fromtheperspectiveofartificialintelligence,peoplerequireasignificantimprovementintheaccuracyofscientificandtechnologicalinformationservices,sothatitsvaluecontinuestorise,bringingchallengesandopportunitiesforintelligencework.Bysummarizingthecontentsofartificialintelligenceandscientificandtechnologicalinformation,combinedwithartificialintelligencetechnology,thispaperstudiestheautomaticperceptionofscientificandtechnologicalinformationneedsconcerningthekeypoints,contentperceptionandotheraspects,highlightingthewisdom,intelligenceandefficiencyofscientificandtechnologicalinformationwork,andoptimizingtheautomaticperceptionscheme.
Keywords:artificialintelligence;scientificandtechnologicalinformation;automaticperception
前言
當(dāng)前科技情報(bào)服務(wù)對(duì)象不僅局限于特定的行業(yè)和領(lǐng)域,已經(jīng)逐漸滲透至某一技術(shù)和個(gè)人,情報(bào)機(jī)構(gòu)只有提升情報(bào)分析和反應(yīng)能力才可以滿(mǎn)足新需求。因此,機(jī)構(gòu)有必要加強(qiáng)對(duì)用戶(hù)需求的感知度,依托人工智能技術(shù)構(gòu)建科技情報(bào)的感知框架,提升感知工作的合理性和高效性,進(jìn)而挖掘科技情報(bào)感知領(lǐng)域的價(jià)值。
1人工智能及科技情報(bào)感知概述
1.1人工智能分析
人工智能又稱(chēng)AI,伴隨著計(jì)算速度、核心算法的優(yōu)化,該技術(shù)已經(jīng)在神經(jīng)網(wǎng)絡(luò)、自然語(yǔ)言、機(jī)器學(xué)習(xí)等方面趨于成熟。當(dāng)前人工智能技術(shù)可以定制個(gè)性化任務(wù),結(jié)合不同的環(huán)境響應(yīng)個(gè)體需求,制定解決方案[1]。因此,人工智能技術(shù)能夠快速處理海量數(shù)據(jù),若人類(lèi)智力水平已無(wú)法滿(mǎn)足嚴(yán)苛工作要求,可以借助人工智能技術(shù)處理復(fù)雜工作。同時(shí),科技情報(bào)感知模塊屬于綜合預(yù)測(cè)過(guò)程,因此有必要結(jié)合人工智能技術(shù)制定科技情報(bào)感知方案,實(shí)現(xiàn)情報(bào)工作向智慧化、個(gè)性化、精準(zhǔn)化方向發(fā)展。
1.2情報(bào)感知分析
科技情報(bào)感知主要是工作人員針對(duì)采集到的數(shù)據(jù)完成處理、分析,進(jìn)而滿(mǎn)足受眾對(duì)于情報(bào)的需求,并對(duì)今后其發(fā)展過(guò)程進(jìn)行預(yù)測(cè)。學(xué)者劉記曾指出,依托科技情報(bào)感知工作可以為實(shí)現(xiàn)國(guó)家治理體系和治理能力現(xiàn)代化提供支持,加快情報(bào)刻畫(huà)、情報(bào)感知以及情報(bào)響應(yīng)能力的建設(shè)進(jìn)程。其中,情境感知的研究具有一定復(fù)雜度,G.Chen通過(guò)調(diào)查情境信息、情境類(lèi)型、情境傳播等模型和系統(tǒng),分析情境感知的應(yīng)用程序,得出情境感知是領(lǐng)域普適學(xué)習(xí)的關(guān)鍵。例如,借助情境感知可以為用戶(hù)提供體溫、運(yùn)動(dòng)路徑、溫度等方面的服務(wù)。
因此,科技情報(bào)感知工作對(duì)于我國(guó)情報(bào)治理、預(yù)先感知等方面影響較大,結(jié)合人工智能技術(shù)創(chuàng)新科技情報(bào)感知模塊已是大勢(shì)所趨。當(dāng)前大數(shù)據(jù)時(shí)代科技情報(bào)已經(jīng)不僅停留于文獻(xiàn)領(lǐng)域,正逐漸向多種數(shù)據(jù)源模式發(fā)展,要求科技情報(bào)軟硬件不斷升級(jí)優(yōu)化,數(shù)據(jù)存儲(chǔ)和處理水平逐漸升級(jí),進(jìn)而滿(mǎn)足社會(huì)對(duì)情報(bào)數(shù)據(jù)的需求。
2人工智能視域下科技情報(bào)需求自動(dòng)感知研究
2.1融合關(guān)鍵點(diǎn)
(1)創(chuàng)新驅(qū)動(dòng)。當(dāng)前科技情報(bào)需求逐漸向科技創(chuàng)新領(lǐng)域發(fā)展,依托我國(guó)創(chuàng)新驅(qū)動(dòng)的發(fā)展戰(zhàn)略,基于科學(xué)技術(shù)完成升級(jí)和發(fā)展。將科學(xué)技術(shù)和科技情報(bào)相結(jié)合后,情報(bào)工作的創(chuàng)新性較強(qiáng),具有數(shù)字化和智慧化優(yōu)勢(shì),并突出情報(bào)工作的個(gè)性化和精準(zhǔn)性。因此,依托人工智能技術(shù)完成科技情報(bào)的自動(dòng)感知十分關(guān)鍵,是當(dāng)前科技發(fā)展的必經(jīng)之路。
(2)前瞻性定位。新時(shí)期資源的網(wǎng)絡(luò)化和數(shù)字化發(fā)展為科技情報(bào)研究工作提供大數(shù)據(jù)支持,可以在海量數(shù)據(jù)的收集、分析、處理方面發(fā)揮優(yōu)勢(shì)。傳統(tǒng)的數(shù)據(jù)研究方式很難在大量數(shù)據(jù)的基礎(chǔ)上提升情報(bào)研究質(zhì)量,同時(shí)會(huì)增加研究人員的任務(wù)量。且每位工作人員自身的專(zhuān)業(yè)知識(shí)、情報(bào)敏感度、知識(shí)狀態(tài)存在差異性,導(dǎo)致最終得出的情報(bào)結(jié)果不同甚至差異化較大。應(yīng)用人工智能技術(shù)完成科技情報(bào)的自動(dòng)感知十分重要,可以突出工作的準(zhǔn)確性、高效性和穩(wěn)定性。因此,將新興人工智能技術(shù)和傳統(tǒng)情報(bào)服務(wù)工作相融合是現(xiàn)代情報(bào)領(lǐng)域的關(guān)鍵,如自動(dòng)獲取和加工情報(bào)、高速處理文本信息、人工智能決策平臺(tái)、依托語(yǔ)義內(nèi)容的科研成果評(píng)價(jià)等[2]。
2.2內(nèi)容感知
(1)感知系統(tǒng)分析。大數(shù)據(jù)背景下,科技情報(bào)預(yù)測(cè)和傳播功能受到重視和應(yīng)用,屬于科技領(lǐng)域的研究熱點(diǎn),可以對(duì)競(jìng)爭(zhēng)、合作、研究方面進(jìn)行正確的價(jià)值判斷??萍记閳?bào)感知主要依托可靠、豐富的數(shù)據(jù),借助“互聯(lián)網(wǎng)+大數(shù)據(jù)”模式獲取信息,在多種資料中得到關(guān)鍵的信息和數(shù)據(jù),進(jìn)而完成科技情報(bào)的感知工作。同時(shí),數(shù)據(jù)源具有冗余度高、形式多樣、存儲(chǔ)量大的優(yōu)勢(shì),因此能夠落實(shí)科技情報(bào)感知工作,篩選數(shù)據(jù)源、除去冗余數(shù)據(jù)、分析剩余有效信息。借助數(shù)據(jù)集模式與知識(shí)儲(chǔ)備庫(kù)、感知數(shù)據(jù)庫(kù)一同為感知過(guò)程提供信息支持。內(nèi)容感知系統(tǒng)內(nèi)的數(shù)據(jù)源并非固定不變,且信息的更新速度較快、技術(shù)淘汰時(shí)間較短,因此內(nèi)容感知是實(shí)時(shí)更新、持續(xù)變化的數(shù)據(jù)系統(tǒng)?;谙嚓P(guān)輔助項(xiàng)目,幫助用戶(hù)了解工作內(nèi)容。例如,借助“科技情報(bào)產(chǎn)品報(bào)告”為感知系統(tǒng)研究和應(yīng)用提供支持,該報(bào)告可以幫助用戶(hù)了解系統(tǒng),提前評(píng)估系統(tǒng)實(shí)際能力,便于用戶(hù)針對(duì)性提出情報(bào)需求。
(2)系統(tǒng)實(shí)現(xiàn)模式。a.數(shù)據(jù)源存儲(chǔ)。若想發(fā)揮科技情報(bào)的自動(dòng)感知作用,系統(tǒng)內(nèi)需要具備大容量數(shù)據(jù)集合,進(jìn)而為感知產(chǎn)品提供分析支持。同時(shí),數(shù)據(jù)處理過(guò)程中對(duì)于信息查詢(xún)、存儲(chǔ)挑戰(zhàn)較大。因此,本課題結(jié)合Neo4j數(shù)據(jù)庫(kù)、互聯(lián)網(wǎng)技術(shù)提升數(shù)據(jù)處理和存儲(chǔ)效率,提高系統(tǒng)適應(yīng)水平,保證其良好的查詢(xún)效率。Neo4j數(shù)據(jù)庫(kù)主要?jiǎng)澐譃閮深?lèi)應(yīng)用模式:服務(wù)器模式、內(nèi)嵌模式。本課題利用內(nèi)嵌模式,借助Java-API,將Neo4j數(shù)據(jù)庫(kù)和圖模型相互整合。由于A(yíng)PI的特點(diǎn)是數(shù)據(jù)結(jié)構(gòu)靈活,因此可以通過(guò)直接編碼的模式和圖數(shù)據(jù)庫(kù)完成交互操作。b.數(shù)據(jù)源分類(lèi)。若想對(duì)數(shù)據(jù)源完成自動(dòng)分類(lèi),建議識(shí)別數(shù)據(jù)源的結(jié)構(gòu)功能。例如,利用機(jī)器學(xué)習(xí)、詞匯特征等方式劃分?jǐn)?shù)據(jù)源的功能及結(jié)構(gòu)。依托數(shù)據(jù)源要素、類(lèi)型詞匯特點(diǎn)、詞匯分布特征等方面,依托神經(jīng)網(wǎng)絡(luò)內(nèi)分類(lèi)器訓(xùn)練模式,圍繞領(lǐng)域技術(shù)、專(zhuān)題、情報(bào)報(bào)告、組織數(shù)據(jù)庫(kù)等方面對(duì)數(shù)據(jù)源進(jìn)行分類(lèi)[3]。c.構(gòu)建任務(wù)抽取模型。結(jié)合用戶(hù)需求抽取目標(biāo)任務(wù)可以充分發(fā)揮科技情報(bào)的自動(dòng)感知優(yōu)勢(shì),優(yōu)化RNN模塊。在研究階段利用Bi-LSTM-CRF、卷積網(wǎng)絡(luò)模型抽取數(shù)據(jù)源,并借助長(zhǎng)短時(shí)雙向記憶模型化解RNN梯度爆炸、消失情況。抽取模型內(nèi)的輸入數(shù)據(jù)是卷積,包含知識(shí)元素、句子、詞等特征向量,而輸出數(shù)據(jù)則依托(Conditionalrandomfield)條件隨機(jī)得到結(jié)果完成預(yù)測(cè)。此模型借助多元組的方式展示數(shù)據(jù)源抽取結(jié)果,圍繞數(shù)據(jù)源性質(zhì)、事項(xiàng)、主體、依據(jù)、對(duì)象等要素進(jìn)行連接。
2.3情境感知
(1)情境感知系統(tǒng)。情境感知系統(tǒng)內(nèi)部因素種類(lèi)較多,且科技情報(bào)感知階段需要依據(jù)情境完成,并對(duì)感知結(jié)果造成影響。因此,在開(kāi)展科技情報(bào)感知工作時(shí),建議對(duì)特定用戶(hù)完成重新評(píng)估。同時(shí),情境感知在情報(bào)感知工作中十分關(guān)鍵,若忽視結(jié)果會(huì)對(duì)外部情境產(chǎn)生較大影響,使預(yù)測(cè)工作喪失精準(zhǔn)度。因此,應(yīng)基于外部情境條件定位事物發(fā)展方向,得到精準(zhǔn)感知結(jié)果,發(fā)揮情報(bào)前瞻性?xún)?yōu)勢(shì)。其中在獲取情境數(shù)據(jù)時(shí)應(yīng)關(guān)注“小數(shù)據(jù)”,即初始結(jié)構(gòu)化數(shù)據(jù),此類(lèi)資源雖數(shù)量較小,但是內(nèi)部包含價(jià)值信息,可以獲取歷史情境信息。此外,問(wèn)題情境應(yīng)圍繞橫向和縱向兩個(gè)層面分析,橫向維度是梳理本層實(shí)際情況,針對(duì)性選擇研究方法和處理方式;縱向維度則依托時(shí)間節(jié)點(diǎn)理清情境信息。
(2)系統(tǒng)執(zhí)行方案。情境感知系統(tǒng)建設(shè)主要內(nèi)容是借助科技手段獲取某一情境內(nèi)的數(shù)據(jù)并完成融合。因此,情境感知技術(shù)實(shí)際上是借助人工智能中傳感器等技術(shù),依托計(jì)算機(jī)感知當(dāng)前情境,完成感知應(yīng)用、智能識(shí)別、決策支持,具有無(wú)干擾的優(yōu)勢(shì)。情境感知包含情境獲取、處理、應(yīng)用三個(gè)階段。其中,情境獲取主要依靠傳感器終端獲取設(shè)備關(guān)聯(lián)、用戶(hù)關(guān)聯(lián)、資源關(guān)聯(lián)、環(huán)境關(guān)聯(lián)情境,并將上述情境信息轉(zhuǎn)變?yōu)閿?shù)字信號(hào),利用嵌入系統(tǒng)完成判斷和處理;情境處理過(guò)程則借助建模的方式控制情境信息,構(gòu)建信息數(shù)據(jù)庫(kù)。整合情境感知信息并協(xié)調(diào)對(duì)應(yīng)的組合,控制資源分布并將其嵌入至感知數(shù)據(jù)庫(kù)內(nèi);服務(wù)應(yīng)用階段相當(dāng)于人工智能處理模塊,可以結(jié)合用戶(hù)需求提供合理服務(wù)。
2.4需求-反饋機(jī)制
(1)工作過(guò)程。需求-反饋機(jī)制實(shí)際上可以體現(xiàn)用戶(hù)和人工智能間的關(guān)聯(lián)性,屬于科技情報(bào)感知的關(guān)鍵環(huán)節(jié),包含自動(dòng)感知信息、數(shù)據(jù)、產(chǎn)品模塊。依托人工智能技術(shù),通過(guò)AI方式減輕工作人員任務(wù)量。其中,AI能夠智能化處理多領(lǐng)域工作,如醫(yī)療、教育、駕駛、金融、安防等。在科技情報(bào)感知領(lǐng)域引入人工智能技術(shù)可以準(zhǔn)確、高效、及時(shí)地開(kāi)展情報(bào)工作,提升工作效率、減少?zèng)Q策偶然性、加快數(shù)據(jù)分析處理速度。同時(shí),科技情報(bào)感知工作的主體是用戶(hù),首先需要將其對(duì)產(chǎn)品的需求發(fā)送至AI處,其次借助人工智能模塊分析、整合內(nèi)外感知數(shù)據(jù)庫(kù)信息,最后向用戶(hù)反饋情報(bào)產(chǎn)品和相關(guān)結(jié)果。
(2)情報(bào)感知產(chǎn)品。情報(bào)感知產(chǎn)品主要結(jié)合用戶(hù)產(chǎn)品需求,依據(jù)感知數(shù)據(jù)庫(kù)內(nèi)的條件因素預(yù)測(cè)今后用戶(hù)對(duì)于情報(bào)產(chǎn)品的需求,進(jìn)而在后續(xù)工作中有針對(duì)性地向用戶(hù)推送產(chǎn)品信息,為科技情報(bào)工作的可持續(xù)發(fā)展提供支持。因此,人工智能和科技情報(bào)感知工作相結(jié)合可以充分發(fā)揮自動(dòng)感知優(yōu)勢(shì),降低對(duì)工作人員決策的依賴(lài)性。專(zhuān)業(yè)人員依據(jù)多種數(shù)據(jù)源進(jìn)行分析與評(píng)估,最終得出精準(zhǔn)的感知結(jié)果。同時(shí),人工智能技術(shù)的應(yīng)用可以自動(dòng)形成情報(bào)感知產(chǎn)品,并向用戶(hù)推送反饋數(shù)據(jù),由主動(dòng)感知向自動(dòng)感知發(fā)展,契合新時(shí)期情報(bào)3.0的發(fā)展趨勢(shì),加快國(guó)家科技決策和科技創(chuàng)新發(fā)展進(jìn)程。