數(shù)據(jù)挖掘論文范文10篇

時間:2024-01-04 13:50:55

導(dǎo)語:這里是公務(wù)員之家根據(jù)多年的文秘經(jīng)驗,為你推薦的十篇數(shù)據(jù)挖掘論文范文,還可以咨詢客服老師獲取更多原創(chuàng)文章,歡迎參考。

數(shù)據(jù)挖掘論文

科研數(shù)據(jù)挖掘技術(shù)論文

一、數(shù)據(jù)挖掘相關(guān)概念

數(shù)據(jù)挖掘技術(shù)是近些年發(fā)展起來的一門新興學(xué)科,它涉及到數(shù)據(jù)庫和人工智能等多個領(lǐng)域。隨著計算機(jī)技術(shù)的普及數(shù)據(jù)庫產(chǎn)生大量數(shù)據(jù),能夠從這些大量數(shù)據(jù)中抽取出有價值信息的技術(shù)稱之為數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘方法有統(tǒng)計學(xué)方法、關(guān)聯(lián)規(guī)則挖掘、決策樹方法、聚類方法等八種方法,關(guān)聯(lián)規(guī)則是其中最常用的研究方法。關(guān)聯(lián)規(guī)則算法是1993年由R.Atal,Inipusqi,Sqtm三人提出的Apriori算法,是指從海量數(shù)據(jù)中挖掘出有價值的能夠揭示實體和數(shù)據(jù)項間某些隱藏的聯(lián)系的有關(guān)知識,其中描述關(guān)聯(lián)規(guī)則的兩個重要概念分別是Suppor(t支持度)和Confi-dence(可信度)。只有當(dāng)Support和Confidence兩者都較高的關(guān)聯(lián)規(guī)則才是有效的、需要進(jìn)一步進(jìn)行分析和應(yīng)用的規(guī)則。

二、使用Weka進(jìn)行關(guān)聯(lián)挖掘

Weka的全名是懷卡托智能分析環(huán)境(WaikatoEnviron-mentforKnowledgeAnalysis),是一款免費(fèi)的、非商業(yè)化的、基于JAVA環(huán)境下開源的機(jī)器學(xué)習(xí)以及數(shù)據(jù)挖掘軟件[2]。它包含了許多數(shù)據(jù)挖掘的算法,是目前最完備的數(shù)據(jù)挖掘軟件之一。Weka軟件提供了Explorer、Experimenter、Knowledge-Flow、SimpleCLI四種模塊[2]。其中Explorer是用來探索數(shù)據(jù)環(huán)境的,Experimenter是對各種實驗計劃進(jìn)行數(shù)據(jù)測試,KnowledgeFlow和Explorer類似,但該模塊通過其特殊的接口可以讓使用者通過拖動的形式去創(chuàng)建實驗方案,Simple-CLI為簡單的命令行界面。以下數(shù)據(jù)挖掘任務(wù)主要用Ex-plorer模塊來進(jìn)行。

(一)數(shù)據(jù)預(yù)處理

數(shù)據(jù)挖掘所需要的所有數(shù)據(jù)可以由系統(tǒng)排序模塊生成并進(jìn)行下載。這里我們下載近兩年的教師科研信息。為了使論文總分、學(xué)術(shù)著作總分、科研獲獎總分、科研立項總分、科研總得分更有利于數(shù)據(jù)挖掘計算,在這里我們將以上得分分別確定分類屬性值。

查看全文

Web數(shù)據(jù)挖掘論文

1Web數(shù)據(jù)挖掘面臨的問題

目前面向Web的數(shù)據(jù)挖掘面臨的問題,主要有兩個方面:

1.1數(shù)據(jù)庫環(huán)境的異構(gòu)型

Web上的每個站點(diǎn)就是一個數(shù)據(jù)源,數(shù)據(jù)源之間是異構(gòu)的,外加上各個站點(diǎn)的信息和組織的不同,Web網(wǎng)站就構(gòu)成了一個巨大的異構(gòu)數(shù)據(jù)庫環(huán)境。要對這些數(shù)據(jù)進(jìn)行挖掘,首先,要解決各個站點(diǎn)之間的異構(gòu)數(shù)據(jù)集成,提供用戶統(tǒng)一界面,從復(fù)雜的數(shù)據(jù)源中取得所需的有用的信息知識。其次,有關(guān)Web上的數(shù)據(jù)查詢。

1.2數(shù)據(jù)結(jié)構(gòu)的半結(jié)構(gòu)化

Web上的數(shù)據(jù)比較復(fù)雜,各個站點(diǎn)的數(shù)據(jù)都獨(dú)立設(shè)計,具有動態(tài)可變性。雖然Web上的數(shù)據(jù)形成半結(jié)構(gòu)化數(shù)據(jù)。這些問題是進(jìn)行Web數(shù)據(jù)挖掘所面臨的最大困難。

查看全文

油井?dāng)?shù)據(jù)挖掘論文

1系統(tǒng)結(jié)構(gòu)組成

系統(tǒng)采用C/S+B/S結(jié)構(gòu),主要由前端數(shù)據(jù)采集設(shè)備(位移及載荷傳感器)、站點(diǎn)客戶端、數(shù)據(jù)庫及Web服務(wù)器等組成。各部分采取分布式協(xié)同處理運(yùn)行方式,站點(diǎn)客戶端利用前端采集的數(shù)據(jù)獨(dú)立分析計算,分析完成后上傳至數(shù)據(jù)庫服務(wù)器,并通過網(wǎng)頁服務(wù)器對外。

2系統(tǒng)數(shù)據(jù)

2.1系統(tǒng)數(shù)據(jù)結(jié)構(gòu)系統(tǒng)采用MicrosoftSQLServer,創(chuàng)建了WPGUI與WPCHQ數(shù)據(jù)庫來管理3萬余口油井?dāng)?shù)據(jù)采集、處理及存儲等,建設(shè)數(shù)據(jù)表65張(見主要數(shù)據(jù)表的關(guān)系圖2),主要包括生產(chǎn)井的完井?dāng)?shù)據(jù)、靜態(tài)數(shù)據(jù)、動態(tài)數(shù)據(jù)、采集數(shù)據(jù)、原油物性數(shù)據(jù)、機(jī)桿管泵等技術(shù)數(shù)據(jù),同時系統(tǒng)保存了油井近兩年功圖電參數(shù)據(jù)(每天每口井到少100張),以及根據(jù)這些數(shù)據(jù)分析計算出來的結(jié)果和匯總生成的數(shù)據(jù)。

3數(shù)據(jù)挖掘應(yīng)用

數(shù)據(jù)挖掘是從大量數(shù)據(jù)集中發(fā)現(xiàn)可行信息的過程,是統(tǒng)計分析技術(shù)、數(shù)據(jù)庫技術(shù)及人工智能技術(shù)的綜合。面對油井工況實時分析及功圖計產(chǎn)系統(tǒng)大量的油井生產(chǎn)完備數(shù)據(jù),長慶油田充分利用數(shù)據(jù)挖掘技術(shù),對數(shù)據(jù)進(jìn)一步清理、集成、轉(zhuǎn)換、挖掘應(yīng)用,深化功圖系統(tǒng)數(shù)據(jù)分析,先后開展了動液面計算,系統(tǒng)效率在線實時監(jiān)測、區(qū)塊動態(tài)分析研究等,并應(yīng)用于油田現(xiàn)場,取得了較好的效果,既節(jié)約了生產(chǎn)成本,又方便了現(xiàn)場管理應(yīng)用,進(jìn)一步提升系統(tǒng)在長慶油田數(shù)字化前端的核心地位。

查看全文

專利數(shù)據(jù)挖掘論文

一、專利數(shù)據(jù)挖掘

數(shù)據(jù)挖掘技術(shù)是延伸和擴(kuò)展了傳統(tǒng)分析方法,可以發(fā)現(xiàn)傳統(tǒng)分析方法不能發(fā)現(xiàn)的內(nèi)容和規(guī)律,并且它將人們從單調(diào)、枯燥的閱讀專利文獻(xiàn)的工作中解放出來,使用計算機(jī)代替了人類勞動,這樣不僅提高了效率,而且提升了準(zhǔn)確度。因此,數(shù)據(jù)挖掘作為一個專利分析的強(qiáng)有力工具被引入到專利分析中來,并且得到快速的發(fā)展應(yīng)用。專利數(shù)據(jù)挖掘流程應(yīng)考慮的問題:一是用數(shù)據(jù)挖掘解決什么樣的問題;二是為進(jìn)行數(shù)據(jù)挖掘所做的數(shù)據(jù)準(zhǔn)備;三是數(shù)據(jù)挖掘的各種分析算法。故專利數(shù)據(jù)挖掘的一般過程通常按照以下步驟來完成:領(lǐng)會數(shù)據(jù)挖掘的目的,獲取分析所用的數(shù)據(jù)集合,探索、清理和預(yù)處理數(shù)據(jù),選擇要使用的數(shù)據(jù)挖掘技術(shù),使用算法解決問題,解釋算法的結(jié)果。而其一般流程可簡化為三個階段:數(shù)據(jù)準(zhǔn)備→數(shù)據(jù)挖掘→結(jié)果解釋和評價。本文采用簡化的流程進(jìn)行實證分析。

二、石家莊地區(qū)制藥企業(yè)專利數(shù)據(jù)挖掘

本文對石家莊地區(qū)制藥企業(yè)的專利數(shù)據(jù)進(jìn)行挖掘分析,挖掘?qū)ο笫侨A北制藥集團(tuán)公司、石家莊制藥集團(tuán)有限公司、石家莊神威藥業(yè)股份有限公司、石家莊四藥股份、河北以嶺藥業(yè)股份有限公司、石家莊市華曙制藥集團(tuán)、河北醫(yī)科大學(xué)制藥廠、河北圣雪大成制藥有限責(zé)任公司等地址在石家莊且具有一定代表性的藥企,希望通過這些藥企數(shù)據(jù)能夠找到石家莊地區(qū)制藥領(lǐng)域的核心組成,并能為藥企更好地發(fā)展提供有力的信息支持。IPC號是目前權(quán)威的專利技術(shù)主題的標(biāo)識編碼之一,基本包含了各行各業(yè)的專利信息,是一個龐大的專利信息體系。目前國內(nèi)外很多分析方法及技術(shù)大部分是基于專利的IPC分類號來分析專利技術(shù)主題的,此分析方法有一定的參考價值和科學(xué)性,而且對于具有大量專利信息的分析具有很好的總結(jié)概括效果。本文以專利全部IPC號為分析對象,并且構(gòu)建IPC號之間的關(guān)聯(lián)規(guī)則,在最大程度上揭示隱含的專利技術(shù)關(guān)聯(lián)性,從而為石家莊地區(qū)制藥企業(yè)專利技術(shù)的發(fā)展提供參考。

1.數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)來源的準(zhǔn)確與否是數(shù)據(jù)分析與挖掘的基礎(chǔ),是數(shù)據(jù)分析與挖掘的根本。本文所使用的石家莊地區(qū)制藥領(lǐng)域?qū)@麛?shù)據(jù)由萬方數(shù)據(jù)公司提供,以制藥企業(yè)地址為石家莊為檢索條件,搜索出了包括從1985—2014年間石家莊地區(qū)制藥領(lǐng)域?qū)@?44條,分別分布在A、B、C、D、E、F、G、H八個大部。對專利數(shù)據(jù)庫中的644條專利進(jìn)行篩選,根據(jù)“分類號”字段限制,它涉及專利信息的分類,有些IPC所涉及的范圍與石家莊地區(qū)制藥領(lǐng)域沒有聯(lián)系或聯(lián)系很小,不宜保留。根據(jù)“申請人(專利權(quán)人)”字段的限制,剔除與石家莊地區(qū)制藥不相關(guān)或制藥企業(yè)地址不在石家莊地區(qū)的專利。最后篩選出590條最符合該領(lǐng)域特點(diǎn)的專利。由于IPC號在幾乎所有現(xiàn)存數(shù)據(jù)庫中均是以一個字段存儲一個專利的所有IPC分類號的,形如:A61K38/26、A61K9/08、A61K47/12、A61P3/10,且每個專利一般都有好幾個分類號,而每個企業(yè)又研究大量的專利,所以在進(jìn)行專利分析之前,需要對專利IPC號進(jìn)行數(shù)據(jù)整理。由于過于細(xì)致的IPC分類號并不利于專利主題的分析與揭示,所以本文中采用專利小類分析,就是取IPC號的前4位。并將申請人與其對應(yīng)的多條IPC號進(jìn)行拆分,拆分后的數(shù)據(jù)項有773條,即顯示每個申請人對應(yīng)的一條IPC分類號。

2.數(shù)據(jù)挖掘。本文數(shù)據(jù)挖掘過程將采用Excel和SQLsever2005軟件,首先對所得到的數(shù)據(jù)導(dǎo)入SQLserver2005進(jìn)行挖掘,利用SQLserver2005可以直接進(jìn)行IPC號的關(guān)聯(lián)規(guī)則挖掘,然后對專利信息進(jìn)行分析。

查看全文

煙草數(shù)據(jù)挖掘論文

1研究背景

目前現(xiàn)有的針對煙草營銷策略的研究,多采用數(shù)據(jù)挖掘的思想,基于數(shù)據(jù)挖掘的營銷策略是對終端客戶進(jìn)行分類,根據(jù)用戶的銷量和誠信記錄把用戶分為多個等級,但這種分級策略只能反應(yīng)用戶的銷量信息,把這個分類作為營銷策略依據(jù)太單薄,只能起一定的輔助作用。更深入地研究是根據(jù)客戶的資料和歷史訂單數(shù)據(jù)對現(xiàn)有商戶進(jìn)行聚類,獲取到自主的商戶分類,但盲目的聚類會導(dǎo)致商戶的分類沒有實際意義,或獲取的結(jié)果是無助于營銷目的的。

2技術(shù)關(guān)鍵

本系統(tǒng)采用基于營銷目的的商戶聚類,技術(shù)關(guān)鍵包括三部分內(nèi)容:數(shù)據(jù)預(yù)處理中的特征選擇、基于限制目標(biāo)的商戶精確聚類和基于聚類結(jié)果的多層關(guān)聯(lián)規(guī)則算法的研究。

2.1特征選擇

假定獲取的數(shù)據(jù)的維數(shù)為n,通常情況下n是很大的一個數(shù),為簡化模型,也為了防止模型陷入過擬合(維數(shù)災(zāi)難),需要進(jìn)行降維處理,即僅把對項目改造判定起關(guān)鍵作用的因素挑選出來。本系統(tǒng)采用PCA算法來進(jìn)行降維處理,過程如下:

查看全文

關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘論文

1相關(guān)技術(shù)

關(guān)聯(lián)規(guī)則最初是針對購物籃分析問題提出的,目的是發(fā)現(xiàn)事務(wù)數(shù)據(jù)庫(TransactionDatabase)中不同商品之間的聯(lián)系。關(guān)聯(lián)規(guī)則是形如A=》B的蘊(yùn)涵式,其中A稱為該關(guān)聯(lián)規(guī)則的前項,B稱為該關(guān)聯(lián)規(guī)則的后項。事務(wù),是一個明確定義的商業(yè)行為,如顧客在商店購物就是一次典型的事務(wù)。由用戶設(shè)定的支持度和置信度的門檻值,當(dāng)sup-port(A=>B)、confidence(A=>B)分別大于等于各自的門檻值時,認(rèn)為A=>B是有趣的,此兩值稱為最小支持度(minsupport)和最小置信度(minconfidence)。同時滿足minsupport和minconfidence的這種關(guān)聯(lián)規(guī)則就叫做強(qiáng)的關(guān)聯(lián)規(guī)則。設(shè)任務(wù)相關(guān)的數(shù)據(jù)D是數(shù)據(jù)庫事物的集合,當(dāng)項集的支持計數(shù)≥D中事務(wù)總數(shù)|D|與minsup-port的乘積時,就叫做頻繁項集,當(dāng)項集的支持計數(shù)可能≥D中事務(wù)總數(shù)|D|與minsupport的乘積時,就叫做侯選項集。所有侯選項集K-項集的集合記作Ck,所有頻繁項集K-項集的集合常記作Lk,很明顯Lk奐Ck。如果僅依賴最小支持度和最小置信度這兩個參數(shù)的限制,所挖掘出的強(qiáng)關(guān)聯(lián)規(guī)則不一定是用戶感興趣的,因此,用戶可以根據(jù)實際應(yīng)用的需求,再結(jié)合自身的領(lǐng)域知識,通過選擇與實際分析任務(wù)有關(guān)的數(shù)據(jù)集,設(shè)置不同的參數(shù),限定前項和后項的個數(shù),選擇前項和后項包含的屬性等操作,對關(guān)聯(lián)規(guī)則的挖掘進(jìn)行約束。

2模糊集理論的引入

在討論實際問題的時候,需要判定模糊概念涵義,如判斷某個數(shù)據(jù)在模糊集的定義和歸屬,這時就需要普通集合與模糊集合可依某種法則相互轉(zhuǎn)換。模糊理論中的截集是模糊集合和普通集合之間相互轉(zhuǎn)換的一座橋梁。

3基于事務(wù)間數(shù)值型關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法

假設(shè)有一就業(yè)數(shù)據(jù)庫,先通過數(shù)據(jù)整理,將原始數(shù)據(jù)記錄值區(qū)間[0,10]偏置10個單位。由此就得到了經(jīng)過偏置后的數(shù)據(jù)庫記錄。再依滑動窗口方法,設(shè)maxspan=1(該值可以依實際情況的需要來定),就可將偏置后的數(shù)據(jù)庫數(shù)據(jù)整理轉(zhuǎn)化為擴(kuò)展事務(wù)數(shù)據(jù)庫。再把擴(kuò)展事務(wù)數(shù)據(jù)庫記錄通過隸屬度函數(shù)轉(zhuǎn)化為對應(yīng)的隸屬度。

查看全文

數(shù)據(jù)挖掘技術(shù)分析論文

[摘要]本文主要介紹了數(shù)據(jù)挖掘的基本概念,以及數(shù)據(jù)挖掘的方法。

[關(guān)鍵詞]數(shù)據(jù)挖掘數(shù)據(jù)挖掘方法

隨著信息技術(shù)迅速發(fā)展,數(shù)據(jù)庫的規(guī)模不斷擴(kuò)大,產(chǎn)生了大量的數(shù)據(jù)。但大量的數(shù)據(jù)往往無法辨別隱藏在其中的能對決策提供支持的信息,而傳統(tǒng)的查詢、報表工具無法滿足挖掘這些信息的需求。因此,需要一種新的數(shù)據(jù)分析技術(shù)處理大量數(shù)據(jù),并從中抽取有價值的潛在知識,數(shù)據(jù)挖掘(DataMining)技術(shù)由此應(yīng)運(yùn)而生。

一、數(shù)據(jù)挖掘的定義

數(shù)據(jù)挖掘是指從數(shù)據(jù)集合中自動抽取隱藏在數(shù)據(jù)中的那些有用信息的非平凡過程,這些信息的表現(xiàn)形式為:規(guī)則、概念、規(guī)律及模式等。它可幫助決策者分析歷史數(shù)據(jù)及當(dāng)前數(shù)據(jù),并從中發(fā)現(xiàn)隱藏的關(guān)系和模式,進(jìn)而預(yù)測未來可能發(fā)生的行為。數(shù)據(jù)挖掘的過程也叫知識發(fā)現(xiàn)的過程。

二、數(shù)據(jù)挖掘的方法

查看全文

垃圾短信數(shù)據(jù)挖掘論文

1垃圾短信治理面臨的調(diào)整

目前的垃圾短信過濾的方法主要有黑名單和白名單監(jiān)控技術(shù),但是短信中心對黑白名單處理數(shù)量有上限要求;基于關(guān)鍵字的過濾技術(shù),但是這種技術(shù)不能靈活識別和更新關(guān)鍵字;基于內(nèi)容的過濾技術(shù),可分為基于規(guī)則的過濾和基于概率統(tǒng)計的過濾;基于數(shù)據(jù)挖掘方法的垃圾短信用戶識別,目前基本上都使用IBMSPSSModeler平臺的決策樹和邏輯回歸經(jīng)典算法識別垃圾短信用戶,由于選取的建模數(shù)據(jù)不全面以及算法本身各自存在不足使得建模效果受到影響。為建立白名單和科學(xué)封堵模型相結(jié)合的垃圾短信治理模式,實現(xiàn)精細(xì)化、行為級、高效性的垃圾短信治理,本方案提出了基于客戶綜合特征分析的垃圾短信治理技術(shù)方案:基于隨機(jī)森林分類的垃圾短信用戶預(yù)測模型。通過客戶入網(wǎng)屬性,客戶通信行為信息、客戶賬單信息等多個維度構(gòu)建模型,對垃圾短信號碼進(jìn)行識別和治理。相比傳統(tǒng)基于短信內(nèi)容識別、發(fā)送量控制的事中控制,本系統(tǒng)能夠進(jìn)行垃圾短信發(fā)送行為預(yù)測,配合垃圾短信攔截系統(tǒng)將垃圾短信在未形成大規(guī)模發(fā)送前攔截。實驗結(jié)果證明該模型能夠有效的識別垃圾短信號碼,對監(jiān)控系統(tǒng)攔截垃圾短信起到很好的輔助作用。

2大數(shù)據(jù)挖掘的原理與優(yōu)勢

大數(shù)據(jù)是指數(shù)據(jù)量很大(一般是TB到PB數(shù)量級)的巨量資料,無法通過主流軟件工具,在合理時間內(nèi)完成數(shù)據(jù)處理并獲取有價值的信息。數(shù)據(jù)大多以非結(jié)構(gòu)化或者半結(jié)構(gòu)化數(shù)據(jù)為主,大數(shù)據(jù)具有4V特點(diǎn):Volume、Velocity、Variety、Veracity。大數(shù)據(jù)處理的一般思路是數(shù)據(jù)壓縮、數(shù)據(jù)抽樣、數(shù)據(jù)挖掘等。數(shù)據(jù)挖掘是一種新的信息處理技術(shù),其主要特點(diǎn)是對商業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其它模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。利用數(shù)據(jù)挖掘進(jìn)行數(shù)據(jù)分析常用的方法主要有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、推薦系統(tǒng)等,它們分別從不同的角度對數(shù)據(jù)進(jìn)行挖掘。大數(shù)據(jù)挖據(jù)的數(shù)據(jù)源和處理方式對比。

3數(shù)據(jù)挖據(jù)流程和模型選取

3.1數(shù)據(jù)挖掘的主要流程

查看全文

針灸治療數(shù)據(jù)挖掘論文

1數(shù)據(jù)挖掘技術(shù)在針灸研究中的應(yīng)用

1.1經(jīng)穴效應(yīng)特異性規(guī)律研究

主要采用關(guān)聯(lián)規(guī)則與頻次分析相結(jié)合的數(shù)據(jù)挖掘方法,關(guān)聯(lián)規(guī)則旨在提示處方中存在的兩個或兩個以上腧穴之間的配伍形式,頻次分析能夠提供針灸治療某一疾病選用的腧穴及其頻繁程度。羅玲等在全面采集古代針灸治療中風(fēng)文獻(xiàn)基礎(chǔ)上,重點(diǎn)進(jìn)行了選穴的經(jīng)絡(luò)癥狀關(guān)聯(lián)分析,發(fā)現(xiàn)針刺治療中風(fēng)半身不遂使用腧穴頻次最多的為曲池、肩等手陽明經(jīng)穴;肩、曲池、足三里、百會、風(fēng)池配伍是最常用處方;多選用足少陽經(jīng)和手足陽明經(jīng)穴位。針刺治療中風(fēng)不省人事使用腧穴頻次最多的為督脈百會穴、心包經(jīng)中沖穴;風(fēng)池、百會、曲池配伍或大椎、百會、風(fēng)池配伍是最常用處方;經(jīng)脈多選用督脈和足少陽、手陽明等陽經(jīng)穴位。以上表明針灸治療中風(fēng)遵循了辨證循經(jīng)取穴的處方規(guī)律。何冬鳳等在全面采集現(xiàn)代針灸治療心絞痛臨床文獻(xiàn)基礎(chǔ)上,重點(diǎn)進(jìn)行了選穴的經(jīng)絡(luò)部位關(guān)聯(lián)分析。結(jié)果發(fā)現(xiàn),心絞痛選穴分布在心包經(jīng)、膀胱經(jīng)、任脈、心經(jīng)最多;選穴主要分布在上肢部、背部、胸部,上肢部用穴中近90%分布于心包經(jīng)和心經(jīng),背部用穴近95%分布于膀胱經(jīng),胸部用穴全分布于任脈和心經(jīng)。以上表明針灸治療心絞痛遵循了辨位循經(jīng)取穴的處方規(guī)律。數(shù)據(jù)挖掘結(jié)果證實了古代、現(xiàn)代取穴規(guī)律和特點(diǎn)與針灸臨床理論的一般規(guī)律和特點(diǎn)是基本相符的。經(jīng)絡(luò)辨證提示了經(jīng)穴效應(yīng)的循經(jīng)性,特定穴的選用提示了經(jīng)氣會聚狀態(tài)是腧穴發(fā)揮效應(yīng)特異性的關(guān)鍵。

1.2腧穴運(yùn)用規(guī)律的研究

1)神經(jīng)系統(tǒng)疾?。黑w凌等收錄了從先秦至清末的偏頭痛針灸專著,采用多層關(guān)聯(lián)規(guī)則挖掘算法,計算腧穴項集的支持度和置信度,發(fā)現(xiàn)手足少陽經(jīng)脈的穴位絲竹空、風(fēng)池、率谷、頷厭、頭臨泣出現(xiàn)頻次最高,偏頭痛處方配伍中以合谷一風(fēng)池出現(xiàn)的頻次最高,少陽經(jīng)的交會穴選用最多。楊潔等發(fā)現(xiàn)針灸治療貝爾面癱中,手足陽明經(jīng)穴選用最多,重視局部穴位,配合遠(yuǎn)端選穴,地倉穴為使用頻次最多經(jīng)穴,交會穴、五輸穴、下合穴等特定穴運(yùn)用廣泛。吳糧葶等挖掘針灸治療中風(fēng)后遺癥的現(xiàn)代文獻(xiàn),表明針灸治療中風(fēng)后遺癥選穴以循經(jīng)為基礎(chǔ),首選陽經(jīng)腧穴,分布主要在四肢,陽明經(jīng)與少陽經(jīng)的配伍關(guān)系最為常用,特定穴為選穴的主體,特別重視交會穴及肘膝關(guān)節(jié)以下的特定穴。李旗等挖掘出針刺治療格林巴利綜合征所選腧穴以足三里、合谷、曲池、陽陵泉、外關(guān)、三陰交使用頻率最高,經(jīng)絡(luò)則以手足陽明經(jīng)最為常用。CongMen等以不同針刺手法刺激小鼠足三里,構(gòu)筑神經(jīng)元混沌放電的復(fù)雜網(wǎng)絡(luò)來刻畫神經(jīng)元放電時間序列的時變特性。

2)消化系統(tǒng)疾?。喝斡裉m等通過多維、多層的關(guān)聯(lián)規(guī)則分析針刺治療功能性消化不良的古文獻(xiàn),發(fā)現(xiàn)足三里、中脘、脾俞、胃俞、內(nèi)關(guān)是治療FD最常用的主要腧穴,足三里與中脘相配是最主要穴位組配方式;取穴以循經(jīng)為基礎(chǔ),主要集中在任脈、膀胱經(jīng)、脾胃經(jīng)上;所選腧穴以特定穴為主體,遵循局部與遠(yuǎn)端取穴相結(jié)合原則。張勇等以古文獻(xiàn)中治療鼓脹的經(jīng)穴為原始數(shù)據(jù),運(yùn)用頻數(shù)統(tǒng)計及關(guān)聯(lián)規(guī)則算法,統(tǒng)計出古代治療鼓脹最常用經(jīng)穴為足三里、水分、氣海等,通過2次priori關(guān)聯(lián)結(jié)果,最終確認(rèn)組穴1(復(fù)溜,中風(fēng))和組穴2(復(fù)溜,脾俞)在臨床應(yīng)用中具有強(qiáng)關(guān)聯(lián)性。鄭華斌等發(fā)現(xiàn)在治療腸易激綜合征中,特定穴的使用廣泛,其中以足三里為最,其次為天樞、上巨虛、中脘等,臟腑辨證取穴為針刺治療腸易激綜合征的重要原則,以足陽明胃經(jīng)的足三里和天樞為主。

查看全文

移動通信數(shù)據(jù)挖掘論文

摘要:我國移動網(wǎng)絡(luò)信息技術(shù)發(fā)展較快處于世界前沿,但由于其復(fù)雜的內(nèi)容與龐大的數(shù)據(jù)量,在使用過程中難免發(fā)生一定的錯誤與不足。因此,移動通信商對其必須做出調(diào)整優(yōu)化工作,以期帶來更好的服務(wù)。數(shù)據(jù)挖掘技術(shù)就是幫助移動通信商調(diào)整4G網(wǎng)絡(luò)使用的重要技術(shù)方法。通過本文的分析,希望對我國網(wǎng)絡(luò)供應(yīng)商給予幫助,使其優(yōu)化我國的移動通信網(wǎng)絡(luò)。

關(guān)鍵詞:4G環(huán)境;移動通信;網(wǎng)絡(luò)優(yōu)化;數(shù)據(jù)挖掘

隨著我國的移動信息力量不斷發(fā)展,目前社會已進(jìn)入了4G的通訊時代。4G環(huán)境下,移動通信網(wǎng)絡(luò)實現(xiàn)了實時的更新與擴(kuò)大,同時人們對于移動網(wǎng)絡(luò)的使用要求也越來越高。如果不及時對移動通信網(wǎng)絡(luò)進(jìn)行更新優(yōu)化,4G網(wǎng)絡(luò)將無法發(fā)揮力量,進(jìn)一步為社會與人們服務(wù)。因此,為深化4G網(wǎng)絡(luò)的使用,必須對其數(shù)據(jù)進(jìn)行深度挖掘與分析,從而找尋更好使其為人們服務(wù)的途徑與方法。

1關(guān)于數(shù)據(jù)挖掘技術(shù)的問題分析

1.1數(shù)據(jù)挖掘的概念。數(shù)據(jù)挖掘技術(shù)是目前我國一類新興的互聯(lián)網(wǎng)科技技術(shù),其運(yùn)用基于目前的大數(shù)據(jù)時代形勢下。數(shù)據(jù)挖掘的實質(zhì)是對巨大的信息量,通過后臺的整合處理,找尋具有一定規(guī)律的數(shù)據(jù)并對其深入分析,找尋各組數(shù)據(jù)之間的聯(lián)系,對后續(xù)可能潛在產(chǎn)生的數(shù)據(jù)進(jìn)行預(yù)測。因此,數(shù)據(jù)挖掘在目前信息量龐大的現(xiàn)代網(wǎng)絡(luò)社會而言,具有找尋各組數(shù)據(jù)的關(guān)聯(lián)性,發(fā)現(xiàn)人們潛在需求的重要作用,是進(jìn)一步優(yōu)化4G網(wǎng)絡(luò)通訊與使用的重要依據(jù)。1.2數(shù)據(jù)挖掘的分析方法。數(shù)據(jù)挖掘的方法較多,通常情況下使用以下三類方法進(jìn)行具體的挖掘工作。首先,分類分析法是最常用的一類數(shù)據(jù)挖掘方法。該方法需要技術(shù)人員對所有的數(shù)據(jù)進(jìn)行初步篩選,并依據(jù)其特點(diǎn)做好標(biāo)記的工作。在第一次篩選工作完成后,對其進(jìn)行先前以標(biāo)記分類的數(shù)據(jù)進(jìn)行二次篩選,根據(jù)其特點(diǎn)再一次篩選。重復(fù)篩選的工作直至得到符合技術(shù)人員需求的規(guī)模后,在對其同類型的數(shù)據(jù)進(jìn)行定點(diǎn)分析,找尋其規(guī)律后根據(jù)其特性對4G網(wǎng)絡(luò)進(jìn)行優(yōu)化工作。其次,通常使用關(guān)聯(lián)分析法進(jìn)行數(shù)據(jù)挖掘的工作。所謂關(guān)聯(lián)分析法,是指對人們使用4G網(wǎng)絡(luò)的情況排查,分析其使用某數(shù)據(jù)時與其關(guān)聯(lián)的數(shù)據(jù),找尋二者的規(guī)律與相似處,并以此為依據(jù)對4G網(wǎng)絡(luò)的使用進(jìn)行進(jìn)一步優(yōu)化調(diào)整。關(guān)聯(lián)分析法的優(yōu)勢是更貼合人們的需求,能夠基于人性化的基礎(chǔ)上對4G網(wǎng)絡(luò)進(jìn)行調(diào)整。最后,序列分析法也是常用的數(shù)據(jù)挖掘方法。其原理類似于分類分析法,但其采用的方法是先由技術(shù)人員對所有需要分析的數(shù)據(jù)進(jìn)行采集編號,然后由計算機(jī)對其數(shù)據(jù)根據(jù)序列的不同進(jìn)行分析工作。相較于分類分析法,盡管其人性化程度較低,但其分析的速度是常用的數(shù)據(jù)分析法中速度最快的。因此,技術(shù)人員同時使用序列分析法對數(shù)據(jù)進(jìn)行第一次篩選與分析的工作后,根據(jù)情況具體使用分類分析法或關(guān)聯(lián)分析法進(jìn)行具體的篩選工作。

24G移動通信網(wǎng)絡(luò)的特點(diǎn)分析

查看全文