數(shù)據(jù)挖掘技術(shù)應(yīng)用范文

時間:2023-03-30 19:34:39

導(dǎo)語:如何才能寫好一篇數(shù)據(jù)挖掘技術(shù)應(yīng)用,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

數(shù)據(jù)挖掘技術(shù)應(yīng)用

篇1

數(shù)據(jù)挖掘(DataMining,DM),是隨著數(shù)據(jù)庫和人工智能發(fā)展起來的新興的信息處理技術(shù)。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程,其主要特點是對數(shù)據(jù)庫中的大量數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,并從中提取輔助決策的關(guān)鍵性數(shù)據(jù)。它可幫助決策者分析歷史數(shù)據(jù)及當(dāng)前數(shù)據(jù),并從中發(fā)現(xiàn)隱藏的關(guān)系和模式,進(jìn)而預(yù)測未來可能發(fā)生的行為。數(shù)據(jù)挖掘是一門涉及面很廣的交叉性新興學(xué)科,涉及到數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計、可視化、并行計算等領(lǐng)域。

2、數(shù)據(jù)挖掘技術(shù)

2.1關(guān)聯(lián)規(guī)則方法

關(guān)聯(lián)規(guī)則是一種簡單,實用的分析規(guī)則,描述了一個事物中某些屬性同時出現(xiàn)的規(guī)律和模式,是數(shù)據(jù)挖掘中最成熟的主要技術(shù)之一。大多數(shù)關(guān)聯(lián)規(guī)則挖掘算法能夠無遺漏發(fā)現(xiàn)隱藏在所挖掘數(shù)據(jù)中的所有關(guān)聯(lián)關(guān)系,所挖掘出的關(guān)聯(lián)規(guī)則量往往非常巨大,但是。并不是所有通過關(guān)聯(lián)得到的屬性之間的關(guān)系都有實際應(yīng)用價值,對這些關(guān)聯(lián)規(guī)則進(jìn)行有效的評價。篩選出用戶真正感興趣的。有意義的關(guān)聯(lián)規(guī)則尤為重要。

2.2分類和聚類方法

分類就是假定數(shù)據(jù)庫中的每個對象屬于一個預(yù)先給定的類。從而將數(shù)據(jù)庫中的數(shù)據(jù)分配到給定的類中。而聚類分析是根據(jù)所選樣本間關(guān)聯(lián)的標(biāo)準(zhǔn)將其劃分成幾個組,同組內(nèi)的樣本具有較高的相似度,不同組的則相異。分類和聚類的區(qū)別在于分類事先知道類別數(shù)和各類的典型特征,而聚類則事先不知道。聚類方法適合于探討樣本間的內(nèi)部關(guān)系,從而對樣本結(jié)構(gòu)做出合理的評價。

2.3數(shù)據(jù)統(tǒng)計方法

使用這些方法一般首先建立一個數(shù)據(jù)模型或統(tǒng)計模型,然后根據(jù)這種模型提取有關(guān)的知識。傳統(tǒng)的統(tǒng)計學(xué)為數(shù)據(jù)挖掘提供了許多判別和回歸分析方法。貝葉斯推理、回歸分析、方差分析等技術(shù)是許多挖掘應(yīng)用中有力的工具之一。

2.4神經(jīng)網(wǎng)絡(luò)方法

神經(jīng)元網(wǎng)絡(luò),具有非線形映射特性、信息的分布存儲、并行處理和全局集體的作用、高度的自學(xué)習(xí)、自組織和自適應(yīng)能力的種種優(yōu)點。這些優(yōu)點使得神經(jīng)元網(wǎng)絡(luò)非常適合解決數(shù)據(jù)挖掘的問題。因此近年來越來越受到人們的關(guān)注。典型的神經(jīng)網(wǎng)絡(luò)模型主要分3大類;用于分類、預(yù)測和模式識別的前饋式神經(jīng)網(wǎng)絡(luò)模型;用于聯(lián)想記憶和優(yōu)化計算的反饋式神經(jīng)網(wǎng)絡(luò)模型;用于聚類的自組織映射方法。新晨

2.5決策樹方法

決策樹學(xué)習(xí)是一種通過逼近離散值日標(biāo)函數(shù)的方法,把實例從根結(jié)點排列到某個葉子結(jié)點來分類實例。葉子結(jié)點即為實例所屬的分類,利用信息論中的互信息(信息增益)尋找數(shù)據(jù)庫中具有最大信息量的字段。建立決策樹的一個結(jié)點,再根據(jù)字段的不同取值建立樹的分支;在每個分枝子集中,重復(fù)建立樹的下層結(jié)點和分支的過程,即可建立決策樹。

篇2

【關(guān)鍵詞】數(shù)據(jù)倉庫 數(shù)據(jù)挖掘 技術(shù) 應(yīng)用

信息時代背景下,傳統(tǒng)數(shù)據(jù)庫主要是面向事務(wù)并存儲在線交易的數(shù)據(jù)信息,但是無法為人們找到信息中隱藏的重要內(nèi)容。因此社會發(fā)展新形勢下,數(shù)據(jù)倉庫與挖掘技術(shù)應(yīng)運(yùn)而生,并成為企業(yè)現(xiàn)代化發(fā)展的重要應(yīng)用技術(shù),不僅能夠提高數(shù)據(jù)信息管理能力,還能夠促進(jìn)企業(yè)發(fā)展。因此加強(qiáng)對該課題的研究具有積極意義。

1 數(shù)據(jù)倉庫及數(shù)據(jù)挖掘技術(shù)概念

所謂數(shù)據(jù)倉庫技術(shù)設(shè)計靈感來自于傳統(tǒng)數(shù)據(jù)庫技術(shù),其主要是在計算機(jī)中實現(xiàn)數(shù)據(jù)存儲的一種技術(shù)。但是相比較傳統(tǒng)數(shù)據(jù)庫,二者存在本質(zhì)上的差別。數(shù)據(jù)倉庫的出現(xiàn)并未取代傳統(tǒng)數(shù)據(jù)庫,二者共存在信息時代,且發(fā)揮自身獨特的優(yōu)勢。數(shù)據(jù)庫主要存儲在線交易數(shù)據(jù),且盡量避免冗余,通常采取符合范式規(guī)則設(shè)計;而數(shù)據(jù)倉庫在設(shè)計過程中有意引入冗余,采取反范式方式實現(xiàn)設(shè)計目標(biāo)。

而數(shù)據(jù)挖掘技術(shù)是在數(shù)據(jù)集合基礎(chǔ)之上,從中抽取隱藏在數(shù)據(jù)當(dāng)中的有用信息的非平凡過程。這些信息表現(xiàn)形式呈現(xiàn)多樣化,如概念、規(guī)則等。它在具體應(yīng)用過程中,不僅能夠幫助決策者分析歷史與當(dāng)前數(shù)據(jù)信息,還具有預(yù)見作用。就本質(zhì)上來看,數(shù)據(jù)挖掘過程也是知識發(fā)現(xiàn)的過程。數(shù)據(jù)挖掘技術(shù)是多個學(xué)科綜合的結(jié)果,對此其融合了多項技術(shù)功能,如聚類、分類及預(yù)測等,且這些功能并非獨立存在,而是存在相互依存關(guān)系。

2 數(shù)據(jù)倉庫與挖掘技術(shù)的應(yīng)用

2.1 數(shù)據(jù)倉庫技術(shù)的應(yīng)用

作為信息提供平臺,其從業(yè)務(wù)處理系統(tǒng)中獲得數(shù)據(jù),并以星型與雪花模型實現(xiàn)對數(shù)據(jù)的有效組織。一般情況下,它具體應(yīng)用主要表現(xiàn)在四個方面:

2.1.1 抽取數(shù)據(jù)信息

數(shù)據(jù)倉庫具有獨立性,在應(yīng)用中需要從事務(wù)處理系統(tǒng)、外部數(shù)據(jù)源等介質(zhì)當(dāng)中獲取數(shù)據(jù),并設(shè)置定時抽取,但需要合理控制操作時間、順序等,以提高數(shù)據(jù)信息有效性。

2.1.2 存儲和管理數(shù)據(jù)

作為數(shù)據(jù)倉庫的關(guān)鍵,數(shù)據(jù)存儲及管理模式直接決定其自身特性。因此該方面工作需要從技術(shù)特點入手,并積極解決對各項業(yè)務(wù)并行處理、查詢優(yōu)化等問題。

2.1.3 表現(xiàn)數(shù)據(jù)

數(shù)據(jù)表現(xiàn)作為數(shù)據(jù)倉庫的開端,集中在多位分析、數(shù)理統(tǒng)計等多個方面。其中多維分析是數(shù)據(jù)倉庫的核心,也是具體表現(xiàn)形式,而通過數(shù)據(jù)統(tǒng)計能夠幫助企業(yè)抓住機(jī)遇,實現(xiàn)經(jīng)濟(jì)效益最大化目標(biāo)。

2.1.4 技術(shù)咨詢

數(shù)據(jù)倉庫的出現(xiàn)及應(yīng)用并不簡單,其是一個系統(tǒng)性的解決方案和工程。實施數(shù)據(jù)倉庫時,技術(shù)咨詢服務(wù)十分重要,是一個必不可少的部分,對此在應(yīng)用中,應(yīng)加強(qiáng)對技術(shù)咨詢的關(guān)注力度。

2.2 數(shù)據(jù)挖掘技術(shù)在各領(lǐng)域中的應(yīng)用

不同于傳統(tǒng)時代,社會各領(lǐng)域在參與激烈的市場競爭過程中,充分認(rèn)識到數(shù)據(jù)對自身長遠(yuǎn)發(fā)展戰(zhàn)略實現(xiàn)的重要性。因此數(shù)據(jù)挖掘技術(shù)在當(dāng)前各行業(yè)發(fā)展中隨處可見。

2.2.1 應(yīng)用于醫(yī)學(xué)方面,提高診斷準(zhǔn)確率

眾所周知,人體奧秘?zé)o窮無盡,遺傳密碼、人類疾病等方面都蘊(yùn)含了海量數(shù)據(jù)信息。而傳統(tǒng)研究模式,單純依靠人工無法真正探索真正的秘密。而利用數(shù)據(jù)挖掘技術(shù)能夠有效解決這些問題,給醫(yī)療工作者帶來了極大的便利。同時,醫(yī)療體制改革背景下,醫(yī)院內(nèi)部醫(yī)療器具的管理、病人檔案資料整理等方面同樣涉及數(shù)據(jù),引進(jìn)數(shù)據(jù)挖掘技術(shù),能夠深入分析疾病之間的聯(lián)系及規(guī)律,幫助醫(yī)生診斷和治療,以達(dá)到診斷事半功倍的目標(biāo),且為保障人類健康等提供強(qiáng)大的技術(shù)支持。

2.2.2 應(yīng)用于金融方面,提高工作有效性

銀行及金融機(jī)構(gòu)中涉及儲蓄、信貸等大量數(shù)據(jù)信息。利用數(shù)據(jù)挖掘技術(shù)管理和應(yīng)用這些數(shù)據(jù)信息,能夠幫助金融機(jī)構(gòu)更好地適應(yīng)互聯(lián)網(wǎng)金融時代的發(fā)展趨勢。提高金融數(shù)據(jù)完整、可靠性,為金融決策提供科學(xué)依據(jù)。金融市場變幻莫測,要想在競爭中提升自身核心競爭力,需要對數(shù)據(jù)進(jìn)行多維分析和研究。在應(yīng)用中,特別是針對偵破洗黑錢等犯罪活動,可以采取孤立點分析等工具進(jìn)行分析,為相關(guān)工作有序開展奠定堅實的基礎(chǔ)。

2.2.3 應(yīng)用于高校日常管理方面,實現(xiàn)高校信息化建設(shè)

當(dāng)前,針對高校中存在的貧困大學(xué)生而言,受到自身家庭等因素的影響,他們學(xué)業(yè)與生活存在很多困難。而高校給予了貧困生很多幫助。對此將數(shù)據(jù)挖掘技術(shù)引入到貧困生管理工作中,能夠?qū)⑿?nèi)貧困生群體作為主要研究對象,采集和存儲在校生生活、學(xué)習(xí)等多方面信息,然后構(gòu)建貧困生認(rèn)定模型,并將此作為基礎(chǔ)進(jìn)行查詢和統(tǒng)計,為貧困生針對管理工作提供技術(shù)支持,從而提高高校學(xué)生管理實務(wù)效率,促進(jìn)高校和諧、有序發(fā)展。

2.2.4 應(yīng)用于電信方面,實現(xiàn)經(jīng)濟(jì)效益最大化目標(biāo)

現(xiàn)代社會發(fā)展趨勢下,電信產(chǎn)業(yè)已經(jīng)不僅限于傳統(tǒng)意義上的電話服務(wù)提供商、而將語言、電話等有機(jī)整合成為一項數(shù)據(jù)通信綜合業(yè)務(wù)。電信網(wǎng)、因特網(wǎng)等網(wǎng)絡(luò)融合已經(jīng)成為必然趨勢,并將成為未來發(fā)展的主要方向。在大融合影響下,數(shù)據(jù)挖掘技術(shù)應(yīng)用能夠幫助運(yùn)營商業(yè)務(wù)運(yùn)作,如利用多維分析電信數(shù)據(jù);或者采取聚類等方法查找異常狀態(tài)及盜用模式等,不斷提高數(shù)據(jù)資源利用率,更為深入地了解用戶行為,促進(jìn)電信業(yè)務(wù)的推廣及應(yīng)用,從而實現(xiàn)經(jīng)濟(jì)效益最大化目標(biāo)。

3 結(jié)論

根據(jù)上文所述,數(shù)據(jù)倉庫與挖掘技術(shù)作為一項新型技術(shù),在促進(jìn)相關(guān)產(chǎn)業(yè)發(fā)展等方面占據(jù)十分重要的位置。因此在具體應(yīng)用中,除了要積極明確數(shù)據(jù)倉庫與傳統(tǒng)數(shù)據(jù)庫之間的差別之外,還應(yīng)切實結(jié)合實際情況,積極引入數(shù)據(jù)挖掘技術(shù),充分挖掘和探索數(shù)據(jù)信息中的重要內(nèi)容,為制定科學(xué)決策提供支持,同時還應(yīng)加大對技術(shù)的深度研究,不斷提高技術(shù)應(yīng)用水平,從而為用戶帶來更大的利益。

參考文獻(xiàn)

[1]陳宏.淺談數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)及應(yīng)用[J].科技廣場,2011,09:90-93.

[2]崔愿星.淺析數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的應(yīng)用[J].內(nèi)江科技,2014,01:141-142.

[3]王慧.數(shù)據(jù)倉庫和數(shù)據(jù)挖掘在醫(yī)院信息系統(tǒng)中的應(yīng)用[J].電腦開發(fā)與應(yīng)用,2014,01:76-78.

[4]靳鑫.淺析數(shù)據(jù)倉庫和數(shù)據(jù)挖掘[J].中國新通信,2012,11:29-31.

篇3

論文關(guān)鍵詞:網(wǎng)絡(luò)營銷,數(shù)據(jù),挖掘,技術(shù),應(yīng)用

(新疆財經(jīng)大學(xué)計算機(jī)科學(xué)與工程學(xué)院新疆烏魯木齊830012)

0前言

近些年來,已經(jīng)有越來越多的企業(yè)把通信、網(wǎng)絡(luò)技術(shù)和計算機(jī)應(yīng)用引入企業(yè)的日常管理工作和業(yè)務(wù)開發(fā)處理當(dāng)中,企業(yè)的各類信息化程度也在不斷提高?,F(xiàn)代科技信息技術(shù)的廣泛應(yīng)用已經(jīng)顯著的提高了企業(yè)的工作效率和經(jīng)濟(jì)效益。但是,在使用信息技術(shù)給企業(yè)帶來的方便、快捷的同時,也不斷的出現(xiàn)了新的問題和需求。企業(yè)經(jīng)過多年積累了大量的歷史數(shù)據(jù),這些數(shù)據(jù)對企業(yè)當(dāng)前的日常經(jīng)營活動幾乎沒有任何的使用價值,成了留之無用棄之可惜的累贅。而且儲藏這些歷史數(shù)據(jù)會對企業(yè)造成很大的困難和費(fèi)用開銷。為此數(shù)據(jù)挖掘技術(shù)應(yīng)用在網(wǎng)絡(luò)營銷中勢在必行,全面細(xì)致的分析數(shù)據(jù)庫資源并從中提取有價值的信息來對商業(yè)決策進(jìn)行支持,從而來控制運(yùn)營成本、提高經(jīng)濟(jì)效益。本文將從網(wǎng)絡(luò)營銷中數(shù)據(jù)挖掘技術(shù)的幾個應(yīng)用進(jìn)行探討和分析。

1客戶關(guān)系管理

客戶關(guān)系管理在網(wǎng)絡(luò)營銷,商業(yè)競爭是一家以客戶為中心的競技狀態(tài)的客戶,留住客戶,擴(kuò)大客戶基礎(chǔ),建立密切的客戶關(guān)系,客戶需求分析和創(chuàng)造客戶需求等,是非常關(guān)鍵的營銷問題??蛻絷P(guān)系管理,營銷和信息技術(shù)領(lǐng)域是一個新概念,這在90年代初,軟件產(chǎn)品在上世紀(jì)90年代后期出現(xiàn)的誕生。目前,在國內(nèi)和國外的此類產(chǎn)品的研究和發(fā)展階段。然而,繼續(xù)與數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)的進(jìn)步和發(fā)展,客戶關(guān)系管理,也是對實際應(yīng)用階段。CRM的目標(biāo)是管理者與客戶的互動,提升客戶價值,提高客戶滿意度,提高客戶的忠誠度,還發(fā)現(xiàn),市場營銷和銷售渠道,然后尋找新客戶,提高客戶的利潤貢獻(xiàn)率的最終目的是為了推動社會和經(jīng)濟(jì)效益??蛻絷P(guān)系管理的目的,應(yīng)用是改善企業(yè)與客戶的關(guān)系,它是企業(yè)和服務(wù)本質(zhì)管理和協(xié)調(diào),以滿足客戶的需求,企業(yè)政策支持這項工作,并聯(lián)系客戶服務(wù)加強(qiáng)管理,提高客戶滿意度和品牌忠誠度。

然而,數(shù)據(jù)挖掘可以應(yīng)用到很多方面的CRM和不同階段,包括以下內(nèi)容:

(1)“一對一”營銷的內(nèi)部工作人員認(rèn)識到,客戶是在這個領(lǐng)域的企業(yè),而不是貿(mào)易發(fā)展生存的關(guān)鍵。與每一個客戶接觸的過程,也是了解客戶的進(jìn)程,而且也讓客戶了解業(yè)務(wù)流程。

(2)企業(yè)與客戶之間的銷售應(yīng)該是一種商業(yè)關(guān)系不斷向前發(fā)展??蛻艉蜖I銷公司成立這種方式,而且有許多方法可以使這種與客戶的關(guān)系,往往以改善包括:延長時間,客戶關(guān)系和維護(hù)客戶關(guān)系,以進(jìn)一步加強(qiáng)相互交往過程中,公司可以在對方取得聯(lián)系更多的利潤。

(3)客戶對客戶盈利能力分析。我們的客戶盈利能力是非常不同的,如果你不明白客戶盈利能力,很難制定有效的營銷策略,以獲取最有價值的客戶,或進(jìn)一步提高客戶的忠誠度的價值。數(shù)據(jù)挖掘技術(shù)可以用來預(yù)測客戶在市場條件變化不同的盈利能力。它可以找到所有這些行為和使用模型來預(yù)測客戶行為模式的客戶交易盈利水平或新客戶找到高利潤。

(4)在所有部門維護(hù)客戶關(guān)系的競爭日趨激烈,企業(yè)獲得新客戶的成本上升,因此,保持現(xiàn)有客戶的關(guān)系變得越來越重要。對于企業(yè)客戶可分為三大類:沒有價值或者低價值的客戶,不容易失去寶貴的客戶,并不斷尋找更多的優(yōu)惠,更有價值的服務(wù)給客戶。前兩個類型的客戶,客戶關(guān)系管理,現(xiàn)代化,然而,最具潛力的市場活動,是第三個層次的用戶,而且還特別需求和營銷工具,以保護(hù)客戶,可以減緩企業(yè)經(jīng)營成本,而且還獲得了寶貴的客戶。數(shù)據(jù)挖掘還可以發(fā)現(xiàn),由于客戶流失,該公司能夠滿足這些客戶的需要,采取適當(dāng)措施,保持銷售。

(5)客戶訪問企業(yè)業(yè)務(wù)系統(tǒng)資源,包括能夠獲得新客戶的關(guān)鍵指標(biāo)。為了提供這些新的資源,包括企業(yè)搜索客戶誰不知道該產(chǎn)品的客戶,可能是競爭對手,服務(wù)客戶。這些細(xì)分客戶,潛在客戶可以幫助企業(yè)完成檢查。

2企業(yè)經(jīng)營定位

通過挖掘客戶的有關(guān)數(shù)據(jù),可以對客戶進(jìn)行分類,找出其相同點和不同點,以便為客戶提供個性化的產(chǎn)品和服務(wù),使企業(yè)和客戶之間能夠通過網(wǎng)絡(luò)進(jìn)行有效的溝通和信息交流。例如,關(guān)聯(lián)分析,客戶在購買某種商品時,有可能會連帶著購買其他的相關(guān)產(chǎn)品,這樣購買的某種商品和連帶購買的其他相關(guān)產(chǎn)品之間就存在著某種關(guān)聯(lián),企業(yè)可以針對這種關(guān)聯(lián)進(jìn)行分析,分析出規(guī)律,已制定有效的營銷策略來長效的起到吸引客戶連帶消費(fèi),購買其他產(chǎn)品的營銷策略。它能夠智能化地從大量的數(shù)據(jù)中提取出有用的信息和知識,為企業(yè)的管理人員提供決策支持。數(shù)據(jù)挖掘技術(shù)使數(shù)據(jù)庫技術(shù)進(jìn)入了一個更高級的階段,它不僅能對過去的數(shù)據(jù)進(jìn)行查詢和遍歷,并且能夠找出過去數(shù)據(jù)之間的潛在聯(lián)系,從而促進(jìn)信息的傳遞。

客戶群體的劃分也會用到數(shù)據(jù)挖掘,沒有基于數(shù)據(jù)挖掘的客戶劃分,就沒有真正的差異化、個性化營銷,就沒有現(xiàn)代營銷的根本。做為企業(yè)的領(lǐng)導(dǎo)者,不管你的企業(yè)是賣產(chǎn)品的還是賣服務(wù),第一個應(yīng)該準(zhǔn)確把握的商業(yè)問題就是你的目標(biāo)客戶群體,他們是誰,有什么特點和行為模式,有那些獨特的喜好可以作為營銷的突破口,有多大的多長久的贏利價值。這些問題是你整個商業(yè)運(yùn)做的核心和基礎(chǔ),不了解你的客戶,下面的路就根本別指望能走下去了。數(shù)據(jù)挖掘營銷應(yīng)用中的客戶群體劃分可以科學(xué)有效的解決這個問題,也能給企業(yè)找到一個合理的營銷定位。

3客戶信用風(fēng)險控制

數(shù)據(jù)挖掘技術(shù)在90年代開始應(yīng)用于信用評估與風(fēng)險分析中。企業(yè)在進(jìn)行網(wǎng)絡(luò)營銷的過程中會受到各種各樣的來自買方的信用風(fēng)險的威脅,隨著市場競爭的加劇,貿(mào)易信用已經(jīng)成為企業(yè)成功開發(fā)客戶和加強(qiáng)客戶關(guān)系的重要條件??蛻粜庞霉芾碇饕撬鸭瘍Υ婵蛻粜畔?,因為客戶既是企業(yè)最大的財富來源,也是風(fēng)險的主要來源。為了讓企業(yè)在這方面更少的受到威脅,可以利用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)企業(yè)經(jīng)常面臨的詐騙行為或延付貨款行為,進(jìn)而進(jìn)行回避。同時盡可能把客戶信用風(fēng)險控制在交易發(fā)生之前是成功信用管理的根本。因此,充分獲取客戶的詳細(xì)資料并做出安全的決策非常重要。

客戶信用風(fēng)險管理應(yīng)用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢:

(1)數(shù)據(jù)挖掘技術(shù),自動總結(jié)相對簡單的評估模型,數(shù)據(jù)挖掘應(yīng)用程序的形式被廣泛用于學(xué)習(xí)技術(shù),它可以自動完成統(tǒng)計歸納和推理機(jī)實現(xiàn)的任務(wù)數(shù)量,系統(tǒng)用戶無法理解模型詳情及有關(guān)統(tǒng)計知識的情況下,它可以很容易地得出結(jié)論。這種評價模型在實際應(yīng)用中降低了成本;

(2)數(shù)據(jù)挖掘技術(shù)更適合描述的財務(wù)指標(biāo)和信貸上的信用評價模型指標(biāo)為基礎(chǔ)的傳統(tǒng)方法,非線性特性的情況基本上是線性的基礎(chǔ)上適當(dāng)?shù)姆椒ê蛯嶋H應(yīng)用,企業(yè)信用狀況和財務(wù)指標(biāo)常表現(xiàn)出非線性特性,但在體重指標(biāo)體系和分配方法來描述這些困難的非線性關(guān)系,實現(xiàn)了數(shù)據(jù)挖掘應(yīng)用,其中不少是在非線性系統(tǒng)為基礎(chǔ),尤其描述了合適的非線性特性;

(3)數(shù)據(jù)挖掘技術(shù)也可以適應(yīng)各種形式的數(shù)據(jù),數(shù)據(jù)挖掘可以是連續(xù)的數(shù)據(jù),離散數(shù)據(jù),而其他形式的數(shù)據(jù)處理,以便在更大的靈活性,在選擇指標(biāo)時,更加符合客觀實際的信用風(fēng)險模型。

(4)數(shù)據(jù)挖掘技術(shù)是優(yōu)于修正的噪音數(shù)據(jù),對那些在特殊階段或數(shù)據(jù)的完整性,市場條件可能不準(zhǔn)確,有可能是虛假的數(shù)據(jù)。由數(shù)據(jù)挖掘的方法可以修改一些在一定程度上,從而提高了模型的準(zhǔn)確性進(jìn)行評估;

(5)數(shù)據(jù)挖掘在不完全信息的情況下也可以計算,計算信貸風(fēng)險往往會遇到德國不完整的信息問題,一些指標(biāo)只能在一個范圍的估計。通過粗糙集數(shù)據(jù)挖掘或分類樹方法,可以優(yōu)化性能的范圍,以獲取該指標(biāo)更準(zhǔn)確的估計;

為現(xiàn)代信用風(fēng)險管理方法有兩個:第一是所謂的指數(shù)法,其基礎(chǔ)是信用相關(guān)業(yè)務(wù)的某些特性來企業(yè)信用評估;第二類是所謂的結(jié)構(gòu)化方法,根據(jù)歷史數(shù)據(jù)和市場數(shù)據(jù)模擬在企業(yè)資產(chǎn)價值變化的動態(tài)持續(xù)的過程,然后確定其企業(yè)信用的位置。

4在網(wǎng)絡(luò)營銷中進(jìn)行數(shù)據(jù)挖掘的優(yōu)勢

網(wǎng)絡(luò)營銷作為適應(yīng)網(wǎng)絡(luò)經(jīng)濟(jì)時代的網(wǎng)絡(luò)虛擬市場的新營銷理論,是市場營銷理念在新時期的發(fā)展和應(yīng)用。它能夠智能化地從大量的數(shù)據(jù)中提取出有用的信息和知識,為企業(yè)的管理人員提供決策支持。數(shù)據(jù)挖掘技術(shù)使數(shù)據(jù)庫技術(shù)進(jìn)入了一個更高級的階段,它不僅能對過去的數(shù)據(jù)進(jìn)行查詢和遍歷,并且能夠找出過去數(shù)據(jù)之間的潛在聯(lián)系,從而促進(jìn)信息的傳遞。

1.維護(hù)原有客戶,挖掘潛在新客戶

網(wǎng)絡(luò)營銷中銷售商可以通過客戶的訪問記錄來挖掘出客戶的潛在信息,跟據(jù)客戶的興趣與需求向客戶有針對性的做個性化的推薦,制定出客戶滿意的產(chǎn)品服務(wù)。在做好維護(hù)原有老客戶的基礎(chǔ)上,通過對數(shù)據(jù)的挖掘,利用分類技術(shù),也可以尋找出潛在的客戶,通過對web日志的挖掘,可以對已經(jīng)存在的訪問者進(jìn)行分類,根據(jù)這種精細(xì)的分類,還可以找到潛在的新客戶。

2.制定營銷策略,優(yōu)化促銷活動

對于保留的商品訪問記錄和銷售記錄進(jìn)行挖掘,可以發(fā)現(xiàn)客戶的訪問規(guī)律,了解客戶消費(fèi)的生命周期,起伏規(guī)律,結(jié)合市場形勢的變化,針對不同的商品和客戶群制定不同的營銷策略,保證促銷活動針對客戶群有的放矢,收到意想不到的效果。

3.降低運(yùn)營成本,提高競爭力

網(wǎng)絡(luò)營銷的管理者可以通過數(shù)據(jù)挖掘發(fā)現(xiàn)市場反饋的可靠信息,預(yù)測客戶未來的購買行為,有針對性的進(jìn)行營銷活動,還可以根據(jù)產(chǎn)品訪問者的瀏覽習(xí)慣來覺定產(chǎn)品廣告的位置,使廣告有針對性的起到宣傳的效果。從而提高廣告的投資回報率,從而能降低運(yùn)營成本,提高且的核心競爭力。

4.對客戶進(jìn)行個性化推薦

根據(jù)客戶采礦活動對網(wǎng)絡(luò)規(guī)則,有針對性的網(wǎng)絡(luò)營銷平臺,提供“個性化”服務(wù)。個性化服務(wù)是在服務(wù)策略和服務(wù)內(nèi)容的不同客戶的不同,其本質(zhì)是客戶為中心的Web服務(wù)的需求。它通過收集和分析客戶資料,以了解客戶的利益和購買行為,然后采取主動,以達(dá)到建議的服務(wù)。

5.完善網(wǎng)絡(luò)營銷網(wǎng)站的設(shè)計

網(wǎng)站的建設(shè)者可以根據(jù)對客戶交易行為的記錄和反饋的情況對站點做出改進(jìn),站點的設(shè)計者可以根據(jù)這些信息進(jìn)一步優(yōu)化網(wǎng)站結(jié)構(gòu),站點導(dǎo)航等功能來提高站點的點擊率,為客戶提供更為方便的瀏覽方式。利用關(guān)聯(lián)規(guī)則,

參考文獻(xiàn)1 馮英健著,《網(wǎng)絡(luò)營銷基礎(chǔ)與實踐》,清華大學(xué)出版社,2002年1月第1版

篇4

引言

一、數(shù)據(jù)挖掘技術(shù)的含義

數(shù)據(jù)挖掘是從數(shù)據(jù)當(dāng)中發(fā)現(xiàn)趨勢和模式的過程,它融合了現(xiàn)代統(tǒng)計學(xué)、知識信息系統(tǒng)、機(jī)器學(xué)習(xí)、決策理論和數(shù)據(jù)庫管理等多學(xué)科的知識。它能有效地從大量的、不完全的、模糊的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的潛在有用的信息和知識,揭示出大量數(shù)據(jù)中復(fù)雜的和隱藏的關(guān)系,為決策提供有用的參考。

二、數(shù)據(jù)挖掘的方法和基本步驟

(一)數(shù)據(jù)挖掘的主要方法

常用的數(shù)據(jù)挖掘方法主要有決策樹(Decision Tree)、遺傳算法(Genetic Algorithms)、關(guān)聯(lián)分析(Association Analysis)、聚類分析(Cluster Analysis)、序列模式分析(Sequential Pattern)以及神經(jīng)網(wǎng)絡(luò)(Neural Networks)等。

(二)數(shù)據(jù)挖掘的基本步驟

SAS研究所提出的SEMMA方法是目前最受歡迎的一種數(shù)據(jù)挖掘方法,其描述的數(shù)據(jù)挖掘的大致過程包括取樣(Sample)、探索(Explore)、修改(Modify)、模型(Model)和評價(Assess)。

1.數(shù)據(jù)取樣

在進(jìn)行數(shù)據(jù)挖掘之前,首先要根據(jù)數(shù)據(jù)挖掘的目標(biāo)選定相關(guān)的數(shù)據(jù)庫。通過創(chuàng)建一個或多個數(shù)據(jù)表進(jìn)行抽樣。所抽取的樣本數(shù)據(jù)量既要大到足以包含有實際意義的信息,同時又不至于大到無法處理。

2.數(shù)據(jù)探索

數(shù)據(jù)探索就是對數(shù)據(jù)進(jìn)行深入調(diào)查的過程,通過對數(shù)據(jù)進(jìn)行深入探察以發(fā)現(xiàn)隱藏在數(shù)據(jù)中預(yù)期的或未被預(yù)期的關(guān)系和異常,從而獲取對事物的理解和概念。

3.數(shù)據(jù)調(diào)整

在上述兩個步驟的基礎(chǔ)上對數(shù)據(jù)進(jìn)行增刪、修改,使之更明確、更有效。

4.建模

使用人工神經(jīng)網(wǎng)絡(luò)、回歸分析、決策樹、時間序列分析等分析工具來建立模型,從數(shù)據(jù)中發(fā)現(xiàn)那些能夠?qū)︻A(yù)測結(jié)果進(jìn)行可靠預(yù)測的模型。

5.評價

就是對從數(shù)據(jù)挖掘過程中發(fā)現(xiàn)的信息的實用性和可靠性進(jìn)行評估。

三、數(shù)據(jù)挖掘在管理會計中的運(yùn)用

(一)數(shù)據(jù)挖掘在管理會計中運(yùn)用的重要意義

1.提供有力的決策支持

面對日益激烈的競爭環(huán)境,企業(yè)管理者對決策信息的需求也越來越高。管理會計作為企業(yè)決策支持系統(tǒng)的重要組成部分,提供更多、更有效的有用信息責(zé)無旁貸。因此,從海量數(shù)據(jù)中挖掘和尋求知識和信息,為決策提供有力支持成為管理會計師使用數(shù)據(jù)挖掘的強(qiáng)大動力。例如,數(shù)據(jù)挖掘可以幫助企業(yè)加強(qiáng)成本管理,改進(jìn)產(chǎn)品和服務(wù)質(zhì)量,提高貨品銷量比率,設(shè)計更好的貨品運(yùn)輸與分銷策略,減少商業(yè)成本。

2.贏得戰(zhàn)略競爭優(yōu)勢的有力武器

實踐證明數(shù)據(jù)挖掘不僅能明顯改善企業(yè)內(nèi)部流程,而且能夠從戰(zhàn)略的高度對企業(yè)的競爭環(huán)境、市場、顧客和供應(yīng)商進(jìn)行分析,以獲得有價值的商業(yè)情報,保持和提高企業(yè)持續(xù)競爭優(yōu)勢。如,對顧客價值分析能夠?qū)槠髽I(yè)創(chuàng)造80%價值的20%的顧客區(qū)分出來,對其提供更優(yōu)質(zhì)的服務(wù),以保持這部分顧客。

3.預(yù)防和控制財務(wù)風(fēng)險

利用數(shù)據(jù)挖掘技術(shù)可以建立企業(yè)財務(wù)風(fēng)險預(yù)警模型。企業(yè)財務(wù)風(fēng)險的發(fā)生并非一蹴而就,而是一個積累的、漸進(jìn)的過程,通過建立財務(wù)風(fēng)險預(yù)警模型,可以隨時監(jiān)控企業(yè)財務(wù)狀況,防范財務(wù)危機(jī)的發(fā)生。另外,也可以利用數(shù)據(jù)挖掘技術(shù),對企業(yè)籌資和投資過程中的行為進(jìn)行監(jiān)控,防止惡意的商業(yè)欺詐行為,維護(hù)企業(yè)利益。尤其是在金融企業(yè),通過數(shù)據(jù)挖掘,可以解決銀行業(yè)面臨的如信用卡的惡意透支及可疑的信用卡交易等欺詐行為。根據(jù)SEC的報告,美國銀行、美國第一銀行、聯(lián)邦住房貸款抵押公司等數(shù)家銀行已采用了數(shù)據(jù)挖掘技術(shù)。

篇5

本文在分析商業(yè)網(wǎng)站中使用的數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)上,從網(wǎng)站數(shù)據(jù)挖掘、網(wǎng)站結(jié)構(gòu)設(shè)計和網(wǎng)站功能設(shè)計這三個方面對數(shù)據(jù)挖掘技術(shù)在商業(yè)網(wǎng)站設(shè)計中的應(yīng)用問題展開了探討,以便為商業(yè)網(wǎng)站的設(shè)計提供一些指導(dǎo)。

關(guān)鍵詞:

數(shù)據(jù)挖掘;網(wǎng)站設(shè)計;應(yīng)用

就目前來看,受到網(wǎng)絡(luò)化的影響,很多既有交易型態(tài)和商業(yè)行為都開始將交易機(jī)制轉(zhuǎn)移到網(wǎng)站上。所以,如何設(shè)計商業(yè)網(wǎng)站,成為了不少企業(yè)關(guān)注的問題。而利用數(shù)據(jù)挖掘技術(shù)可以完成對商業(yè)網(wǎng)站中的大量數(shù)據(jù)的分析,從而實現(xiàn)網(wǎng)站商品的定向營銷。

1數(shù)據(jù)挖掘技術(shù)概念及應(yīng)用概況

從技術(shù)層面上來看,數(shù)據(jù)挖掘技術(shù)就是從大量數(shù)據(jù)中進(jìn)行有用數(shù)據(jù)信息的提取的技術(shù),需要擺脫噪聲數(shù)據(jù)、隨機(jī)數(shù)據(jù)和模糊數(shù)據(jù)的干擾。而從商業(yè)角度來看數(shù)據(jù)挖掘技術(shù)是供應(yīng)商行業(yè)處理信息的技術(shù),可以幫助企業(yè)從商業(yè)數(shù)據(jù)庫中提取大量有用業(yè)務(wù)數(shù)據(jù),并且通過處理和分析這些數(shù)據(jù)信息實現(xiàn)對關(guān)鍵知識的提取,從而為企業(yè)制定決策提供依據(jù)。就目前來看,在商業(yè)網(wǎng)站中應(yīng)用的數(shù)據(jù)挖掘技術(shù)有路徑分析技術(shù)、關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)技術(shù)、序列模式和分類聚類技術(shù)等。

2數(shù)據(jù)挖掘技術(shù)在商業(yè)網(wǎng)站設(shè)計中的應(yīng)用

2.1在網(wǎng)站數(shù)據(jù)挖掘中的應(yīng)用

利用數(shù)據(jù)挖掘技術(shù)充分挖掘商業(yè)網(wǎng)站包含的數(shù)據(jù),才能合理進(jìn)行網(wǎng)站內(nèi)容的設(shè)計。而客戶背景資料信息是系統(tǒng)需要的數(shù)據(jù)來源,主要來自于客戶填寫的登記表和相關(guān)單證。完成這些數(shù)據(jù)的收集后,網(wǎng)站需要將數(shù)據(jù)傳遞至后臺數(shù)據(jù)庫中,并進(jìn)行數(shù)據(jù)的存儲。而利用數(shù)據(jù)挖掘技術(shù)進(jìn)行這些數(shù)據(jù)的分析和處理,將能得到相應(yīng)的數(shù)據(jù)分析報告。利用這些報告,網(wǎng)站管理人員就能進(jìn)行網(wǎng)站內(nèi)容的設(shè)計或改進(jìn),并進(jìn)行相應(yīng)數(shù)據(jù)的存儲。但是,出于隱私信息的保密性考慮,客戶有時不愿意在網(wǎng)上單證上填寫詳細(xì)的資料信息,以至于將給數(shù)據(jù)的挖掘和分析帶來困難。為此,還需要使用數(shù)據(jù)挖掘技術(shù)分析網(wǎng)站瀏覽者的行為表現(xiàn)數(shù)據(jù),以便根據(jù)這些數(shù)據(jù)進(jìn)行客戶背景資料信息的推測。比如,分析網(wǎng)站瀏覽者的點擊訪問情況就能進(jìn)行客戶行為表現(xiàn)的觀察,并實現(xiàn)對有用信息的挖掘。就目前來看,在設(shè)計商業(yè)網(wǎng)站時,可以根據(jù)網(wǎng)站日志進(jìn)行客戶這部分信息數(shù)據(jù)的獲取。而通過對這些日志數(shù)據(jù)進(jìn)行清洗、過濾和轉(zhuǎn)換,才能將獲得的數(shù)據(jù)存儲到網(wǎng)站數(shù)據(jù)庫中。在此基礎(chǔ)上,還要將這些數(shù)據(jù)當(dāng)成是數(shù)據(jù)挖掘的數(shù)據(jù)源,并從數(shù)據(jù)庫中進(jìn)行數(shù)據(jù)的調(diào)用和抽取,然后完成對數(shù)據(jù)的模式識別[1]。而在生成多維數(shù)據(jù)視圖后,通過分析就能得到數(shù)據(jù)挖掘結(jié)果和報告。最終,還要將這些內(nèi)容存儲到后臺數(shù)據(jù)庫中,以便為網(wǎng)站管理者提供參考。

2.2在網(wǎng)站結(jié)構(gòu)設(shè)計中的應(yīng)用

在設(shè)計商業(yè)網(wǎng)站時,使用具有商業(yè)邏輯基礎(chǔ)的數(shù)據(jù)挖掘商業(yè)應(yīng)用平臺才能實現(xiàn)挖掘客戶數(shù)據(jù)信息的目的。所以,需要應(yīng)用數(shù)據(jù)挖掘技術(shù)設(shè)計商業(yè)網(wǎng)站結(jié)構(gòu),以便創(chuàng)建一個與商業(yè)邏輯相結(jié)合的數(shù)據(jù)挖掘系統(tǒng)。在設(shè)計的過程中,可以圍繞著數(shù)據(jù)存儲、數(shù)據(jù)處理和數(shù)據(jù)展示這三個方面進(jìn)行數(shù)據(jù)庫系統(tǒng)的設(shè)置。同時,需要將網(wǎng)站用戶接入部分當(dāng)做是客戶端,而數(shù)據(jù)挖掘系統(tǒng)需要為用戶接入和交互提供支持。在客戶端發(fā)出請求后,系統(tǒng)應(yīng)對請求作出商業(yè)邏輯分解,并從數(shù)據(jù)存儲處進(jìn)行數(shù)據(jù)的獲取,然后再將處理后的結(jié)果返還客戶端。從總體結(jié)構(gòu)上來看,數(shù)據(jù)挖掘商業(yè)應(yīng)用平臺應(yīng)該由三部分構(gòu)成,即客戶層、中間層和數(shù)據(jù)服務(wù)層。

2.3在網(wǎng)站功能設(shè)計中的應(yīng)用

2.3.1網(wǎng)站搜索引擎的設(shè)計

面對成千上完的商業(yè)網(wǎng)站,想要從質(zhì)量不一的網(wǎng)上站點中選取便宜且適合自己的網(wǎng)站其實并不容易。而設(shè)計網(wǎng)站搜索引擎則能較好的解決這一問題,從而為用戶選擇網(wǎng)站提供便利。從國內(nèi)來看,8848網(wǎng)站是最早具有中文購物搜索引擎功能的網(wǎng)站,可以面向中國內(nèi)地提供專用網(wǎng)上購物商品搜索引擎。在設(shè)計網(wǎng)站功能時,網(wǎng)站利用了數(shù)據(jù)挖掘技術(shù)進(jìn)行信息搜索功能的實現(xiàn)。在該網(wǎng)站上,可以為用戶提供兩種搜索方式,即全網(wǎng)搜索和網(wǎng)上商城搜索。通過在搜索框內(nèi)輸入商品信息,用戶就能在短時間內(nèi)找到互聯(lián)網(wǎng)上眾多商業(yè)網(wǎng)站經(jīng)營的有關(guān)商品。同時,在瀏覽器上,用戶還能看到商品的信息介紹,并且得知商品的來源網(wǎng)站。此外,搜索引擎功能還能為用戶提供價格比價和商品排序等多種信息顯示方式,用戶可以直接點擊網(wǎng)站鏈接進(jìn)行商品網(wǎng)站的訪問。

2.3.2網(wǎng)站客戶關(guān)系管理的設(shè)計

利用數(shù)據(jù)挖掘技術(shù),商業(yè)網(wǎng)站還能獲得客戶關(guān)系管理功能。而所謂的客戶關(guān)系管理,其實就是對企業(yè)和客戶之間的交互活動進(jìn)行管理。從設(shè)計思想上來看,網(wǎng)站管理者需要以客戶為導(dǎo)向,并且盡量滿足客戶的個性化和多樣化需求。而應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行客戶信息的挖掘,將能幫助網(wǎng)站管理者了解客戶和產(chǎn)品的歷史交易信息,從而得知客戶的消費(fèi)傾向和產(chǎn)品的受歡迎程度。所以,數(shù)據(jù)挖掘技術(shù)的應(yīng)用可以為企業(yè)提供更多將商品銷售給現(xiàn)有客戶的機(jī)會,并且也能夠為企業(yè)制定商品分析決策提供數(shù)據(jù)依據(jù)[2]。此外,利用數(shù)據(jù)挖掘技術(shù)實現(xiàn)對客戶關(guān)系管理業(yè)務(wù)數(shù)據(jù)的共享和自動化管理,也能夠幫助企業(yè)完成業(yè)務(wù)分析、供應(yīng)鏈整合等工作,從而使商業(yè)網(wǎng)站的運(yùn)營管理以客戶為中心。

2.3.3網(wǎng)站個性化服務(wù)的設(shè)計

商業(yè)網(wǎng)站想要取得一定的市場競爭力,還要致力于為客戶提供個性化的服務(wù)。應(yīng)用數(shù)據(jù)挖掘技術(shù)可以使消費(fèi)者利用網(wǎng)站搜索引擎,并根據(jù)自己的需求和個性特點選擇感興趣的商店。而在獲得符合自己個性要求的資料庫后,用戶的在線購物過程將更具個性化的特點。同時,通過與用戶交流,網(wǎng)站的模擬商店銷售人員也能夠為用戶提供商品推薦,從而幫助用戶盡快找到需要的商品。此外,網(wǎng)站也能夠根據(jù)消費(fèi)者反饋的信息進(jìn)行特別服務(wù)的提供。具體來講,就是用戶在信息交流區(qū)發(fā)表看法或建議后,網(wǎng)站可以通過自動服務(wù)系統(tǒng)為用戶定制個性化服務(wù)菜單。而為用戶提供個性化服務(wù),顯然能夠起到防止網(wǎng)站用戶流失作用。

3結(jié)論

總而言之,商業(yè)網(wǎng)站是企業(yè)開展電子商務(wù)的信息平臺,是商家與服務(wù)對象聯(lián)系的溝通渠道。所以,商家能否從網(wǎng)站獲取有用的客戶信息,網(wǎng)站結(jié)構(gòu)設(shè)計是否合理,網(wǎng)絡(luò)功能是否齊全,將直接關(guān)系到網(wǎng)站交易的成敗。因此,在設(shè)計商業(yè)網(wǎng)站時,應(yīng)該較好的進(jìn)行數(shù)據(jù)挖掘技術(shù)的應(yīng)用,以便打造一個能夠為客戶提供滿意服務(wù)的網(wǎng)絡(luò)消費(fèi)平臺。

作者:馬宗禹 單位:馬鞍山師范高等??茖W(xué)校

參考文獻(xiàn):

篇6

[關(guān)鍵詞]電子商務(wù);數(shù)據(jù)挖掘;路徑分析

隨著Internet 的普及,電子商務(wù)的興起,人們的商務(wù)理念正在改變, 電子商務(wù)的廣泛應(yīng)用使企業(yè)產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),如何更快、更好地利用各種有效的數(shù)據(jù)更好地開展電子商務(wù),這是目前電子商務(wù)急需解決的問題。

一 、數(shù)據(jù)挖掘技術(shù)

20 世紀(jì) 90 年代以來,隨著信息技術(shù)和數(shù)據(jù)庫技術(shù)的迅猛發(fā)展,人們可以非常方便地獲取和存儲大量的數(shù)據(jù)。面對大規(guī)模的海量的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)分析工具(如管理信息系統(tǒng))只能進(jìn)行一些表層的處理(如查詢、統(tǒng)計等),而不能獲得數(shù)據(jù)之間的內(nèi)在關(guān)系和隱含的信息。為了擺脫“數(shù)據(jù)豐富,知識貧乏”的困境,人們迫切需要一種能夠智能地自動地把數(shù)據(jù)轉(zhuǎn)換成有用信息和知識的技術(shù)和工具,這種對強(qiáng)有力數(shù)據(jù)分析工具的迫切需求使得數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。人們認(rèn)識到數(shù)據(jù)庫中存儲的數(shù)據(jù)量急劇增大,在大量的數(shù)據(jù)背后隱藏著許多重要的信息,如果能把這些信息從數(shù)據(jù)庫中抽取出來,將為公司創(chuàng)造很多潛在的利潤。這種從海量數(shù)據(jù)庫中挖掘信息的技術(shù),就稱之為數(shù)據(jù)挖掘。數(shù)據(jù)挖掘一般有以下四類主要任務(wù):

(一)數(shù)據(jù)總結(jié)

數(shù)據(jù)挖掘能夠?qū)?shù)據(jù)庫中的有關(guān)數(shù)據(jù)從較低的個體層次抽象總結(jié)到較高的總體層次上,從而實現(xiàn)對原始基本數(shù)據(jù)的總體把握。

(二)分類

分析數(shù)據(jù)的各種屬性,并找出數(shù)據(jù)的屬性模型,確定哪些數(shù)據(jù)屬于哪些組。這樣我們就可以利用該模型來分析已有數(shù)據(jù),并預(yù)測新數(shù)據(jù)將屬于哪一個組。

(三)關(guān)聯(lián)分析

數(shù)據(jù)庫中的數(shù)據(jù)一般都存在著關(guān)聯(lián)關(guān)系,也就是說,兩個或多個變量的取值之間存在某種規(guī)律性。通過挖掘數(shù)據(jù)派生關(guān)聯(lián)規(guī)則,可以了解客戶的行為。

(四)聚類

聚類分析是按照某種相近程度度量方法,將用戶數(shù)據(jù)分成一系列有意義的子集合。每一個集合中的數(shù)據(jù)性質(zhì)相近,不同集合之間的數(shù)據(jù)性質(zhì)相差較大。

數(shù)據(jù)挖掘的特點和性質(zhì)對于企業(yè)而言,有助于發(fā)現(xiàn)其企業(yè)業(yè)務(wù)發(fā)展的趨勢, 揭示已知的事實, 預(yù)測未知的結(jié)果, 并幫助企業(yè)分析出完成任務(wù)所需的關(guān)鍵因素, 以達(dá)到增加收入, 降低成本, 使企業(yè)處于更有利的競爭位置的目的。

二、數(shù)據(jù)挖掘在電子商務(wù)中的作用

數(shù)據(jù)挖掘技術(shù)源于商業(yè)的直接需求, 因此它在各種商業(yè)領(lǐng)域都存在廣泛的使用價值。電子商務(wù)是商業(yè)領(lǐng)域的一種新興商務(wù)模式,是指利用電子信息技術(shù)開展一切商務(wù)活動。當(dāng)電子商務(wù)在企業(yè)中得到應(yīng)用時, 企業(yè)信息系統(tǒng)將產(chǎn)生大量數(shù)據(jù), 這些海量數(shù)據(jù)使數(shù)據(jù)挖掘有了豐富的數(shù)據(jù)基礎(chǔ), 同時高性能計算機(jī)和高傳輸速率網(wǎng)絡(luò)的使用也給數(shù)據(jù)挖掘技術(shù)提供了堅實的保障。因此數(shù)據(jù)挖掘技術(shù)在電子商務(wù)活動中有了更大的用武之地。下面介紹數(shù)據(jù)挖掘在以下電子商務(wù)幾個方面的作用:

(一)客戶細(xì)分

隨著“以客戶為中心”的經(jīng)營理念的不斷深入人心, 分析客戶、了解客戶并引導(dǎo)客戶的需求已成為企業(yè)經(jīng)營的重要課題。通過對電子商務(wù)系統(tǒng)收集的交易數(shù)據(jù)進(jìn)行分析, 可以按各種客戶指標(biāo)(如自然屬性、收入貢獻(xiàn)、交易額、價值度等) 對客戶分類, 然后確定不同類型客戶的行為模式, 以便采取相應(yīng)的營銷措施, 促使企業(yè)利潤的最大化。

(二)客戶獲得

利用數(shù)據(jù)挖掘可以有效地獲得客戶。比如通過數(shù)據(jù)挖掘可以發(fā)現(xiàn)購買某種商品的消費(fèi)者是男性還是女性, 學(xué)歷、收入如何, 有什么愛好, 是什么職業(yè)等等。甚至可以發(fā)現(xiàn)不同的人在購買該種商品的相關(guān)商品后多長時間有可能購買該種商品, 以及什么樣的人會購買什么型號的該種商品等等。也許很多因素表面上看起來和購買該種商品不存在任何聯(lián)系, 但數(shù)據(jù)挖掘的結(jié)果卻證明它們之間有聯(lián)系。在采用了數(shù)據(jù)挖掘后, 針對目標(biāo)客戶發(fā)送的廣告的有效性和回應(yīng)率將得到大幅度的提高, 推銷的成本將大大降低。

(三)客戶保持

數(shù)據(jù)挖掘可以把你大量的客戶分成不同的類, 在每個類里的客戶擁有相似的屬性, 而不同類里的客戶的屬性也不同。你完全可以做到給不同類的客戶提供完全不同的服務(wù)來提高客戶的滿意度。數(shù)據(jù)挖掘還可以發(fā)現(xiàn)具有哪些特征的客戶有可能流失, 這樣挽留客戶的措施將具有針對性, 挽留客戶的費(fèi)用將下降。

(四)交叉銷售

交叉銷售可以使企業(yè)比較容易地得到關(guān)于客戶的豐富的信息,而這些大量的數(shù)據(jù)對于數(shù)據(jù)挖掘的準(zhǔn)確性來說是有很大幫助的。在企業(yè)所掌握的客戶信息, 尤其是以前購買行為的信息中, 可能正包含著這個客戶決定他下一個購買行為的關(guān)鍵, 甚至決定因素。這個時候數(shù)據(jù)挖掘的作用就會體現(xiàn)出來, 它可以幫助企業(yè)尋找到這些影響他購買行為的因素。

(五)個

當(dāng)客戶在電子商務(wù)網(wǎng)站注冊時, 客戶將會看到帶有客戶姓名的歡迎詞。根據(jù)客戶的訂單紀(jì)錄, 系統(tǒng)可以向客戶顯示那些可能引起客戶特殊興趣的新商品。當(dāng)客戶注意到一件特殊的商品時, 系統(tǒng)會建議一些在購買中可以增加的其他商品。普通的產(chǎn)品目錄手冊常常簡單地按類型對商品進(jìn)行分組, 以簡化客戶挑選商品的步驟。然而對于在線商店, 商品分組可能是完全不同的, 它常常以針對客戶的商品補(bǔ)充條目為基礎(chǔ)。不僅考慮客戶看到的條目, 而且還考慮客戶購物籃中的商品。使用數(shù)據(jù)挖掘技術(shù)可以使推薦更加個性化。

(六)資源優(yōu)化

節(jié)約成本是企業(yè)盈利的關(guān)鍵。通過分析歷史的財務(wù)數(shù)據(jù)、庫存數(shù)據(jù)和交易數(shù)據(jù), 可以發(fā)現(xiàn)企業(yè)資源消耗的關(guān)鍵點和主要活動的投入產(chǎn)出比例, 從而為企業(yè)資源優(yōu)化配置提供決策依據(jù), 例如降低庫存、提高庫存周轉(zhuǎn)率、提高資金使用率等。

(七)異常事件的確定

在許多商業(yè)領(lǐng)域中, 異常事件具有顯著的商業(yè)價值, 如客戶流失、銀行的信用卡欺詐、電信中移動話費(fèi)拖欠等。通過數(shù)據(jù)挖掘中的奇異點分析可以迅速準(zhǔn)確地甄別這些異常事件。

由此可見數(shù)據(jù)挖掘在電子商務(wù)中有著重要的作用。在生活中采用數(shù)據(jù)挖掘的成功的例子很多。例如總部位于美國阿肯色州的WalMart零售商的“尿布與啤酒”的故事。WalMart擁有世界上最大的數(shù)據(jù)倉庫系統(tǒng),它利用數(shù)據(jù)挖掘工具對數(shù)據(jù)倉庫中的原始交易數(shù)據(jù)進(jìn)行分析,得到了一個意外發(fā)現(xiàn):跟尿布一起購買最多的商品竟然是啤酒。如果不是借助于數(shù)據(jù)倉庫和數(shù)據(jù)挖掘,商家決不可能發(fā)現(xiàn)這個隱藏在背后的事實:在美國,一些年輕的父親下班后經(jīng)常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時也為自己買一些啤酒。有了這個發(fā)現(xiàn)后,超市調(diào)整了貨架的擺放,把尿布和啤酒放在一起,明顯增加了銷售額。

三、電子商務(wù)中如何應(yīng)用數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘在電子商務(wù)中有廣泛的應(yīng)用。那么在電子商務(wù)中是如何應(yīng)用數(shù)據(jù)挖掘技術(shù)的?

首先,從挖掘過程說,對在線訪問客戶數(shù)據(jù)的挖掘主要有兩部分:一部分是客戶訪問信息的挖掘,另一部分是客戶登記信息的挖掘。面對大量的訪問日志,首先要做的就是對數(shù)據(jù)進(jìn)行清洗,即預(yù)處理,把無關(guān)的數(shù)據(jù),不重要的數(shù)據(jù)等處理掉;接著對數(shù)據(jù)進(jìn)行事務(wù)識別,通過對事務(wù)進(jìn)行劃分后,就可以根據(jù)具體的分析需求選擇模式發(fā)現(xiàn)的技術(shù),如路徑分析、興趣關(guān)聯(lián)規(guī)則、聚類等。通過模式分析,找到有用的信息,再通過聯(lián)機(jī)分析(OLAP) 的驗證,結(jié)合客戶登記信息,找出有價值的市場信息,或發(fā)現(xiàn)潛在的市場。

其次,挖掘方法主要有以下幾種:

1.路徑分析

路徑分析是一種找尋頻繁訪問路徑的方法,它通過對Web 服務(wù)器的日志文件中客戶訪問站點的訪問次數(shù)分析,挖掘出頻繁訪問路徑。 例如:一客戶從某一站點訪問到某一感興趣的頁面后就會經(jīng)常訪問該頁面, 通過路徑分析確定頻繁訪問路徑, 可以了解客戶對哪些頁面感興趣,(下轉(zhuǎn)第78頁)(上接第80頁)從而更好地改進(jìn)設(shè)計,為客戶服務(wù)。

2.興趣關(guān)聯(lián)規(guī)則

當(dāng)客戶訪問某一網(wǎng)頁時,一般會通過興趣詞條找出相關(guān)的興趣網(wǎng)頁通過鏈接繼續(xù)訪問, 這種關(guān)聯(lián)產(chǎn)生的數(shù)據(jù)如果能夠按照某種策略進(jìn)行挖掘分析, 統(tǒng)計出客戶訪問某些頁面及興趣關(guān)聯(lián)頁面的比率, 就可以很好地組織站點, 實施有效的市場策略。

3.聚類分析

聚類分析是電子商務(wù)中很重要的一個方面,通過分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,更好地幫助電子商務(wù)的用戶了解自己的客戶,向客戶提供更合適的服務(wù)。如通過對眾多的瀏覽“camera”網(wǎng)頁的客戶分析,發(fā)現(xiàn)在該網(wǎng)頁上經(jīng)?;ㄒ欢螘r間瀏覽的客戶,再通過對這部分客戶的登記資料分析,知道這些客戶是潛在要買相機(jī)的客戶群體。就可以調(diào)整“camera”網(wǎng)頁的內(nèi)容和風(fēng)格,以適應(yīng)客戶的需要。

通過以上幾種數(shù)據(jù)分析的方法可以有效地對電子商務(wù)中的信息進(jìn)行分析,從而更有效地開展電子商務(wù)。

目前,數(shù)據(jù)挖掘技術(shù)正以前所未有的速度發(fā)展,并且擴(kuò)大著用戶群體,在未來越來越激烈的市場競爭中,擁有數(shù)據(jù)挖掘技術(shù)必將比別人獲得更快速的反應(yīng),贏得更多的商業(yè)機(jī)會?,F(xiàn)在世界上的主要數(shù)據(jù)庫廠商紛紛開始把數(shù)據(jù)挖掘功能集成到自己的產(chǎn)品中,加快數(shù)據(jù)挖掘技術(shù)的發(fā)展。我國在這一領(lǐng)域正處在研究開發(fā)階段,加快研究數(shù)據(jù)挖掘技術(shù),并把它應(yīng)用于電子商務(wù)中,應(yīng)用到更多行業(yè)中,勢必會有更好的商業(yè)機(jī)會和更光明的前景。

[參考文獻(xiàn)]

篇7

關(guān)鍵詞:數(shù)據(jù)挖掘;CRM;電信企業(yè)

Abstract: with the popularity and rapid development of mobile network, the telecom enterprises with a large number of customer data, an urgent need to convert data advantage into enterprise competitive advantage, based on data mining of telecom customer relationship management (CRM) system arises at the historic moment. In this paper, the concept of customer relationship management (CRM) and data mining, and comprehensive application in telecom enterprises are studied.

Key words: data mining; CRM; Telecom enterprise

1 引言

隨著經(jīng)濟(jì)的發(fā)展,營銷方式從“以產(chǎn)品為中心”轉(zhuǎn)變?yōu)椤耙钥蛻魹橹行摹?,逐步建立以客戶和市場為?dǎo)向的經(jīng)營戰(zhàn)略,主動營銷對企業(yè)的發(fā)展變得異常重要,因此,越來越多的企業(yè)都開展了客戶關(guān)系管理(CRM)。CRM能為企業(yè)獲得市場競爭優(yōu)勢,樹立良好的企業(yè)形象。通過客戶關(guān)系管理系統(tǒng)可建立統(tǒng)一的客戶聯(lián)系渠道和全面的客戶服務(wù)能力,可為客戶提供更好的服務(wù),促使客戶購買更多的產(chǎn)品或服務(wù),并建立起對客戶的忠誠度,從而增加收人和提高銷售利潤。因此,企業(yè)需要對客戶形成更加深刻的理解和認(rèn)識,而數(shù)據(jù)挖掘技術(shù)可以通過對CRM系統(tǒng)的海量客戶數(shù)據(jù)的深人分析,發(fā)現(xiàn)大量潛在的、真正有價值的信息和知識,滿足企業(yè)對客戶關(guān)系管理的需求,是當(dāng)前電信企業(yè)提升CRM水平的重要手段。

2 數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘是一門綜合性學(xué)科,其涉及統(tǒng)計學(xué)、人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫等多方面知識。數(shù)據(jù)挖掘就是從海量數(shù)據(jù)中提取或“挖掘”知識,它要從不完全的、大量的、隨機(jī)的、模糊的歷史數(shù)據(jù)中發(fā)掘出人們事先未知的,但是潛在有用的信息和知識。

數(shù)據(jù)挖掘根據(jù)任務(wù)的不同主要分為

(1)描述性數(shù)據(jù)挖掘:包括統(tǒng)計、聚類和關(guān)聯(lián)規(guī)則等;

(2)預(yù)言性數(shù)據(jù)挖掘:包括分類、回歸和時間序列;

數(shù)據(jù)挖掘算法有決策樹算法、神經(jīng)網(wǎng)絡(luò)算法、關(guān)聯(lián)規(guī)則算法、粗糙集以及遺傳算法等。

數(shù)據(jù)挖掘的實現(xiàn)過程是一個循環(huán)往復(fù)的過程,主要分為以下幾個步驟:

(1)數(shù)據(jù)準(zhǔn)備

選擇計算所需要的合適數(shù)據(jù),掌握了解數(shù)據(jù)分布情況和異常數(shù)據(jù),補(bǔ)充和修正缺失的數(shù)據(jù),為計算的方便轉(zhuǎn)換數(shù)據(jù)類型,為提高計算對數(shù)據(jù)進(jìn)行合理的分組。

(2)建立模型

選取合適的數(shù)據(jù)挖掘算法,對預(yù)處理過的數(shù)據(jù)進(jìn)行計算和挖掘,調(diào)試該算法的運(yùn)行參數(shù),生成該業(yè)務(wù)的模型。

(3)評估和解釋模型

比較和評估上述建立的各個模型,從中選取一個最優(yōu)模型,并用業(yè)務(wù)語言解釋該模型。

(4)運(yùn)用和優(yōu)化模型

在實際操作中,監(jiān)控該模型的表現(xiàn)和運(yùn)行情況,若表現(xiàn)不好,則修正和考察該模型,使模型能夠真實的放映實際業(yè)務(wù)的運(yùn)作規(guī)律。

3 數(shù)據(jù)挖掘技術(shù)在電信 CRM 中的應(yīng)用

數(shù)據(jù)挖掘技術(shù)使用關(guān)聯(lián)分析、偏差分析、聚類分析和預(yù)測等方法完成對復(fù)雜客戶的數(shù)據(jù)的處理,從數(shù)據(jù)中將所需的分析結(jié)果提取出來。本文對CRM系統(tǒng)中客戶群體、客戶滿意程度、交叉銷售、客戶盈利能力、客戶流失情況應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行分析。

(1)客戶群體分類

采用決策樹和聚類方法把海量客戶分成不同的類型,每類客戶擁有相似的屬性,不同類的客戶具有不同的屬性。企業(yè)可以針對不同類型的客戶,提供完全不同的個性化的服務(wù),以此來提高客戶的滿意度。

(2) 客戶流失的控制與預(yù)測

隨著行業(yè)之間的競爭愈演愈烈,企業(yè)獲得新客戶的難度越來越大,這使得保持原有客戶就顯得尤為重要。要想從客戶身上獲得的價值更多,那么必然要做好維護(hù)工作。數(shù)據(jù)挖掘技術(shù)可以從客戶數(shù)據(jù)中發(fā)現(xiàn)易流失的客戶,從而企業(yè)可針對客戶的需求,采取相應(yīng)措施保持原有客戶。

(3)客戶利潤回報預(yù)測

通過已有的客戶數(shù)據(jù)預(yù)測未知的消費(fèi)趨勢和消費(fèi)領(lǐng)域,使用決策樹算法和神經(jīng)網(wǎng)絡(luò)算法對數(shù)據(jù)進(jìn)行分析,考察哪些客戶對產(chǎn)品感興趣,哪些人是企業(yè)的潛在客戶,然后根據(jù)分析結(jié)果采取有針對性的營銷,達(dá)到企業(yè)和客戶雙贏的目的。

(4)交叉銷售

交叉銷售是企業(yè)向原有客戶銷售新的產(chǎn)品或服務(wù)的過程。在企業(yè)所掌握的客戶數(shù)據(jù)信息中,包含著客戶下一次購買行為的關(guān)鍵信息,數(shù)據(jù)挖掘技術(shù)可以從這些數(shù)據(jù)中挖掘出影響客戶購買行為的主要因素,這樣客戶因獲得其滿意的服務(wù)而獲益,企業(yè)因銷售增長而獲益。

(5) 產(chǎn)品和服務(wù)的關(guān)聯(lián)分析

關(guān)聯(lián)分析是數(shù)據(jù)挖掘技術(shù)的重要算法,是挖掘不同數(shù)據(jù)之間關(guān)系的重要手段。對電信產(chǎn)品或服務(wù)作有效的關(guān)聯(lián)分析,可以發(fā)掘出電信服務(wù)或產(chǎn)品之間的關(guān)系,由此可以定制合理的組合套餐,為用戶提供貼心服務(wù),從而開發(fā)出最受客戶歡迎的產(chǎn)品服務(wù)組合。

(6) 客戶欺詐行為分析

客戶欺詐行為是指以不付費(fèi)的方式撥打移動通信服務(wù)。采用決策樹算法對客戶數(shù)據(jù)信息進(jìn)行分析,對客戶行為進(jìn)行研究,根據(jù)分析結(jié)果判斷哪些客戶存在欺詐行為。

4 結(jié)束語

良好的客戶關(guān)系管理是電信企業(yè)增加利潤,提高客戶滿意度和忠誠度的有效工具,引入數(shù)據(jù)挖掘技術(shù)可以更好地實現(xiàn)客戶關(guān)系管理的目標(biāo),加深企業(yè)對客戶的理解,建立更準(zhǔn)確的客戶模型,改進(jìn)營銷策略,提供更好的客戶服務(wù),尋找更好的目標(biāo)市場,使企業(yè)獲得和保持市場競爭力。而隨著數(shù)據(jù)挖掘技術(shù)的不斷完善和成熟,基于數(shù)據(jù)挖擁技術(shù)的客戶關(guān)系管理必將獲得越來越廣泛的應(yīng)用。

參考文獻(xiàn)

[1] 王輝,基于數(shù)據(jù)挖掘技術(shù)的客戶關(guān)系管理在電信企業(yè)中的應(yīng)用[J],中國科技信息,2005(18):25-16.

[2] 張驊,試析數(shù)據(jù)挖掘在移動通信CRM中的應(yīng)用[J],企業(yè)導(dǎo)報,2014(16):134-135.

[3] 冉宏坤,趙京輝,李媛,數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)在電信CRM中的應(yīng)用[J],信息通信,2014(1):234-234.

[4] 吳建華,數(shù)據(jù)挖掘技術(shù)在電信行業(yè)CRM中應(yīng)用研究[J],電腦知識與技術(shù),2013(35):7908-7910.

[5] 閆娜娜,劉鋒,李錫娟,耿波. 支持CRM分析的數(shù)據(jù)倉庫多維啟動模型[J]. 計算機(jī)技術(shù)與發(fā)展. 2008(05)

[6] 陳建輝. 一種基于數(shù)據(jù)挖掘的CRM系統(tǒng)框架的實現(xiàn)[J]. 華北水利水電學(xué)院學(xué)報. 2007(05)

[7] 陳加順. 基于數(shù)據(jù)挖掘技術(shù)的房地產(chǎn)CRM的研究與應(yīng)用[J]. 中國水運(yùn)(學(xué)術(shù)版). 2007(09)

篇8

為給企業(yè)提供更加科學(xué)、有效的決策支持,本文敘述了數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用,首先介紹了數(shù)據(jù)挖掘技術(shù)相關(guān)內(nèi)容,并結(jié)合客戶關(guān)系管理需求將其引入CRM系統(tǒng)設(shè)計中,構(gòu)建了系統(tǒng)體系架構(gòu),并在此基礎(chǔ)上剖析了數(shù)據(jù)挖掘技術(shù)在其中的具體應(yīng)用過程和方法,從而為相關(guān)研究提供一定的參考。

關(guān)鍵詞:

客戶關(guān)系管理;數(shù)據(jù)挖掘技術(shù);數(shù)據(jù)倉庫

市場經(jīng)濟(jì)競爭的層層升級,倒逼企業(yè)開始由產(chǎn)品轉(zhuǎn)向以客戶為中心,客戶關(guān)系管理(CRM)也因此成了企業(yè)獲取更大市場份額,提升營銷快速敏捷性和高效性的重要內(nèi)容之一,如何挖掘有效的客戶信息,實現(xiàn)其背后隱藏的市場價值,是企業(yè)提升綜合競爭力所面臨的首要問題。

1數(shù)據(jù)挖掘技術(shù)應(yīng)用的原理及方法

數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘是一種擁有強(qiáng)大規(guī)模數(shù)據(jù)庫、高效計算能力的數(shù)據(jù)獲取和處理技術(shù),“能夠從大量的、龐雜的數(shù)據(jù)信息中挖掘和提取深層次的、有效的、價值性較高的知識和規(guī)則”[1],為營銷管理、經(jīng)營決策、市場預(yù)測、發(fā)展規(guī)劃等提供科學(xué)、有效的支撐。當(dāng)前數(shù)據(jù)挖掘技術(shù)已成為一種新型的企業(yè)客戶關(guān)心處理技術(shù),通過對企業(yè)數(shù)據(jù)庫、數(shù)據(jù)倉庫或是其他數(shù)據(jù)庫中模糊的、隨機(jī)的和不完全信息和知識進(jìn)行抽取分析和模式化處理,獲取更具價值的客戶數(shù)據(jù)。數(shù)據(jù)挖掘應(yīng)用的方法涉及:決策樹和決策規(guī)則、關(guān)聯(lián)規(guī)則、人工神經(jīng)網(wǎng)絡(luò)、聚類分析、粗糙集、統(tǒng)計方法及可視化方法等,在具體應(yīng)用過程中應(yīng)結(jié)合企業(yè)客戶關(guān)系管理任務(wù)和側(cè)重點的差異性,進(jìn)行合理選擇。

2基于數(shù)據(jù)挖掘的CRM體系結(jié)構(gòu)的構(gòu)建

本文應(yīng)用數(shù)據(jù)挖掘技術(shù)所構(gòu)建的CRM系統(tǒng)旨在改善企業(yè)與客戶之間的新型管理機(jī)制,為實現(xiàn)銷售、營銷、服務(wù)、研發(fā)等提供決策支持功能,其體系架構(gòu)如圖1所示。

2.1客戶接觸該模塊是企業(yè)與客戶之間溝通、交流的主要方式,“用戶可通過呼叫中心email、電話、傳真等多種形式提出要求、獲取所需信息”[2],這也為企業(yè)獲取、整合客戶資源的、進(jìn)行決策規(guī)劃等提供條件,同時,其所涉及的客戶包含現(xiàn)有客戶、潛在客戶、長期客戶、短期客戶等。

2.2數(shù)據(jù)存儲在經(jīng)過客戶接觸之后,系統(tǒng)將利用數(shù)據(jù)抽取工具對獲取的客戶數(shù)據(jù)進(jìn)行預(yù)處理、存儲,并形成以前區(qū)數(shù)據(jù)庫、后區(qū)數(shù)據(jù)庫、客戶及產(chǎn)品數(shù)據(jù)庫集、數(shù)據(jù)倉庫等為基礎(chǔ)的數(shù)據(jù)基礎(chǔ),其中企業(yè)內(nèi)外部的即時數(shù)據(jù)存儲于前、后區(qū)數(shù)據(jù)庫,其與數(shù)據(jù)倉庫存在雙向聯(lián)動,為應(yīng)用管理提供支撐。

2.3數(shù)據(jù)挖掘數(shù)據(jù)挖掘是該系統(tǒng)的核心,數(shù)據(jù)挖掘模塊從商業(yè)應(yīng)用中提取應(yīng)用目標(biāo),并制定相應(yīng)的數(shù)據(jù)需求定義,向數(shù)據(jù)存儲發(fā)送數(shù)據(jù)需求,依需求選取相關(guān)數(shù)據(jù)采用數(shù)據(jù)挖掘工具進(jìn)行數(shù)據(jù)分析、處理,所得結(jié)果用于商業(yè)應(yīng)用,以為客戶互動渠道提供決策支持,并據(jù)此優(yōu)化以往的商業(yè)應(yīng)用目標(biāo)定義。

2.4商業(yè)應(yīng)用商業(yè)應(yīng)用是系統(tǒng)的基礎(chǔ)內(nèi)容,涉及銷售、營銷、生產(chǎn)、管理等內(nèi)容,其關(guān)鍵在于將CRM思想融入到企業(yè)實踐中,調(diào)動企業(yè)全部員工和部門參與其中,通過與客戶接觸了解客戶需求,進(jìn)而依商業(yè)應(yīng)用定義應(yīng)用目標(biāo),并由數(shù)據(jù)挖掘進(jìn)行數(shù)據(jù)處理,在數(shù)據(jù)挖掘發(fā)現(xiàn)的知識和模型的支持下,實施商業(yè)應(yīng)用,以便在與客戶接觸中為其提供高品質(zhì)的產(chǎn)品和服務(wù)。

3數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中應(yīng)用的具體步驟

本文從以技術(shù)為中心的角度來分析數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中應(yīng)用的過程和步驟如圖1所示,詳細(xì)分析如下:

3.1數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備影響著數(shù)據(jù)挖掘的精確度和效率,并決定著最終挖掘模型的有效性?!皵?shù)據(jù)集成是將所有的數(shù)據(jù)進(jìn)行整合、解釋語義模糊性、剔除無用的數(shù)據(jù)、彌補(bǔ)漏洞等”[3];數(shù)據(jù)選擇是依據(jù)用戶需求利用數(shù)據(jù)存儲庫對數(shù)據(jù)進(jìn)行處理,并從中選取需要挖掘的數(shù)據(jù)集合;數(shù)據(jù)預(yù)處理是對所選取的數(shù)據(jù)進(jìn)行深度處理,檢驗數(shù)據(jù)的數(shù)據(jù)的完整性和一致性,彌補(bǔ)丟失的數(shù)據(jù),噪聲數(shù)據(jù)的處理,確定挖掘操作的類型,縮減待處理數(shù)據(jù)量;數(shù)據(jù)轉(zhuǎn)換時以數(shù)據(jù)挖掘需求為準(zhǔn)進(jìn)行的離散數(shù)值和連續(xù)數(shù)值量數(shù)據(jù)之間的轉(zhuǎn)換。

3.2數(shù)據(jù)挖掘數(shù)據(jù)挖掘的主要目的是建立訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù),依據(jù)數(shù)據(jù)特點和系統(tǒng)應(yīng)用要求選用合適的技術(shù)和方法對數(shù)據(jù)進(jìn)行分析,構(gòu)建相對最優(yōu)的模型,并以業(yè)務(wù)語言對這一模型進(jìn)行相應(yīng)處理,同時,依據(jù)應(yīng)用需求還可能對數(shù)據(jù)進(jìn)行預(yù)處理。應(yīng)用模型是不斷變化的過程,在搜尋最優(yōu)模型過程中可能受到新情況的影響需要對重新選擇和修改數(shù)據(jù),甚至重新定義應(yīng)用目標(biāo),同時,在模型建立之后,需要借助測試數(shù)據(jù)對其進(jìn)行實時評估和檢測,觀察模型的應(yīng)用效果,以準(zhǔn)確判斷何種模型對企業(yè)客戶數(shù)據(jù)挖掘的業(yè)務(wù)問題最為適用。

3.3結(jié)果表達(dá)和解釋結(jié)果表達(dá)和解釋主要是在數(shù)據(jù)挖掘模型正式應(yīng)用后,將所提取的知識依據(jù)最終用戶的決策目的進(jìn)行分心,并區(qū)分出來最有價值的信息提交給用戶,在這個過程中不僅需要將所獲取的知識數(shù)據(jù)以簡單易懂的形式表現(xiàn)出來,還要逐列檢查數(shù)據(jù)的有效性,一旦無法滿足用戶需求,則應(yīng)重新進(jìn)行數(shù)據(jù)挖掘,構(gòu)建新的應(yīng)用模型。

4數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用實施

數(shù)據(jù)挖掘技術(shù)可應(yīng)用到以客戶為中心的企業(yè)決策分析和管理的各個不同領(lǐng)域和階段,涉及客戶細(xì)分、客戶保持、客戶拓展、交叉銷售等多方面,但所采用的數(shù)據(jù)挖掘技術(shù)存在差異,本文以下兩方面為例來探討數(shù)據(jù)挖掘技術(shù)的應(yīng)用實施:

4.1客戶細(xì)分客戶細(xì)分多選用數(shù)據(jù)挖掘中的決策樹分類算法來進(jìn)行模型的構(gòu)建,并幫助企業(yè)依據(jù)此客戶分類模型策劃不同的應(yīng)用策略,以提升客戶服務(wù)的針對性,具體應(yīng)用過程如下:(1)目標(biāo)變量的確定,本文依據(jù)營銷學(xué)原理,選用客戶購買能力作為目標(biāo)變量,并細(xì)化為三類:較高、一般和較低,并以輸入屬性:客戶名稱、性別、年齡、職業(yè)等為內(nèi)容建立屬性列表,依據(jù)其中根據(jù)客戶信的特定屬性按次排序。(2)確定決策書中的最佳分裂點,首先創(chuàng)建根節(jié)點,且各個屬性列表的數(shù)據(jù)記錄都屬于根節(jié)點,“依照一定次序計算列表屬性的基尼值,選擇合適的分裂點,并以此計算他們的GINI值,選取GINI值最小的選為該屬性列表的最佳分裂點”[4],經(jīng)對比最優(yōu)屬性的最佳分裂點作為根節(jié)點的最佳分裂點,并將屬性列表劃分為兩部分,建立數(shù)的兩分支,并在此基礎(chǔ)上對創(chuàng)建的兩個子節(jié)點進(jìn)行最佳分裂點的確定,直至屬性列表中的數(shù)據(jù)歸屬同類或數(shù)據(jù)個數(shù)很少是,則停止劃分,此時得到的節(jié)點為樹的葉子節(jié)點,應(yīng)用MDL算法剪修決策樹,生成較為準(zhǔn)確的決策樹。(3)客戶分類模型的建立,以所得決策樹種的葉子節(jié)點作為一個獨立的客戶分類,從根節(jié)點至葉子節(jié)點的一條路徑對應(yīng)一條規(guī)則,整個決策樹就可以認(rèn)為是對應(yīng)著的一組客戶分裂表達(dá)式規(guī)則,由此企業(yè)便可很對不同客戶指定差異性營銷策略,精準(zhǔn)尋求目標(biāo)客戶群。

4.2客戶保持市場競爭環(huán)境的不斷能升級,加劇了客戶的流失,本文將利用聚類技術(shù)中的一平均算法來分析客戶保持的應(yīng)用示例,挖掘過程如下:(1)建立客戶服務(wù)評價表從數(shù)據(jù)倉庫中提取客戶服務(wù)數(shù)據(jù),該數(shù)據(jù)主要是有關(guān)客戶的問卷調(diào)查,屬性列表中輸入:客戶ID、服務(wù)內(nèi)容、客戶打分,依據(jù)服務(wù)滿意度從1—5分區(qū)間選擇打分。(2)確定3個點作為簇的中心“依據(jù)客戶服務(wù)內(nèi)容、層次水準(zhǔn)的差異性,依據(jù)不同的戲份市場將其構(gòu)成更加科學(xué)、有效的服務(wù)組合,并將客戶打分?jǐn)?shù)據(jù)輸入聚類模型”[5],設(shè)定K值為3,得出評分函數(shù),并從中隨機(jī)提取3各客戶的打分向量作為初始的簇中心。(3)分析結(jié)果依據(jù)上述結(jié)果可得出具有類似服務(wù)需求的客戶ID,進(jìn)而可將其進(jìn)行聚類分組,以便提供“一對一營銷”的貼心服務(wù),提升客戶的忠誠度。

5結(jié)束語

本文針對企業(yè)客戶關(guān)系管理的需求,給出了數(shù)據(jù)挖掘技術(shù)在其中的應(yīng)用、建模、分析等過程和方法,為有效整合、管理客戶資源,發(fā)現(xiàn)有用信息提供一定的參考,并為提升客戶服務(wù)能力和企業(yè)競爭力奠定基礎(chǔ),但是鑒于企業(yè)信息系統(tǒng)封閉性的顯著,目前研究內(nèi)容具有一定的局限性,仍需后續(xù)不斷完善、發(fā)展。

參考文獻(xiàn)

[1]曹軍.?dāng)?shù)據(jù)挖掘技術(shù)在銀行客戶關(guān)系管理中的應(yīng)用研究[D].湖南大學(xué),2013.

[2]王芳,楊奕.論數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理(CRM)中的應(yīng)用[J].現(xiàn)代商貿(mào)工業(yè),2009,01:350-351.

[3]劉建蘭.?dāng)?shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用研究[D].南昌大學(xué),2010.

[4]趙春.基于數(shù)據(jù)挖掘技術(shù)的財務(wù)風(fēng)險分析與預(yù)警研究[D].北京化工大學(xué),2012.

[5]劉英華,楊炳儒,馬楠,曹丹陽.分布式隱私保護(hù)數(shù)據(jù)挖掘研究[J].計算機(jī)應(yīng)用研究.2011(10).

[6]呂志軍,王照飛,謝福鼎,桑雪.基于FCM聚類的時間序列模糊關(guān)聯(lián)規(guī)則挖掘[J].大連理工大學(xué)學(xué)報.2010(05).

[7]孫亮.對大規(guī)模數(shù)據(jù)集高效數(shù)據(jù)挖掘算法的研究[J].自動化與儀器儀表.2016(03).

[8]陳文鋒.基于統(tǒng)計信息的數(shù)據(jù)挖掘算法[J].統(tǒng)計與決策.2008(15).

篇9

關(guān)鍵詞 數(shù)據(jù)挖掘;市場;零售;應(yīng)用方法

中圖分類號TP311 文獻(xiàn)標(biāo)識碼A 文章編號 1674-6708(2011)34-0117-01

1 數(shù)據(jù)挖掘的概念闡釋

數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中挖掘出隱含的、未知的、用戶可能感興趣的和對對策有潛在價值的知識和規(guī)則。從商業(yè)的角度看,數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點是對商業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。簡而言之,數(shù)據(jù)挖掘其實是一種深層次的數(shù)據(jù)分析方法。數(shù)據(jù)分析本身已經(jīng)有很多年的歷史,過去數(shù)據(jù)收集和分析的目的是用于科學(xué)研究,現(xiàn)在隨著科學(xué)技術(shù)的發(fā)展,它更主要的是為商業(yè)決策提供真正有價值的信息,進(jìn)而獲得利潤。但所有企業(yè)面臨的共同問題是,企業(yè)的數(shù)據(jù)量非常大,而其中真正有價值的信息卻很少。因此,類似于淘金是“數(shù)據(jù)挖掘”應(yīng)運(yùn)而生。所以,數(shù)據(jù)挖掘又可以描述為:一種按企業(yè)既定業(yè)務(wù)目標(biāo),對大量的企業(yè)數(shù)據(jù)進(jìn)行探索和分析,揭示隱藏的、未知的或驗證已知的規(guī)律性,并進(jìn)一步將其模型化得先進(jìn)有效的方法。

2 數(shù)據(jù)挖掘技術(shù)在零售業(yè)的適用性

數(shù)據(jù)挖掘技術(shù)以市場細(xì)分為基礎(chǔ),其基本假定是“消費(fèi)者過去的行為是其今后消費(fèi)傾向的最好說明”。零售業(yè)是數(shù)據(jù)挖掘的主要應(yīng)用領(lǐng)域,這是因為零售業(yè)積累了豐富的銷售數(shù)據(jù)。隨著信息時代的到來,信息量在迅速膨脹,如何更好的利用這些數(shù)據(jù),就成為零售業(yè)面臨的一大難題。

商業(yè)信息來自市場中的各個渠道,數(shù)據(jù)信息從各個渠道中被采集,經(jīng)條件分類,被放到數(shù)據(jù)庫中。這些數(shù)據(jù)被組合,通過超級計算機(jī)、并行處理、神經(jīng)元網(wǎng)絡(luò)、模型化算法和其他信息處理技術(shù)進(jìn)行處理,從中得到商家用于向特定消費(fèi)種群或個體進(jìn)行定向營銷的決策信息。更有甚者,有些發(fā)達(dá)地區(qū)的公司在原有信息系統(tǒng)的基礎(chǔ)上通過數(shù)據(jù)挖掘?qū)I(yè)務(wù)信息進(jìn)行深加工,以構(gòu)筑自己的競爭優(yōu)勢,擴(kuò)大自己的營業(yè)額。

3 數(shù)據(jù)挖掘技術(shù)在零售業(yè)中的應(yīng)用分析

數(shù)據(jù)挖掘就是透過數(shù)據(jù)找出人與物間規(guī)律的典型,現(xiàn)今它主要應(yīng)用于以下幾個方面:

1)商品擺放、購買推薦和商品參照。通過對顧客購買記錄數(shù)據(jù)分析,從中挖掘出商品間的關(guān)聯(lián)規(guī)則,將關(guān)聯(lián)規(guī)則中的商品在同一貨架上擺放,也可以挖掘出商品季節(jié)性的銷費(fèi)數(shù)據(jù),在商品銷售旺盛季節(jié),采取商品推薦等形式進(jìn)行促銷活動;

2)消費(fèi)者分析。根據(jù)顧客的實際購買情況,分析顧客的消費(fèi)傾向和偏好的變化,對消費(fèi)者進(jìn)行分類,確定目標(biāo)群體,優(yōu)化營銷策略,對老顧客采取調(diào)整價格或贈送商品的方式提升顧客的忠誠度,留住老顧客,吸引新顧客;

3)數(shù)據(jù)倉庫的合理設(shè)計。設(shè)計合理的數(shù)據(jù)庫模型對于商家來說是很有必要的。隨著銷售業(yè)務(wù)的增加,數(shù)據(jù)庫的合理性將受到考驗。通過數(shù)據(jù)挖掘系統(tǒng),將銷售數(shù)據(jù)和庫存數(shù)據(jù)結(jié)合起來進(jìn)行分析,以決定商品庫存的增減來盡可能降低成本,提高利潤;

4)了解銷售全局。通過分類信息,按照商品的分類、銷售數(shù)量、價格和日期等了解每天的運(yùn)營和財政狀況,對銷售的增長,庫存的變化以及促銷銷售額了解清楚對零售商店十分重要。零售商店在銷售商品時,要隨時檢查商品結(jié)構(gòu)是否合理,考慮因素包括季節(jié)變化對需求的影響,同行競爭對手的商品結(jié)構(gòu)調(diào)整等因素;

5)市場定位和銷售趨勢分析。利用數(shù)據(jù)挖掘工具和統(tǒng)計模型對數(shù)據(jù)庫的數(shù)據(jù)信息仔細(xì)研究以分析顧客的消費(fèi)習(xí)慣,廣告成功率及其他重要信息。通過對這些信息的挖掘及其分析,預(yù)測商品的需求量,庫存趨勢,確定商品價格等。

4 數(shù)據(jù)挖掘技術(shù)在零售業(yè)中應(yīng)用所面臨的問題

1)目前世界上有多種用于解決所有商業(yè)模式的數(shù)據(jù)挖掘系統(tǒng),但實際上這些系統(tǒng)并不實用,一般用戶很難用這些技術(shù)解決自己的商業(yè)問題。問題在于如何將數(shù)據(jù)挖掘技術(shù)和現(xiàn)有技術(shù)很好的結(jié)合起來,如果不能將特殊領(lǐng)域的商業(yè)邏輯與數(shù)據(jù)庫邏輯結(jié)合起來,數(shù)據(jù)挖掘的分析效果不可能達(dá)到峰值。系統(tǒng)的定位,軟件供應(yīng)商和企業(yè)互相交流,對系統(tǒng)功能的不斷完善和擴(kuò)充可以在一定程度上解決這個問題;

2)數(shù)據(jù)挖掘是一門涉及到多個領(lǐng)域的的交叉學(xué)科,需要由數(shù)據(jù)庫技術(shù)、人工智能技術(shù)、數(shù)理統(tǒng)計、并行計算等各方面的專家共同參與合作解決問題;其又是一個新興學(xué)科,內(nèi)容繁復(fù).從數(shù)據(jù)特征化到挖掘數(shù)據(jù)的關(guān)聯(lián)規(guī)則、數(shù)據(jù)分類、聚集和偏差檢測,每個都有不同的需求。因此數(shù)據(jù)挖掘語言的設(shè)計又是一個巨大的挑戰(zhàn);

3)數(shù)據(jù)挖掘也會帶來一些社會問題如個人隱私、非法數(shù)據(jù)交易、數(shù)據(jù)價值評估等問題,這些深層問題會隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展而越來越突出,這還需要商家的自律、法規(guī)的完善和客戶的共同努力。

參考文獻(xiàn)

篇10

關(guān)鍵詞:數(shù)據(jù)挖掘;人工智能;載體;電子商務(wù)

中圖分類號:TP311.13 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9599 (2011) 23-0000-01

Web Data Mining Technology Applications in Business

Zhang Jing,Zhou Shuchen

(Huanghuai University,International College,Zhumadian 463000,China)

Abstract:Data mining is the most recent years,database technology and artificial intelligence technology with the development and application of the emergence of a new information technology.With a wide range of general computer applications,so as to obtain all aspects of Web information of the most important way.With its excellent Web condition,it occupies a major market.I have Web-based personal computers and relevant information about the introduction of Web data mining through the process of all parties concerned,and the characteristics of the talk,and focused on the technology of Web data mining in the contemporary business applications,especially e-commerce.

Keywords:Data mining;Artificial intelligence;Carrier;E-commerce

一、對Web數(shù)據(jù)挖掘的綜合概述

Web挖掘是從Web資源上抽取所需信息的過程,它是將傳統(tǒng)的數(shù)據(jù)挖掘的思想和方法應(yīng)用于Web。Web數(shù)據(jù)挖掘在很多方面都發(fā)揮著主導(dǎo)作用,如搜索引擎結(jié)構(gòu)的數(shù)據(jù)挖掘,搜索引擎的開發(fā),改進(jìn)和提高搜索引擎的質(zhì)量和效率,確定權(quán)威頁面。Web挖掘研究覆蓋了多個研究領(lǐng)域,包括數(shù)據(jù)庫技術(shù)、信息獲取技術(shù)等。特別是在電子商務(wù)領(lǐng)域,通過對用戶特征的理解和分析,如對用戶訪問行為、頻度、內(nèi)容等的分析,提取出用戶的特征,從而為用戶定制個性化的界面,有助于開展有針對性的電子商務(wù)活動。

二、Web數(shù)據(jù)挖掘的特點

(一)半結(jié)構(gòu)化數(shù)據(jù)。Web頁面以某種格式呈現(xiàn)的半結(jié)構(gòu)化數(shù)據(jù),其數(shù)據(jù)不完整、結(jié)構(gòu)不規(guī)則,復(fù)雜程度與普通文本相比遠(yuǎn)遠(yuǎn)高于普通的文本文檔,其數(shù)據(jù)結(jié)構(gòu)隱含、模式信息量大、模式變化快。大量的文檔無任何排列次序,無分類索引。

(二)Web是一個異質(zhì)、分布、動態(tài)的信息源。Web及其數(shù)據(jù)無固定的模式且更新、增長速度極快。Web上的信息幾乎都是隱藏的、潛在的、未知的,從Web上發(fā)現(xiàn)這些未知的信息和有用的模式,僅用傳統(tǒng)的基于關(guān)鍵字的檢索方式很難實現(xiàn),現(xiàn)在的搜索引擎尚不具備這些功能。

(三)面對一個非常廣泛不同類型的用戶群體,不同的用戶對訪問Web的愛好和使用目的各不相同,根據(jù)不同的用戶,能否使用戶根據(jù)自己的愛好興趣定制網(wǎng)頁,甚至能否根據(jù)發(fā)現(xiàn)的用戶自動為用戶定制網(wǎng)頁,從而提供個性化的信息檢索和查詢服務(wù)。

三、Web數(shù)據(jù)在電子商務(wù)中的挖掘過程

(一)數(shù)據(jù)預(yù)處理。它包括數(shù)據(jù)清理、用戶識別、用戶會話識別、訪問路徑補(bǔ)充和事務(wù)識別等步驟。數(shù)據(jù)清洗的目的是刪除Web日志中與數(shù)據(jù)不相關(guān)的冗余項,縮小被挖掘數(shù)據(jù)對象的范圍。在數(shù)據(jù)凈化后就必須確定單一的用戶,用戶識別的目的就是對用戶惟一性的識別。

(二)模式識別。通常對即將處理之后的數(shù)據(jù)進(jìn)行處理進(jìn)而得到相應(yīng)的事務(wù)數(shù)據(jù)庫。在事務(wù)數(shù)據(jù)庫的基礎(chǔ)上度數(shù)據(jù)進(jìn)行挖掘,總的來說需要進(jìn)行一下兩個方面的工作:其一將事務(wù)數(shù)據(jù)庫進(jìn)行整理使之變換成與一定挖掘技術(shù)相適應(yīng)的數(shù)據(jù)存儲形式;其二利用數(shù)據(jù)挖掘算法挖掘出更加有效的、新奇的、潛在的、有用的且可以進(jìn)行實際研究的信息和知識??捎糜赪eb的挖掘技術(shù)有路徑選擇、關(guān)聯(lián)、分析、分類規(guī)則、聚類分析、序列分析、依靠性建模等。

(三)模式分析。該階段的主要任務(wù)是從上一階段收集的數(shù)據(jù)集中過濾掉不喜歡的或無關(guān)聯(lián)的數(shù)據(jù)及模式,進(jìn)而發(fā)現(xiàn)有趣模式。最常見的模式分析方法是SQL語言知識查詢機(jī)制,也可以利用存儲Web使用數(shù)據(jù)的數(shù)據(jù)庫進(jìn)行數(shù)據(jù)導(dǎo)入,再利用OLAP方法發(fā)現(xiàn)數(shù)據(jù)中的特定模式結(jié)果。

(四)可視化。主要是采用可視化的技術(shù)以圖形界面的方式表示挖掘的成果。

四、Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用

(一)挽留老顧客。挖掘潛力在于客戶通過Web挖掘,電子商務(wù)的經(jīng)營者可以獲的每位訪問者的個人信息,充分地了解客戶各方面的需要,然后根據(jù)每一類顧客的獨特需求向他們提供特定的產(chǎn)品,并根據(jù)需求動態(tài)地向客戶做頁面推薦,從而調(diào)整Web頁面,提高客戶對所需產(chǎn)品的滿意度,延長客戶在網(wǎng)頁的駐留時間,最終達(dá)到留住客戶的目的。通過Web日志記錄的充分挖掘,首先可以對已經(jīng)存在的訪問者進(jìn)行分類,然后從所分的類別中判定出某個新客戶是否是潛在的客戶。

(二)制定產(chǎn)品營銷策略,優(yōu)化促銷活動。通過對商品訪問情況和銷售情況進(jìn)行挖掘,企業(yè)能夠準(zhǔn)確的獲得客戶的訪問規(guī)律,確定顧客進(jìn)行消費(fèi)的生命周期,然后根據(jù)當(dāng)前市場需求的變化,針對不同的產(chǎn)品制定相應(yīng)的營銷策略。

(三)降低運(yùn)營成本,提高企業(yè)競爭力。電子商務(wù)的經(jīng)營者通過Web數(shù)據(jù)挖掘,可以獲得可靠的客戶對產(chǎn)品的反饋信息,認(rèn)真分析消費(fèi)者的將來消費(fèi)動向,進(jìn)行有針對性的電子商務(wù)營銷活動,還可以根據(jù)客戶對某產(chǎn)品瀏覽模式和訪問次數(shù)來設(shè)置廣告的位置,進(jìn)而增加了廣告的針對性,提高廣告的投資回收率,從而降低運(yùn)營成本,提高企業(yè)競爭力。

五、結(jié)束語

隨著計算機(jī)技術(shù)的迅發(fā)展和Internet資源的快速增長,特別是電子商務(wù)的興起,Web挖掘成為二十一世紀(jì)的熱門研究領(lǐng)域之一,其研究具有更加廣闊的應(yīng)用前景和巨大的現(xiàn)實意義。就目前國內(nèi)的Web挖掘看還尚處于學(xué)習(xí)、跟蹤和探索階段,Web挖掘有許多問題有待于進(jìn)一步的研究和深化,希望未來的發(fā)展能更好的服務(wù)于社會。

參考文獻(xiàn):

[1]凌傳繁.Web挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].情報雜志,2006

[2]郝先臣.基于電子商務(wù)中的數(shù)據(jù)挖掘技術(shù)研究[M].小型微型計算機(jī)系統(tǒng),2007

[3]韓家煒.王靜Web挖掘研究[J].計算機(jī)研究與發(fā)展,2006