時(shí)間:2022-07-23 10:06:02
序論:在您撰寫(xiě)電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的運(yùn)用時(shí),參考他人的優(yōu)秀作品可以開(kāi)闊視野,小編為您整理的1篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。
1數(shù)據(jù)挖掘過(guò)程
在電子商務(wù)進(jìn)行應(yīng)用的數(shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn)過(guò)程大致要?jiǎng)澐譃槿齻€(gè)不同的階段:第一部分對(duì)需要挖掘的數(shù)據(jù)信息的準(zhǔn)備階段,第二部分對(duì)數(shù)據(jù)信息的挖掘階段,第三部分的主要任務(wù)是對(duì)數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋與評(píng)價(jià).
1.1數(shù)據(jù)信息的準(zhǔn)備準(zhǔn)備部分又可以分成數(shù)據(jù)的選取、數(shù)據(jù)信息的預(yù)處理.對(duì)數(shù)據(jù)進(jìn)行選取的主要目的就是對(duì)操作對(duì)象進(jìn)行確定,即是對(duì)目標(biāo)數(shù)據(jù)進(jìn)行確定,所謂的目標(biāo)數(shù)據(jù)是在經(jīng)過(guò)對(duì)用戶的需要進(jìn)行細(xì)致分析之后,對(duì)最有可能得到有利用價(jià)值的信息的那些從數(shù)據(jù)庫(kù)中抽取出來(lái)的數(shù)據(jù).獲取到這些數(shù)據(jù)以后需要進(jìn)行預(yù)處理,主要包含數(shù)據(jù)的去噪、計(jì)算缺值數(shù)據(jù)的推導(dǎo)、數(shù)據(jù)類型的轉(zhuǎn)換,數(shù)據(jù)類型轉(zhuǎn)換舉個(gè)例子來(lái)說(shuō)比如把連續(xù)型數(shù)據(jù)轉(zhuǎn)化成離散數(shù)據(jù),以方便進(jìn)行符號(hào)的歸納.
1.2挖掘過(guò)程數(shù)據(jù)信息的挖掘階段是在上一步的基礎(chǔ)之上,即在目標(biāo)數(shù)據(jù)已經(jīng)確定,并且已經(jīng)完成了初始化的基礎(chǔ)之上,需要確定數(shù)據(jù)挖掘的目的與挖掘的類型.在對(duì)挖掘任務(wù)的目標(biāo)確定之后,要根據(jù)數(shù)據(jù)挖掘的知識(shí)類型選取合適的數(shù)據(jù)挖掘方法,最終完成數(shù)據(jù)挖掘具體操作即采用特定的數(shù)據(jù)挖掘方法從數(shù)據(jù)倉(cāng)庫(kù)中抽取所需的挖掘目標(biāo).
1.3挖掘結(jié)果的解釋和評(píng)價(jià)數(shù)據(jù)挖掘的結(jié)果的解釋和評(píng)價(jià)是在完成數(shù)據(jù)挖掘階段之后對(duì)發(fā)現(xiàn)的知識(shí),進(jìn)行評(píng)估,對(duì)于冗余或者無(wú)關(guān)的知識(shí)要進(jìn)行刪除;對(duì)于獲得的知識(shí)不符合用戶的要求的要進(jìn)行重新的挖掘.與此同時(shí),因?yàn)閿?shù)據(jù)挖掘需要面臨用戶,所以,在得到目標(biāo)知識(shí)以后還需要對(duì)所挖掘的知識(shí)附加相關(guān)解釋,來(lái)用一種便于用戶理解的方式供用戶使用.綜上所述,整個(gè)數(shù)據(jù)信息的挖掘在實(shí)際情況下是一個(gè)不斷地循環(huán)與反復(fù)的過(guò)程,所以要對(duì)所挖掘出來(lái)的知識(shí)不斷求精和深化,最終要獲得用戶所需要的結(jié)果.
2電子商務(wù)中數(shù)據(jù)挖掘的特點(diǎn)
由于電子商務(wù)自身的某些獨(dú)特的特點(diǎn),同其他的應(yīng)用于普通商業(yè)領(lǐng)域中的數(shù)據(jù)挖掘相比,應(yīng)用于電子商務(wù)的數(shù)據(jù)挖掘具有如下幾個(gè)特點(diǎn):(1)應(yīng)用于電子商務(wù)的數(shù)據(jù)挖掘的最終目的主要表現(xiàn)在企業(yè)與客戶之間的關(guān)系管理方面,電子商務(wù)利用因特網(wǎng)的技術(shù)能夠使企業(yè)和客戶之間的關(guān)系處理變得更加方便.所以,其主要的功能是怎樣使企業(yè)采用這些頻繁的交流信息,快速的掌握客戶的趨向、改善與客戶交流情況或者獲取交流方向等;(2)電子商務(wù)本身就是一個(gè)信息化程度比較高的系統(tǒng),其自身累積的數(shù)據(jù)信息會(huì)存放在電子商務(wù)數(shù)據(jù)庫(kù)內(nèi),用戶可以比較便捷地得到這些信息,所以對(duì)于電子商務(wù)的數(shù)據(jù)挖掘的數(shù)據(jù)信息的準(zhǔn)備階段的相關(guān)工作就變得相對(duì)容易;(3)電子商務(wù)領(lǐng)域的數(shù)據(jù)挖掘的主要目標(biāo)一般是使電子商務(wù)系統(tǒng)得到有效的改進(jìn).例如為客戶提供個(gè)性化頁(yè)面、把用戶比較感興趣的信息展現(xiàn)在網(wǎng)站首頁(yè)或得到哪一些商品比較受到客戶的歡迎等.
3電子商務(wù)中的數(shù)據(jù)挖掘運(yùn)用
首先要講的是關(guān)聯(lián)規(guī)則在電子商務(wù)中的運(yùn)用,利用比較通俗的語(yǔ)言來(lái)講,從一個(gè)事件的發(fā)生與否方面進(jìn)行解釋,所謂的關(guān)聯(lián)規(guī)則法在大量的事件發(fā)生或者不發(fā)生的條件下,對(duì)這些事件中的任意兩個(gè)或者多個(gè)事件提取出來(lái),通過(guò)一定的統(tǒng)計(jì)分析算法,最終確定兩個(gè)或者多個(gè)事件的發(fā)生與否是否存在著某種關(guān)系,而這種可能存在的管理,我們稱之為關(guān)聯(lián)規(guī)則.列舉一個(gè)有趣的故事,就是在一個(gè)超市里面,店家把小孩的尿布同啤酒放到了一起,來(lái)供購(gòu)買者進(jìn)行購(gòu)買,結(jié)果是二者的銷量都提升了一倍,其實(shí)這就是因?yàn)槎咧g有著某種潛在聯(lián)系,店家通過(guò)數(shù)據(jù)挖掘的方法發(fā)現(xiàn)的這個(gè)規(guī)則,并對(duì)這一關(guān)聯(lián)規(guī)則進(jìn)行了實(shí)際的運(yùn)用,從中得到了益處.同樣在電子商務(wù)中通過(guò)數(shù)據(jù)挖掘得到關(guān)聯(lián)規(guī)則,有著類似的意義.其次在電子商務(wù)中數(shù)據(jù)挖掘聚類分析方法的應(yīng)用.在大量數(shù)據(jù)倉(cāng)庫(kù)中,數(shù)據(jù)與數(shù)據(jù)之間,往往會(huì)有某些性質(zhì)的類型相似,同樣也會(huì)有某些性質(zhì)或者特點(diǎn)相異,我們把這些性質(zhì)或者特點(diǎn)稱為觀察指標(biāo),聚類分析就是對(duì)于某一個(gè)特點(diǎn)指標(biāo)而言,把指標(biāo)相差不多的數(shù)據(jù)劃分為同一個(gè)類型,若相差較大則要?jiǎng)澐譃椴煌念愋?、這種操作的主要意義就是將具有某種特定的相似特性的客戶或者數(shù)據(jù)分成一個(gè)類.在電子商務(wù)活動(dòng)中,這一方法的應(yīng)用主要集中在市場(chǎng)細(xì)分的工作之中.分類分析系統(tǒng)的建立以生物的遺傳算法為基礎(chǔ),屬于其中的自學(xué)習(xí)的一種,它一般會(huì)包含三個(gè)子系統(tǒng),第一個(gè)是以串規(guī)則為基礎(chǔ)的并行生成子系統(tǒng)、第二個(gè)是規(guī)則評(píng)價(jià)子系統(tǒng).第三個(gè)是遺傳算法子系統(tǒng).分類分析可以說(shuō)是電子商務(wù)中運(yùn)用到數(shù)據(jù)挖掘最多的一種挖掘方式.主要原因就是在于其能夠形成一種預(yù)測(cè)模型能夠?qū)σ恍I(yíng)銷方式或者其他的一些商業(yè)措施做出正確的預(yù)測(cè).
4數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用
更高效的利用企業(yè)現(xiàn)有資源以及開(kāi)發(fā)新資源是當(dāng)代企業(yè)發(fā)展的關(guān)鍵.電子商務(wù)通過(guò)采用數(shù)據(jù)挖掘的技術(shù),能夠更加及時(shí)和正確的獲得企業(yè)當(dāng)前所有資源的具體使用情況,而且通過(guò)數(shù)據(jù)挖掘的技術(shù)可以分析以往的各種企業(yè)數(shù)據(jù),比如說(shuō)企業(yè)財(cái)務(wù)數(shù)據(jù)、企業(yè)庫(kù)存數(shù)據(jù)或者企業(yè)交易數(shù)據(jù),能夠較為及時(shí)的發(fā)現(xiàn)企業(yè)資源過(guò)度消耗的主要問(wèn)題所在,或者能夠得到各種商務(wù)活動(dòng)的投入與產(chǎn)出的比例,來(lái)為企業(yè)領(lǐng)導(dǎo)進(jìn)行經(jīng)營(yíng)決策提供有力的根據(jù)[6].另外在企業(yè)的經(jīng)營(yíng)過(guò)程中,人們不斷推崇“以客戶為中心”的經(jīng)營(yíng)理念,在這一趨勢(shì)下,如何正確快速的分析和了解客戶的需求已成為企業(yè)提高自身市場(chǎng)競(jìng)爭(zhēng)力的一大課題.通過(guò)把數(shù)據(jù)挖掘應(yīng)用到電子商務(wù)之中,能夠使企業(yè)最準(zhǔn)確的分析客戶資源并最有效的利用企業(yè)客戶資源,通過(guò)對(duì)已有客戶行為進(jìn)行相關(guān)性分析,可以形成潛在客戶資源的預(yù)測(cè)模型.除此之外在企業(yè)經(jīng)營(yíng)過(guò)程中,利用數(shù)據(jù)挖掘可以解決另外一個(gè)嚴(yán)重影響了商業(yè)正常秩序的重要問(wèn)題.即當(dāng)前時(shí)區(qū)商務(wù)活動(dòng)中的地下的信用狀況問(wèn)題,這一問(wèn)題的嚴(yán)重程度已經(jīng)引起了人們的廣泛關(guān)注.在電子商務(wù)經(jīng)營(yíng)過(guò)程中,因?yàn)榫W(wǎng)上詐騙公司或者企業(yè)財(cái)務(wù)的現(xiàn)象屢見(jiàn)不鮮,信用危機(jī)已經(jīng)成為影響其快速正常發(fā)展的一個(gè)重要因素.而通過(guò)在電子商務(wù)中采用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)對(duì)企業(yè)經(jīng)營(yíng)活動(dòng)的跟蹤,在此基礎(chǔ)上實(shí)現(xiàn)企業(yè)的資產(chǎn)評(píng)估、利潤(rùn)收益分析以及發(fā)展?jié)摿︻A(yù)測(cè)分析等,為電子商務(wù)在經(jīng)營(yíng)過(guò)程中提供了完善的安全保障體系,同時(shí)利用數(shù)據(jù)挖掘?qū)崿F(xiàn)企業(yè)網(wǎng)上全程監(jiān)控.另外通過(guò)實(shí)現(xiàn)基于數(shù)據(jù)挖掘的信用評(píng)估模型,可以在很大程度上進(jìn)行防范或者化解信用風(fēng)險(xiǎn),從而提高企業(yè)的信用度以及應(yīng)對(duì)風(fēng)險(xiǎn)能力.
5結(jié)束語(yǔ)
電子商務(wù)是而今信息化時(shí)代進(jìn)步的產(chǎn)物,在未來(lái)的幾年內(nèi)電子商務(wù)必將會(huì)成為商業(yè)中存在的主要運(yùn)營(yíng)模式.隨著時(shí)間的積累,各種電子商務(wù)都會(huì)得到巨大的數(shù)據(jù)信息資源,這也是數(shù)據(jù)挖掘在電子商務(wù)中應(yīng)用的基本條件.從另外一方面而言,隨著數(shù)據(jù)挖掘在電子商務(wù)方面中的不斷深入研究與發(fā)展,已經(jīng)能夠向電子商務(wù)系統(tǒng)提供必不可少的技術(shù)支持,促進(jìn)了電子商務(wù)的發(fā)展與普及。
作者:張莉單位:合肥工業(yè)大學(xué)淮北職業(yè)技術(shù)學(xué)院
[摘要]電子商務(wù)的廣泛應(yīng)用使企業(yè)產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),按企業(yè)既定業(yè)務(wù)目標(biāo)對(duì)這些數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘可以幫助企業(yè)分析出完成任務(wù)所需的關(guān)鍵因素。文章介紹了數(shù)據(jù)挖掘技術(shù),以實(shí)例分析了數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用,并介紹了在電子商務(wù)中如何應(yīng)用數(shù)據(jù)挖掘技術(shù)。
[關(guān)鍵詞]電子商務(wù);數(shù)據(jù)挖掘;路徑分析
隨著Internet的普及,電子商務(wù)的興起,人們的商務(wù)理念正在改變,電子商務(wù)的廣泛應(yīng)用使企業(yè)產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),如何更快、更好地利用各種有效的數(shù)據(jù)更好地開(kāi)展電子商務(wù),這是目前電子商務(wù)急需解決的問(wèn)題。
一、數(shù)據(jù)挖掘技術(shù)
20世紀(jì)90年代以來(lái),隨著信息技術(shù)和數(shù)據(jù)庫(kù)技術(shù)的迅猛發(fā)展,人們可以非常方便地獲取和存儲(chǔ)大量的數(shù)據(jù)。面對(duì)大規(guī)模的海量的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)分析工具(如管理信息系統(tǒng))只能進(jìn)行一些表層的處理(如查詢、統(tǒng)計(jì)等),而不能獲得數(shù)據(jù)之間的內(nèi)在關(guān)系和隱含的信息。為了擺脫“數(shù)據(jù)豐富,知識(shí)貧乏”的困境,人們迫切需要一種能夠智能地自動(dòng)地把數(shù)據(jù)轉(zhuǎn)換成有用信息和知識(shí)的技術(shù)和工具,這種對(duì)強(qiáng)有力數(shù)據(jù)分析工具的迫切需求使得數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。人們認(rèn)識(shí)到數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)據(jù)量急劇增大,在大量的數(shù)據(jù)背后隱藏著許多重要的信息,如果能把這些信息從數(shù)據(jù)庫(kù)中抽取出來(lái),將為公司創(chuàng)造很多潛在的利潤(rùn)。這種從海量數(shù)據(jù)庫(kù)中挖掘信息的技術(shù),就稱之為數(shù)據(jù)挖掘。數(shù)據(jù)挖掘一般有以下四類主要任務(wù):
(一)數(shù)據(jù)總結(jié)
數(shù)據(jù)挖掘能夠?qū)?shù)據(jù)庫(kù)中的有關(guān)數(shù)據(jù)從較低的個(gè)體層次抽象總結(jié)到較高的總體層次上,從而實(shí)現(xiàn)對(duì)原始基本數(shù)據(jù)的總體把握。
(二)分類
分析數(shù)據(jù)的各種屬性,并找出數(shù)據(jù)的屬性模型,確定哪些數(shù)據(jù)屬于哪些組。這樣我們就可以利用該模型來(lái)分析已有數(shù)據(jù),并預(yù)測(cè)新數(shù)據(jù)將屬于哪一個(gè)組。
(三)關(guān)聯(lián)分析
數(shù)據(jù)庫(kù)中的數(shù)據(jù)一般都存在著關(guān)聯(lián)關(guān)系,也就是說(shuō),兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性。通過(guò)挖掘數(shù)據(jù)派生關(guān)聯(lián)規(guī)則,可以了解客戶的行為。
(四)聚類
聚類分析是按照某種相近程度度量方法,將用戶數(shù)據(jù)分成一系列有意義的子集合。每一個(gè)集合中的數(shù)據(jù)性質(zhì)相近,不同集合之間的數(shù)據(jù)性質(zhì)相差較大。
數(shù)據(jù)挖掘的特點(diǎn)和性質(zhì)對(duì)于企業(yè)而言,有助于發(fā)現(xiàn)其企業(yè)業(yè)務(wù)發(fā)展的趨勢(shì),揭示已知的事實(shí),預(yù)測(cè)未知的結(jié)果,并幫助企業(yè)分析出完成任務(wù)所需的關(guān)鍵因素,以達(dá)到增加收入,降低成本,使企業(yè)處于更有利的競(jìng)爭(zhēng)位置的目的。
二、數(shù)據(jù)挖掘在電子商務(wù)中的作用
數(shù)據(jù)挖掘技術(shù)源于商業(yè)的直接需求,因此它在各種商業(yè)領(lǐng)域都存在廣泛的使用價(jià)值。電子商務(wù)是商業(yè)領(lǐng)域的一種新興商務(wù)模式,是指利用電子信息技術(shù)開(kāi)展一切商務(wù)活動(dòng)。當(dāng)電子商務(wù)在企業(yè)中得到應(yīng)用時(shí),企業(yè)信息系統(tǒng)將產(chǎn)生大量數(shù)據(jù),這些海量數(shù)據(jù)使數(shù)據(jù)挖掘有了豐富的數(shù)據(jù)基礎(chǔ),同時(shí)高性能計(jì)算機(jī)和高傳輸速率網(wǎng)絡(luò)的使用也給數(shù)據(jù)挖掘技術(shù)提供了堅(jiān)實(shí)的保障。因此數(shù)據(jù)挖掘技術(shù)在電子商務(wù)活動(dòng)中有了更大的用武之地。下面介紹數(shù)據(jù)挖掘在以下電子商務(wù)幾個(gè)方面的作用:
(一)客戶細(xì)分
隨著“以客戶為中心”的經(jīng)營(yíng)理念的不斷深入人心,分析客戶、了解客戶并引導(dǎo)客戶的需求已成為企業(yè)經(jīng)營(yíng)的重要課題。通過(guò)對(duì)電子商務(wù)系統(tǒng)收集的交易數(shù)據(jù)進(jìn)行分析,可以按各種客戶指標(biāo)(如自然屬性、收入貢獻(xiàn)、交易額、價(jià)值度等)對(duì)客戶分類,然后確定不同類型客戶的行為模式,以便采取相應(yīng)的營(yíng)銷措施,促使企業(yè)利潤(rùn)的最大化。
(二)客戶獲得
利用數(shù)據(jù)挖掘可以有效地獲得客戶。比如通過(guò)數(shù)據(jù)挖掘可以發(fā)現(xiàn)購(gòu)買某種商品的消費(fèi)者是男性還是女性,學(xué)歷、收入如何,有什么愛(ài)好,是什么職業(yè)等等。甚至可以發(fā)現(xiàn)不同的人在購(gòu)買該種商品的相關(guān)商品后多長(zhǎng)時(shí)間有可能購(gòu)買該種商品,以及什么樣的人會(huì)購(gòu)買什么型號(hào)的該種商品等等。也許很多因素表面上看起來(lái)和購(gòu)買該種商品不存在任何聯(lián)系,但數(shù)據(jù)挖掘的結(jié)果卻證明它們之間有聯(lián)系。在采用了數(shù)據(jù)挖掘后,針對(duì)目標(biāo)客戶發(fā)送的廣告的有效性和回應(yīng)率將得到大幅度的提高,推銷的成本將大大降低。
(三)客戶保持
數(shù)據(jù)挖掘可以把你大量的客戶分成不同的類,在每個(gè)類里的客戶擁有相似的屬性,而不同類里的客戶的屬性也不同。你完全可以做到給不同類的客戶提供完全不同的服務(wù)來(lái)提高客戶的滿意度。數(shù)據(jù)挖掘還可以發(fā)現(xiàn)具有哪些特征的客戶有可能流失,這樣挽留客戶的措施將具有針對(duì)性,挽留客戶的費(fèi)用將下降。
(四)交叉銷售
交叉銷售可以使企業(yè)比較容易地得到關(guān)于客戶的豐富的信息,而這些大量的數(shù)據(jù)對(duì)于數(shù)據(jù)挖掘的準(zhǔn)確性來(lái)說(shuō)是有很大幫助的。在企業(yè)所掌握的客戶信息,尤其是以前購(gòu)買行為的信息中,可能正包含著這個(gè)客戶決定他下一個(gè)購(gòu)買行為的關(guān)鍵,甚至決定因素。這個(gè)時(shí)候數(shù)據(jù)挖掘的作用就會(huì)體現(xiàn)出來(lái),它可以幫助企業(yè)尋找到這些影響他購(gòu)買行為的因素。
(五)個(gè)性服務(wù)
當(dāng)客戶在電子商務(wù)網(wǎng)站注冊(cè)時(shí),客戶將會(huì)看到帶有客戶姓名的歡迎詞。根據(jù)客戶的訂單紀(jì)錄,系統(tǒng)可以向客戶顯示那些可能引起客戶特殊興趣的新商品。當(dāng)客戶注意到一件特殊的商品時(shí),系統(tǒng)會(huì)建議一些在購(gòu)買中可以增加的其他商品。普通的產(chǎn)品目錄手冊(cè)常常簡(jiǎn)單地按類型對(duì)商品進(jìn)行分組,以簡(jiǎn)化客戶挑選商品的步驟。然而對(duì)于在線商店,商品分組可能是完全不同的,它常常以針對(duì)客戶的商品補(bǔ)充條目為基礎(chǔ)。不僅考慮客戶看到的條目,而且還考慮客戶購(gòu)物籃中的商品。使用數(shù)據(jù)挖掘技術(shù)可以使推薦更加個(gè)性化。
(六)資源優(yōu)化
節(jié)約成本是企業(yè)盈利的關(guān)鍵。通過(guò)分析歷史的財(cái)務(wù)數(shù)據(jù)、庫(kù)存數(shù)據(jù)和交易數(shù)據(jù),可以發(fā)現(xiàn)企業(yè)資源消耗的關(guān)鍵點(diǎn)和主要活動(dòng)的投入產(chǎn)出比例,從而為企業(yè)資源優(yōu)化配置提供決策依據(jù),例如降低庫(kù)存、提高庫(kù)存周轉(zhuǎn)率、提高資金使用率等。
(七)異常事件的確定
在許多商業(yè)領(lǐng)域中,異常事件具有顯著的商業(yè)價(jià)值,如客戶流失、銀行的信用卡欺詐、電信中移動(dòng)話費(fèi)拖欠等。通過(guò)數(shù)據(jù)挖掘中的奇異點(diǎn)分析可以迅速準(zhǔn)確地甄別這些異常事件。
由此可見(jiàn)數(shù)據(jù)挖掘在電子商務(wù)中有著重要的作用。在生活中采用數(shù)據(jù)挖掘的成功的例子很多。例如總部位于美國(guó)阿肯色州的WalMart零售商的“尿布與啤酒”的故事。WalMart擁有世界上最大的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),它利用數(shù)據(jù)挖掘工具對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的原始交易數(shù)據(jù)進(jìn)行分析,得到了一個(gè)意外發(fā)現(xiàn):跟尿布一起購(gòu)買最多的商品竟然是啤酒。如果不是借助于數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘,商家決不可能發(fā)現(xiàn)這個(gè)隱藏在背后的事實(shí):在美國(guó),一些年輕的父親下班后經(jīng)常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時(shí)也為自己買一些啤酒。有了這個(gè)發(fā)現(xiàn)后,超市調(diào)整了貨架的擺放,把尿布和啤酒放在一起,明顯增加了銷售額。
三、電子商務(wù)中如何應(yīng)用數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘在電子商務(wù)中有廣泛的應(yīng)用。那么在電子商務(wù)中是如何應(yīng)用數(shù)據(jù)挖掘技術(shù)的?
首先,從挖掘過(guò)程說(shuō),對(duì)在線訪問(wèn)客戶數(shù)據(jù)的挖掘主要有兩部分:一部分是客戶訪問(wèn)信息的挖掘,另一部分是客戶登記信息的挖掘。面對(duì)大量的訪問(wèn)日志,首先要做的就是對(duì)數(shù)據(jù)進(jìn)行清洗,即預(yù)處理,把無(wú)關(guān)的數(shù)據(jù),不重要的數(shù)據(jù)等處理掉;接著對(duì)數(shù)據(jù)進(jìn)行事務(wù)識(shí)別,通過(guò)對(duì)事務(wù)進(jìn)行劃分后,就可以根據(jù)具體的分析需求選擇模式發(fā)現(xiàn)的技術(shù),如路徑分析、興趣關(guān)聯(lián)規(guī)則、聚類等。通過(guò)模式分析,找到有用的信息,再通過(guò)聯(lián)機(jī)分析(OLAP)的驗(yàn)證,結(jié)合客戶登記信息,找出有價(jià)值的市場(chǎng)信息,或發(fā)現(xiàn)潛在的市場(chǎng)。
其次,挖掘方法主要有以下幾種:
1.路徑分析
路徑分析是一種找尋頻繁訪問(wèn)路徑的方法,它通過(guò)對(duì)Web服務(wù)器的日志文件中客戶訪問(wèn)站點(diǎn)的訪問(wèn)次數(shù)分析,挖掘出頻繁訪問(wèn)路徑。例如:一客戶從某一站點(diǎn)訪問(wèn)到某一感興趣的頁(yè)面后就會(huì)經(jīng)常訪問(wèn)該頁(yè)面,通過(guò)路徑分析確定頻繁訪問(wèn)路徑,可以了解客戶對(duì)哪些頁(yè)面感興趣,(下轉(zhuǎn)第78頁(yè))(上接第80頁(yè))從而更好地改進(jìn)設(shè)計(jì),為客戶服務(wù)。
2.興趣關(guān)聯(lián)規(guī)則
當(dāng)客戶訪問(wèn)某一網(wǎng)頁(yè)時(shí),一般會(huì)通過(guò)興趣詞條找出相關(guān)的興趣網(wǎng)頁(yè)通過(guò)鏈接繼續(xù)訪問(wèn),這種關(guān)聯(lián)產(chǎn)生的數(shù)據(jù)如果能夠按照某種策略進(jìn)行挖掘分析,統(tǒng)計(jì)出客戶訪問(wèn)某些頁(yè)面及興趣關(guān)聯(lián)頁(yè)面的比率,就可以很好地組織站點(diǎn),實(shí)施有效的市場(chǎng)策略。
3.聚類分析
聚類分析是電子商務(wù)中很重要的一個(gè)方面,通過(guò)分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,更好地幫助電子商務(wù)的用戶了解自己的客戶,向客戶提供更合適的服務(wù)。如通過(guò)對(duì)眾多的瀏覽“camera”網(wǎng)頁(yè)的客戶分析,發(fā)現(xiàn)在該網(wǎng)頁(yè)上經(jīng)?;ㄒ欢螘r(shí)間瀏覽的客戶,再通過(guò)對(duì)這部分客戶的登記資料分析,知道這些客戶是潛在要買相機(jī)的客戶群體。就可以調(diào)整“camera”網(wǎng)頁(yè)的內(nèi)容和風(fēng)格,以適應(yīng)客戶的需要。
通過(guò)以上幾種數(shù)據(jù)分析的方法可以有效地對(duì)電子商務(wù)中的信息進(jìn)行分析,從而更有效地開(kāi)展電子商務(wù)。
目前,數(shù)據(jù)挖掘技術(shù)正以前所未有的速度發(fā)展,并且擴(kuò)大著用戶群體,在未來(lái)越來(lái)越激烈的市場(chǎng)競(jìng)爭(zhēng)中,擁有數(shù)據(jù)挖掘技術(shù)必將比別人獲得更快速的反應(yīng),贏得更多的商業(yè)機(jī)會(huì)?,F(xiàn)在世界上的主要數(shù)據(jù)庫(kù)廠商紛紛開(kāi)始把數(shù)據(jù)挖掘功能集成到自己的產(chǎn)品中,加快數(shù)據(jù)挖掘技術(shù)的發(fā)展。我國(guó)在這一領(lǐng)域正處在研究開(kāi)發(fā)階段,加快研究數(shù)據(jù)挖掘技術(shù),并把它應(yīng)用于電子商務(wù)中,應(yīng)用到更多行業(yè)中,勢(shì)必會(huì)有更好的商業(yè)機(jī)會(huì)和更光明的前景。
摘要:本文從浙江電子商務(wù)發(fā)展概況出發(fā),介紹了數(shù)據(jù)挖掘技術(shù),分析了數(shù)據(jù)挖掘技術(shù)在浙江電子商務(wù)中應(yīng)用的可行性。
關(guān)鍵詞:數(shù)據(jù)挖掘;浙江;電子商務(wù)
當(dāng)前,電子商務(wù)正在全國(guó)范圍內(nèi)迅猛發(fā)展,隨著國(guó)務(wù)院《關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動(dòng)的指導(dǎo)意見(jiàn)》、《關(guān)于大力發(fā)展電子商務(wù)加快培育經(jīng)濟(jì)新動(dòng)力的意見(jiàn)》等一系列的政策落地,“農(nóng)村電商、跨境電商、行業(yè)電商”等多種電商模式迎來(lái)了重要發(fā)展機(jī)遇。浙江的電子商務(wù)起步早、發(fā)展快、創(chuàng)新性強(qiáng),在全國(guó)電商市場(chǎng)里名列前茅,已經(jīng)成為浙江經(jīng)濟(jì)發(fā)展重要的增長(zhǎng)極,產(chǎn)生了巨大的經(jīng)濟(jì)效應(yīng)和社會(huì)效應(yīng)。
1浙江電子商務(wù)發(fā)展概況
1.1電商服務(wù)發(fā)達(dá)
2015年浙江省實(shí)現(xiàn)網(wǎng)絡(luò)零售額7610.62億元,同比增長(zhǎng)49.9%,總量居全國(guó)第二位,超額完成“十二五”規(guī)劃目標(biāo)。網(wǎng)絡(luò)零售額與社會(huì)消費(fèi)品零售總額比值達(dá)38%,遠(yuǎn)遠(yuǎn)高于全國(guó)約15%的水平。各類電子商務(wù)市場(chǎng)主體蓬勃發(fā)展,擁有各類活躍網(wǎng)店100多萬(wàn)家,天貓網(wǎng)店近2.5萬(wàn)家,跨境電商經(jīng)營(yíng)主體近4萬(wàn)個(gè),電商服務(wù)企業(yè)3000家左右,其中規(guī)模以上電子商務(wù)服務(wù)企業(yè)約1000家;建有電商產(chǎn)業(yè)基地204個(gè);電子商務(wù)帶動(dòng)直接就業(yè)超過(guò)200萬(wàn)人。
1.2線上線下高度融合
浙江是制造業(yè)大省,也是電子商務(wù)大省。成熟的市場(chǎng)環(huán)境,促成線上線下的高度融合。以金華為例,線下有“義烏小商品市場(chǎng)”、“永康五金市場(chǎng)”等國(guó)內(nèi)乃至國(guó)際一流的行業(yè)市場(chǎng),依托這些實(shí)體市場(chǎng)的突出優(yōu)勢(shì),著力打造“義烏購(gòu)”、“尚五金”等線上平臺(tái),構(gòu)建線上線下高度融合的市場(chǎng)環(huán)境。
2數(shù)據(jù)挖掘技術(shù)初探
2.1數(shù)據(jù)挖掘簡(jiǎn)介
數(shù)據(jù)挖掘技術(shù)起源于20世紀(jì)80年代,它是從數(shù)據(jù)庫(kù)海量數(shù)據(jù)中提取使用者所感興趣的知識(shí)、數(shù)據(jù)和規(guī)律,進(jìn)行深入的分析,提取隱含在其中的、潛在有用的信息,為使用者提供決策支持。從電子商務(wù)的角度來(lái)看,它的主要作用是從電子商務(wù)活動(dòng)中抽取大量數(shù)據(jù),進(jìn)行轉(zhuǎn)讓、分析和模式化處理,從中獲得能幫助電子商務(wù)企業(yè)決策的關(guān)鍵信息,即從電子商務(wù)大量業(yè)務(wù)數(shù)據(jù)中尋找隱含的商機(jī)或者新的商業(yè)模式。
2.2數(shù)據(jù)挖掘在電子商務(wù)領(lǐng)域的應(yīng)用
在電商商務(wù)活動(dòng)的過(guò)程中,電商企業(yè)積累了大量的銷售記錄、瀏覽記錄、消費(fèi)和服務(wù)記錄等數(shù)據(jù),隨著電子商務(wù)不斷發(fā)展,相關(guān)數(shù)據(jù)不斷的膨脹擴(kuò)大,在堆積如山的數(shù)據(jù)中包含著許多待提取的有用知識(shí),這些有用知識(shí)進(jìn)行挖掘是非常有意義的。數(shù)據(jù)挖掘有助于電商企業(yè)識(shí)別客戶購(gòu)買行為,發(fā)現(xiàn)客戶的購(gòu)買模式及趨勢(shì),便于電商企業(yè)改進(jìn)銷售模式、提高服務(wù)質(zhì)量,提高客戶的用戶體驗(yàn)。并且,可以根據(jù)海量數(shù)據(jù)分析,提高貨品銷售比率,優(yōu)化物流和分銷策略,進(jìn)一步降低成本。1)分析客戶的購(gòu)買行為和習(xí)慣。例如“男性客戶購(gòu)買尿不濕的同時(shí)會(huì)購(gòu)買啤酒”,“該女性客戶對(duì)化妝品和護(hù)膚品的品牌偏好”,“某客戶偏好折扣商品”,這些信息雖然看起來(lái)微不足道,卻非常有用,電商企業(yè)可以根據(jù)客戶購(gòu)買行為和習(xí)慣向客戶推送他們偏好的信息。2)分析電商企業(yè)的商品構(gòu)成。將各類商品按盈利水平和銷售情況進(jìn)行分類,挖掘同類商品的共同特征,提取有用信息。幫助企業(yè)決策市場(chǎng)定位、商品定價(jià)等問(wèn)題。3)數(shù)據(jù)挖掘還可以幫助企業(yè)進(jìn)行銷售商品預(yù)測(cè)、商品價(jià)格分析等,在浙江線上線下高度融合的市場(chǎng)環(huán)境下,電商企業(yè)可以挖掘商品價(jià)格、銷售和物流信息的關(guān)聯(lián),合理安排線上線下商品銷售模式,提高企業(yè)運(yùn)營(yíng)效率,降低銷售成本。
3結(jié)束語(yǔ)
浙江電子商務(wù)的快速發(fā)展,各類電商企業(yè)在這片土地上生根發(fā)芽,數(shù)量不斷增多,市場(chǎng)競(jìng)爭(zhēng)日趨激烈。有效的利用數(shù)據(jù)挖掘工具,挖掘隱含在海量數(shù)據(jù)中的有用信息,能夠使企業(yè)做出正常的市場(chǎng)決策,保持有力的競(jìng)爭(zhēng)優(yōu)勢(shì),贏得消費(fèi)者的青睞。隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘的不斷深入,電子商務(wù)數(shù)據(jù)挖掘的研究和應(yīng)用必將取得長(zhǎng)遠(yuǎn)的發(fā)展。
作者:陳麗燕 何士產(chǎn) 洪改艷 單位:上海財(cái)經(jīng)大學(xué)浙江學(xué)院
1數(shù)據(jù)挖掘的概念及其過(guò)程
1.1數(shù)據(jù)挖掘
數(shù)據(jù)挖掘,即在數(shù)據(jù)庫(kù)中的信息發(fā)現(xiàn),是指在大量的、不完整的、模糊的、有噪音的和隨機(jī)的數(shù)據(jù)中,提取出潛在的、不為人知的、同時(shí)又是非常有用的知識(shí)和信息的過(guò)程。數(shù)據(jù)挖掘是一項(xiàng)應(yīng)用技術(shù)廣泛的交叉學(xué)科,它聚集了眾多不同領(lǐng)域的知識(shí),例如人工智能、可視化、數(shù)據(jù)庫(kù)、數(shù)理統(tǒng)計(jì)等。從始至終數(shù)據(jù)挖掘技術(shù)都是面向應(yīng)用領(lǐng)域,不僅是對(duì)于特定數(shù)據(jù)庫(kù)的簡(jiǎn)單檢索查詢,還包括對(duì)數(shù)據(jù)的不同層面、不同角度的統(tǒng)計(jì)、分析、推理和綜合,以此得到問(wèn)題的求解,以及發(fā)現(xiàn)事件之間的聯(lián)系,還有對(duì)未發(fā)生活動(dòng)的預(yù)測(cè)。另外數(shù)據(jù)挖掘技術(shù)在存在大量數(shù)據(jù)積累的電子商務(wù)行業(yè)有著廣泛的應(yīng)用,是現(xiàn)代商務(wù)企業(yè)發(fā)展的不二選擇。
1.2數(shù)據(jù)挖掘的過(guò)程
1.2.1數(shù)據(jù)預(yù)處理
在實(shí)際情況中,企業(yè)獲得的數(shù)據(jù)具有不完整性、模糊性和冗余性,所以數(shù)據(jù)挖掘技術(shù)針對(duì)的不是已得到的數(shù)據(jù),而是潛在的數(shù)據(jù)信息,并通過(guò)預(yù)處理技術(shù)獲得簡(jiǎn)潔、準(zhǔn)確的數(shù)據(jù)。預(yù)處理的工作分為三步,數(shù)據(jù)合并、數(shù)據(jù)選擇和數(shù)據(jù)清洗。先將多個(gè)數(shù)據(jù)庫(kù)和文件中的數(shù)據(jù)進(jìn)行合并,然后選擇適合分析的數(shù)據(jù)信息集合,最后剔除無(wú)關(guān)記錄,并將各個(gè)文件轉(zhuǎn)換成方便數(shù)據(jù)挖掘的格式。
1.2.2模式發(fā)現(xiàn)
這個(gè)階段就是利用挖掘計(jì)算技術(shù)挖掘出有用的、潛在的、新穎的、可以理解的知識(shí)和信息。像關(guān)聯(lián)分析、聚類分析、路徑選擇、序列分析等都可以用于Web的挖掘技術(shù)。
1.2.3模式分析
這個(gè)階段是將模式發(fā)現(xiàn)中沒(méi)有用的模式和規(guī)則過(guò)濾掉。通過(guò)技術(shù)分析,得到有效的結(jié)論。常用關(guān)聯(lián)規(guī)則、序列等手段。
2數(shù)據(jù)挖掘技術(shù)的方法
2.1關(guān)聯(lián)分析
所謂的關(guān)聯(lián)分析,就是利用數(shù)據(jù)間相互關(guān)聯(lián)的規(guī)則進(jìn)行數(shù)據(jù)挖掘,為的是挖掘數(shù)據(jù)間潛在的聯(lián)系規(guī)則。比如,在進(jìn)行關(guān)聯(lián)分析時(shí),能發(fā)現(xiàn)類似哪些產(chǎn)品更受客戶的歡迎、為什么、產(chǎn)品優(yōu)勢(shì)有哪些、有多少客戶會(huì)再次購(gòu)買等問(wèn)題。
2.2序列模式分析
這個(gè)過(guò)程和第一個(gè)關(guān)聯(lián)分析有些類似,但主要任務(wù)是發(fā)現(xiàn)數(shù)據(jù)間的前后順序聯(lián)系,比如在這段時(shí)間里,企業(yè)先銷售出x產(chǎn)品,隨后銷售y產(chǎn)品,然后是z產(chǎn)品,所以就形成x-y-z的銷售序列,出現(xiàn)頻率較高,進(jìn)而對(duì)其進(jìn)行分析。序列模式分析工作方向是:在指定的交易數(shù)據(jù)庫(kù)中,找出按照時(shí)間排布的交易集,發(fā)現(xiàn)其中的高頻序列,從而進(jìn)行下一個(gè)步驟。
2.3分類分析
假設(shè)有一個(gè)數(shù)據(jù)庫(kù)和一組互相區(qū)別的標(biāo)記,利用特殊標(biāo)記數(shù)據(jù)庫(kù)中的每一個(gè)數(shù)據(jù),這樣的數(shù)據(jù)庫(kù)被叫做訓(xùn)練集或者實(shí)例數(shù)據(jù)庫(kù)。分類分析就是利用分析標(biāo)記數(shù)據(jù)庫(kù)中的每一個(gè)數(shù)據(jù),對(duì)每個(gè)類別建立分析模型或做出精準(zhǔn)的描述或者挖掘出分析模型,然后利用分類模式對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行分類分析。
2.4聚類分析
聚類分析所根據(jù)的分類規(guī)則主要取決于聚類分析工具。不同的聚類方法,對(duì)于同樣的記錄集合會(huì)有不同的劃分結(jié)果。聚類分析針對(duì)的未分類的記錄,而且所有記錄適合分成幾類,事先也不知情,然后依據(jù)一定的分類規(guī)則,分析記錄數(shù)據(jù),確定每一個(gè)數(shù)據(jù)所對(duì)應(yīng)的類別。
3數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用
3.1優(yōu)化企業(yè)資源
企業(yè)盈利的關(guān)鍵是節(jié)約成本,利用數(shù)據(jù)挖掘技術(shù)可以找到企業(yè)消耗資源的關(guān)鍵點(diǎn)和各種活動(dòng)的投入與產(chǎn)出比例,進(jìn)而為企業(yè)提供科學(xué)合理的調(diào)整方案,例如資源循環(huán)利用、降低庫(kù)存等方法。通過(guò)數(shù)據(jù)挖掘技術(shù),企業(yè)可以預(yù)先知道市場(chǎng)上的商業(yè)信息,使企業(yè)把握市場(chǎng)動(dòng)態(tài),創(chuàng)造更多的盈利。
3.2管理客戶資料
俗話說(shuō)知己知彼,百戰(zhàn)不殆。對(duì)于企業(yè)來(lái)說(shuō),了解客戶是至關(guān)重要的,比如客戶是男是女、愛(ài)好是什么、職業(yè)是什么等,從而根據(jù)不同客戶需求,改善網(wǎng)絡(luò)結(jié)構(gòu),推出個(gè)性化網(wǎng)頁(yè),吸引更多的客戶對(duì)本企業(yè)的關(guān)注。例如對(duì)電子商務(wù)網(wǎng)站的網(wǎng)站流量進(jìn)行分析。人們?cè)邳c(diǎn)擊或者是訪問(wèn)某一個(gè)網(wǎng)站的同時(shí),就將個(gè)人對(duì)網(wǎng)站內(nèi)容的反饋信息反映了出來(lái),用戶點(diǎn)擊了哪一個(gè)鏈接,在哪個(gè)網(wǎng)頁(yè)中停留的時(shí)間最長(zhǎng),采用了哪個(gè)搜索的項(xiàng)目或者是總共使用的瀏覽時(shí)間等信息都會(huì)被保存在網(wǎng)站中,將這些信息保存下來(lái),進(jìn)行數(shù)據(jù)分析,能夠有效的確定用戶的訪問(wèn)特點(diǎn)以及產(chǎn)品特征,從而提高電子商務(wù)信息提供的精確性。
3.3評(píng)估商業(yè)信譽(yù)
一個(gè)企業(yè)若是沒(méi)有良好的商業(yè)信譽(yù)做基礎(chǔ),一切都是空口說(shuō)白話。所以建立有效的商業(yè)評(píng)估制度就成了重中之重。利用數(shù)據(jù)挖掘技術(shù)對(duì)企業(yè)營(yíng)銷進(jìn)行追蹤,開(kāi)展資產(chǎn)評(píng)估、發(fā)展?jié)摿︻A(yù)測(cè)以及利潤(rùn)收益分析,建立完善的安全系統(tǒng),對(duì)企業(yè)商譽(yù)安全進(jìn)行保障,可以有效的預(yù)防和解決信用風(fēng)險(xiǎn),提高企業(yè)信譽(yù)度。例如,商品售賣出去,要進(jìn)行科學(xué)有效的跟蹤,了解客戶用后體驗(yàn),對(duì)客戶使用產(chǎn)品情況進(jìn)行追蹤式分析,開(kāi)展科學(xué)合理的資產(chǎn)評(píng)估,不斷發(fā)展?jié)撛谟脩趔w驗(yàn),通過(guò)客戶的反饋信息進(jìn)行綜合性分析,提高客戶滿意度,提高商家的信用。
3.4確定異常事件
在商業(yè)領(lǐng)域中,確定異常事件具有十分重要的商業(yè)價(jià)值。在企業(yè)經(jīng)營(yíng)時(shí)間里,經(jīng)常會(huì)有異常事件發(fā)生,例如話費(fèi)拖欠、客戶流失、信用卡欺詐等,通過(guò)數(shù)據(jù)挖掘技術(shù)中的異常點(diǎn)分析可以十分準(zhǔn)確快速地發(fā)現(xiàn)異常點(diǎn),使企業(yè)及時(shí)修整系統(tǒng),減少不必要損失。例如,當(dāng)客戶將商品加入購(gòu)物車后,對(duì)沒(méi)有付款的原因進(jìn)行科學(xué)合理的分析,從而確定要催付的客戶群體。這種催付的行為在一定程度上可能會(huì)打擾到客戶,所以需要準(zhǔn)確的分析其真正的原因。例如客戶沒(méi)有付款的主要原因?yàn)椋哼z忘、沖動(dòng)消費(fèi)不想買了、貨比三家,發(fā)現(xiàn)更好地商品、支付發(fā)生故障等。這個(gè)時(shí)候就需要商家對(duì)號(hào)入座,確定是否要進(jìn)行客戶催付。這就需要數(shù)據(jù)挖掘技術(shù)發(fā)揮自身的優(yōu)勢(shì),進(jìn)行數(shù)據(jù)分析,提出相應(yīng)的解決方案。在催付時(shí)間的選擇上,根據(jù)數(shù)據(jù)挖掘技術(shù)的分析通常情況下理論上在第三天進(jìn)行催付是最為合理的,因?yàn)樵诘诙煊胁簧贂?huì)自發(fā)付款的客戶。同時(shí)還需要考慮到女性消費(fèi)者沖動(dòng)購(gòu)物的習(xí)慣,過(guò)了這個(gè)沖動(dòng)期就不容易再購(gòu)買。所以實(shí)際上要在客戶下單的第二天進(jìn)行催付最為合理。在擬定催付內(nèi)容的時(shí)候需要科學(xué)分析客戶一天各個(gè)時(shí)間段的情緒變化,減少客戶對(duì)商家的排斥與厭煩的心理。
4結(jié)語(yǔ)
隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,電子商務(wù)已經(jīng)成為現(xiàn)如今經(jīng)濟(jì)發(fā)展的主要方式。數(shù)據(jù)挖掘技術(shù)是電子商務(wù)發(fā)展的重要手段。利用數(shù)據(jù)挖掘可以幫助企業(yè)從大量的繁雜的數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)律,找到有效的信息,以此指導(dǎo)企業(yè)調(diào)整經(jīng)營(yíng)策略,提高企業(yè)聲譽(yù),獲得更有利的競(jìng)爭(zhēng)能力。
作者:邢玉鳳 單位:云南經(jīng)濟(jì)管理學(xué)院