前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的數(shù)據(jù)挖掘技術(shù)應(yīng)用主題范文,僅供參考,歡迎閱讀并收藏。
【關(guān)鍵詞】信息時代;數(shù)據(jù);利用;挖掘;應(yīng)用
1.數(shù)據(jù)挖掘的起源
隨著科學(xué)技術(shù)的日新月異,信息正在處于爆炸的時代,但是在數(shù)據(jù)龐大的背后,人們對其利用和提取的價值是有限的,有時候是不能滿足現(xiàn)實(shí)的需要。當(dāng)前大部分只是對所有的數(shù)據(jù)進(jìn)行儲存、統(tǒng)計(jì)、查詢,很難找出數(shù)據(jù)背后存在的某種關(guān)系和規(guī)律,更不能對數(shù)據(jù)的未來發(fā)展進(jìn)行準(zhǔn)確的預(yù)測。這也就導(dǎo)致了雖然信息數(shù)據(jù)非常多但是價值卻占到很少的一部分。正是因?yàn)橛羞@種情況的產(chǎn)生,信息挖掘技術(shù)才會得到發(fā)展和應(yīng)用。
2.數(shù)據(jù)挖掘的定義
所謂的信息挖掘通過對一些已有的數(shù)據(jù)存在不確定性、信息量大、不完整的數(shù)據(jù)進(jìn)行分析提取,提取出數(shù)據(jù)背后存在的一些價值和有用的信息。通過對這些數(shù)據(jù)的分析提取為一些技術(shù)部門和相關(guān)的人員的戰(zhàn)略決策提供很大的支持。
3.數(shù)據(jù)挖掘的過程
數(shù)據(jù)的挖掘是通過數(shù)據(jù)挖掘算法提取出數(shù)據(jù)模型,還有就是針對數(shù)據(jù)挖掘所采取的一些方法和步驟,一般都是經(jīng)歷幾次甚至多次的處理過程。最后才會在數(shù)據(jù)上提取到其存在的潛在價值,整個過程主要包括一下幾個階段。
(1)目標(biāo)定義階段
做任何事情之前通過對將要做的事情進(jìn)行計(jì)劃分析,然后制定對所做這件事情需要達(dá)到的目標(biāo),這樣事情就會很容易成功。數(shù)據(jù)挖掘也不例外,在對數(shù)據(jù)進(jìn)行挖掘的時候,需要相關(guān)的人員了解和明確對所挖掘的數(shù)據(jù)要達(dá)到的目的,這也很大程度上會決定數(shù)據(jù)挖掘的成功與否。因此相關(guān)人員要在指定明確的目標(biāo),然后選擇一定的技術(shù)手段和方式對數(shù)據(jù)進(jìn)行挖掘。
(2)數(shù)據(jù)準(zhǔn)備階段
根據(jù)已有的數(shù)據(jù)挖掘目標(biāo),就應(yīng)該對所有的數(shù)據(jù)進(jìn)行分析處理,大略的挑出能達(dá)到目標(biāo)的一些數(shù)據(jù),剔除一些沒有意義的數(shù)據(jù)。還有就是對數(shù)據(jù)進(jìn)行一些變化,主要就是為了能夠在一些有特征的數(shù)據(jù)找出符合要求的數(shù)據(jù),減少在數(shù)據(jù)挖掘過程中需要考慮的其他因素。
(3)數(shù)據(jù)挖掘階段
這個階段是整個數(shù)據(jù)挖掘階段最重要、最核心的階段。相關(guān)的工作人員應(yīng)該在已有的數(shù)據(jù)挖掘目標(biāo)的基礎(chǔ)上選擇合理、科學(xué)的數(shù)據(jù)挖掘方法對數(shù)據(jù)進(jìn)行挖掘,提取出數(shù)據(jù)背后隱藏的價值。
(4)數(shù)據(jù)挖掘結(jié)果解釋和評估階段
首先應(yīng)該對數(shù)據(jù)挖掘出來的信息進(jìn)行研究,把最終滿足要求的數(shù)據(jù)提取出來。因?yàn)閿?shù)據(jù)的挖掘的最終目的就是為客戶服務(wù),所以還應(yīng)該針對客戶的一些特殊要求對挖掘出來的數(shù)據(jù)進(jìn)行提煉,經(jīng)過客戶對所挖掘的數(shù)據(jù)結(jié)果的評估后,將一些不滿足要求的數(shù)據(jù)剔除。還有就是把挖掘的數(shù)據(jù)應(yīng)該進(jìn)行合理的優(yōu)化使其更加人性化,給客戶優(yōu)質(zhì)的服務(wù)。
4.數(shù)據(jù)挖掘的研究方向
(1)對于數(shù)據(jù)挖掘系統(tǒng)來說,其不可能對各類型的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,因此應(yīng)該針對不同類型的數(shù)據(jù)研究出不同的數(shù)據(jù)挖掘系統(tǒng),這樣就可以在數(shù)據(jù)挖掘時能夠快速、高效的對數(shù)據(jù)進(jìn)行挖掘。
(2)數(shù)據(jù)挖掘系統(tǒng)應(yīng)該具備能夠?qū)?shù)據(jù)進(jìn)行高效率的挖掘,因?yàn)殡S著信息化時代的到來,數(shù)據(jù)會越來越多,越來越復(fù)雜。如果其系統(tǒng)不能高效的工作,會很大程度上影響到數(shù)據(jù)挖掘的整體進(jìn)度。
(3)數(shù)據(jù)挖掘結(jié)果的準(zhǔn)確性、通俗性以及有效性也是數(shù)據(jù)挖掘所需要達(dá)到的,只有這幾方面都能滿足要求,才會能夠很好的服務(wù)客戶。
(4)隨著信息時代和科學(xué)技術(shù)的快速發(fā)展,人們也越來越關(guān)注到一些個人隱私。所以在對數(shù)據(jù)挖掘的過程中不應(yīng)該侵犯到他人的隱私。還有就是對挖掘出來的數(shù)據(jù)有一定的安全保護(hù)措施,防止數(shù)據(jù)丟失。
(5)挖掘出來的數(shù)據(jù)也應(yīng)該能夠及時的和現(xiàn)有的數(shù)據(jù)進(jìn)行結(jié)合和補(bǔ)充,這樣就能使數(shù)據(jù)得到更廣泛的應(yīng)用和利用。
5.數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域
隨著科技的不斷發(fā)展和信息化時代的到來,數(shù)據(jù)挖掘技術(shù)也取得了一些成就,在許多行業(yè)也得到了一定的應(yīng)用
(1)科學(xué)研究
因?yàn)樵S多科學(xué)研究的數(shù)據(jù)的大量性、復(fù)雜性使得一般的分析工具很大對數(shù)據(jù)進(jìn)行分析、提取,因此數(shù)據(jù)挖掘技術(shù)在這種情況下深受科學(xué)研究方面的廣大歡迎,其也在這個行業(yè)得到了快速的發(fā)展和應(yīng)用。通過數(shù)據(jù)挖掘在科學(xué)研究的應(yīng)用,促進(jìn)了科學(xué)的快速發(fā)展,使其能夠?yàn)樯鐣峁┯袃r值的科學(xué)成果,為國家做出貢獻(xiàn)。
(2)風(fēng)險分析和欺詐辨別
因?yàn)樵S多行業(yè)的數(shù)據(jù)存在具有龐大性、真假難辨性,所以對這些數(shù)據(jù)進(jìn)行挖掘分析,分析出有價值、真的數(shù)據(jù),防止因?yàn)榧俚臄?shù)據(jù)給我們帶來的不必要的麻煩。還可以經(jīng)過對數(shù)據(jù)的挖掘分析提高對風(fēng)險的分析能力。還有就是一些行業(yè)的數(shù)據(jù)可能被不法分子利用對人們進(jìn)行欺詐,通過數(shù)據(jù)挖掘可以對這些數(shù)據(jù)進(jìn)行辨別,從而避免了經(jīng)濟(jì)損失。
(3)制造業(yè)的應(yīng)用
數(shù)據(jù)挖掘一般就是對制造業(yè)的制造部件的缺陷進(jìn)行分析,通過分析挖掘出能夠優(yōu)化制造部件的數(shù)據(jù),從而避免制造部件的缺陷。
(4)學(xué)校教育的應(yīng)用
學(xué)校的數(shù)據(jù)也是非常龐大、復(fù)雜的,因此數(shù)據(jù)挖掘也在學(xué)校的各個信息系統(tǒng)得到了一定的應(yīng)用。學(xué)校通過數(shù)據(jù)挖掘挖掘出對學(xué)校、老師、學(xué)生有價值的數(shù)據(jù),從而讓學(xué)??茖W(xué)的管理,老師更加高效的工作和教學(xué),學(xué)生更加高效的學(xué)習(xí)。
參考文獻(xiàn):
[1] Jiawei Han.Data Mining:Concepts and Techniques[M].機(jī)械工業(yè)出版社.2004
[2] 劉同明等.數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[J].北京:國防工業(yè)出版社.2001.(9)
[3] 康曉東.基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術(shù)[J].北京:機(jī)械工業(yè)出版社.2004.(1):131~175
[關(guān)鍵詞] 數(shù)據(jù)挖掘 商業(yè)決策 數(shù)據(jù)分析
一、應(yīng)用數(shù)據(jù)挖掘技術(shù)支撐商業(yè)管理理念的實(shí)施
商業(yè)管理理論及理念的研究一直沒有停歇,那面是“二八原則”,這面又是“藍(lán)平長二”,無論是什么,其宗旨都是為使企業(yè)能在激烈的商業(yè)競爭中審時度勢,迅速出擊,知己知彼,百戰(zhàn)不殆。任何好的商業(yè)決策都必須及時、準(zhǔn)確,有真實(shí)可靠的事實(shí)與數(shù)據(jù)為依據(jù)。商業(yè)組織如果感覺不靈敏,很容易陷入“夜半臨深池”的危險境地卻不自知,有先進(jìn)的管理理念也無濟(jì)于事。面對日益復(fù)雜的競爭環(huán)境,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。
數(shù)據(jù)挖掘技術(shù)基于人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等技術(shù),可高度自動化地從深層次上分析商業(yè)組織在運(yùn)營過程中積累的海量業(yè)務(wù)數(shù)據(jù),抽取重要信息,使商業(yè)組織大大提高認(rèn)知其組織內(nèi)外環(huán)境的能力,靈活應(yīng)對突發(fā)事件,迅速制定合理決策,使先進(jìn)的商業(yè)管理理念落到實(shí)處。
二、數(shù)據(jù)挖掘功能及其所能解決的典型商業(yè)問題
1.關(guān)聯(lián)分析
關(guān)聯(lián)分析是從大量的數(shù)據(jù)中發(fā)現(xiàn)項(xiàng)集之間相關(guān)關(guān)系或因果結(jié)構(gòu)的數(shù)據(jù)分析方法。通過對大量銷售數(shù)據(jù)的分析,可以發(fā)現(xiàn)兩種或多種商品之間存在的關(guān)聯(lián)關(guān)系,據(jù)此可改變商品的擺放位置,制定捆綁銷售等策略。亞馬遜及當(dāng)當(dāng)?shù)荣徫锞W(wǎng)站在用戶選擇商品后及時給出的其他商品的推介就是利用關(guān)聯(lián)分析得到的。
2.分類與預(yù)測
分類與預(yù)測是通過對當(dāng)前數(shù)據(jù)集合的描述以識別未知數(shù)據(jù)的歸屬或預(yù)測未來數(shù)據(jù)的發(fā)展趨勢。通過對大量銷售數(shù)據(jù)的分析,可以確定特定客戶的興趣、消費(fèi)習(xí)慣、消費(fèi)傾向和消費(fèi)需求,進(jìn)而推斷其下一步的消費(fèi)行為,據(jù)此進(jìn)行定向營銷和推送服務(wù),必將大大節(jié)省營銷成本,獲得良好的營銷收益。
3.聚類分析
聚類就是按照事物的某些屬性把事物聚集成類。聚類之前類的數(shù)量及類的特征都是未知的。應(yīng)用聚類技術(shù)能發(fā)現(xiàn)不同客戶群并刻畫出客戶群的特征,據(jù)此制定營銷策略和客戶服務(wù)策略,如超市根據(jù)客戶聚集地中心點(diǎn)制定班車路線,制定商品宣傳策略等。
4.孤立點(diǎn)分析
數(shù)據(jù)庫中包含的與其他數(shù)據(jù)行為或模型不一致的數(shù)據(jù)對象稱為孤立點(diǎn),在數(shù)據(jù)庫中查找識別孤立點(diǎn)的技術(shù)即為孤立點(diǎn)分析。在銀行、電信等行業(yè)的業(yè)務(wù)數(shù)據(jù)中發(fā)現(xiàn)的孤立點(diǎn)可能預(yù)示著欺詐行為,盡早識別,可以為企業(yè)減少不必要的經(jīng)濟(jì)損失。另外可用于網(wǎng)絡(luò)的入侵檢測,生態(tài)系統(tǒng)的失調(diào)檢測,特殊病種檢測等。
5.時序演變分析
時序演變分析是建立事件或?qū)ο笮袨殡S時間變化的規(guī)律或趨勢的模型。據(jù)此方法利用股市交易信息可分析股市的波動趨勢,利用商業(yè)交易信息可分析出產(chǎn)品的銷量變化趨勢、目標(biāo)市場發(fā)展趨勢等,利用天氣狀況數(shù)據(jù)可分析天氣的變化趨勢等。
6.文本信息抽取
文本信息抽取是從非結(jié)構(gòu)化的文本中提取重要信息的過程。利用該技術(shù)可獲取競爭情報,可從新聞等文本中動態(tài)抽取日期、地點(diǎn)和人物等信息,并借助關(guān)聯(lián)分析方法進(jìn)一步識別出產(chǎn)品、企業(yè)、人、事件和地點(diǎn)之間的關(guān)系,使企業(yè)對競爭環(huán)境的感知更敏銳。
7.Web挖掘
Web挖掘是指從網(wǎng)絡(luò)環(huán)境中提取有價值信息的過程。如搜索引擎的應(yīng)用;如分析網(wǎng)站的參觀者和購買者的高頻率瀏覽路徑,以確定用戶對某產(chǎn)品的需求,發(fā)現(xiàn)用戶的個人喜好,發(fā)現(xiàn)用戶的去留傾向……據(jù)此可改變網(wǎng)頁的設(shè)置,為用戶提供個性化服務(wù),改變受歡迎產(chǎn)品的經(jīng)營和宣傳策略等。
三、數(shù)據(jù)挖掘流程及所面對的問題
數(shù)據(jù)挖掘流程可描述為“數(shù)據(jù)選擇數(shù)據(jù)預(yù)處理數(shù)據(jù)挖掘模式評估知識表示”。
數(shù)據(jù)挖掘首先根據(jù)分析目標(biāo)從數(shù)據(jù)源中選取與業(yè)務(wù)相關(guān)的數(shù)據(jù)。數(shù)據(jù)源是存儲業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)庫或數(shù)據(jù)倉庫。選取的數(shù)據(jù)通常會存在不完整、含噪聲(錯誤數(shù)據(jù))、不一致等問題,需要預(yù)處理數(shù)據(jù)使數(shù)據(jù)適合于挖掘。在這一過程中元數(shù)據(jù)起了非常重要的作用。
數(shù)據(jù)挖掘之前必須選定數(shù)據(jù)挖掘模型,即先做出某種假定,關(guān)聯(lián)分析、聚類分析及分類與預(yù)測為不同的挖掘模型。分析商品銷售數(shù)據(jù)時假定其中某些商品具有相關(guān)性,則選擇關(guān)聯(lián)分析模型,若挖掘的結(jié)果找到了產(chǎn)品A的購買帶來產(chǎn)品B的購買則是具體的模式。最終需要評測這種模式是不是真實(shí)有效且對商業(yè)決策有指導(dǎo)意義(模型評估,利用興趣度度量加人的識別),保留有意義的模型,并用一種用戶容易理解的方式表達(dá)出來(知識表示)。
數(shù)據(jù)的選擇和預(yù)處理會直接影響數(shù)據(jù)挖掘的結(jié)果。另外任何一種挖掘模型和挖掘算法都不是萬能的,不同的商業(yè)問題需要用不同的方法去解決。對于特定的商業(yè)問題和特定數(shù)據(jù)可能有多種算法,需要評估以選取最佳算法。
四、總結(jié)
數(shù)據(jù)挖掘作為正在興起并得到廣泛應(yīng)用的信息技術(shù)具有巨大的商業(yè)價值,特別是在銀行、電信、保險、交通、網(wǎng)上商城、超市等商業(yè)領(lǐng)域都有很好的表現(xiàn)。數(shù)據(jù)挖掘技術(shù)可以組織并深層次分析企業(yè)積累的海量業(yè)務(wù)數(shù)據(jù),預(yù)測客戶行為,預(yù)測產(chǎn)品狀況,預(yù)測市場走勢,幫助決策者正確判斷即將出現(xiàn)的機(jī)會,調(diào)整策略,減少風(fēng)險。因此利用數(shù)據(jù)挖掘技術(shù)必將大大提高商業(yè)組織利用信息的能力,使得信息更好地為決策服務(wù)。
但數(shù)據(jù)挖掘不是萬能的,在實(shí)際應(yīng)用中還要受到許多限制。有足夠的合適的數(shù)據(jù),選擇恰當(dāng)?shù)哪P秃退惴?,有決策者的支持等都是有效應(yīng)用數(shù)據(jù)挖掘技術(shù)的必要條件。
參考文獻(xiàn):
[1]李佩鈺等:藍(lán)平長二 商業(yè)理論洛陽紙貴,biz.省略
[2]欒世武:數(shù)據(jù)挖掘給企業(yè)應(yīng)用帶來什么,省略ki.省略
【關(guān)鍵詞】數(shù)據(jù)挖掘 知識獲取 數(shù)據(jù)庫
數(shù)據(jù)的迅速增加與數(shù)據(jù)分析方法的滯后之間的矛盾越來越突出,人們希望在對已有的大量數(shù)據(jù)分析的基礎(chǔ)上進(jìn)行科學(xué)研究、商業(yè)決策或者企業(yè)管理,但是目前所擁有的數(shù)據(jù)分析工具很難對數(shù)據(jù)進(jìn)行深層次的處理,使得人們只能望“數(shù)”興嘆。數(shù)據(jù)挖掘正是為了解決傳統(tǒng)分析方法的不足,并針對大規(guī)模數(shù)據(jù)的分析處理而出現(xiàn)的。數(shù)據(jù)挖掘通過在大量數(shù)據(jù)的基礎(chǔ)上對各種學(xué)習(xí)算法的訓(xùn)練,得到數(shù)據(jù)對象間的關(guān)系模式,這些模式反映了數(shù)據(jù)的內(nèi)在特性,是對數(shù)據(jù)包含信息的更高層次的抽象。
一、數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是從數(shù)據(jù)倉庫中提取出可信的、新穎的、有效的并能被人理解的模式的高級處理過程。所謂模式,可以看作是我們所說的知識,它給出了數(shù)據(jù)的特性或數(shù)據(jù)之間的關(guān)系,是對數(shù)據(jù)包含的信息更抽象的描述。如:成績優(yōu)秀的學(xué)生學(xué)習(xí)都非常刻苦;發(fā)燒的人是因?yàn)榛剂烁忻暗?。模式的表示方法很多,可以利用圖形、文字、表達(dá)式等方式表示;所謂處理過程是指數(shù)據(jù)挖掘是一個多步驟的對大量數(shù)據(jù)進(jìn)行分析的過程,包括數(shù)據(jù)預(yù)處理、模式提取、知識評估及過程優(yōu)化。知識提取往往需要經(jīng)過多次的反復(fù),通過對相關(guān)數(shù)據(jù)的再處理及知識學(xué)習(xí)算法的優(yōu)化,不斷提高學(xué)習(xí)效率。
二、數(shù)據(jù)挖掘的技術(shù)算法
在數(shù)據(jù)挖掘的處理過程中,數(shù)據(jù)挖掘引擎是最為關(guān)鍵的,而決定數(shù)據(jù)挖掘引擎的算法主要有以下幾類:
(一)數(shù)據(jù)挖掘的信息論方法
該類方法是利用信息論原理,計(jì)算數(shù)據(jù)庫中各字段的信息量,建立決策樹或者決策規(guī)則樹。比較重要的有ID3方法和IBLE方法。
(二)數(shù)據(jù)挖掘的集合論方法
粗集方法:在數(shù)據(jù)庫中將元素看成行對象,列元素看成屬性(分為條件屬性和結(jié)論屬性)。等價關(guān)系定義為不同對象在某個屬性上相同,這些等價關(guān)系的對象組成的集合稱為該等價關(guān)系的等價類。條件屬性上的等價類E與結(jié)論屬性上的等價類之間有三種關(guān)系:下近似,Y包含E;上近似,Y和E的交非空;無關(guān),Y和E的交為空。對下近似建立確定性規(guī)則,對上近似建立不確定性規(guī)則(含可信度),對無關(guān)情況不存在規(guī)則。
概念樹方法:數(shù)據(jù)庫中記錄的屬性字段按歸類方式進(jìn)行抽象,建立起來的層次結(jié)構(gòu)稱為概念樹。
(三)數(shù)據(jù)挖掘的仿生物方法
神經(jīng)網(wǎng)絡(luò)方法:神經(jīng)網(wǎng)絡(luò)通過學(xué)習(xí)待分析數(shù)據(jù)中的模式來構(gòu)造模型,一般可對隱類型進(jìn)行分類,用于非線性的、復(fù)雜的數(shù)據(jù)。神經(jīng)網(wǎng)絡(luò)由“神經(jīng)元”的互連或按層組織的結(jié)點(diǎn)構(gòu)成。通常,神經(jīng)模型由三個層次組成:輸入、中間層和輸出。每一神經(jīng)元求得輸入值,再計(jì)算總輸入值,由過濾機(jī)制比較總輸入,然后確定其自己的輸出值??赏ㄟ^連接一組神經(jīng)元來模型化復(fù)雜行為。當(dāng)修改連接層的“連接度”或參數(shù)時,神經(jīng)網(wǎng)絡(luò)就進(jìn)行了“學(xué)習(xí)”和“訓(xùn)練”。這里,神經(jīng)網(wǎng)絡(luò)用恰當(dāng)?shù)臄?shù)據(jù)倉庫示例來訓(xùn)練。目前,神經(jīng)網(wǎng)絡(luò)以MP和Hebb學(xué)習(xí)規(guī)則為基礎(chǔ),建立了三大類多種神經(jīng)網(wǎng)絡(luò)模型。
三、數(shù)據(jù)挖掘技術(shù)的應(yīng)用
首先介紹一個著名的實(shí)例:SKICAT。然后結(jié)合實(shí)際具體探討數(shù)據(jù)挖掘技術(shù)在Bayesian中的應(yīng)用。
(一)天文數(shù)據(jù)分析中的數(shù)據(jù)挖掘
數(shù)據(jù)挖掘在天文學(xué)上有一個非常著名的應(yīng)用系統(tǒng):SKICAT[外3]。它是美國加州理工學(xué)院(CIT)與天文科學(xué)家合作開發(fā)的用于幫助天文學(xué)家發(fā)現(xiàn)遙遠(yuǎn)的類星體的一個工具。SKICAT既是第一個獲得相當(dāng)成功的數(shù)據(jù)挖掘應(yīng)用,也是人工智能技術(shù)在天文學(xué)和空間科學(xué)上第一批成功應(yīng)用之一。利用SKICAT,天文學(xué)家已發(fā)現(xiàn)了16個新的極其遙遠(yuǎn)的類星體,該項(xiàng)發(fā)現(xiàn)能幫助天文工作者更好地研究類星體的形成以及早期宇宙的結(jié)構(gòu)。
(二)Bayesian網(wǎng)絡(luò)中的數(shù)據(jù)挖掘
Bayesian網(wǎng)是由變量及其關(guān)聯(lián)組成的有向圖。它主要用于處理實(shí)際應(yīng)用中遇到的不確定信息。圖中還帶有各變量的概率分布,定量的概率信息被表示為條件概率表中在決策前對實(shí)際問題的先驗(yàn)的理解與把握。
然而,針對實(shí)際問題建立一個應(yīng)用于決策的Bayesian網(wǎng)絡(luò)時存在兩個問題。首先,我們常常是憑個人對問題的經(jīng)驗(yàn)與理解來建立模型的,因此建立的模型很難反映問題的客觀實(shí)際。其二,在確定Bayesian網(wǎng)中的條件概率表時,我們需要用定量的數(shù)值以支持計(jì)算,但實(shí)際中,人們很難給出一個具體概率值,一般的應(yīng)用往往是根據(jù)經(jīng)驗(yàn),這就要求我們有一個合理的方法,從大量雜亂無序的數(shù)據(jù)中將它們找到,并填入條件概率表中去。
而數(shù)據(jù)挖掘技術(shù)恰恰為我們提供了一系列有效的方法來尋找隱藏于大規(guī)模數(shù)據(jù)之中的有用數(shù)據(jù),以解決以上兩個問題。在Bayesian建模中,我們需要找到各變量之間的關(guān)聯(lián),這種關(guān)聯(lián)與關(guān)系數(shù)據(jù)庫理論中的函數(shù)依賴(Functional Dependence)近似,后者表示了關(guān)系表中各屬性(Attribute)之間的依賴關(guān)系,而前者表示Bayesian網(wǎng)中各變量是關(guān)系表中的屬性時,兩者的表示含義是一致而和諧的。因而,只要在關(guān)系表的元組中發(fā)掘出函數(shù)依賴,便可以認(rèn)清Bayesian網(wǎng)中各變量之間的關(guān)系,從而給建模予以理論依據(jù),并且在數(shù)量上以具體值作為技術(shù)支持。
將數(shù)據(jù)挖掘中函數(shù)依賴的挖掘與Bayesian網(wǎng)技術(shù)結(jié)合起來[外4],將帶來以下好處:簡化Bayesian網(wǎng)的結(jié)構(gòu); 根據(jù)所挖掘出的函數(shù)依賴的置信度,可以使Bayesian網(wǎng)中各結(jié)點(diǎn)關(guān)聯(lián)更加清晰且有理可尋。
隨著信息技術(shù)的發(fā)展,采集的數(shù)據(jù)量的急劇加大,此時產(chǎn)生了數(shù)據(jù)挖掘,它就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。在對大量的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理過程中,從而提取得到對一些決策數(shù)據(jù)的支撐。
數(shù)據(jù)挖掘是一個由數(shù)理統(tǒng)計(jì)到人工智能,進(jìn)而到機(jī)器學(xué)習(xí)的逐步演變、變化過程。它是一門交叉的學(xué)科,是一門涉及廣泛的學(xué)科,是一門在社會的發(fā)展歷程中不斷前進(jìn)變化的學(xué)科。它所涉及到的內(nèi)容包括數(shù)據(jù)庫技術(shù)、人機(jī)智能、知識庫系統(tǒng)、知識獲取、神經(jīng)網(wǎng)絡(luò)、統(tǒng)計(jì)學(xué)、模式識別、信息檢索等,并且在跟著發(fā)展的需要、學(xué)科的進(jìn)步變化而不斷發(fā)展、向前。
由于數(shù)據(jù)量之大,傳統(tǒng)的統(tǒng)計(jì)分析方法主要是對沒有明確假設(shè)的前提下去挖掘信息,只會使得效率低下,同時,對于問題的解決也在大打折扣,處理的結(jié)果不理想,傳統(tǒng)的這種方法沒有找到數(shù)據(jù)之間的內(nèi)在聯(lián)系,這樣只是看到過去,不能很好的預(yù)測未來,對所要探索的目標(biāo)不能得出想要的結(jié)論;而數(shù)據(jù)挖掘是將所得到的信息是對前者的補(bǔ)充,得到未知的潛在的東西,是在原有的基礎(chǔ)上發(fā)現(xiàn)那些沒法預(yù)料的、不是靠感官所能察覺的,甚至是一些與生活所違背的,它更是人工智能和統(tǒng)計(jì)分析的結(jié)合,是對傳統(tǒng)技術(shù)的進(jìn)一步拓展,由于對數(shù)據(jù)分析要求的進(jìn)一步提高,也正是這一些特征才使得數(shù)據(jù)挖掘的結(jié)果而更加有意義與價值。
二、數(shù)據(jù)挖掘的相關(guān)技術(shù)與在經(jīng)濟(jì)統(tǒng)計(jì)中的應(yīng)用
正是由于對于數(shù)據(jù)的大量收集、先進(jìn)的計(jì)算機(jī)技術(shù)、數(shù)據(jù)算法的產(chǎn)生、超大規(guī)模數(shù)據(jù)庫的出現(xiàn)、數(shù)據(jù)訪問速度的提升、對數(shù)據(jù)進(jìn)行精深統(tǒng)計(jì)方法計(jì)算的能力等等一系列東西的出現(xiàn),從而一步步使得數(shù)據(jù)挖掘技術(shù)的作用越來越廣泛。對于經(jīng)濟(jì)統(tǒng)計(jì)準(zhǔn)確性與實(shí)用性的需要,數(shù)據(jù)挖掘技術(shù)才開始慢慢滲透到經(jīng)濟(jì)統(tǒng)計(jì)工作中。數(shù)據(jù)挖掘技術(shù)的主要方法有:
統(tǒng)計(jì)分析方法,數(shù)據(jù)庫字段項(xiàng)之間存在兩種關(guān)系,函數(shù)關(guān)系和相關(guān)關(guān)系,即能用函數(shù)公式表示的確定性關(guān)系與不能用函數(shù)公式表示,但仍是相關(guān)確定性關(guān)系。即利用統(tǒng)計(jì)學(xué)原理對數(shù)據(jù)庫中的信息進(jìn)行分析。
神經(jīng)網(wǎng)絡(luò)方法,是一種模擬人腦信息加工過程的智能化信息技術(shù)。就像人的神經(jīng)網(wǎng)絡(luò)的過程一樣,經(jīng)過輸入、分析、輸出的過程,而在經(jīng)濟(jì)統(tǒng)計(jì)過程中得到實(shí)際應(yīng)用。它為我們提供了一種完整的、準(zhǔn)確的處理過程,使得經(jīng)濟(jì)運(yùn)行模式就像人在接受處理信息的過程一樣而形象化、具體化、實(shí)用化,更好地取得經(jīng)濟(jì)過程中各個部分之間的聯(lián)系,從而獲得對經(jīng)濟(jì)問題的分析,獲得處理辦法。
決策樹是一種用于預(yù)測模型的算法,是基于統(tǒng)計(jì)理論的非參數(shù)識別技術(shù),通過對大量數(shù)據(jù)的有目的分類,找到有價值、潛在的信息。正是由于分類速度快,描述簡單,特別適合對經(jīng)濟(jì)運(yùn)行過程中出現(xiàn)的大規(guī)模數(shù)據(jù)的處理工作。
粗集理論的方法,是一種研究不精確、不確定知識的數(shù)學(xué)工具,是通過對上下近似集來出來不確定問題。它算法簡單,易于操作;不需要給出額外信息;簡化輸入信息的表達(dá)空間。對于不確定的經(jīng)濟(jì)因素提供了一種思維方法,正是通過這種近似原則,使得經(jīng)濟(jì)決策更加的與需求所接近,為最大利益化的獲得給予有力支撐。
遺傳算法,是一種根據(jù)生物自然選擇與遺傳機(jī)理的隨機(jī)搜索算法,其思路是根據(jù)社會問題,在指定對象的人群中去采集信息,通過對隱含信息的整合、分析,進(jìn)而得到結(jié)果。它具有隱含性、易于和其它模型結(jié)合,可以對隱含數(shù)據(jù)進(jìn)行采集,而后把挖掘出的數(shù)據(jù)加以分析,進(jìn)而得到應(yīng)用。經(jīng)濟(jì)問題是一個發(fā)展變化的問題,內(nèi)部有著千絲萬縷的聯(lián)系,參照遺傳算法,我們就可以通過源頭開始,一步步向下延伸,去提取數(shù)據(jù),進(jìn)行整體分析,這樣就把經(jīng)濟(jì)問題具體化、直接化、目標(biāo)化,使得問題的研究更加直觀,把隱性的表現(xiàn)化,促使經(jīng)濟(jì)統(tǒng)計(jì)工作更加簡單、直白。
三、數(shù)據(jù)挖掘流程在經(jīng)濟(jì)統(tǒng)計(jì)中的體現(xiàn)
定義問題,對于經(jīng)濟(jì)問題,要定義出所要探究的問題,確定數(shù)據(jù)挖掘的目的。1.數(shù)據(jù)準(zhǔn)備,選擇數(shù)據(jù),數(shù)據(jù)預(yù)處理。即對所要探究的經(jīng)濟(jì)問題所涉及到的數(shù)據(jù)進(jìn)行采集,做好前期的一些處理工作,使得數(shù)據(jù)得到簡化,為后續(xù)工作的順利進(jìn)行做準(zhǔn)備。2.數(shù)據(jù)挖掘,根據(jù)數(shù)據(jù)的類型和數(shù)據(jù)的特點(diǎn)選擇相應(yīng)的算法,利用人工智能、統(tǒng)計(jì)等方法,去發(fā)掘出有用的信息。3.結(jié)果分析,對上述得到的結(jié)果進(jìn)行分析、評估,進(jìn)而通過這一步驟去調(diào)整上面的方法,使得結(jié)果更加貼切。4.知識的運(yùn)用,將得到的結(jié)果應(yīng)用到實(shí)際經(jīng)濟(jì)問題中去,進(jìn)而實(shí)現(xiàn)經(jīng)濟(jì)的良好運(yùn)行與發(fā)展。
關(guān)鍵詞:數(shù)據(jù)挖掘 移動通信 應(yīng)用
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2012)09-0032-01
自20世紀(jì)50年代中期開始,計(jì)算機(jī)及網(wǎng)絡(luò)技術(shù)的蓬勃發(fā)展,將社會前進(jìn)的步伐帶入了信息時代。當(dāng)下是一個信息爆炸的時代,每一分鐘都有大量的信息涌現(xiàn)。這大量信息的產(chǎn)生一方面給人們帶來了便利,另一面這種信息爆炸現(xiàn)象的負(fù)面作用也愈發(fā)明顯:信息量巨大,難以一一消化,同時這其中真?zhèn)坞y辨,給信息安全帶來威脅;由于信息的載體形式多種多樣,也為有效處理信息造成困難。信息爆炸卻知識貧乏,如何從海量的信息中提取有用的知識。不是被信息淹沒,而是有效利用信息。數(shù)據(jù)挖掘技術(shù)因此應(yīng)運(yùn)而生,并成為計(jì)算機(jī)技術(shù)發(fā)展的熱點(diǎn)。
1、數(shù)據(jù)挖掘技術(shù)概述
所謂數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中人們事先不知道的、但又是潛在有用的信息和知識的過程[1]。數(shù)據(jù)挖掘是一門交叉學(xué)科,涉及到數(shù)據(jù)庫技術(shù)、統(tǒng)計(jì)學(xué)、可視化、機(jī)器學(xué)習(xí)、信息科學(xué)等多種學(xué)科。數(shù)據(jù)挖掘技術(shù)除了對數(shù)據(jù)進(jìn)行基本的查詢,更重要的是從無序的數(shù)據(jù)中挖掘、整理信息,提取知識,進(jìn)而提供決策支持。
1.1 數(shù)據(jù)挖掘的原理
數(shù)據(jù)挖掘的原理可以簡單概括為6個過程:確定任務(wù)目標(biāo),熟悉研究領(lǐng)域內(nèi)的數(shù)據(jù)及背景情況,明確數(shù)據(jù)挖掘的目標(biāo);建立數(shù)據(jù)倉庫,即對根據(jù)要求對數(shù)據(jù)進(jìn)行選擇,選擇與任務(wù)目標(biāo)相關(guān)的數(shù)據(jù);進(jìn)行數(shù)據(jù)預(yù)處理,精簡數(shù)據(jù),除去冗余的數(shù)據(jù)信息,并統(tǒng)一形式,便于處理;數(shù)據(jù)挖掘,根據(jù)目標(biāo)確定算法,并選擇適合參數(shù)、建立模型;評估、解釋和應(yīng)用模型,必要時進(jìn)行反復(fù)提?。恢R評價,將提取的數(shù)據(jù)知識提供給用戶試用,并進(jìn)行反饋[2]。
1.2 數(shù)據(jù)挖掘的常用技術(shù)
對數(shù)據(jù)進(jìn)行分析的常用技術(shù)包括有聚類、分類、回歸分析、關(guān)聯(lián)原則、偏差分析等等[3]。聚類分析是以相似性、差異性對數(shù)據(jù)進(jìn)行分析,同一組數(shù)據(jù)相似性盡可能大,不同組數(shù)據(jù)差異性要明顯,分類反之?;貧w分析是分析數(shù)據(jù)屬性隨時間的變化,探索不同數(shù)據(jù)間變化的依賴關(guān)系。關(guān)聯(lián)原則即探尋數(shù)據(jù)間的關(guān)聯(lián)及相互關(guān)系。偏差分析主要是對數(shù)據(jù)庫中的異常記錄,反常實(shí)例進(jìn)行分析,尋找有意義的差別。
數(shù)據(jù)挖掘的常用技術(shù)主要來自以下相關(guān)領(lǐng)域:統(tǒng)計(jì)學(xué)、決策樹、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、粗集、模糊邏輯、可視化技術(shù)等。數(shù)據(jù)挖掘的應(yīng)用十分廣泛,主要有商業(yè)應(yīng)用,多應(yīng)用于市場營銷、金融、銀行、制造和通信領(lǐng)域;在科學(xué)研究方面,對生物、醫(yī)學(xué)、氣象、水文、地質(zhì)和考古等學(xué)科的科研工作都有積極作用。
2、我國移動通信現(xiàn)狀概述
近年來,移動通信領(lǐng)域迅猛發(fā)展,成為人們?nèi)粘I钪胁豢苫蛉钡臏贤ㄊ侄?。移動通信的服?wù)從最初提供簡單通話服務(wù)發(fā)展成綜合服務(wù),包括語音、圖像等多種類的信息傳遞。隨著技術(shù)的不斷發(fā)展和人們需求的多樣化,計(jì)算機(jī)及網(wǎng)絡(luò)等方式綜合應(yīng)用于通信領(lǐng)域已是大勢所趨。利用數(shù)據(jù)挖掘技術(shù)可以有效利用資源,能夠提高通信領(lǐng)域的工作效率,改善服務(wù)質(zhì)量。1998年我國的移動通信業(yè)開始興起,其后的發(fā)展速度令人咋舌,為世界之最。中國移動通信業(yè)的發(fā)展世人側(cè)目,而且還具有巨大提升潛力和盈利空間。產(chǎn)業(yè)內(nèi)部的競爭狀態(tài)取決于五種基本競爭作用力[4],即進(jìn)入威脅、替代威脅、買方侃價能力、供方侃價能力和現(xiàn)有競爭對手的競爭。
3、數(shù)據(jù)挖掘技術(shù)在移動通信中的應(yīng)用
移動通信業(yè)在信息化過程中得到了長足的發(fā)展,各類應(yīng)用系統(tǒng)被廣泛應(yīng)用,如計(jì)費(fèi)系統(tǒng)、綜合業(yè)務(wù)系統(tǒng)等,在較為完整的保存歷史數(shù)據(jù)的同時,也造成的海量數(shù)據(jù)的冗余,無法有效為使用者提供有用的信息。另一方面,海量數(shù)據(jù)的存在也為計(jì)算機(jī)設(shè)備的有效運(yùn)行帶來困擾。如何滿足用戶日益提高的需求的同時降低成本、提高效益,成為移動通信發(fā)展的重大課題。
數(shù)據(jù)挖掘技術(shù)成為解決這一問題重要手段,由于日益激勵的競爭、數(shù)據(jù)電子化程度較高、用戶關(guān)系管理系統(tǒng)的建立等多方面原因,中國移動通信等電信企業(yè)已經(jīng)將該技術(shù)納入企業(yè)的經(jīng)營中。
3.1 數(shù)據(jù)挖掘應(yīng)用的典型技術(shù)
數(shù)據(jù)倉庫的建立,共建一個可以共享移動通信業(yè)務(wù)數(shù)據(jù)的平臺,采用合適的算法對數(shù)據(jù)信息進(jìn)行挖掘,獲得對有用信息,對運(yùn)營商的發(fā)展提供科學(xué)技術(shù)支持。
決策樹技術(shù)的應(yīng)用,該技術(shù)可對具有不同特性的商品的營銷生成相應(yīng)的模型,有效區(qū)分用戶群體,對不同的群體采取不同的應(yīng)對策略。關(guān)聯(lián)規(guī)則的應(yīng)用于告警相關(guān)性分析,快捷查出故障點(diǎn)及發(fā)生原因。同時APriori算法可確定告警之間的關(guān)聯(lián),方便維護(hù)及管理,提高工作效率。
3.2 數(shù)據(jù)挖掘技術(shù)應(yīng)用于移動通信中的作用
業(yè)務(wù)預(yù)測通過分析用戶的歷史信息包括用戶個人數(shù)據(jù)及使用情況,確定業(yè)務(wù)發(fā)展的關(guān)鍵影響因素。通過對相關(guān)因素進(jìn)行合理的預(yù)測,確定未來業(yè)務(wù)發(fā)展的可能狀況。從而為下一步業(yè)務(wù)的開展、制定戰(zhàn)略等提供決策依據(jù)。同時可以根據(jù)發(fā)生的實(shí)際情況對預(yù)測的算法、模型進(jìn)行改善。主要應(yīng)用的算法有時間序列模式、神經(jīng)網(wǎng)絡(luò)預(yù)測。
數(shù)據(jù)挖掘還可以對用戶忠誠度的進(jìn)行預(yù)測和控制,“用戶忠誠度”是指用戶更換運(yùn)營商的可能性。通過對離網(wǎng)標(biāo)識、用戶信息資料、呼叫數(shù)據(jù)、賬戶和付費(fèi)數(shù)據(jù)及其他數(shù)據(jù)的分析對用戶忠誠度進(jìn)行預(yù)測,采取相關(guān)措施,從而最大限度的保留用戶量。
通過對分類和聚類算法對用戶群體進(jìn)行細(xì)分,為一對一營銷和相關(guān)新產(chǎn)品的開發(fā)提供基礎(chǔ)。用戶呼叫模式是通過用戶的通話詳單來進(jìn)行分析,使得運(yùn)營商掌握用戶行為特征,以制定不同的營銷策略。數(shù)據(jù)挖掘技術(shù)還可應(yīng)用于網(wǎng)絡(luò)資源管理,大客戶特征識別等,通過對相關(guān)數(shù)據(jù)的分析,為運(yùn)營商提供決策支持。
數(shù)據(jù)挖掘系統(tǒng)被開發(fā)出來已廣泛應(yīng)用到社會生活的各個方面,雖然效率方面不盡如人意,但是隨著硬件的改善,算法的改進(jìn),數(shù)據(jù)挖掘技術(shù)在移動通信中的應(yīng)用乃至各行各業(yè)都會有迅猛的進(jìn)展。
參考文獻(xiàn)
[1]陳東鵬.數(shù)據(jù)倉庫技術(shù)在移動通信領(lǐng)域的應(yīng)用.電信科學(xué),2001,(5):34-35.
[2]王扶東,朱云龍,薛勁松,李兵.基于數(shù)據(jù)挖掘的客戶關(guān)系分析評價系統(tǒng).東南大學(xué)學(xué)報(哲學(xué)社會科學(xué)版,2002,10(4):99-102.
關(guān)鍵詞:商務(wù)智能數(shù)據(jù)挖掘第三方物流研究
在當(dāng)今競爭日益激烈的市場環(huán)境中,第三方物流企業(yè)都希望能夠從浩如煙海的商務(wù)數(shù)據(jù)以及其他相關(guān)的物流業(yè)務(wù)數(shù)據(jù)中發(fā)現(xiàn)帶來巨額利潤的商機(jī)。只有那些利用先進(jìn)的信息技術(shù)成功地收集、分析、理解信息并依據(jù)信息進(jìn)行決策的物流企業(yè)才能獲得競爭優(yōu)勢,才是物流市場的贏家。因此,越來越多的物流管理者開始借助商務(wù)智能技術(shù)來發(fā)現(xiàn)物流運(yùn)營過程中存在的問題,找到有利的物流解決方案。
商務(wù)智能技術(shù)應(yīng)用現(xiàn)狀
我國加入了WTO,在許多領(lǐng)域,如金融、保險、物流等領(lǐng)域?qū)⒅鸩綄ν忾_放,這就意味著許多第三方物流企業(yè)將面臨來自國際大型跨國物流公司的巨大競爭壓力。國外發(fā)達(dá)國家各種企業(yè)采用商務(wù)智能的水平已經(jīng)遠(yuǎn)遠(yuǎn)超過了我國。美國PaloAlto管理集團(tuán)公司1999年對歐洲、北美和日本375家大中型企業(yè)的商務(wù)智能技術(shù)的采用情況進(jìn)行了調(diào)查。結(jié)果顯示,在金融領(lǐng)域,商務(wù)智能技術(shù)的應(yīng)用水平已經(jīng)達(dá)到或接近70%,在營銷領(lǐng)域也達(dá)到50%,并且在其他應(yīng)用領(lǐng)域?qū)υ摷夹g(shù)的采納水平都提高約50%?,F(xiàn)在,許多第三方物流企業(yè)都把數(shù)據(jù)看成寶貴的財富,紛紛利用商務(wù)智能發(fā)現(xiàn)其中隱藏的信息,借此獲得巨額的回報。
據(jù)IDC對歐洲和北美62家采用了商務(wù)智能技術(shù)的企業(yè)的調(diào)查分析發(fā)現(xiàn),這些企業(yè)的3年平均投資回報率為401%,其中25%的企業(yè)的投資回報率超過600%。調(diào)查結(jié)果還顯示,一個企業(yè)要想在復(fù)雜的環(huán)境中獲得成功,高層管理者必須能夠控制極其復(fù)雜的商業(yè)結(jié)構(gòu),若沒有詳實(shí)的事實(shí)和數(shù)據(jù)支持,是很難辦到的。因此,隨著數(shù)據(jù)挖掘技術(shù)的不斷改進(jìn)和日益成熟,它必將被更多的第三方物流企業(yè)采用,使更多的物流管理者得到更多的商務(wù)智能。
商務(wù)智能技術(shù)的組成
具體地說,商務(wù)智能技術(shù)有數(shù)據(jù)倉庫(datawarehousing)、聯(lián)機(jī)分析處理(on-lineanalyticalprocessing,簡稱OLAP)、數(shù)據(jù)挖掘(datamining),包括這三者在內(nèi)的用于綜合、探察和分析商務(wù)數(shù)據(jù)的先進(jìn)的信息技術(shù)的統(tǒng)稱就是商務(wù)智能技術(shù)。
數(shù)據(jù)倉庫是一個面向主題的、集成的、隨時間變化的主要用于決策支持的數(shù)據(jù)的集合。一般來說,大的物流公司或企業(yè)內(nèi)存在著各種各樣的信息系統(tǒng),這些應(yīng)用驅(qū)動的操作型信息系統(tǒng)為企業(yè)不同的物流業(yè)務(wù)系統(tǒng)服務(wù),具有不同接口和不同的數(shù)據(jù)表示方法,互相孤立。利用數(shù)據(jù)倉庫技術(shù)可以動態(tài)地將各個物流企業(yè)子系統(tǒng)中的數(shù)據(jù)抽取集成到一起,進(jìn)行清洗、轉(zhuǎn)換等處理之后加載到數(shù)據(jù)倉庫中,通過周期性的刷新,為物流用戶提供一個統(tǒng)一的干凈的數(shù)據(jù)視圖,為數(shù)據(jù)分析提供一個高質(zhì)量的數(shù)據(jù)源。
對于數(shù)據(jù)倉庫中的數(shù)據(jù),可以使用一些增強(qiáng)的查詢和報表工具進(jìn)行復(fù)雜的查詢和即時的報表制作,可以利用OLAP技術(shù)從多種角度對物流業(yè)務(wù)數(shù)據(jù)進(jìn)行多方面的匯總、統(tǒng)計(jì)、計(jì)算,還可以利用數(shù)據(jù)挖掘技術(shù)自動發(fā)現(xiàn)其中隱含的有用的物流信息。
數(shù)據(jù)挖掘又稱知識發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,簡稱KDD),是從大量數(shù)據(jù)中抽取有意義的、隱含的、以前未知的并有潛在使用價值的知識的過程。數(shù)據(jù)挖掘是一個多學(xué)科交叉性學(xué)科,它涉及統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫、模式識別、可視化以及高性能計(jì)算等多個學(xué)科。利用數(shù)據(jù)挖掘技術(shù)可以分析各種類型的數(shù)據(jù),例如結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)、靜態(tài)的歷史數(shù)據(jù)和動態(tài)數(shù)據(jù)流數(shù)據(jù)等。
數(shù)據(jù)挖掘技術(shù)在第三方物流企業(yè)的應(yīng)用分析
數(shù)據(jù)挖掘是從大量的、不完全的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的數(shù)據(jù)中發(fā)現(xiàn)其潛在規(guī)律的技術(shù),是當(dāng)前計(jì)算機(jī)科學(xué)研究的熱點(diǎn)之一。隨著信息技術(shù)的高速發(fā)展,積累的有關(guān)物流行業(yè)的數(shù)據(jù)量劇增,如何從大量的物流數(shù)據(jù)中提取有用的知識成為第三方物流企業(yè)當(dāng)務(wù)之急。數(shù)據(jù)挖掘就是為順應(yīng)需要應(yīng)運(yùn)而生發(fā)展起來的數(shù)據(jù)處理技術(shù)。
數(shù)據(jù)挖掘的對象
關(guān)系數(shù)據(jù)庫(relationaldatabase)中通常存儲和管理的是結(jié)構(gòu)化的數(shù)據(jù),它將一個實(shí)體的各方面信息通過離散的屬性進(jìn)行描述。而文本數(shù)據(jù)庫(textdatabase)或文檔數(shù)據(jù)庫(documentdatabase)則通常存儲和管理的是半結(jié)構(gòu)化的數(shù)據(jù),例如新聞稿件、研究論文、電子郵件、書籍以及WEB頁面等都屬于半結(jié)構(gòu)化數(shù)據(jù)??臻g數(shù)據(jù)庫、多媒體數(shù)據(jù)庫中存放的是非結(jié)構(gòu)化數(shù)據(jù),例如地圖、圖片、音頻、視頻等都屬于非結(jié)構(gòu)化數(shù)據(jù)。相對于半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)來說,針對結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)比較成熟,市場上有很多的商品軟件可以使用,用的較多的包括IBMIntelligentMiner、SASEnterpriseMiner、SGIMineSet、ClementineSPSS以及MicrosoftSQLServer2000等。關(guān)于半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)挖掘軟件尚不多,相應(yīng)的算法相對還較少。從另一個角度來說,數(shù)據(jù)挖掘的分析對象分為兩種類型:靜態(tài)數(shù)據(jù)和數(shù)據(jù)流(datastream)數(shù)據(jù)?,F(xiàn)在的多數(shù)數(shù)據(jù)挖掘算法是用于分析靜態(tài)數(shù)據(jù)的。
數(shù)據(jù)挖掘的分析
無論要分析的數(shù)據(jù)對象的類型如何,常用的數(shù)據(jù)挖掘分析包括關(guān)聯(lián)分析、序列分析、分類、預(yù)測、聚類分析以及時間序列分析等。
關(guān)聯(lián)分析關(guān)聯(lián)分析是由RakeshApwal等人首先提出的。兩個或兩個以上變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的、可被發(fā)現(xiàn)的知識。關(guān)聯(lián)分為簡單關(guān)聯(lián)、時序關(guān)聯(lián)和因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。一般用支持度和可信度兩個閥值來度量關(guān)聯(lián)規(guī)則的相關(guān)性,還不斷引入興趣度、相關(guān)性等參數(shù),使得所挖掘的規(guī)則更符合需求。關(guān)聯(lián)分析主要用于發(fā)現(xiàn)不同事件之間的關(guān)聯(lián)性,即一個事件發(fā)生的同時,另一個事件也經(jīng)常發(fā)生。關(guān)聯(lián)分析的重點(diǎn)在于快速發(fā)現(xiàn)那些有實(shí)用價值的關(guān)聯(lián)發(fā)生的事件。其主要依據(jù)是事件發(fā)生的概率和條件概率應(yīng)該符合一定的統(tǒng)計(jì)意義。對于結(jié)構(gòu)化的數(shù)據(jù),以物流客戶的采購習(xí)慣數(shù)據(jù)為例,利用關(guān)聯(lián)分析,可以發(fā)現(xiàn)物流客戶的關(guān)聯(lián)采購需要。例如,對于第三方物流企業(yè)來說,一個托運(yùn)貨物的貨主很可能同時有貨物的包裝、流通加工等物流業(yè)務(wù)的需求。利用這種知識可以采取積極的物流運(yùn)營策略,擴(kuò)展物流客戶采購物流服務(wù)的范圍,吸引更多的物流客戶。通過調(diào)整服務(wù)的內(nèi)容便于物流顧客采購到各種物流服務(wù),或者通過降低一種物流業(yè)務(wù)的價格來促進(jìn)另一種物流業(yè)務(wù)的銷售等。
分類分析分類分析是通過分析具有類別的樣本的特點(diǎn),得到?jīng)Q定樣本屬于各種類別的規(guī)則或方法。利用這些規(guī)則和方法對未知類別的樣本分類時應(yīng)該具有一定的準(zhǔn)確度。分類分析可以根據(jù)顧客的消費(fèi)水平和基本特征對物流顧客進(jìn)行分類,找出對第三方物流企業(yè)有較大利益貢獻(xiàn)的重要的物流客戶的特征,通過對其進(jìn)行個性化物流服務(wù),提高他們的忠誠度。
聚類分析聚類分析是根據(jù)物以類聚的原理,將本身沒有類別的樣本聚集成不同的組,并且對每一個這樣的組進(jìn)行描述的過程。其主要依據(jù)是聚到同一個組中的樣本應(yīng)該彼此相似,而屬于不同組的樣本應(yīng)該足夠不相似。
以第三方物流企業(yè)的客戶關(guān)系管理為例,利用聚類分析,根據(jù)物流客戶的個人特征以及物流業(yè)務(wù)消費(fèi)數(shù)據(jù),可以將客戶群體進(jìn)行細(xì)分。例如,可以得到這樣的一個物流業(yè)務(wù)消費(fèi)群體:生產(chǎn)企業(yè)對物流業(yè)務(wù)中運(yùn)輸需求占41%,對物流業(yè)務(wù)中倉儲業(yè)務(wù)的需求占23%;商業(yè)企業(yè)對物流業(yè)務(wù)中運(yùn)輸需求占59%,對物流業(yè)務(wù)中倉儲業(yè)務(wù)需求占77%。針對不同的客戶群,可以實(shí)施不同的物流服務(wù)方式,從而提高客戶的滿意度。
數(shù)據(jù)挖掘流程
定義問題:第三方物流企業(yè)首先清晰地定義出各種物流業(yè)務(wù)問題,確定數(shù)據(jù)挖掘的目的。
數(shù)據(jù)準(zhǔn)備:首先第三方物流企業(yè)在大型數(shù)據(jù)庫和數(shù)據(jù)倉庫目標(biāo)中提取數(shù)據(jù)挖掘的目標(biāo)數(shù)據(jù)集進(jìn)行數(shù)據(jù)選擇;其次進(jìn)行數(shù)據(jù)的預(yù)處理,包括檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性、填補(bǔ)丟失的域,刪除無效數(shù)據(jù)等。
數(shù)據(jù)挖掘:第三方物流企業(yè)根據(jù)數(shù)據(jù)功能的類型和數(shù)據(jù)的特點(diǎn)選擇相應(yīng)的算法,在凈化和轉(zhuǎn)換過的數(shù)據(jù)集上進(jìn)行數(shù)據(jù)挖掘。
結(jié)果分析:第三方物流企業(yè)對數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋和評價,轉(zhuǎn)換成為能夠最終被理解的知識。
知識的運(yùn)用:第三方物流企業(yè)將分析所得到的知識集成到物流業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。
評價數(shù)據(jù)挖掘軟件需要考慮的問題
越來越多的軟件供應(yīng)商加入了數(shù)據(jù)挖掘這一領(lǐng)域的競爭。第三方物流企業(yè)如何正確評價一個商業(yè)軟件,選擇合適的軟件成為數(shù)據(jù)挖掘成功應(yīng)用的關(guān)鍵。評價一個數(shù)據(jù)挖掘軟件主要應(yīng)從以下四個主要方面:
計(jì)算性能:如該軟件能否在不同的物流業(yè)務(wù)平臺運(yùn)行;軟件的架構(gòu);能否連接不同的數(shù)據(jù)源;操作大數(shù)據(jù)集時,性能變化是線性的還是指數(shù)的;算的效率;是否基于組件結(jié)構(gòu)易于擴(kuò)展;運(yùn)行的穩(wěn)定性等;
功能性:如軟件是否提供足夠多樣的算法;能否避免挖掘過程黑箱化;軟件提供的算法能否應(yīng)用于多種類型的數(shù)據(jù);第三方物流企業(yè)能否調(diào)整算法和算法的參數(shù);軟件能否從數(shù)據(jù)集隨機(jī)抽取數(shù)據(jù)建立預(yù)挖掘模型;能否以不同的形式表現(xiàn)挖掘結(jié)果等。
可用性:如用戶界面是否友好;軟件是否易學(xué)易用;軟件面對的用戶是初學(xué)者、高級用戶還是專家;錯誤報告對用戶調(diào)試是否有很大幫助。
【關(guān)鍵詞】就業(yè)指導(dǎo);數(shù)據(jù)挖掘技術(shù);應(yīng)用
近年來隨著高校畢業(yè)生人數(shù)的逐年增加,大學(xué)生就業(yè)壓力也在逐漸增大,如何做好就業(yè)指導(dǎo),促進(jìn)學(xué)生更快更好的就業(yè),已成為目前各大高校研究的重點(diǎn)課題。隨著信息化技術(shù)的快速發(fā)展和信息搜集能力的日益提高,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到高校的就業(yè)指導(dǎo)工作中,從大量的數(shù)據(jù)中挖掘發(fā)現(xiàn)隱藏的、有價值的信息來指導(dǎo)學(xué)生有效的就業(yè),提高學(xué)生的就業(yè)質(zhì)量,已成為一個非常值得研究的重要課題。
1數(shù)據(jù)挖掘技術(shù)概念和類型分析
1.1數(shù)據(jù)挖掘技術(shù)概念
信息技術(shù)水平的迅速發(fā)展,使得一些新技術(shù)在教育領(lǐng)域當(dāng)中得到了廣泛的應(yīng)用,有效促進(jìn)了教育教學(xué)的快速發(fā)展。信息技術(shù)的應(yīng)用會產(chǎn)生大量的數(shù)據(jù),對這些數(shù)據(jù)的處理顯得非常的重要,利用數(shù)據(jù)挖掘技術(shù)不但能發(fā)揮數(shù)據(jù)信息處理的優(yōu)勢,還能大大提高信息處理的效率。數(shù)據(jù)挖掘(DataMining)又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn),是指從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取隱含的、未知的、非平凡的、極有潛在應(yīng)用價值的信息或模式,是數(shù)據(jù)庫研究中的一個很有應(yīng)用價值的新領(lǐng)域,是一個涉及到高性能計(jì)算、模式識別以及神經(jīng)網(wǎng)絡(luò)等各方面內(nèi)容的交叉性學(xué)科。數(shù)據(jù)挖掘需要經(jīng)過數(shù)據(jù)采集、預(yù)處理、數(shù)據(jù)分析、結(jié)果表示等一系列過程,對數(shù)據(jù)信息進(jìn)行有效的處理。采用的相關(guān)方法有決策樹方法、遺傳算法、粗糙集方法等。
1.2數(shù)據(jù)挖掘技術(shù)類型分析
數(shù)據(jù)挖掘技術(shù)由于涉及到的學(xué)科比較多,故此在數(shù)據(jù)挖掘技術(shù)的類型上也比較多樣,根據(jù)不同的標(biāo)準(zhǔn)就能分成不同的類型。根據(jù)數(shù)據(jù)庫的類型進(jìn)行分類,數(shù)據(jù)挖掘主要是關(guān)系數(shù)據(jù)庫中挖掘知識,在數(shù)據(jù)庫的類型上會不斷的增加,這樣就出現(xiàn)了不同數(shù)據(jù)庫數(shù)據(jù)挖掘,在這些數(shù)據(jù)挖掘類型當(dāng)中,歷史數(shù)據(jù)挖掘以及模糊數(shù)據(jù)挖掘等都是比較突出的應(yīng)用技術(shù)類型。在數(shù)據(jù)挖掘技術(shù)的類型當(dāng)中,結(jié)合挖掘方法的不同,以及技術(shù)應(yīng)用的不同進(jìn)行分類,主要方法有統(tǒng)計(jì)方法、探索性分析和數(shù)據(jù)庫方法。除此之外,按照數(shù)據(jù)挖掘的任務(wù)對其進(jìn)行分類,也能分成不同的類型,主要有時序模式、關(guān)聯(lián)分析、分類數(shù)據(jù)挖掘等。對不同的數(shù)據(jù)挖掘技術(shù)類型進(jìn)行分析與應(yīng)用,對信息數(shù)據(jù)的處理效率水平的提高可起到積極作用。
2數(shù)據(jù)挖掘技術(shù)在高校學(xué)生就業(yè)指導(dǎo)中的應(yīng)用步驟和具體應(yīng)用
2.1數(shù)據(jù)挖掘技術(shù)在高校學(xué)生就業(yè)指導(dǎo)中的應(yīng)用步驟
將數(shù)據(jù)挖掘應(yīng)用到高校學(xué)生就業(yè)指導(dǎo)當(dāng)中,能促進(jìn)就業(yè)指導(dǎo)教學(xué)的整體質(zhì)量水平的提高。而對數(shù)據(jù)挖掘技術(shù)的應(yīng)用,需要遵循相應(yīng)的步驟,這樣才能有利于發(fā)揮其積極的作用。數(shù)據(jù)挖掘技術(shù)的應(yīng)用要注重過程操作。2.1.1對問題進(jìn)行分析源數(shù)據(jù)庫需要評估以及確認(rèn)是否與數(shù)據(jù)挖掘的標(biāo)準(zhǔn)相符合,對這一情況結(jié)合實(shí)際加以分析。2.1.2提取、清洗和校驗(yàn)數(shù)據(jù)所提取的數(shù)據(jù)放在一個結(jié)構(gòu)上和數(shù)據(jù)模型兼容的數(shù)據(jù)庫當(dāng)中,采取統(tǒng)一模式清除不兼容數(shù)據(jù),保障數(shù)據(jù)的完整性。2.1.3選定數(shù)據(jù)挖掘算法結(jié)合其目的,通過DM過程當(dāng)中的準(zhǔn)則選擇一個特定的數(shù)據(jù)挖掘算法,用于搜索數(shù)據(jù)當(dāng)中的模式。2.1.4實(shí)施數(shù)據(jù)挖掘通過數(shù)據(jù)挖掘方法,產(chǎn)生一個特定的感興趣模式或特定數(shù)據(jù)集。2.1.5在對數(shù)據(jù)挖掘之后進(jìn)行解釋對所發(fā)現(xiàn)的模式進(jìn)行分析,去掉多余的不切題意的模式。2.1.6進(jìn)行知識評價對知識作用加以查看或證明,采用預(yù)先可信知識,檢查以及解決知識當(dāng)中所存在的矛盾。通過以上一系列的操作,可將數(shù)據(jù)挖掘技術(shù)的作用得到充分發(fā)揮。
2.2數(shù)據(jù)挖掘技術(shù)在高校學(xué)生就業(yè)指導(dǎo)中具體應(yīng)用
在高校畢業(yè)生的就業(yè)指導(dǎo)工作中,需要對影響學(xué)生就業(yè)的因素實(shí)施量化分析,為在畢業(yè)生就業(yè)指導(dǎo)方面提供相應(yīng)的數(shù)據(jù)。在數(shù)據(jù)挖掘技術(shù)的應(yīng)用中,主要就是對學(xué)生生源地信息以及學(xué)生就業(yè)率關(guān)聯(lián)關(guān)系實(shí)施挖掘,對學(xué)生性別和就業(yè)的關(guān)聯(lián)關(guān)系進(jìn)行挖掘,還有對學(xué)生的就業(yè)和學(xué)業(yè)的關(guān)聯(lián)關(guān)系進(jìn)行挖掘。結(jié)合實(shí)際情況對數(shù)據(jù)挖掘技術(shù)系統(tǒng)進(jìn)行設(shè)計(jì),并且在該系統(tǒng)中,要和數(shù)據(jù)挖掘?qū)I(yè)知識緊密結(jié)合,將其設(shè)計(jì)成幾個重要的模塊,即:數(shù)據(jù)預(yù)處理,頻繁項(xiàng)挖掘,關(guān)聯(lián)規(guī)則分析。(1)數(shù)據(jù)挖掘技術(shù)的采集以及轉(zhuǎn)換和預(yù)處理操作。在對數(shù)據(jù)進(jìn)行采集以及轉(zhuǎn)換和預(yù)處理環(huán)節(jié)的操作上,先對學(xué)生就業(yè)情況加以分析,在決策屬性方面明確,然后分析指標(biāo)數(shù)據(jù),如:對學(xué)生的實(shí)踐能力水平以及計(jì)算機(jī)等級等進(jìn)行分析。(2)對相關(guān)的指標(biāo)數(shù)據(jù)采集充分重視,在數(shù)據(jù)信息的采集方面,要和開發(fā)的成績管理系統(tǒng)進(jìn)行連接,并能從成績數(shù)據(jù)庫當(dāng)中提取學(xué)生綜合性的成績。通過Excel表格將學(xué)號導(dǎo)入,提供輸入數(shù)據(jù)界面,管理人員進(jìn)行手工輸入。對學(xué)生工作單位量化標(biāo)識,將工作單位分成升學(xué)、事業(yè)單位、企業(yè)、個體公司,采用字母a、b、c、d進(jìn)行表示。(3)數(shù)據(jù)挖掘技術(shù)的應(yīng)用過程中,對決策樹的應(yīng)用也比較重要,這是通過離散型變量作為屬性類型的學(xué)習(xí)方法。通過決策樹當(dāng)中C4.5算法思想的應(yīng)用,能夠有效處理描述屬性連續(xù)的相關(guān)問題。某連續(xù)屬性將存儲訓(xùn)練實(shí)例中的不同屬性值進(jìn)行排序,然后選擇相鄰值中的點(diǎn),作為離散時區(qū)分不同屬性值的標(biāo)準(zhǔn)。(4)數(shù)據(jù)挖掘技術(shù)中決策樹和算法的選擇應(yīng)用也是比較重要的,如在對算法的選擇方面,就要能先建立真正適合挖掘算法的分析模型,選擇合適的數(shù)據(jù)挖掘技術(shù)和算法,然后采用程序設(shè)計(jì)語言實(shí)現(xiàn)算法,這樣就能獲得有效的數(shù)據(jù)算法。在數(shù)據(jù)庫的處理方法方面,就包含著諸多的內(nèi)容,其中的數(shù)據(jù)讀取以及查詢操作是比較重要的。根據(jù)這些操作應(yīng)用對學(xué)生的相關(guān)數(shù)據(jù)信息的提取查看就比較方便。
3結(jié)語
綜上所述,高校畢業(yè)生就業(yè)指導(dǎo)過程當(dāng)中對數(shù)據(jù)挖掘技術(shù)的應(yīng)用,能有效提高就業(yè)指導(dǎo)的效率水平,從而為學(xué)生的未來就業(yè)發(fā)展提供有力條件,對教師在為學(xué)生就業(yè)指導(dǎo)方面能指明方向。希望在此次對數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究下,有助于實(shí)際的就業(yè)指導(dǎo)教學(xué)發(fā)展。
參考文獻(xiàn)
[1]金延軍.數(shù)據(jù)挖掘技術(shù)在高校學(xué)生就業(yè)指導(dǎo)中的應(yīng)用[J].黑龍江工程學(xué)院學(xué)報(自然科學(xué)版),2015(01).
[2]蔡麗艷.淺談數(shù)據(jù)挖掘技術(shù)及其在高校就業(yè)工作中的應(yīng)用[J].電腦知識與技術(shù),2015(09).
[3]康艷霞.數(shù)據(jù)挖掘在學(xué)生成績分析中的應(yīng)用[J].信息與電腦(理論版),2014(09).
[4]馮麗霞.數(shù)據(jù)挖掘技術(shù)在學(xué)校教學(xué)中的應(yīng)用研究[J].甘肅科技,2015(20).
[關(guān)鍵詞]CRM;數(shù)據(jù)挖掘;信息技術(shù)
[作者簡介]馬凱旋,河南農(nóng)業(yè)大學(xué)華豫學(xué)院商學(xué)院講師,碩士,河南商丘476113
[中圖分類號]F270.7 [文獻(xiàn)標(biāo)識碼]A [文章編號]1672-2728(2009)03-0136-03
客戶作為一種企業(yè)核心資源,擁有和保持更多的客戶決定著企業(yè)今后發(fā)展的命運(yùn),因此有效地開發(fā)和利用客戶資源,發(fā)展和鞏固企業(yè)同客戶之間的和諧關(guān)系,在最大程度上滿足客戶需求的同時實(shí)現(xiàn)企業(yè)的經(jīng)濟(jì)社會效益最大化,已經(jīng)成為企業(yè)界和學(xué)術(shù)界關(guān)注的焦點(diǎn)。信息經(jīng)濟(jì)環(huán)境中企業(yè)客戶關(guān)系管理是利用IT技術(shù)實(shí)現(xiàn)對客戶的整合營銷,是以客戶為核心的企業(yè)營銷的技術(shù)實(shí)現(xiàn)和管理實(shí)現(xiàn),并在企業(yè)與客戶之間建立一種實(shí)時、互動的交流管理系統(tǒng),最終目的是通過為客戶創(chuàng)造價值,建立個性化、高質(zhì)量的商品與服務(wù)來獲得新客戶,增加原有客戶的忠誠度和提高客戶的贏利能力,進(jìn)而增強(qiáng)企業(yè)的核心競爭力。同時隨著信息技術(shù)的迅速發(fā)展,特別是數(shù)據(jù)庫技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)的廣泛應(yīng)用,企業(yè)所面對的客戶數(shù)據(jù)量、企業(yè)內(nèi)外信息量急劇膨脹,企業(yè)如果能夠?qū)@海量的數(shù)據(jù)進(jìn)行有效、快速和深入的分析和處理,發(fā)現(xiàn)有價值的知識,就能為企業(yè)作出正確的經(jīng)營決策、捕捉稍縱即逝的市場機(jī)會提供極大的幫助。
一、數(shù)據(jù)挖掘技術(shù)分析
(一)數(shù)據(jù)挖掘技術(shù)的發(fā)展過程。數(shù)據(jù)挖掘是生產(chǎn)發(fā)展的必然結(jié)果,最初的數(shù)據(jù)挖掘僅僅是用一些信息儲存工具儲存一些簡單的信息,人們并不去對這些信息進(jìn)行分析來提取更深層次的、更有價值的知識,而且使用和獲得信息的速度也很緩慢,隨著生產(chǎn)力水平的極大提高和信息技術(shù)的飛速發(fā)展,目前已經(jīng)實(shí)現(xiàn)了人們能實(shí)時地獲得經(jīng)過深入提煉的知識與信息。數(shù)據(jù)挖掘的每一步發(fā)展,可以說都是建立在前一階段的基礎(chǔ)上,總的來說,數(shù)據(jù)挖掘分為四個發(fā)展階段:(1)數(shù)據(jù)收集階段(Data Col-lection):企業(yè)僅僅是簡單地整理儲存信息,并應(yīng)用一些簡單的運(yùn)算工具進(jìn)行數(shù)據(jù)加工,如對信息的總量計(jì)算、平均數(shù)計(jì)算等;(2)數(shù)據(jù)追溯階段(DataAccess)企業(yè)開始應(yīng)用關(guān)聯(lián)模式處理儲存信息,在整個企業(yè)范圍內(nèi)建立起了數(shù)據(jù)收集和信息管理系統(tǒng),管理層可以獲得企業(yè)的歷史信息;(3)數(shù)據(jù)導(dǎo)航階段(Data Navigation)、企業(yè)內(nèi)出現(xiàn)了數(shù)據(jù)倉庫,應(yīng)用多維數(shù)據(jù)基的處理和儲存信息,企業(yè)不僅能應(yīng)用信息管理系統(tǒng)獲得企業(yè)整體和各個地區(qū)經(jīng)營狀況的信息,而且通過應(yīng)用在線分析系統(tǒng)(OLAP)等手段進(jìn)行數(shù)據(jù)對比;(4)數(shù)據(jù)挖掘階段(Data Min-ing):也就是通過使用在線分析工具、先進(jìn)的信息技術(shù)以及統(tǒng)計(jì)數(shù)學(xué)等方法為企業(yè)提供實(shí)時的信息反饋和與合作伙伴的信息交流。數(shù)據(jù)挖掘使企業(yè)管理者更能獲得存在于信息之中的深層價值,從而為企業(yè)的經(jīng)營戰(zhàn)略決策產(chǎn)生重要幫助作用。
(二)數(shù)據(jù)挖掘技術(shù)的內(nèi)容。數(shù)據(jù)挖掘是進(jìn)行信息處理的系統(tǒng)工具,按照信息處理的流程來分類,一般有三種類型:信息發(fā)現(xiàn)(Discovery)、預(yù)測模型(Predictive Model)和異常分析(Forensic Analy-山)。信息發(fā)現(xiàn)是指單純地對信息進(jìn)行處理、整理和分析,以發(fā)掘出蘊(yùn)涵在信息之間的潛在的有價值的知識或者聯(lián)系,但并不進(jìn)行對信息處理結(jié)果的預(yù)測。信息發(fā)現(xiàn)包括條件邏輯推理、關(guān)聯(lián)處理和信息規(guī)律趨勢和變化等;預(yù)測模型是指通過上一階段的信息處理,利用有價值的知識資源和預(yù)測模型對其進(jìn)行發(fā)展趨勢預(yù)測,這包括結(jié)論預(yù)測和發(fā)展趨勢展望等;異常分析是指數(shù)據(jù)挖掘的擴(kuò)展階段,對發(fā)現(xiàn)的異常情況作出分析,包括偏離偵測和關(guān)聯(lián)分析等。總的來說,數(shù)據(jù)挖掘技術(shù)通常有六種手段進(jìn)行信息處理:分類、回歸模型、時間序列、聚類、關(guān)聯(lián)分析和序列發(fā)現(xiàn)。分類和回歸模型一般用于趨勢預(yù)測,關(guān)聯(lián)和序列發(fā)現(xiàn)用于分析客戶行為,聚類則可用于以上兩種情況。
數(shù)據(jù)挖掘技術(shù)按對信息的處理方式分為數(shù)據(jù)保存技術(shù)和數(shù)據(jù)提煉技術(shù)兩種方式。數(shù)據(jù)保存技術(shù)主要是能夠方便地為企業(yè)決策提供信息幫助,在企業(yè)決策中應(yīng)用案例分析(CBR)來保證經(jīng)營決策的有效性。但是企業(yè)要想獲得蘊(yùn)涵在信息之中的有價值的知識,就必須使用數(shù)據(jù)提煉技術(shù),數(shù)據(jù)提煉技術(shù)包括:邏輯方法是運(yùn)用多維或者OLAP技術(shù)對量化的或者非量化的數(shù)據(jù)進(jìn)行統(tǒng)一模式的處理,包括規(guī)則公式和決策樹;橫向?qū)Ρ戎饕菍Χㄐ詳?shù)據(jù)指標(biāo)進(jìn)行類比分析,包括類比中介和可信網(wǎng)絡(luò);程式分析是能夠有效地應(yīng)用多維模型和數(shù)理統(tǒng)計(jì)方法對大規(guī)模的數(shù)據(jù)進(jìn)行處理,包括數(shù)理統(tǒng)計(jì)方法和神經(jīng)網(wǎng)絡(luò)等。
二、數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用
在客戶關(guān)系管理過程中,客戶生命周期對企業(yè)來說非常重要,因?yàn)樗苯雨P(guān)系到企業(yè)的客戶收益和客戶利潤,一方面客戶生命周期提供了客戶信息來源,另一方面客戶生命周期使得企業(yè)明確了為滿足客戶需求應(yīng)注重的方面??蛻羯芷跒閿?shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用提供了基礎(chǔ),數(shù)據(jù)挖掘是建立在數(shù)據(jù)倉庫之上的,通過各種先進(jìn)的信息技術(shù)和數(shù)理統(tǒng)計(jì)方法挖掘數(shù)據(jù)倉庫中的潛在的、有價值的客戶信息,通過運(yùn)用數(shù)據(jù)挖掘,企業(yè)能把大量的客戶記錄變成系統(tǒng)的客戶信息,提供給決策者,這樣不僅解決了企業(yè)進(jìn)行決策時遇到的信息匱乏,也充分發(fā)揮了企業(yè)實(shí)施CRM的效用。
(一)客戶分析。CRM系統(tǒng)主要是面向客戶,因此對客戶數(shù)據(jù)的分析是極為重要的,通過對客戶數(shù)據(jù)的分析,發(fā)現(xiàn)客戶需求,調(diào)整企業(yè)戰(zhàn)略并實(shí)施相應(yīng)的措施,客戶分析主要有幾個方面:(1)購買頻率,通過對客戶購買頻率的分析,企業(yè)實(shí)施相應(yīng)的營銷活動,可以利用諸如促銷、折扣和優(yōu)惠等手段來刺激消費(fèi)者的消費(fèi)欲望;(2)近期消費(fèi),通過對客戶最近消費(fèi)時間的分析,可以及時發(fā)現(xiàn)客戶流失的原因,從而采取相應(yīng)的措施;(3)客戶忠誠度分析,通過對客戶交易資料的記錄和分析,可以采用序列模式來預(yù)測消費(fèi)者的忠誠度,并據(jù)此來調(diào)整企業(yè)的生產(chǎn)和提供的服務(wù),提高客戶的忠誠度并吸引新客戶;(4)客戶分類,不同的消費(fèi)者對產(chǎn)品和服務(wù)的要求不同,也為企業(yè)創(chuàng)造不同的收益,企業(yè)根據(jù)數(shù)據(jù)挖掘技術(shù)的信息處理分析,對客戶采用聚類的方法進(jìn)行分類,挖掘客戶群的需求特征和需求趨勢,并發(fā)現(xiàn)最有價值和最有盈利潛力的客戶群,對這些客戶實(shí)施“一對一”的市場營銷,取得最大的收益;(5)客戶購買相關(guān)性分析,通過銷售記錄的信息挖掘,可以發(fā)現(xiàn)客戶購買相關(guān)性,這也是發(fā)現(xiàn)客戶消費(fèi)偏好、消費(fèi)特點(diǎn)的重要方法,據(jù)此企業(yè)可以積極采用各種手段,如推薦、傳單以及網(wǎng)絡(luò)推廣等方式幫助消費(fèi)者選擇商品,增加企業(yè)的收益;(6)營銷合理化分析,通過分析營銷活動的有效
性,有助于改善營銷效率,多維分析可以實(shí)現(xiàn)這方面分析的要求,即通過比較營銷改變前后銷售狀況。
(二)異常偏離分析。企業(yè)在對客戶數(shù)據(jù)進(jìn)行分析時,有可能發(fā)現(xiàn)異常數(shù)據(jù)或者無法解釋的現(xiàn)象發(fā)生,企業(yè)應(yīng)對此應(yīng)高度關(guān)注,一般的做法是通過使用數(shù)據(jù)挖掘的各種先進(jìn)技術(shù),如決策樹、神經(jīng)網(wǎng)絡(luò)、聚類等來及時分析這些異常情況,使企業(yè)能作出快速的反應(yīng),并針對處理的結(jié)果及時調(diào)整企業(yè)的營銷決策。
(三)趨勢分析和預(yù)測。數(shù)據(jù)挖掘的工具為客戶需求趨勢預(yù)測提供了有效的手段,常用的工具是時間序列分析、系統(tǒng)力學(xué)和神經(jīng)網(wǎng)絡(luò)。這些工具能為企業(yè)提供科學(xué)、有效的趨勢分析,并用于企業(yè)的生產(chǎn)和營銷決策。具體內(nèi)容包括:評價產(chǎn)品銷售狀況,企業(yè)通過分析客戶數(shù)據(jù)庫中記錄每一位消費(fèi)者的交易信息,可以針對不同的產(chǎn)品、不同的區(qū)域采取不同的銷售策略,實(shí)現(xiàn)盈利最大化;預(yù)測銷售狀況,通過準(zhǔn)確的預(yù)測,發(fā)現(xiàn)隱藏的信息,是把握市場動向,滿足客戶需求,調(diào)整生產(chǎn)結(jié)構(gòu)和營銷方法,從而使企業(yè)在激烈的市場競爭中立于不敗之地。
(四)客戶服務(wù)支持??蛻舴?wù)是CRM中的重要組成部分,包括客戶信息和服務(wù)信息,這些數(shù)據(jù)既有結(jié)構(gòu)化的也有非結(jié)構(gòu)化的,結(jié)構(gòu)化的數(shù)據(jù)比較容易分析和整理,如銷售狀況、客戶交易信息等,非結(jié)構(gòu)化的數(shù)據(jù)如故障信息、故障處理信息以及客戶反饋信息等。對結(jié)構(gòu)化數(shù)據(jù)挖掘的主要過程是:根據(jù)相應(yīng)數(shù)據(jù)的特點(diǎn)來選擇規(guī)則模板,對數(shù)據(jù)進(jìn)行選取和轉(zhuǎn)換,并應(yīng)用歸納學(xué)習(xí)法、決策樹、最鄰近法、人工神經(jīng)網(wǎng)絡(luò)技術(shù)等來進(jìn)行數(shù)據(jù)挖掘,挖掘得到的結(jié)果可以存入數(shù)據(jù)庫,幫助企業(yè)決策,非結(jié)構(gòu)化數(shù)據(jù)由于存在的形式和性質(zhì)難以進(jìn)行標(biāo)準(zhǔn)化分析,但是非結(jié)構(gòu)化所隱藏的價值可以通過兩種途徑來進(jìn)行挖掘:一是建立全新的數(shù)據(jù)挖掘算法,直接對非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行挖掘,但是由于非結(jié)構(gòu)化的自身特點(diǎn),使得這樣的全新數(shù)據(jù)挖掘非常復(fù)雜,而且難以評估數(shù)據(jù)挖掘結(jié)果的可靠性;二是通過將非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化,而后采用結(jié)構(gòu)化的數(shù)據(jù)挖掘技術(shù)對其進(jìn)行挖掘,這就需要建立非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換技術(shù),而且也是非常復(fù)雜。總的來說,結(jié)構(gòu)化數(shù)據(jù)挖掘技術(shù)已經(jīng)成熟,但是非結(jié)構(gòu)化的數(shù)據(jù)挖掘尚待進(jìn)一步發(fā)展。
(五)銷售管理。銷售管理自動化是客戶關(guān)系管理成長最快的部分,銷售人員與潛在客戶的互動行為、將潛在的客戶發(fā)展成真正客戶并提高其忠誠度是使企業(yè)盈利的核心因素。在此環(huán)節(jié)中,數(shù)據(jù)挖掘可以對多種市場活動的有效性進(jìn)行實(shí)時跟蹤和分析,數(shù)據(jù)挖掘不僅使銷售人員及時把握銷售機(jī)遇、提高工作效率,而且企業(yè)管理層也可以隨時掌握市場動態(tài)。
(六)數(shù)據(jù)挖掘和客戶隱私。數(shù)據(jù)挖掘技術(shù)幫助企業(yè)能比以往更好地發(fā)現(xiàn)客戶信息中的隱性知識,但是這也增加了客戶隱私被企業(yè)侵犯的風(fēng)險。一方面客戶信息挖掘有助于客戶與企業(yè)之間建立起親密的關(guān)系,另一方面客戶信息如果被企業(yè)不正當(dāng)?shù)乩?,則會給客戶本身帶來不利影響。比如客戶信用等級、客戶交易行為等信息如果不當(dāng)利用,會給消費(fèi)者帶來推銷騷擾,甚至是某種社會歧視或者失業(yè)的威脅??蛻綦[私按其本質(zhì)來說,更是一個道德問題而非一個技術(shù)問題,關(guān)鍵是處理好企業(yè)數(shù)據(jù)挖掘與客戶個人信息保護(hù)之間的平衡問題,現(xiàn)在世界上好多企業(yè)在處理客戶交易信息時,采用匿名方式,將客戶的個人身份信息隱藏起來,只將交易資料,如客戶偏好、消費(fèi)等級、需求特點(diǎn)和客戶價值等資料輸入到數(shù)據(jù)處理模型中??傊?,企業(yè)在實(shí)施客戶關(guān)系管理的同時,必須注重客戶隱私的保護(hù),這樣才能給消費(fèi)者以安全的感覺,才會讓客戶真正地與企業(yè)之間進(jìn)行交流,才能充分發(fā)揮數(shù)據(jù)挖掘在客戶關(guān)系管理的作用。
關(guān)鍵詞:消防滅火救援;數(shù)據(jù)挖掘技術(shù);應(yīng)用
引言
近年來,我國的城市化建設(shè)的步伐在逐漸加快,城市規(guī)模、各種建筑、車輛、人員都在快速地增長。在此背景下,火災(zāi)預(yù)防工作呈現(xiàn)復(fù)雜化和多樣化等特點(diǎn)。不僅火災(zāi)隱患的數(shù)量有所增多,滅火救援的難度也在逐漸的增大。如果不能及時的消除與控制火災(zāi)隱患,一旦發(fā)生火災(zāi),將會帶來巨大的損失,威脅著人們的生命財產(chǎn)安全。消防滅火救援工作的有效開展,離不開消防滅火系統(tǒng)的穩(wěn)定運(yùn)行。消防滅火系統(tǒng)在運(yùn)行的過程中,往往會涉及到大量的相關(guān)數(shù)據(jù)。如果應(yīng)用數(shù)據(jù)挖掘技術(shù)對其進(jìn)行分析,將有助于提高消防滅火救援的質(zhì)量與效率。因此,研究消防滅火救援中數(shù)據(jù)挖掘技術(shù)的應(yīng)用,具有重要的理論意義和現(xiàn)實(shí)意義。
1 數(shù)據(jù)挖掘技術(shù)概述
數(shù)據(jù)挖掘技術(shù)是社會經(jīng)濟(jì)發(fā)展的成果之一。在數(shù)理統(tǒng)計(jì)分析、數(shù)據(jù)庫、模糊數(shù)學(xué)、人工智能等技術(shù)不斷發(fā)展的背景下,數(shù)據(jù)挖掘技術(shù)通過融合了各種相關(guān)知識,逐漸形成為一項(xiàng)綜合性技術(shù)。隨著信息時代的到來,數(shù)據(jù)挖掘技術(shù)更是得到了廣泛的應(yīng)用與發(fā)展。數(shù)據(jù)挖掘作為一種專門用來分析數(shù)據(jù)的技術(shù)之一,主要的應(yīng)用原理是:選取恰當(dāng)?shù)姆治黾夹g(shù),在隨機(jī)的、模糊的數(shù)據(jù)中提取有價值的信息。通過實(shí)現(xiàn)數(shù)據(jù)與信息之間的有效轉(zhuǎn)換,能夠找到?jīng)]有意識到的問題、將定性的問題定量化,甚至還能找出未來發(fā)展的趨勢,從而為決策提供有效的依據(jù)。完整的數(shù)據(jù)挖掘流程包括多個環(huán)節(jié),并且在不同的應(yīng)用領(lǐng)域中,其包含的步驟也各不相同。文章將其大致分為以下三個階段。(1)數(shù)據(jù)的準(zhǔn)備階段。(2)數(shù)據(jù)挖掘階段。(3)對數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋。
2 數(shù)據(jù)挖掘技術(shù)在消防滅火救援中的主要作用
數(shù)據(jù)挖掘不僅在商業(yè)領(lǐng)域獲得的廣泛的應(yīng)用,在其它行業(yè)中的作用也不容小視。隨著現(xiàn)代城市的發(fā)展,消防滅火救援工作的難度也隨之增長。將數(shù)據(jù)挖掘技術(shù)運(yùn)用于消防滅火救援中,同樣能夠發(fā)揮重要的作用,有助于提高效率。數(shù)據(jù)挖掘技術(shù)在消防滅火救援中所能發(fā)揮的作用,具體體現(xiàn)為以下幾個方面。
首先,運(yùn)用數(shù)據(jù)挖掘技術(shù)能夠?qū)Τ鞘邢澜o水系統(tǒng)中的相關(guān)信息進(jìn)行有效處理。在消防滅火救援過程中,充足的水源通常發(fā)揮著重要的滅火作用。因此,為了做好城市消防滅火工作,提高消防滅火救援的質(zhì)量,及時消滅火源,應(yīng)當(dāng)對消防給水系統(tǒng)進(jìn)行合理化設(shè)置。在優(yōu)化消防給水系統(tǒng)的過程中,如果運(yùn)用數(shù)據(jù)挖掘技術(shù),有助于設(shè)置合理的消防給水系統(tǒng)的覆蓋點(diǎn),從而進(jìn)一步提升優(yōu)化水平。
其次,運(yùn)用數(shù)據(jù)挖掘技術(shù),能夠在整理與排查火災(zāi)源頭和隱患時有效的發(fā)揮作用,從而最大限度的避免火災(zāi)事故的發(fā)生,減少人員傷亡。因?yàn)?,?shù)據(jù)挖掘技術(shù),能夠從大量的隨機(jī)數(shù)據(jù)中挖掘出具有潛在利用價值的信息,其應(yīng)用在整理與排查火災(zāi)隱患時,有助于提高效率。與此同時,利用數(shù)據(jù)挖掘技術(shù)能夠?qū)ξ磥淼陌l(fā)展行為或趨勢做出自動預(yù)測。在面對不同情況的建筑分布時,可以利用數(shù)據(jù)挖掘技術(shù)進(jìn)行細(xì)化分類,預(yù)測不同程度的火災(zāi)所必需的水量。
最后,運(yùn)用數(shù)據(jù)挖掘技術(shù)能夠加快消防滅火救援決策的速度。當(dāng)發(fā)生火災(zāi)事故時,快速抵達(dá)火災(zāi)事故現(xiàn)場,并采取有效措施展開滅火救援工作,能夠挽回更多的生命與財產(chǎn)損失。一方面,利用數(shù)據(jù)挖掘技術(shù),對所獲取的路網(wǎng)監(jiān)控數(shù)據(jù)、可用消防栓的分布狀況以及消防通道情況等信息進(jìn)行實(shí)時分析,有助于在險情發(fā)生時提供一條快速抵達(dá)火災(zāi)事故現(xiàn)場的合理路線方案。另一方面,利用數(shù)據(jù)挖掘技術(shù),可以根據(jù)火災(zāi)事故現(xiàn)場的條件、化學(xué)物質(zhì)主要物濃度、風(fēng)速風(fēng)向等氣象條件進(jìn)行數(shù)據(jù)分析,通過建立數(shù)據(jù)模型,分析可能發(fā)生的次生災(zāi)害,為消防滅火救援決策提供重要的技術(shù)支持。
3 消防滅火救援中數(shù)據(jù)挖掘的應(yīng)用
通過上文的分析,了解到數(shù)據(jù)挖掘技術(shù)在消防滅火救援中能夠發(fā)揮多方面的作用。所以,為了完善消防滅火系統(tǒng),提高消防滅火救援工作的整體質(zhì)量,數(shù)據(jù)挖掘技術(shù)在滅火救援中的應(yīng)用,需要做好以下幾點(diǎn)。
3.1 建立數(shù)據(jù)模型
在消防滅火救援中,應(yīng)用數(shù)據(jù)挖掘技術(shù),首先應(yīng)當(dāng)建立數(shù)據(jù)模型。需要注意的是,數(shù)據(jù)挖掘技術(shù)包含多種方法,每一種方法都有其各自的適用范圍。因此,在建立數(shù)據(jù)模型的過程中,為了高效地實(shí)現(xiàn)數(shù)據(jù)挖掘任務(wù),提取有價值的信息,應(yīng)當(dāng)采用科學(xué)合理的數(shù)據(jù)挖掘方法。盡管方法不同,在建立數(shù)據(jù)庫時,都應(yīng)當(dāng)包括以下幾個方面的功能:火災(zāi)風(fēng)險評估功能、消防給水功能以及歷史或再分析功能。要想同時滿足這三個功能,需要對數(shù)據(jù)倉庫進(jìn)行分類,構(gòu)建三層分類模型。分別是概念模型、邏輯模型和物理模型三類。(1)在概念模型的設(shè)計(jì)過程中,應(yīng)當(dāng)以信息包圖為基礎(chǔ)進(jìn)行。在此期間,需要注意以下兩個方面的內(nèi)容。其一,要確定信息包圖的指標(biāo)、維度與類別三大方面。其二,應(yīng)當(dāng)對實(shí)體對象進(jìn)行分析,進(jìn)而完成信息包圖。(2)邏輯模型的基礎(chǔ)是星型圖,它的主要方面是指標(biāo)實(shí)體、維度實(shí)體和詳細(xì)類別實(shí)體三種,用來反映概念模型中實(shí)體間的關(guān)系。(3)在物理模型的設(shè)計(jì)過程中,主要以數(shù)據(jù)庫表為基礎(chǔ)。數(shù)據(jù)庫表是指,將指標(biāo)的實(shí)體轉(zhuǎn)化成的數(shù)據(jù)編成表。
3.2 聯(lián)機(jī)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)的分析
在消防滅火救援中,應(yīng)用數(shù)據(jù)挖掘技術(shù),還需要聯(lián)機(jī)網(wǎng)絡(luò)對數(shù)據(jù)做進(jìn)一步的分析。運(yùn)用網(wǎng)絡(luò)工具對于所采集的消防滅火救援相關(guān)數(shù)據(jù)進(jìn)行聯(lián)機(jī)分析,主要分為以下兩個步驟。首先,定義控制流任務(wù),選用適當(dāng)?shù)亩嗝襟w工具進(jìn)行數(shù)據(jù)的提取與轉(zhuǎn)換。為了提高數(shù)據(jù)挖掘技術(shù)的應(yīng)用效果,應(yīng)當(dāng)確保數(shù)據(jù)的真實(shí)性與時效性。其次,建立多維數(shù)據(jù),主要是將數(shù)據(jù)倉庫中的表轉(zhuǎn)換為多維化數(shù)據(jù)。
3.3 分析火災(zāi)風(fēng)險
聚類分析屬于數(shù)據(jù)挖掘技術(shù)中一種重要的數(shù)據(jù)處理方法,有助于增強(qiáng)對客觀現(xiàn)實(shí)的認(rèn)識,其主要原理是將指標(biāo)量變?yōu)閿?shù)據(jù)量。聚類分析的主要步驟是:(1)建立指標(biāo)體系。(2)確定指標(biāo)因子的權(quán)重。(3)量化指標(biāo)。(4)實(shí)現(xiàn)聚類分析。通過聚類方法分析火災(zāi)風(fēng)險,可以對不同地區(qū)的火災(zāi)等級進(jìn)行分類,評估不同地區(qū)的火災(zāi)隱患嚴(yán)重度,從而合理地安排消防給水系統(tǒng),保障該區(qū)域消防滅火工作得以順利的進(jìn)行,實(shí)現(xiàn)對于火災(zāi)的有效預(yù)防與控制。
4 結(jié)束語
數(shù)據(jù)挖掘技術(shù)作為社會經(jīng)濟(jì)發(fā)展的成果之一,能夠?qū)?shù)據(jù)進(jìn)行有效的統(tǒng)計(jì)分析,為相關(guān)的決策提供一定的幫助,因此,在各行業(yè)中都發(fā)揮著不同程度的作用。雖然我國消防工作中涉及到大量的數(shù)據(jù),但是由于對數(shù)據(jù)處理技術(shù)的掌握還比較生疏,導(dǎo)致數(shù)據(jù)挖掘技術(shù)的利用率比較低。從長遠(yuǎn)來看,為了提高消防滅火救援的效率與效果,數(shù)據(jù)挖掘技術(shù)仍然具有廣闊的應(yīng)用空間。文章對于消防滅火救援中數(shù)據(jù)挖掘技術(shù)的作用進(jìn)行了簡要的分析,對數(shù)據(jù)挖掘技術(shù)有了初步了解。隨著我國社會經(jīng)濟(jì)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)也會逐步的改進(jìn)與完善,其終將廣泛應(yīng)用于消防領(lǐng)域中,為我國的消防滅火救援工作貢獻(xiàn)出一份力量。
參考文獻(xiàn)
[1]謝道文.基于數(shù)據(jù)挖掘的火災(zāi)分析模型及應(yīng)用研究[D].中南大學(xué),2014.