時間:2023-01-15 11:27:27
導(dǎo)語:在數(shù)據(jù)挖掘技術(shù)論文的撰寫旅程中,學(xué)習(xí)并吸收他人佳作的精髓是一條寶貴的路徑,好期刊匯集了九篇優(yōu)秀范文,愿這些內(nèi)容能夠啟發(fā)您的創(chuàng)作靈感,引領(lǐng)您探索更多的創(chuàng)作可能。

關(guān)鍵詞:數(shù)據(jù)挖掘電子商務(wù)應(yīng)用
當(dāng)今,國內(nèi)外電子商務(wù)類網(wǎng)站日益興起。許多電子商務(wù)類網(wǎng)站都提供了一定程度的個性化服務(wù),比如提供商品推薦服務(wù)。而構(gòu)成這些個性化服務(wù)的基礎(chǔ)就是數(shù)據(jù)挖掘技術(shù)。
一、數(shù)據(jù)挖掘分析
1.數(shù)據(jù)挖掘的定義。數(shù)據(jù)挖掘(datamining,DM)是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識的過程。包括存儲和處理數(shù)據(jù),選擇處理大數(shù)據(jù)集的算法、解釋結(jié)果、使結(jié)果可視化。
2.數(shù)據(jù)挖掘的方法。從商業(yè)的角度來看,數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點是對商業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘的方法大致可以分成4類:關(guān)聯(lián)分析、概括分析、分類分析、聚類分析。(1)關(guān)聯(lián)分析:分析表面上不相關(guān)數(shù)據(jù)之間的內(nèi)在聯(lián)系,揭示各事之間的依賴性和相關(guān)性,分析范圍包括簡單關(guān)聯(lián)、因果關(guān)聯(lián)等。在電子商務(wù)中,用數(shù)據(jù)挖掘找到隱藏的關(guān)聯(lián)規(guī)則,當(dāng)客戶瀏覽、搜索關(guān)聯(lián)規(guī)則中的某種商品時,就可以在頁面中以推薦商品的形式顯示關(guān)聯(lián)規(guī)則中的其它商品。在進貨計劃和促銷計劃中,也可以將這個因素考慮進去。(2)概括分析:即提取數(shù)據(jù)庫中指定的數(shù)據(jù)集合的一般特性,找出遍性規(guī)律。(3)分類分析:設(shè)置分類規(guī)則,把各個事務(wù)或?qū)嶓w按照性質(zhì)和特征不同進行歸類,把數(shù)據(jù)層次化和規(guī)整化,從而建立數(shù)據(jù)的分類模型。(4)聚類分析:通過分析和歸納實體之間的特征差異,選出具相識特征的實體聚合成為一個類,并用某種規(guī)則來描述該類的相同屬性,形成一種聚類規(guī)則,實際上,它是與分類分析法互逆的過程。
3.數(shù)據(jù)挖掘的過程。該過程從大型數(shù)據(jù)庫中挖掘先前未知的、有效的、可實用的信息,并使用這些信息做出決策或豐富知識。(1)確定業(yè)務(wù)對象:清晰地定義出業(yè)務(wù)問題,認清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步。挖掘的最后結(jié)構(gòu)是不可預(yù)測的,但要探索的問題應(yīng)是有預(yù)見的,為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘則帶有盲目性,是不會成功的。(2)數(shù)據(jù)準備。數(shù)據(jù)的選擇:搜索所有與業(yè)務(wù)對象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù)。(3)數(shù)據(jù)挖掘:對所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進行挖掘。除了完善從選擇合適的挖掘算法外,其余一切工作都能自動地完成。(4)結(jié)果分析:解釋并評估結(jié)果。其使用的分析方法一般應(yīng)作數(shù)據(jù)挖掘操作而定,通常會用到可視化技術(shù)。(5)知識的同化:將分析所得到的知識集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。
二、數(shù)據(jù)挖掘與電子商務(wù)的關(guān)系
在電子商務(wù)企業(yè)中,數(shù)據(jù)挖掘運用于客戶行為分析,企業(yè)從中受益體現(xiàn)在以下四個方面:(1)可以發(fā)現(xiàn)客戶和訪問者的愛好、生活模式。(2)可以爭取新顧客,怎樣使產(chǎn)品適銷對路、怎樣給產(chǎn)品定價、怎樣吸引單個客戶、怎樣優(yōu)化Web網(wǎng)站。(3)可以用相應(yīng)的信息確定顧客的消費周期,針對不同的產(chǎn)品制定相應(yīng)的營銷策略。(4)可以確定客戶細分,為每一個客戶的獨特需求設(shè)計“量身定制”的產(chǎn)品。三、數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用
1.面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)設(shè)計。本系統(tǒng)電子商務(wù)平臺采用基于三層體系結(jié)構(gòu)構(gòu)建,服務(wù)器端采用先進的J2EE平臺構(gòu)架,有完整的體系框架組成,具有很好的可擴展性、互聯(lián)性和可維護性。因此面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)由數(shù)據(jù)庫服務(wù)器、應(yīng)用服務(wù)器和客戶端三層組成,整個體系結(jié)構(gòu)是以J2EE企業(yè)級的構(gòu)建技術(shù)為基礎(chǔ)。對數(shù)據(jù)挖掘過程中產(chǎn)生的數(shù)據(jù),采用獨立的數(shù)據(jù)挖掘庫表存放,這樣既不影響也不依賴數(shù)據(jù)挖掘的數(shù)據(jù)源。應(yīng)用服務(wù)器完成所有的數(shù)據(jù)挖掘運算,通過接受客戶端的設(shè)置,完成所有對數(shù)據(jù)進行探索、轉(zhuǎn)換、挖掘的工作。數(shù)據(jù)挖掘系統(tǒng)的每個功能模塊都以EJB的形式進行封裝,以實現(xiàn)分布式計算和負載平衡等分布式計算的要求,把具有繁重計算任務(wù)的模塊和用戶交互模塊分開??蛻舳艘撠?zé)數(shù)據(jù)挖掘流程的創(chuàng)建工作、所有功能模塊參數(shù)的設(shè)定以及各種可視化結(jié)果的顯示。用戶可以根據(jù)自己的要求任意創(chuàng)建各種形式的挖掘流程,同時按照需要執(zhí)行某部分流程,獲取相應(yīng)的可視化分析結(jié)果,其系統(tǒng)體系結(jié)構(gòu)如圖所示。
面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)體系結(jié)構(gòu)圖
2.面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)功能設(shè)計。面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)主要以下幾大功能模塊:(1)用戶信息分析。運用分類和聚類挖掘方法對用戶的信息分析,可以得到用戶的些特征。對用戶分類相當(dāng)于對具有某些公共屬性的用戶群體建立了概要特征描述,這些特征可以用來對新增的用戶進行分類,可以發(fā)現(xiàn)未來的潛在用戶并開展有針對性的商務(wù)活動,如自動給一類特定的用戶發(fā)送銷售郵件,當(dāng)屬于同一類的用戶再次訪問站點時為其動態(tài)地改變站點的內(nèi)容等。通過這些舉措使商務(wù)活動能夠在一定程度上滿足用戶的要求,實現(xiàn)目標(biāo)營銷。(2)商品信息分析。運用關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)商品訪問中所有關(guān)聯(lián)和相聯(lián)系的規(guī)則,可以從交易事務(wù)數(shù)據(jù)庫中發(fā)現(xiàn)商品間的相互聯(lián)系。這對電子商務(wù)公司組織站點網(wǎng)頁結(jié)構(gòu)、開展有效的營銷策略非常有幫助。(3)物流信息分析。采用神經(jīng)網(wǎng)絡(luò)預(yù)測技術(shù),根據(jù)各物流配送點接到的網(wǎng)站用戶訂單來預(yù)測其庫存數(shù)量。預(yù)測信息可以給物流配送中心以參考,用來合理地確定各配送點倉庫的庫存量,使各配送點的補貨能更加合理有序,降低物流成本,節(jié)約庫存費用。
四、結(jié)束語
數(shù)據(jù)挖掘是一個新興的領(lǐng)域,具有廣闊應(yīng)用前景,目前,電子商務(wù)在我國正處于快速發(fā)展和應(yīng)用階段,利用數(shù)據(jù)挖掘技術(shù),能夠強化對客戶的服務(wù)、促進市場最優(yōu)化、加速資金周轉(zhuǎn)、實現(xiàn)企業(yè)的創(chuàng)新發(fā)展。電子商務(wù)平臺上的數(shù)據(jù)挖掘技術(shù)有待人們?nèi)ミM行更深入的研究工作,這將不斷的推動數(shù)據(jù)挖掘技術(shù)的深入發(fā)展和廣泛應(yīng)用,創(chuàng)造出更多的社會和經(jīng)濟價值。
參考文獻:
[1]張云濤龔鈴:數(shù)據(jù)挖掘原理與技術(shù).北京,電子工業(yè)出版社,2004年1月
[2]方真等:電子商務(wù)教程[M].北京:清華大學(xué)出版社.2004
國外很多大學(xué)都開設(shè)了數(shù)據(jù)挖掘類課程,波士頓大學(xué)的“數(shù)據(jù)管理與商務(wù)智能”課程主要包括基礎(chǔ)、核心技術(shù)、應(yīng)用三部分。授課方式包括理論內(nèi)容講授、案例教學(xué),以及學(xué)生以團隊合作方式完成項目并進行課堂演講。從麻省理工學(xué)院開放性課程資料(斯隆管理學(xué)院)中可以看出,在每章講解一種算法之后都盡可能地安排了商務(wù)實例的分析,并在課程后期安排了客座講座的形式。國內(nèi)對于數(shù)據(jù)挖掘的教學(xué)類研究成果也很多,主要集中在三類問題的研究上,較為普遍的是根據(jù)專業(yè)建立大綱的研究,例如針對電子商務(wù)專業(yè)進行大綱設(shè)計;另外也有專注研究某一種或多種適合數(shù)據(jù)挖掘或商務(wù)智能的教學(xué)方法,如專題研討法;還有的討論算法理解與程序設(shè)計、軟件應(yīng)用的關(guān)系。
2、基于模塊化方法的課程內(nèi)容分析
模塊化教學(xué)模式是按照程序模塊化的構(gòu)想和原則來設(shè)計教學(xué)內(nèi)容的一整套教學(xué)體系,它是在既定的培養(yǎng)目標(biāo)指導(dǎo)下,將全部教學(xué)內(nèi)容按照一定標(biāo)準或規(guī)則進行分解,使其成為多個相對獨立的教學(xué)模塊,且各教學(xué)模塊之間可以按照一定的規(guī)則有選擇性的重新組合。該方法在20世紀70年代,由國際勞工組織引入教學(xué)之中,開發(fā)出以現(xiàn)場教學(xué)為主,以技能培訓(xùn)為核心的模塊化教學(xué)模式,在很多國家得到廣泛應(yīng)用。由于該教學(xué)法具有針對性、靈活性、現(xiàn)實性等特點,越來越受到教育界的關(guān)注。模塊化教學(xué)本質(zhì)上是以知識點與實踐的細化為出發(fā)點研究,本課程的知識點細化分為兩個層次:一是從宏觀角度,參考ACM的SIGKDD的數(shù)據(jù)挖掘課程建設(shè)建議,設(shè)計課程的基礎(chǔ)內(nèi)容模塊和高級主題模塊;二是從微觀角度,針對較為復(fù)雜的算法進行的知識點劃分。課程內(nèi)容的一至五章屬于基礎(chǔ)內(nèi)容模塊,介紹本課程的基礎(chǔ)理論和入門的數(shù)據(jù)挖掘技術(shù);六至第八章介于基礎(chǔ)內(nèi)容與高級主題之間,介紹數(shù)據(jù)挖掘的核心算法,可以根據(jù)學(xué)生情況進行靈活處理,可強調(diào)應(yīng)用,也可深化算法介紹;第九、十章為高級主題模塊,可以作為擴展材料介紹應(yīng)用,或為感興趣同學(xué)提供算法介紹;課程實踐模塊包含數(shù)據(jù)倉庫建設(shè)與數(shù)據(jù)挖掘算法的應(yīng)用,難度居中,可以在引導(dǎo)學(xué)生思考的前提下給出實驗步驟,并引導(dǎo)學(xué)生使用類似的方法處理不同的數(shù)據(jù)。
3、基于模塊化方法進行重要知識點的模塊化分析
重要知識點內(nèi)涵較為豐富,一般體現(xiàn)在經(jīng)典數(shù)據(jù)挖掘算法上,通常一大類算法下還分有多個算法,不同算法的在難度上有漸進層次,同一種算法也有很大改進研究空間,講授彈性比較大。因此,適合使用模塊化方法進行處理,并且需要在課程設(shè)計中明確一定課時量所要達到的內(nèi)容和難度。基礎(chǔ)部分為必選內(nèi)容,介紹基本概念和基本原理;決策樹作為數(shù)據(jù)挖掘分類算法的最基礎(chǔ)算法也是必選內(nèi)容,決策樹算法有多種分類,需要進行按照難易程度進行選擇;最后要根據(jù)難度選擇其他分類算法進行介紹。
4、結(jié)論
0前言
隨著現(xiàn)代商業(yè)經(jīng)濟和信息技術(shù)的發(fā)展,商業(yè)信息的增長速度呈現(xiàn)指數(shù)上升,積累了海量的、以不同形式存儲的商業(yè)數(shù)據(jù)資料,原有的決策支持系統(tǒng)(DSS)和領(lǐng)導(dǎo)執(zhí)行系統(tǒng)(EIS)已不能滿足需要,這時出現(xiàn)數(shù)據(jù)挖掘技術(shù),它能夠去粗存精、去偽存真,從海量的商業(yè)信息中提取知識和有用信息的技術(shù)?,F(xiàn)代信息技術(shù)處理商業(yè)信息經(jīng)過一定的發(fā)展,逐步形成現(xiàn)在的商業(yè)數(shù)據(jù)挖掘技術(shù)。
1.?dāng)?shù)據(jù)挖掘方法在商業(yè)信息中應(yīng)用的規(guī)則
數(shù)據(jù)挖掘技術(shù)在商業(yè)中的應(yīng)用主要基于AI、機器學(xué)習(xí)、統(tǒng)計學(xué)等技術(shù),高度自動化地分析商業(yè)原始數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,預(yù)測客戶的行為,幫助商業(yè)決策者調(diào)整市場策略,減少風(fēng)險,做出正確的決策,體現(xiàn)一種決策支持過程。
1.1商業(yè)信息泛化、簡約和特征提取規(guī)則。商業(yè)信息泛化是為了商業(yè)數(shù)據(jù)更好的理解和掌握,將其具體一般的數(shù)據(jù)信息抽象到較高層次的過程;商業(yè)信息簡約是為了采用一定的手段對信息進行描述;商業(yè)信息特征是找出這些信息的共同特征,尋找信息的通用性特征式。
1.2商業(yè)信息分類技術(shù)規(guī)則。商業(yè)信息分類是按照一組商業(yè)信息對象的特征給出信息對象劃分的過程。其目的是學(xué)會一個分類函數(shù)或分類模型,該模型能把數(shù)據(jù)庫的數(shù)據(jù)信息項映射到給定類別中的某一個。
1.3商業(yè)信息的聚類規(guī)則。聚類規(guī)則是識別一組信息對象的內(nèi)在規(guī)則,從而將對象分組,構(gòu)成相似的對象類,從而找出數(shù)據(jù)信息的分布規(guī)律,并進一步去發(fā)現(xiàn)隱含在一組混雜的數(shù)據(jù)信息集里的分類規(guī)則。聚類是把一組個體按照相似性歸類,即"物以類聚"。使屬于同一類別的個體之間的距離盡可能小,而不同類別的個體間的距離盡可能大。
1.4商業(yè)信息的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的商業(yè)數(shù)據(jù)挖掘已經(jīng)從單一概念層次的關(guān)聯(lián)規(guī)則發(fā)展到多概念層次的關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)。關(guān)聯(lián)規(guī)則是如下的一種規(guī)則:"我們在研究大型商場的顧客在購買上衣和褲子的時候,發(fā)現(xiàn)其中在這些顧客中有10%的顧客同時買了帽子(上衣+褲子+帽子),這就形成簡單的關(guān)聯(lián)規(guī)則。除了具有上述關(guān)聯(lián)規(guī)律,還有時間或序列上的規(guī)律,在不同的時間(春夏秋冬)所購的衣服、褲子以及帽子是不相同的,并且不同層次或者不同年齡的人所購商品又有一定的規(guī)律性。
2.?dāng)?shù)據(jù)挖掘技術(shù)在商業(yè)信息中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)是目前在商業(yè)信息處理中應(yīng)用的比較多的一項技術(shù),為了在商業(yè)領(lǐng)域中對海量數(shù)據(jù)庫和大量復(fù)雜信息中提取有價值的知識,進一步提高信息的利用率,對公司及時制定相應(yīng)的對策有非常重要的意義,在這里,討論幾個主要商業(yè)行業(yè)中的商業(yè)信息處理。
2.1數(shù)據(jù)挖掘技術(shù)在電子商務(wù)網(wǎng)站數(shù)據(jù)中的應(yīng)用
隨著Web技術(shù)的發(fā)展,電子商務(wù)網(wǎng)站正在成為現(xiàn)在商家的必爭之地。如何讓電子商務(wù)網(wǎng)站有效益要想有效益就必須吸引客戶,增加能帶來效益的客戶忠誠度。電子商務(wù)網(wǎng)站每天都可能有上百萬次的在線交易,生成大量的記錄文件和登記表,如何對這些數(shù)據(jù)進行分析和挖掘,充分了解客戶的喜好、購買模式,甚至是客戶一時的沖動,設(shè)計出滿足于不同客戶群體需要的個性化網(wǎng)站,進而增加其競爭力,幾乎變得勢在必行。若想在競爭中生存進而獲勝,就要比您的競爭對手更了解客戶。
在對網(wǎng)站進行數(shù)據(jù)挖掘時,所需要的數(shù)據(jù)主要來自于兩個方面:一方面是客戶的背景信息,此部分信息主要來自于客戶的登記表;而另外一部分數(shù)據(jù)主要來自瀏覽者的點擊流,此部分數(shù)據(jù)主要用于考察客戶的行為表現(xiàn)。但有的時候,客戶對自己的背景信息十分珍重,不肯把這部分信息填寫在登記表上,這就會給數(shù)據(jù)分析和挖掘帶來不便。在這種情況之下,就不得不從瀏覽者的表現(xiàn)數(shù)據(jù)中來推測客戶的背景信息,進而再加以利用。就分析和建立模型的技術(shù)和算法而言,網(wǎng)站的數(shù)據(jù)挖掘和原來的數(shù)據(jù)挖掘差別并不是特別大,很多方法和分析思想都可以運用。所不同的是網(wǎng)站的數(shù)據(jù)格式有很大一部分來自于點擊流,和傳統(tǒng)的數(shù)據(jù)庫格式有區(qū)別。因而對電子商務(wù)網(wǎng)站進行數(shù)據(jù)挖掘所做的主要工作是數(shù)據(jù)準備。
2.2數(shù)據(jù)挖掘技術(shù)可以用在金融領(lǐng)域的應(yīng)用
金融事務(wù)需要搜集和處理大量數(shù)據(jù),對這些數(shù)據(jù)進行分析,發(fā)現(xiàn)其數(shù)據(jù)模式及特征,然后可能發(fā)現(xiàn)某個客戶、消費群體或組織的金融和商業(yè)興趣,并可觀察金融市場的變化趨勢。
數(shù)據(jù)挖掘在銀行信息中的應(yīng)用。商業(yè)銀行業(yè)務(wù)的利潤和風(fēng)險是共存的。為了保證最大的利潤和最小的風(fēng)險,必須對賬戶進行科學(xué)的分析和歸類,并進行信用評估,利用數(shù)據(jù)挖掘工具,可以根據(jù)客戶的消費模式預(yù)測何時為客戶提供何種產(chǎn)品。銀行如何讓一家新開的銀行網(wǎng)點實現(xiàn)快速贏利呢?銀行結(jié)合了GPS推理信息系統(tǒng)和商業(yè)智能應(yīng)用系統(tǒng),在銀行的客戶信息中,詳細記錄有客戶的常駐地,并且,當(dāng)銀行客戶到該銀行網(wǎng)點辦理業(yè)務(wù)時,銀行商業(yè)智能系統(tǒng)將自動記錄客戶的操作信息,以及銀行網(wǎng)點地址信息。經(jīng)過大量的記錄,客戶的常駐地到銀行網(wǎng)點的行動路線,將被通過數(shù)據(jù)分析而得出。大量的客戶路線得出后,我們可能會發(fā)現(xiàn),某個地區(qū)進行銀行業(yè)務(wù)操作的客戶特別多,但他們附近沒有銀行網(wǎng)點,而是要到離他們較遠的地方去辦理,于是銀行就決定在這個地區(qū)開辦一個銀行網(wǎng)點。
數(shù)據(jù)挖掘在證券信息中的應(yīng)用。上市公司定期公布的財務(wù)報告具有很強的信息含量,但是當(dāng)期會計盈余數(shù)據(jù)的信息會在披露前后在股票市價中迅速得以體現(xiàn)。因此對于中長期投資者來說,重要的是預(yù)見未來。質(zhì)地優(yōu)良且未來具有較高盈利增長能力的公司是中長期投資者(包括普通投資者,證券投資基金和券商)普遍關(guān)注的對象,因為只有這類公司才能給投資者帶來持續(xù)的回報。而財務(wù)報告包含了大量描述公司經(jīng)營狀況的數(shù)據(jù)。這些數(shù)據(jù)應(yīng)能為投資者提供關(guān)于公司未來盈利能力的信息。對于中長期投資者而言,需要做的就是利用這些信息挖掘出未來能夠具有較高盈利水平同時又具有較好的成長性公司。采用數(shù)據(jù)挖掘技術(shù)來發(fā)掘這些財務(wù)報告中是否包含關(guān)于公司未來盈利情況的信息,獲得較精確的預(yù)測效果,選出的投資組合能否獲得超額收益,這對于投資者來說是非常重要的。
2.3數(shù)據(jù)挖掘技術(shù)在企業(yè)市場營銷中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)在企業(yè)市場營銷中得到了比較普遍的應(yīng)用,它是以市場營銷學(xué)的市場細分原理為基礎(chǔ),其基本假定是"消費者過去的行為是其今后消費傾向的最好說明"。通過收集、加工和處理涉及消費者消費行為的大量信息,確定特定消費群體或個體的興趣、消費習(xí)慣、消費傾向和消費需求,進而推斷出相應(yīng)消費群體或個體下一步的消費行為,然后以此為基礎(chǔ),對所識別出來的消費群體進行特定內(nèi)容的定向營銷,這與傳統(tǒng)的不區(qū)分消費者對象特征的大規(guī)模營銷手段相比,大大節(jié)省了營銷成本,提高了營銷效果,從而為企業(yè)帶來更多的利潤。這些來自各種渠道的數(shù)據(jù)信息被組合,應(yīng)用超級計算機、并行處理、神經(jīng)元網(wǎng)絡(luò)、模型化算法和其他信息處理技術(shù)手段進行處理,從中得到商家用于向特定消費群體或個體進行定向營銷的決策信息。4數(shù)據(jù)挖掘技術(shù)在民用通信部門中的應(yīng)用
我國各種民用通信用得最多的國家之一,為了分析出那一類收費對應(yīng)那類層次的人群,我們就可以利用數(shù)據(jù)挖掘技術(shù),把當(dāng)前電信消費者的數(shù)據(jù)進行收集、分析、總結(jié),制定出有效的管理辦法,這既有利于公司又有利于客戶的優(yōu)惠政策,這樣能夠及時發(fā)現(xiàn)問題,減少顧客流失,為通信公司挽回損失。數(shù)據(jù)挖掘在通信部門中體現(xiàn)在三個方面:(1)客戶挽留解決方案;(2)電信業(yè)客戶細分解決方案;(3)電信業(yè)交叉銷售和提升銷售解決方案。這三個項目的實施,可以為民用通信部門解決三個決策問題:第一,預(yù)測哪些客戶最具有流失的傾向以及影響客戶流失的關(guān)鍵因素,通過預(yù)制的分析模型提供"流失記分"幫助識別風(fēng)險客戶,在客戶流失之前采取針對性措施來挽留他們。第二,根據(jù)客戶可能的行為和潛在的盈利性對客戶進行分類,制定更準確的產(chǎn)品組合、更準確的產(chǎn)品介紹和產(chǎn)品捆綁服務(wù)。第三,從現(xiàn)有客戶中識別出有可能接受交叉銷售和提升銷售的客戶人選,評估客戶過去的購買模式,預(yù)測客戶下一步可能購買什么。
[關(guān)鍵詞]數(shù)據(jù)挖掘技術(shù);軟件工程;數(shù)據(jù)預(yù)處理
[引言]隨著我國信息技術(shù)的進步,數(shù)據(jù)挖掘技術(shù)得到廣泛應(yīng)用,在軟件工程中需要對數(shù)據(jù)信息進行搜集、分類與整理,通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用可以有效提高工作效率,推動軟件工程的有序發(fā)展。我國對數(shù)據(jù)挖掘技術(shù)的應(yīng)用與研究雖然處于初級階段,但通過不斷的經(jīng)驗積累也能夠發(fā)揮技術(shù)的更多價值。
1數(shù)據(jù)挖掘技術(shù)概述
數(shù)據(jù)挖掘技術(shù)指的是在信息技術(shù)發(fā)展背景下,對信息數(shù)據(jù)展開處理的技術(shù)。與過去的信息處理技術(shù)相比,數(shù)據(jù)挖掘技術(shù)功能更加強大,可以應(yīng)用在各個領(lǐng)域,無論是數(shù)據(jù)處理、數(shù)據(jù)轉(zhuǎn)換還是數(shù)據(jù)分析,都能夠完成相互之間的聯(lián)系,并對數(shù)據(jù)進行最終評估。將數(shù)據(jù)挖掘技術(shù)應(yīng)用在軟件工程中,能夠提高企業(yè)處理信息數(shù)據(jù)的效率,避免操作失誤,保護企業(yè)數(shù)據(jù)準確[1]。
2數(shù)據(jù)挖掘技術(shù)在軟件工程中的重要性分析
2.1高效整合多樣化信息數(shù)據(jù)
由于數(shù)據(jù)挖掘技術(shù)的功能比較多,其中包含了傳統(tǒng)處理技術(shù)的功能,實現(xiàn)多樣化信息的收集與分類,并將數(shù)據(jù)按照類別存儲與整理。數(shù)據(jù)挖掘技術(shù)可以在多樣化數(shù)據(jù)中實現(xiàn)數(shù)據(jù)的系統(tǒng)化管理,為人們進行數(shù)據(jù)查閱工作帶來方便。在軟件工程中應(yīng)用該技術(shù),方便信息數(shù)據(jù)的高效整合,幫助企業(yè)全方位了解信息與數(shù)據(jù)[2]。
2.2保證信息數(shù)據(jù)的準確率
數(shù)據(jù)挖掘技術(shù)擁有強大數(shù)據(jù)運算功能,以往的數(shù)據(jù)信息系統(tǒng)運算數(shù)據(jù)時需要耗費大量時間與成本。如果信息數(shù)據(jù)體系龐大,系統(tǒng)運算時會面臨癱瘓問題。在軟件工程中,一旦系統(tǒng)發(fā)生癱瘓,系統(tǒng)將無法正常使用,數(shù)據(jù)也會受到破壞。應(yīng)用數(shù)據(jù)挖掘技術(shù)之后可以有效解決以上問題,實現(xiàn)系統(tǒng)的優(yōu)化,使系統(tǒng)可以在最短時間內(nèi)處理數(shù)據(jù),防止信息數(shù)據(jù)發(fā)生丟失現(xiàn)象,提高數(shù)據(jù)處理的時效性。面對大量的信息數(shù)據(jù),有的數(shù)據(jù)得不到利用,但長期處于系統(tǒng)中會影響系統(tǒng)運行效率,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以將無價值的數(shù)據(jù)剔除,留下有用的信息數(shù)據(jù),保證系統(tǒng)的運行效率和數(shù)據(jù)質(zhì)量。
2.3縮短信息數(shù)據(jù)處理時間
在軟件工程中應(yīng)用數(shù)據(jù)挖掘技術(shù)可以分類處理雜亂無章的數(shù)據(jù),實現(xiàn)數(shù)據(jù)的轉(zhuǎn)換與調(diào)用。對數(shù)據(jù)進行深入挖掘處理時也可以應(yīng)用數(shù)據(jù)挖掘技術(shù)進行數(shù)據(jù)的分類,并對模糊數(shù)據(jù)及時清理,提高系統(tǒng)內(nèi)現(xiàn)存數(shù)據(jù)的實用價值。人們獲取到的信息數(shù)據(jù)需要進行反復(fù)核對,以此保證數(shù)據(jù)真實性,通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用減少時間浪費,提高數(shù)據(jù)核對效率。
3數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析
3.1系統(tǒng)結(jié)構(gòu)
數(shù)據(jù)挖掘技術(shù)應(yīng)用流程主要分為三個階段:數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、模式評估與知識表示。在數(shù)據(jù)預(yù)處理階段中,高效得到原始數(shù)據(jù)的根本原因在于確定任務(wù)處理對象,得到符合軟件工程需求的數(shù)據(jù)。通過數(shù)據(jù)清洗彌補原始數(shù)據(jù)存在的缺陷,確保數(shù)據(jù)的完整性。數(shù)據(jù)抽取需要從數(shù)據(jù)庫中選擇與軟件工程任務(wù)相符合的信息。數(shù)據(jù)轉(zhuǎn)換需要將數(shù)據(jù)格式加以轉(zhuǎn)化,實現(xiàn)數(shù)據(jù)的適用性。在數(shù)據(jù)挖掘中需要制定一定的挖掘任務(wù),通過對數(shù)據(jù)的分類與評價總結(jié),合理應(yīng)用運算方法進行數(shù)據(jù)推敲。在模式評估與知識表示中,其實際用途在于挖掘成功的表達,將興趣度作為衡量標(biāo)準,提高數(shù)據(jù)表達的識別能力。
針對軟件工程中數(shù)據(jù)挖掘技術(shù)的優(yōu)化應(yīng)用,可以從系統(tǒng)結(jié)構(gòu)方面入手,具體如下:(1)檢測軟件工程中的克隆代碼。以軟件工程為標(biāo)準,將一部分代碼復(fù)制,結(jié)合實際情況更改一部分代碼,并對這些代碼進行檢測,代碼檢測與更改可以同時進行,能有效提高檢測效率,實現(xiàn)系統(tǒng)的維護工作。當(dāng)前應(yīng)用數(shù)據(jù)挖掘技術(shù)進行克隆代碼檢測的方式一共有四種,具體為比較標(biāo)識符、對比文本、檢測系統(tǒng)程序結(jié)構(gòu)與度量圈。在實際操作中,要求人們結(jié)合實際情況選擇相應(yīng)的克隆代碼檢測方法。(2)數(shù)據(jù)信息挖掘法。這是以橫切關(guān)注點為主的挖掘方法,在軟件工程中應(yīng)用該方法可以改造系統(tǒng),對數(shù)據(jù)信息達到良好的處理效果[3]。
3.2軟件管理
為了讓數(shù)據(jù)挖掘技術(shù)更好地應(yīng)用在軟件工程中,需要從軟件管理角度入手,采用以下兩方面舉措。一方面,深入挖掘數(shù)據(jù)的組織關(guān)系,另一方面,挖掘版本控制信息。軟件工程系統(tǒng)比較繁瑣,挖掘組織關(guān)系時較為困難,人們需要合理調(diào)配各項信息,以此作為挖掘的依據(jù)。如果以軟件工程管理流程作為主題,對電子郵件與共享文件展開組織關(guān)系挖掘,可以有效避免系統(tǒng)流程發(fā)生混亂,保護軟件管理的秩序。當(dāng)信息數(shù)據(jù)發(fā)生變化時,應(yīng)用數(shù)據(jù)挖掘技術(shù)進行軟件管理,將版本控制作為重要依據(jù),將數(shù)據(jù)挖掘技術(shù)與版本控制相聯(lián)系,降低系統(tǒng)運行成本,并達到警示的效果,提高軟件工程的管理水平。
3.3軟件開發(fā)
在軟件工程初期階段,人們將數(shù)據(jù)挖掘技術(shù)看成數(shù)據(jù)庫,隨著技術(shù)的發(fā)展,軟件工程發(fā)展到現(xiàn)實應(yīng)用,系統(tǒng)和現(xiàn)實共同發(fā)展。軟件工程將各項指標(biāo)與要求緊密結(jié)合,研發(fā)出最新產(chǎn)品,以往的軟件工程中軟件開發(fā)十分困難,而如今應(yīng)用數(shù)據(jù)挖掘技術(shù),可以將其與數(shù)據(jù)庫相融合,發(fā)揮數(shù)據(jù)庫內(nèi)信息的最大價值,有效推動軟件開發(fā)的進步。不僅如此,軟件工程可以對信息進行更深層次的挖掘,充分發(fā)揮軟件工程的價值,利用數(shù)據(jù)挖掘技術(shù)實現(xiàn)數(shù)據(jù)的更新,保證軟件開發(fā)質(zhì)量,優(yōu)化軟件操作流程。在技術(shù)的支持下,人們可以合理劃分軟件內(nèi)部,方便及時發(fā)現(xiàn)問題,并展開積極有效的問題處理。利用數(shù)據(jù)挖掘技術(shù)可以進行網(wǎng)站設(shè)計,對網(wǎng)站內(nèi)容進行挖掘,特別是對文本內(nèi)容的挖掘,隨后整合網(wǎng)站信息,通過自動歸類技術(shù)實現(xiàn)信息的層次性組織。在軟件或網(wǎng)站管理中,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以根據(jù)用戶對網(wǎng)站的訪問記錄,進行記錄信息挖掘,從中了解用戶對該網(wǎng)站內(nèi)容的興趣,進而對用戶提供信息推送服務(wù)和定制服務(wù),以此吸引更多用戶訪問該網(wǎng)站。
在軟件開發(fā)階段,可以使用DataAnalytics輕量級業(yè)務(wù)數(shù)據(jù)可視化分析平臺,這是數(shù)據(jù)挖掘技術(shù)的一項成果。該平臺能夠?qū)崿F(xiàn)異構(gòu)數(shù)據(jù)源的高效整合,可以兼容各種數(shù)據(jù)源類型,支持海量數(shù)據(jù)。可接入Excel/CSV等數(shù)據(jù)文件、企業(yè)各種業(yè)務(wù)系統(tǒng)、第三方互聯(lián)網(wǎng)數(shù)據(jù)、公共數(shù)據(jù)服務(wù)平臺等來源,輕松整合所有相關(guān)業(yè)務(wù)數(shù)據(jù),幫助企業(yè)消滅數(shù)據(jù)孤島。企業(yè)利用該平臺可以完成數(shù)據(jù)的深度交互分析,DataAnalytics基于探索式分析,支持智能推薦圖形與圖表,二者可以協(xié)同過濾,幫助用戶快速定位,通過數(shù)據(jù)挖掘找出問題,以拖拽式操作方法解決問題。
3.4聚類
在數(shù)據(jù)挖掘技術(shù)中聚類指的是對各個環(huán)節(jié)數(shù)據(jù)加以分析,結(jié)合軟件工程的具體要求實現(xiàn)數(shù)據(jù)細化,以類型細化作為基礎(chǔ),為原始數(shù)據(jù)類型做出保障。通過聚類可以讓同種類型數(shù)據(jù)具有相似性特點,在存在相似性的同時,也存在一定的差異,突出各自的特點。應(yīng)用數(shù)據(jù)挖掘技術(shù)實現(xiàn)聚類劃分時,面對的對象無法預(yù)測,與其他算法相比,聚類擁有更加廣泛的應(yīng)用范圍,進行數(shù)據(jù)分析時更加獨特,挖掘信息數(shù)據(jù)時可以確保檢測結(jié)果的有效性與真實性。
4結(jié)論
總而言之,隨著信息技術(shù)的深入發(fā)展,人們已經(jīng)步入信息時代,數(shù)據(jù)挖掘技術(shù)也成為對信息數(shù)據(jù)展開處理和存儲的有效方式。在軟件工程中應(yīng)用數(shù)據(jù)挖掘技術(shù),有利于提高軟件開發(fā)效率,提升軟件管理質(zhì)量,加強數(shù)據(jù)挖掘力度,使數(shù)據(jù)挖掘技術(shù)發(fā)揮巨大效果,人們可以應(yīng)用數(shù)據(jù)挖掘技術(shù)完成數(shù)據(jù)的聚類和網(wǎng)站設(shè)計,為人們的生活帶來便利。
[軟件工程碩士論文參考文獻]
[1]張立鑒.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2019(6):47-48.
[2]王祥順.數(shù)據(jù)挖掘技術(shù)在軟件工程中的實踐與探索[J].電腦編程技巧與維護,2019(4):82-83+100.
關(guān)鍵詞:數(shù)據(jù)倉庫,數(shù)據(jù)挖掘,電子政務(wù)
在電子政務(wù)信息建設(shè)中已經(jīng)有了成功的電子政務(wù)業(yè)務(wù)處理和信息管理系統(tǒng),卓有成效的過程控制指揮系統(tǒng)和辦公自動化系統(tǒng)。但從電子政務(wù)全局的高層次和大范圍的分析角度去審視,則感到數(shù)據(jù)分散,難以整合。因此,研究電子政務(wù)數(shù)據(jù)倉庫和數(shù)據(jù)挖掘很有必要。
1.電子政務(wù)信息建設(shè)的數(shù)據(jù)倉庫
電子政務(wù)數(shù)據(jù)倉庫是電子政務(wù)信息架構(gòu)的新焦點,它提供集成化的和歷史化的電子政務(wù)業(yè)務(wù)數(shù)據(jù);它集成種類不同的電子政務(wù)應(yīng)用系統(tǒng);電子政務(wù)數(shù)據(jù)倉庫從事物發(fā)展和歷史角度來組織和存儲電子政務(wù)數(shù)據(jù),以供信息化和分析處理之用。它是對現(xiàn)有電子政務(wù)信息系統(tǒng)深刻認識的結(jié)果,來自異地、異構(gòu)的電子政務(wù)數(shù)據(jù)源或數(shù)據(jù)庫的數(shù)據(jù)經(jīng)過加工后在電子政務(wù)數(shù)據(jù)倉庫中存儲、提取和維護。傳統(tǒng)的電子政務(wù)數(shù)據(jù)庫主要面向業(yè)務(wù)處理,而電子政務(wù)數(shù)據(jù)倉庫面向復(fù)雜數(shù)據(jù)分析、高層決策支持。電子政務(wù)數(shù)據(jù)倉庫提供來自種類不同的電子政務(wù)應(yīng)用系統(tǒng)的集成化和歷史化的數(shù)據(jù),為全局范圍的電子政務(wù)戰(zhàn)略決策和社會治安長期趨勢分析提供有效的支持。免費論文參考網(wǎng)。目前,經(jīng)過近20年的建設(shè),全國電子政務(wù)信息系統(tǒng)建設(shè)已經(jīng)積累了大量數(shù)據(jù),對于電子政務(wù)工作起了意義深遠的推動作用,電子政務(wù)工作已經(jīng)初步進入了數(shù)字化、電子化、信息化,極大地提高了電子政務(wù)工作的效率。以土地管理為例,現(xiàn)在的管理方式是以前不能比擬的。但是,如何將這些數(shù)據(jù)用于全局范圍的戰(zhàn)略決策和長期趨勢分析,則是需要進一步解決的問題。例如,土地問題,近年來始終與住房問題、物價問題和就業(yè)問題一起,成為全國人民非常關(guān)心的問題,其問題有表面的原因,也有深刻的歷史原因和現(xiàn)實原因。如何花較少的代價,將此問題解決得圓滿一些,建設(shè)電子政務(wù)數(shù)據(jù)倉庫是一重要手段。免費論文參考網(wǎng)。
電子政務(wù)數(shù)據(jù)倉庫是一種全新的分布式異構(gòu)數(shù)據(jù)系統(tǒng)的集成方法:把各個信息源中與決策支持有關(guān)的數(shù)據(jù),預(yù)先經(jīng)過提取、轉(zhuǎn)換、過濾,并與相應(yīng)信息源中其它數(shù)據(jù)進行合并,按主題存放在一個中央數(shù)據(jù)庫中,當(dāng)用戶需要查詢時,可以直接訪問中央數(shù)據(jù)庫,不必訪問其它數(shù)據(jù)源。
電子政務(wù)數(shù)據(jù)倉庫包括3個基本的功能部分。數(shù)據(jù)獲?。簭碾娮诱?wù)一線數(shù)據(jù)源獲取數(shù)據(jù),數(shù)據(jù)被區(qū)分出來,進行拷貝或重新定義格式等處理后,準備載入電子政務(wù)數(shù)據(jù)倉庫。數(shù)據(jù)存儲和管理:負責(zé)電子政務(wù)數(shù)據(jù)倉庫的內(nèi)部維護和管理,包括數(shù)據(jù)存儲的組織、數(shù)據(jù)的維護、數(shù)據(jù)的分發(fā)。信息訪問:屬于電子政務(wù)數(shù)據(jù)倉庫的前端,面向用戶------提取信息、分析數(shù)據(jù)集、實施決策。進行數(shù)據(jù)訪問的工具主要是查詢生成工具、多維分析工具和數(shù)據(jù)挖掘工具等。
電子政務(wù)數(shù)據(jù)倉庫的特點:針對全局電子政務(wù)業(yè)務(wù)戰(zhàn)略分析,非常詳細的數(shù)據(jù),第三范式數(shù)據(jù)結(jié)構(gòu),高層次和大范圍的分析,詳細的歷史信息,存儲和管理大量的數(shù)據(jù),整個數(shù)據(jù)結(jié)構(gòu)統(tǒng)一,索引較少。
因此,原來對分布式異構(gòu)數(shù)據(jù)的復(fù)雜訪問變成直接在該倉庫上進行即席查詢的簡單操作:用戶需要某些指定信息和快速查詢,但不一定要最新信息,在這個環(huán)境中需要高性能和訪問信息源中不能長期保存的信息。
電子政務(wù)數(shù)據(jù)倉庫是一個比傳統(tǒng)解決方法更為有效的集成技術(shù),即對感興趣的數(shù)據(jù)及其變化預(yù)先提取并按公共模式集成到一個中央數(shù)據(jù)庫中,由于分布和異構(gòu)問題被提前解決,用戶可以在中央數(shù)據(jù)倉庫上進行高效的查詢或分析。
由于電子政務(wù)數(shù)據(jù)倉庫的體系結(jié)構(gòu),必須照顧電子政務(wù)已有的信息系統(tǒng)的體系結(jié)構(gòu),以及相關(guān)的基礎(chǔ)設(shè)施,因此,確定電子政務(wù)數(shù)據(jù)倉庫的體系結(jié)構(gòu),必須兼顧用戶需求的多變性、基礎(chǔ)設(shè)施的復(fù)雜性、技術(shù)更新的步伐。數(shù)據(jù)倉庫本身可以使用通用的或者特別要求的數(shù)據(jù)庫管理系統(tǒng)來實現(xiàn)。盡管在圖中表示的是一個單獨的、中央化的數(shù)據(jù)倉庫,實際上,為了達到理想的性能,分布式和并行性往往是必然的選擇。
電子政務(wù)數(shù)據(jù)倉庫技術(shù)中一些比較重要的問題是:數(shù)據(jù)倉庫管理,數(shù)據(jù)源和數(shù)據(jù)倉庫的演化,復(fù)制帶來的不一致,過期數(shù)據(jù)處理等。電子政務(wù)數(shù)據(jù)倉庫管理涉及電子政務(wù)數(shù)據(jù)倉庫開發(fā)的各個階段,與之相關(guān)的問題涉及電子政務(wù)數(shù)據(jù)倉庫設(shè)計、數(shù)據(jù)裝載、元數(shù)據(jù)管理等。數(shù)據(jù)源和數(shù)據(jù)倉庫演化,則是研究電子政務(wù)數(shù)據(jù)倉庫體系結(jié)構(gòu)如何順利處理信息源的變化問題,如模式變化、新信息源加入,舊信息源刪除等。復(fù)制不一致,是指從各個信息源拷貝來的同一信息或者相關(guān)信息出現(xiàn)的不一致,一般用集成器對這些數(shù)據(jù)進行清理。對于電子政務(wù)數(shù)據(jù)倉庫中的數(shù)據(jù),可能會保存很多年,但是一般不會永遠保留下去,這就要求研究比較可靠的技術(shù)以保證過期的數(shù)據(jù),可以自動而有效地從電子政務(wù)數(shù)據(jù)倉庫中被清除出去。
2.電子政務(wù)數(shù)據(jù)挖掘一般方法
電子政務(wù)部門在過去若干年的時間里都積累了海量的、以不同形式存貯的數(shù)據(jù)資料,例如戶籍資料、土地資料和規(guī)劃管理資料等。此外,電子政務(wù)工作所涉及到的數(shù)據(jù)類型是相當(dāng)復(fù)雜的,例如:用地指數(shù),其特征抽取相當(dāng)復(fù)雜;土地配置規(guī)律特點,其數(shù)據(jù)聯(lián)系是非平面的,也是非標(biāo)準立體的。由于這些資料十分繁雜,要從中發(fā)現(xiàn)有價值的信息或者知識,達到為決策服務(wù)的目的,成為非常艱巨的任務(wù)。電子政務(wù)數(shù)據(jù)挖掘一般方法的提出,讓用戶有能力最終認識數(shù)據(jù)的真正價值,即蘊藏在數(shù)據(jù)中的信息和知識。
電子政務(wù)數(shù)據(jù)挖掘是按照既定的電子政務(wù)業(yè)務(wù)目標(biāo),對大量的數(shù)據(jù)進行探索、揭示隱藏其中的規(guī)律性并進一步將其模型化的先進、有效的方法。數(shù)據(jù)是按照電子政務(wù)數(shù)據(jù)倉庫的概念重組過的,在電子政務(wù)數(shù)據(jù)倉庫中的數(shù)據(jù)、信息才能最有效的支持電子政務(wù)數(shù)據(jù)挖掘。因此,首先從正在運行的電子政務(wù)計算機系統(tǒng)中完整地將數(shù)據(jù)取出;其次各個環(huán)節(jié)的數(shù)據(jù)要按一定的規(guī)則有機、準確地銜接起來,以極易取用的數(shù)據(jù)結(jié)構(gòu)方式,全面地描述該業(yè)務(wù)目標(biāo)。
電子政務(wù)數(shù)據(jù)挖掘就是從大量的、不完全的、模糊的、有噪聲的、隨機的數(shù)據(jù)中,提取隱含在其中的、事前不知道的、但是潛在有用的信息和知識的過程。電子政務(wù)數(shù)據(jù)挖掘技術(shù)是面向應(yīng)用的,不僅面向特定數(shù)據(jù)庫的簡單檢索和查詢調(diào)用,而且要對這些數(shù)據(jù)進行微觀和宏觀的分析、統(tǒng)計、綜合和推理,從中發(fā)現(xiàn)事件間的相互關(guān)系,對未來的活動進行預(yù)測。
3.基于電子政務(wù)數(shù)據(jù)倉庫的數(shù)據(jù)挖掘
基于電子政務(wù)數(shù)據(jù)倉庫的數(shù)據(jù)挖掘的方法,是以電子政務(wù)數(shù)據(jù)倉庫為中心,各信息源由原始數(shù)據(jù)庫,經(jīng)過打包和集成到電子政務(wù)數(shù)據(jù)倉庫;基于電子政務(wù)數(shù)據(jù)倉庫的數(shù)據(jù)挖掘,是通過模型庫和方法庫的協(xié)助,對電子政務(wù)數(shù)據(jù)倉庫進行數(shù)據(jù)挖掘,從而獲得分析預(yù)測結(jié)果和決策支持的。
基于電子政務(wù)數(shù)據(jù)倉庫的數(shù)據(jù)挖掘的特點:1、規(guī)模: 電子政務(wù)數(shù)據(jù)倉庫中集成和存儲著來自若干分布、異質(zhì)的信息源的數(shù)據(jù)。免費論文參考網(wǎng)。這些信息源本身就可能是一個規(guī)模龐大的電子政務(wù)數(shù)據(jù)庫,可以想象數(shù)據(jù)倉庫會有比一般數(shù)據(jù)庫系統(tǒng)更大的數(shù)據(jù)規(guī)模。如何從如此巨量的數(shù)據(jù)中有效的提取有用信息,需要各方面技術(shù)的進步。從當(dāng)前發(fā)展來看,支持并行處理的分布式DBMS、具有大規(guī)模并行處理(MPP)能力的計算機、超大規(guī)模的存儲機構(gòu)等技術(shù)的發(fā)展和協(xié)同將使電子政務(wù)數(shù)據(jù)倉庫走向?qū)嵱谩?、歷史數(shù)據(jù):傳統(tǒng)的電子政務(wù)數(shù)據(jù)庫系統(tǒng)為了獲得最大的執(zhí)行效率,往往存儲盡可能少的數(shù)據(jù)量。因為,擁有的數(shù)據(jù)越多,數(shù)據(jù)組織、重構(gòu)、瀏覽、索引和監(jiān)控的難度越大。傳統(tǒng)電子政務(wù)數(shù)據(jù)庫系統(tǒng)在“時間”方向的長度很有限。比較而言,電子政務(wù)數(shù)據(jù)倉庫的根本特征之一就是進行長時間的歷史數(shù)據(jù)存儲,這使得可以進行數(shù)據(jù)長期趨勢的分析。電子政務(wù)數(shù)據(jù)倉庫為長期決策行為提供了獨一無二的支持,電子政務(wù)數(shù)據(jù)倉庫中的數(shù)據(jù)在時間方向上具有大的縱深性。3、數(shù)據(jù)集成和綜合性:從全局的角度看,數(shù)據(jù)倉庫集成了電子政務(wù)內(nèi)各部門的全面的、綜合的數(shù)據(jù)。電子政務(wù)數(shù)據(jù)挖掘面對的是關(guān)系更加復(fù)雜的全局模式的知識發(fā)現(xiàn),能更好地滿足高層戰(zhàn)略決策的要求。在電子政務(wù)數(shù)據(jù)倉庫中,數(shù)據(jù)已經(jīng)被充分收集起來了,進行了整理、合并,有些還進行了初步的分析處理。另外,電子政務(wù)數(shù)據(jù)倉庫中對數(shù)據(jù)不同粒度的集成和綜合,更有效地支持了多層次、多種知識的挖掘。4、查詢支持 電子政務(wù)數(shù)據(jù)倉庫面向決策支持,電子政務(wù)數(shù)據(jù)倉庫的體系結(jié)構(gòu)努力保證查詢(Query)和分析的實時性。電子政務(wù)數(shù)據(jù)倉庫設(shè)計成只讀方式,用戶可以直接訪問電子政務(wù)數(shù)據(jù)倉庫,挖掘過程可以做到實時交互,使決策者的思維保持連續(xù),挖掘出更深入、更有價值的知識。
電子政務(wù)數(shù)據(jù)倉庫和數(shù)據(jù)挖掘是將來電子政務(wù)智能化的基礎(chǔ),可以幫助用戶得到他們想知道的信息,有些數(shù)據(jù)也許隱藏人們意想不到的信息,數(shù)據(jù)挖掘就是讓用戶發(fā)現(xiàn)這些隱藏信息的工具。電子政務(wù)數(shù)據(jù)倉庫和數(shù)據(jù)挖掘研究和應(yīng)用所面臨的主要問題:挖掘的對象:更大型的數(shù)據(jù)庫、更高的維數(shù)和屬性之間的復(fù)雜關(guān)系;多種形式的輸入數(shù)據(jù);用戶參與和領(lǐng)域知識的融合;證實(Validation)技術(shù);知識的表達和解釋機制;知識的更新和維護;多平臺支持、與其他系統(tǒng)的集成。
近年來,電子政務(wù)利用信息技術(shù)的能力大幅度提高,大量數(shù)據(jù)庫被用于土地管理和城市規(guī)劃。為了利用這一巨大的信息資源,從中及時發(fā)現(xiàn)有用的知識,提高信息的價值,使數(shù)據(jù)真正成為電子政務(wù)的有力武器,為電子政務(wù)自身的業(yè)務(wù)決策和戰(zhàn)略發(fā)展服務(wù),電子政務(wù)數(shù)據(jù)倉庫和數(shù)據(jù)挖掘是現(xiàn)在和將來的一個重要發(fā)展方向。
論文摘要:隨著數(shù)據(jù)庫技術(shù)和人工智能技術(shù)的不斷進步,數(shù)據(jù)挖掘技術(shù)逐步發(fā)展起來,作為當(dāng)前計算機信息技術(shù)中的一項較為新興的技術(shù),綜合運用了數(shù)理統(tǒng)計、模式識別、計算智能、人工智能等多項先進技術(shù),主要是從大量的數(shù)據(jù)中來發(fā)現(xiàn)和挖掘一些隱含的有價值的知識,從大型的數(shù)據(jù)庫數(shù)據(jù)中挖掘一些人們比較感興趣的知識,本文主要講了數(shù)據(jù)挖掘技術(shù)的概念、數(shù)據(jù)挖掘技術(shù)在保護設(shè)備故障信息中的實現(xiàn)方法以及數(shù)據(jù)挖掘技術(shù)保護設(shè)備故障信息管理的基本功能等問題。
數(shù)據(jù)挖掘技術(shù)作為當(dāng)前計算機信息技術(shù)中的一項較為新興的技術(shù),綜合運用了數(shù)理統(tǒng)計、模式識別、計算智能、人工智能等多項先進技術(shù),主要是從大量的數(shù)據(jù)中來發(fā)現(xiàn)和挖掘一些隱含的有價值的知識,也就是從大型的數(shù)據(jù)庫數(shù)據(jù)中挖掘一些人們比較感興趣的知識,這些被提取的知識通常會表現(xiàn)為模式、規(guī)律、規(guī)則和概念,將數(shù)據(jù)挖掘的所有對象定義成數(shù)據(jù)庫或者是文件系統(tǒng)以及其他的一些組織在一起的數(shù)據(jù)集合,數(shù)據(jù)挖掘技術(shù)也是現(xiàn)在智能理論系統(tǒng)的重要研究內(nèi)容,已經(jīng)開始被應(yīng)用于行政管理、醫(yī)學(xué)、金融、商業(yè)、工業(yè)等不同的領(lǐng)域當(dāng)中,在保護設(shè)備故障信息管理方面發(fā)揮出了積極的作用。
一、數(shù)據(jù)挖掘技術(shù)的概念
隨著數(shù)據(jù)庫技術(shù)和人工智能技術(shù)的不斷進步,數(shù)據(jù)挖掘技術(shù)逐步發(fā)展起來,主要是指從大量的數(shù)據(jù)中發(fā)現(xiàn)和挖掘一些隱含的有價值的有用信息和知識,這些被提取的知識通常會表現(xiàn)為模式、規(guī)律、規(guī)則和概念,將數(shù)據(jù)挖掘的所有對象定義成數(shù)據(jù)庫或者是文件系統(tǒng)以及其他的一些組織在一起的數(shù)據(jù)集合,當(dāng)前數(shù)據(jù)挖掘技術(shù)已經(jīng)逐漸被應(yīng)用于了醫(yī)藥業(yè)、保險業(yè)、制造業(yè)、電信業(yè)、銀行業(yè)、市場營銷等不同的領(lǐng)域,隨著計算技術(shù)、網(wǎng)絡(luò)技術(shù)以及信息技術(shù)的不斷進步,在故障診斷過程中所采集到的數(shù)據(jù)可以被廣泛地存儲在不同的數(shù)據(jù)庫當(dāng)中,如果依然采用傳統(tǒng)的數(shù)據(jù)處理方法來對這些海量的信息數(shù)據(jù)進行分析處理,不僅會浪費大量的實踐而且也很難挖掘到有效的信息數(shù)據(jù),同時,盡管智能診斷以及專家系統(tǒng)等方式在故障的診斷過程中已經(jīng)被得到了廣泛的應(yīng)用,但是這些方法卻仍然存在著很多推理困難、知識瓶頸等一些尚未完全被解決的問題,采用數(shù)據(jù)挖掘技術(shù)就可以比較有效地來解決這些難題,在故障診斷的過程中發(fā)揮其獨特的優(yōu)勢。wWW.133229.Com從不同的角度進行分析,數(shù)據(jù)挖掘技術(shù)可以分為不同的方法,就目前的發(fā)展現(xiàn)狀來看,常用的數(shù)據(jù)挖掘技術(shù)方法主要有遺傳算法、粗集方法、神經(jīng)網(wǎng)絡(luò)方法以及決策樹方法等。
二、數(shù)據(jù)挖掘技術(shù)在保護設(shè)備故障信息中的實現(xiàn)方法
1.基本原理。在設(shè)備出現(xiàn)故障時采用數(shù)據(jù)挖掘技術(shù)對設(shè)備進行一系列的故障診斷,也就是說根據(jù)這一設(shè)備的運行記錄,對其運行的趨勢進行預(yù)測,并對其可能存在的運行狀態(tài)進行分類,故障診斷的實質(zhì)就是一種模式識別方式,對機器設(shè)備的故障進行診斷的過程也就是該模式匹配和獲取的過程。
2.對故障診斷的數(shù)據(jù)挖掘方法建模。針對機械故障的診斷來說,首先就應(yīng)當(dāng)獲取一些關(guān)于本機組的一些運行參數(shù),既要包括機器在正常運行以及平穩(wěn)工作時的信息數(shù)據(jù),也應(yīng)當(dāng)包括機器在出現(xiàn)故障時的一些信息數(shù)據(jù),在現(xiàn)場的監(jiān)控系統(tǒng)中往往就會存在著相應(yīng)的正常工作狀態(tài)下以及出現(xiàn)故障時的不同運行參數(shù),而數(shù)據(jù)挖掘的任務(wù)就是從這些雜亂無章的信息樣本庫中找出其中所隱藏著的內(nèi)在規(guī)律,并且從中提取各自故障的不同特征,在對故障的模式進行劃分時,我們通??梢越柚怕式y(tǒng)計的方式,在對故障模式進行識別時可以采用較為成熟的關(guān)聯(lián)規(guī)則理論,實現(xiàn)變量之間的關(guān)聯(lián)關(guān)系,并最終得到分類所需要用到的一些規(guī)則,從而最終達到分類的目的,依據(jù)這些規(guī)則,就可以對一些新來的數(shù)據(jù)進行判斷,而且可以準確地對故障進行分類,找出故障所產(chǎn)生的原因和解決故障的正確方法。
三、數(shù)據(jù)挖掘技術(shù)保護設(shè)備故障信息管理的基本功能
1.數(shù)據(jù)傳輸功能。數(shù)據(jù)挖掘技術(shù)保護設(shè)備故障信息管理與分析系統(tǒng)的主要數(shù)據(jù)來源就是故障信息的分站系統(tǒng),而分站系統(tǒng)中的數(shù)據(jù)是各個子站的一個數(shù)據(jù)匯總,而保護設(shè)備故障信息管理與分析系統(tǒng)所采用的獲取數(shù)據(jù)的主要方式就是一些專門的通信程序構(gòu)建起系統(tǒng)與分站之間的聯(lián)系,將分站上的一些匯總數(shù)據(jù)傳輸?shù)焦收闲畔⑾到y(tǒng)的數(shù)據(jù)庫中,分析系統(tǒng)所具有的數(shù)據(jù)傳輸功能,在進行數(shù)據(jù)的處理時又能做到不影響原先分站數(shù)據(jù)庫的正常運行,并且具備抗干擾能力強、計算效率高的優(yōu)點。
2.數(shù)據(jù)的分析功能。系統(tǒng)在正常運行時,會從故障信息子站或者是分站采集相關(guān)的數(shù)據(jù)并且對這些采集到的數(shù)據(jù)進行分析整理,最終得到有用的數(shù)據(jù)信息,利用數(shù)據(jù)挖掘技術(shù)對龐大的故障數(shù)據(jù)進行分析、分類以及整理,能夠有效地找出有用的信息,歸并一些冗余的信息,對信息進行有效地存儲和分類。另外,數(shù)據(jù)挖掘技術(shù)還具有信息查詢的功能,可以進行不同條件下的查詢,例如按時間段、報告類型、設(shè)備型號以及單位等進行查詢,實現(xiàn)查詢后的備份轉(zhuǎn)存等,根據(jù)故障信息系統(tǒng)所提供高的數(shù)據(jù)信息以及本系統(tǒng)庫中所保存的一些整定阻抗值,可以通過邏輯判斷生產(chǎn)繼電保護動作的分析報告,主要包括對故障過程的簡述、故障切除情況以及保護動作情況等,可以便于繼電保護人員直觀的對保護裝置的動作情況進行分析。
四、結(jié)語
隨著企業(yè)自動化程度的不斷提高以及數(shù)據(jù)庫技術(shù)的迅速發(fā)展,很多企業(yè)在一些重要的設(shè)備方面都安裝了監(jiān)測系統(tǒng),對設(shè)備運行過程中的一些重要參數(shù)和數(shù)據(jù)進行采集,采用數(shù)據(jù)挖掘技術(shù)可以有效地解決設(shè)備故障診斷中的一些知識獲取瓶頸,將數(shù)據(jù)挖掘系統(tǒng)充分應(yīng)用到監(jiān)控系統(tǒng)中,有效解決故障診斷中的一些困難,事實證明,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到故障診斷中是非常有效的,也是值得研究和學(xué)習(xí)的新型技術(shù)手段。
參考文獻:
[1]李勛,龔慶武,楊群瑛,羅思需,李社勇.基于數(shù)據(jù)挖掘技術(shù)的保護設(shè)備故障信息管理與分析系統(tǒng)[j].電力自動化設(shè)備,2011,9
[2]李建業(yè),劉志遠,蔡乾,趙洪波.基于web的故障信息系統(tǒng)[j].電力信息化,2007,s1
【關(guān)鍵詞】 計算機 數(shù)據(jù)挖掘技術(shù) 開發(fā)
引言:計算機數(shù)據(jù)挖掘技術(shù)是基于計算機原有的功能基礎(chǔ)之上,融入了一些統(tǒng)計學(xué)理論,使人們可以利用數(shù)據(jù)挖掘技術(shù)在眾多的計算機系統(tǒng)內(nèi)部的信息中抓取自己需要的信息和數(shù)據(jù)。計算機數(shù)據(jù)挖掘技術(shù)的出現(xiàn)極大的促進了社會整體的進步,引領(lǐng)了社會各個領(lǐng)域內(nèi)的數(shù)據(jù)量潮流,人們要想在無限的數(shù)據(jù)中采集有用信息,就必須深入計算機數(shù)據(jù)挖掘技術(shù)的開發(fā)研究。
一、計算機數(shù)據(jù)挖掘技術(shù)開發(fā)流程
1.1明確數(shù)據(jù)挖掘目的
由于數(shù)據(jù)挖掘技術(shù)的功能是多種多樣的,所以在開發(fā)具體的計算機數(shù)據(jù)挖掘技術(shù)過程中需要根據(jù)自身需要明確數(shù)據(jù)挖掘目的,進而選擇對應(yīng)數(shù)據(jù)庫。因為在開發(fā)過程中,不同的數(shù)據(jù)挖掘目標(biāo)需要依靠不同的挖掘技術(shù)數(shù)據(jù)算法,如果目的不明很容易造成最終開發(fā)結(jié)果的偏差[1]。
1.2數(shù)據(jù)選擇和預(yù)處理
明確數(shù)據(jù)挖掘目標(biāo)、數(shù)據(jù)庫后還要對所持有的數(shù)據(jù)進行選擇和預(yù)處理,數(shù)據(jù)選擇是要將數(shù)據(jù)中的部分信息納入數(shù)據(jù)挖掘研究范圍內(nèi),預(yù)處理是將這些數(shù)據(jù)中的錯誤信息進行刪除和修正,確保列下有用信息。
1.3數(shù)據(jù)挖掘
數(shù)據(jù)挖掘過程中要有兩個步驟,其一是根據(jù)挖掘目標(biāo)確定接下來要利用的開發(fā)技術(shù)和采用的算法,其二是在確定了挖掘技術(shù)和數(shù)據(jù)算法后構(gòu)建出數(shù)學(xué)模型,以此來推動挖掘技術(shù)的開發(fā)。
1.4評估結(jié)果
評估結(jié)果的最大作用就是對開發(fā)出的數(shù)據(jù)挖掘結(jié)果進行科學(xué)評估,對數(shù)據(jù)挖掘技術(shù)的開發(fā)成果進行檢測和驗證。如果數(shù)據(jù)挖掘結(jié)果不能夠達到數(shù)據(jù)挖掘開發(fā)目的要求,就要及時進行修正,如果數(shù)據(jù)開發(fā)結(jié)果符合數(shù)據(jù)開發(fā)目的要求,那么就可以將其投入到實踐應(yīng)用之中[2]。
二、計算機數(shù)據(jù)挖掘技術(shù)開發(fā)
1、可視化技術(shù)開發(fā)。要想得到有效的信息,就需要從計算機系統(tǒng)中獲得的信息入手,但是當(dāng)前的網(wǎng)絡(luò)信息中存在不少的隱性信息,這些信息的獲得就要依靠計算機數(shù)據(jù)挖掘技術(shù)。采用計算機挖掘技術(shù)可以有效的抓取隱性信息的某些特征,當(dāng)利用散點圖的方式將這些隱性信息表現(xiàn)出來。所以可視化技術(shù)是計算機數(shù)據(jù)挖掘技術(shù)開發(fā)項目中的一個重點。
2、聯(lián)機分析處理。網(wǎng)絡(luò)是復(fù)雜的,其中的網(wǎng)絡(luò)信息和數(shù)據(jù)更是十分的龐雜,要想快速、準確的抓取到自己想要的信息,需要依靠聯(lián)機分析出不同地域和時段的多維數(shù)據(jù),聯(lián)機分析處理方式需要依靠用戶的配合。在處理多維數(shù)據(jù)時,需要所有計算機用戶自行的使用或者篩選出分析算法,利用這些分析算法對數(shù)據(jù)做處理,這樣對探索數(shù)據(jù)也有巨大的推動作用。
3、決策樹。計算機數(shù)據(jù)挖掘技術(shù)的開發(fā)中需要對決策樹進行規(guī)則化建立,決策樹是一項重要的開發(fā)項目,因為決策樹的作用是發(fā)揮預(yù)測和分類的功能,對所處理的數(shù)據(jù)信息進行具體的預(yù)測和分類。目前開發(fā)的決策樹算法已經(jīng)有很多種,主要有SLIQ、SPRINT、ID3、C4.5等,SLIQ算法具備連續(xù)性屬性,還可以對數(shù)據(jù)做出具體的分類,SPRINT算法與SLIQ算法有同樣的功能屬性,并且這兩種算法可以通過大型訓(xùn)練集對決策時做出歸納[3]。
4、計算機神經(jīng)網(wǎng)絡(luò)。計算機數(shù)據(jù)挖掘技術(shù)在開發(fā)之中借助了醫(yī)學(xué)神經(jīng)系統(tǒng)的研究結(jié)果,將人體神經(jīng)元研究脈絡(luò)通過技術(shù)處理形成了計算機網(wǎng)絡(luò)神經(jīng)的研究,并且經(jīng)過一系列的深入探索,目前已經(jīng)取得了重大的成果。計算機中研發(fā)出的神經(jīng)網(wǎng)絡(luò)是安全輸入、輸出和處理單元三種類型進行規(guī)劃的,這三個層面代表了計算機神經(jīng)網(wǎng)絡(luò)系統(tǒng),當(dāng)前的開發(fā)結(jié)果中顯示,可以利用計算機神經(jīng)網(wǎng)絡(luò)技術(shù)實現(xiàn)數(shù)據(jù)的調(diào)整、計算和整理。
5、遺傳算法。計算機數(shù)據(jù)挖掘技術(shù)的開發(fā)中借鑒了許多其他學(xué)科領(lǐng)域中的研究方向和理論,在自然學(xué)科中,生物基因可以通過遺傳中的不同變化促進后代的自我優(yōu)化,利用這種思想理論,在計算機數(shù)據(jù)挖掘技術(shù)的開發(fā)中也可以通過對不同模型進行組合、演變來創(chuàng)新開發(fā)出新的數(shù)據(jù)算法。
結(jié)束語:計算機數(shù)據(jù)挖掘技術(shù)屬于當(dāng)前社會中最重要的分析工具之一,數(shù)據(jù)挖掘技術(shù)已經(jīng)被各個領(lǐng)域廣泛的應(yīng)用,并且其功能得到驗證,極大的促進了社會行業(yè)的快速發(fā)展。隨著科技水平的日益提升,相信計算機數(shù)據(jù)挖掘技術(shù)將會得到更多方面的創(chuàng)新研究和開發(fā),給社會帶來更大的促進作用。
參 考 文 獻
[1]夏天維. 計算機數(shù)據(jù)挖掘技術(shù)的開發(fā)及其應(yīng)用探究[A]. 《Q策與信息》雜志社、北京大學(xué)經(jīng)濟管理學(xué)院.“決策論壇――管理科學(xué)與工程研究學(xué)術(shù)研討會”論文集(下)[C].《決策與信息》雜志社、北京大學(xué)經(jīng)濟管理學(xué)院:,2016:1.
關(guān)鍵詞: 科研成果管理; 決策支持; 數(shù)據(jù)倉庫; 聯(lián)機分析處理; 數(shù)據(jù)挖掘
中圖分類號: TN911?34; TM417 文獻標(biāo)識碼: A 文章編號: 1004?373X(2016)07?0120?04
Abstract: The traditional scientific research achievement management uses the database to store the result data. The multiple data types of the scientific research achievement and unified storage way become the obstacle to obtain the valid result data in decision?making analysis, simultaneously the traditional scientific research achievement system can only extract the result information. In view of the above problems, the scientific research achievement management and decision support system based on data warehouse is proposed, in which the data warehouse, on?line analysis processing (OLAP) and association rule mining algorithm are integrated. The system supports that the management personnel can discover the potential achievement, evaluate the scientific research projects, and reasonably allocate the human resources. The association rules of the data were mined in college paper database. It is found that paper quantity and time dimension have some relationship, which conforms with the practical training situation. The effectiveness of using Apriori in this system was verified.
Keywords: scientific research achievement management; decision support; data warehouse; OLAP; data mining
0 引 言
傳統(tǒng)的科研項目管理過程費時費力,且浪費了大量的人力資源??蒲羞^程中產(chǎn)生的有價值的信息,也被這樣死板的管理方法給淹沒了,人們不能也不愿意從紙質(zhì)的資料文獻中去發(fā)現(xiàn)價值??蒲泄芾矸绞叫实蜁乐赜绊懙娇蒲许椖块_發(fā)的進度。隨著科學(xué)技術(shù)的快速發(fā)展,科研單位雖然對傳統(tǒng)方法進行了改進,開始建立管理系統(tǒng),但是還遠遠不能滿足要求[1]。
近年來,國內(nèi)研究機構(gòu)也開始重視科研項目管理方面的研究,目的多是為了提高項目管理的水平,對優(yōu)秀的科研成果進行公示,共同分享研究信息[2]。科研成果管理決策支持系統(tǒng)的目的是為了解決傳統(tǒng)科研管理系統(tǒng)對成果資源的浪費情況,加強對科研成果信息中潛在知識的利用,提高科研項目管理中對成果管理的有效性,利用數(shù)據(jù)挖掘充分發(fā)揮成果數(shù)據(jù)的潛力,為管理層提供決策支持依據(jù)[3]。
1 SRAM?DSS的需求分析
1.1 功能需求
科研成果管理決策支持系統(tǒng)主要面向科研項目的成果進行管理,這些成果包括學(xué)術(shù)論文、著作、期刊、專利等。數(shù)據(jù)倉庫的應(yīng)用可以對成果數(shù)據(jù)采取智能的分析,將成果數(shù)據(jù)進行歸類和按照成果數(shù)據(jù)的分析要求進行整理,從中發(fā)現(xiàn)成果與項目、人員之間的聯(lián)系和潛在的規(guī)律,幫助決策者調(diào)整科研定位,做出科學(xué)的決策。
基本管理功能要求用戶可以利用本系統(tǒng)完成對成果的基本管理,包括成果提交、 審核、審批等流程的規(guī)范管理,還有對保密項目成果的加密處理,不僅要系統(tǒng)能夠保存使用過程中存入的成果,還可以導(dǎo)入外部數(shù)據(jù)庫的成果數(shù)據(jù),為數(shù)據(jù)挖掘功能提供數(shù)據(jù)基礎(chǔ),對數(shù)據(jù)的集成程度要求很高,因此需要利用數(shù)據(jù)倉庫存放成果數(shù)據(jù)[4]。
1.2 用戶需求
系統(tǒng)的主要角色包括科研員,科研管理員,決策員,數(shù)據(jù)管理員,系統(tǒng)管理員。
2 總體設(shè)計
2.1 科研成果數(shù)據(jù)倉庫的設(shè)計
對于科研成果數(shù)據(jù)倉庫從概念模型、邏輯模型、物理模型三方面進行建模。需要根據(jù)不同的主題把數(shù)據(jù)倉庫中的數(shù)據(jù)劃分好具體的維度[5]。以成果主題為例,成果數(shù)據(jù)包括成果名稱,成果類型,成果來源,成果性質(zhì),成果作者,成果審核結(jié)果,所屬項目,成果完成時間,成果數(shù)量等,以此作為分析的依據(jù)。因為數(shù)據(jù)倉庫是多維的,OLAP要在多維數(shù)據(jù)集之上才能進行,成果數(shù)據(jù)要滿足分析的要求可以根據(jù)維層次繼續(xù)劃分,成果類型包括論文,專利,專著,軟件成果等;成果性質(zhì)包括科技,醫(yī)藥,航天等[6]。
(1) 邏輯模型
系統(tǒng)主要用戶利用成果信息進行分析,以此來評估科研項目,并為決策者提供決策支持。分析成果事實表中的數(shù)據(jù)信息有用戶維、成果維、時間維。在OLAP分析時可以按照不同的層次進行分析,如圖2所示。
(2) 物理模型
在設(shè)計數(shù)據(jù)倉庫的物理模型時,定義成果數(shù)據(jù)的數(shù)據(jù)標(biāo)準是需要注意的重點,目的是使成果數(shù)據(jù)在數(shù)據(jù)倉庫中都有一個統(tǒng)一的格式,定義表示成果的相關(guān)屬性來描述成果邏輯關(guān)系,得到對成果數(shù)據(jù)倉庫的特征進行完整描述。系統(tǒng)采用SQLServer2008建立數(shù)據(jù)庫[7]。利用AnalysisServices獲得后臺數(shù)據(jù)庫里面的信息,這樣建立的數(shù)據(jù)倉庫可以滿足需求。
2.2 SRAM?DSS功能的設(shè)計
為實現(xiàn)科研成果管理科學(xué),全方位管理,設(shè)計成果管理,決策支持,用戶管理,系統(tǒng)管理四個模塊的內(nèi)容,并且用戶在登陸系統(tǒng)之前要進行身份驗證。
(1) 成果管理模塊
成果管理主要包括成果查詢,添加成果,申報成果,成果審核,成果加密以及成果導(dǎo)出等功能,系統(tǒng)采用分組加密方式進行加密。
(2) 決策支持模塊
數(shù)據(jù)倉庫是決策支持功能的數(shù)據(jù)基礎(chǔ),有了數(shù)據(jù)就需要更多的操作來完成決策支持。對于系統(tǒng)中不同的數(shù)據(jù)來源,包括外部導(dǎo)入數(shù)據(jù)利用ETL過程,實現(xiàn)規(guī)范化。然后將符合標(biāo)準的數(shù)據(jù)裝入數(shù)據(jù)倉庫中。然后針對用戶的要求進行聯(lián)機分析處理和關(guān)聯(lián)規(guī)則挖掘。
(3) 用戶管理模塊
用戶在Web地址欄輸入URL進入登錄,用戶名文本框內(nèi)輸入用戶姓名,在密碼框內(nèi)輸入密碼。系統(tǒng)認證平臺會判斷用戶身份,若是新用戶要完成注冊才能登陸,注冊時要填寫用戶真實的信息,才能獲得登陸權(quán)利,若用戶輸入的用戶信息正確,登錄成功。用戶可以在用戶管理中進行創(chuàng)建,添加到用戶數(shù)據(jù)表中,也能獲得系統(tǒng)的使用權(quán)限[8]。
(4) 系統(tǒng)管理模塊
系統(tǒng)管理模塊主要是針對系統(tǒng)的權(quán)限分配,系統(tǒng)維護以及一些常用工具的設(shè)計。不同的用戶進行的操作不同,能夠看到的信息不同,就要求系統(tǒng)控制權(quán)限,建立權(quán)限分配制度,有利于對用戶權(quán)限進行合理的分配也保證了系統(tǒng)的安全運行。系統(tǒng)維護是管理系統(tǒng)中必不可少的關(guān)鍵功能,包括對系統(tǒng)用戶數(shù)據(jù),成果信息數(shù)據(jù)等的備份工作,實現(xiàn)數(shù)據(jù)庫的安全管理,管理相應(yīng)功能結(jié)構(gòu)規(guī)范性,為系統(tǒng)的更新與升級提供支持。
3 系統(tǒng)實現(xiàn)
3.1 基于數(shù)據(jù)倉庫的OLAP模型
聯(lián)機分析處理技術(shù)能夠高效的分析數(shù)據(jù),發(fā)現(xiàn)事物發(fā)展規(guī)律,捕獲異常和細節(jié)。OLAP支持數(shù)據(jù)分析,而數(shù)據(jù)倉庫里的數(shù)據(jù)是經(jīng)過ETL處理后集成到一起,保證了分析在一個快速的時間內(nèi)給予響應(yīng)。所以本階段就是基于數(shù)據(jù)倉庫建立OLAP模型,從而得到更為可靠的數(shù)據(jù)立方體,既降低了刷新代價又提高了響應(yīng)速度。
OLAP包括了維和度量,在前面建立數(shù)據(jù)倉庫時已經(jīng)完成。利用SQL Server中的Analysis Services項目模板建立多維數(shù)據(jù)集,定義數(shù)據(jù)源以及建立事實表與維表之間的關(guān)系。
OLAP模型對數(shù)據(jù)倉庫中的數(shù)據(jù)利用MDX進行多維查找,可以有效分析多維數(shù)據(jù)集。MDX是OLAP的查詢語句,語法與結(jié)構(gòu)化查詢語言SQL很類似。在成果管理系統(tǒng)中,通過MDX語言把科研員和決策者需要的成果數(shù)據(jù)查詢出來,展現(xiàn)在前臺界面里。
利用OLAP模型進行分析,決策者可以依據(jù)分析要求,選擇更多角度去分析數(shù)據(jù),能得到的分析也更多,如下:
(1) 由科研成果的類型分布來看整體項目的側(cè)重重點,以及在成果突出領(lǐng)域的發(fā)展機會和潛力;
(2) 由科研成果參與者和第一申請單位作者與項目之間的關(guān)系,可以看到參與者職稱水平,技術(shù)支持水平對成果完成數(shù)量與質(zhì)量的關(guān)系,并不是參與者越多的成果越完善,可以以此作為合理分配人才資源參與項目開發(fā)的依據(jù),也可以以此評估參與人員的水平,作為考核參考;
(3) 以科研成果在一定時間內(nèi)的增長,作為項目進度和發(fā)展的一個參考標(biāo)準。也可以看到成果的趨勢和項目完成單位的能力和業(yè)務(wù)的提升;
(4) 可以利用數(shù)據(jù)庫,對以往成果信息進行分析,由于在傳統(tǒng)的數(shù)據(jù)庫中不具備OLAP的功能。
3.2 基于數(shù)據(jù)倉庫的關(guān)聯(lián)規(guī)則挖掘
基于數(shù)據(jù)倉庫的關(guān)聯(lián)規(guī)則挖掘,Apriori算法的核心是提高關(guān)聯(lián)規(guī)則產(chǎn)生的效率。利用Apriori算法對科研成果數(shù)據(jù)進行分析的時候要明確成果的特征,根據(jù)成果特征描述來看,適合利用Apriori算法進行關(guān)聯(lián)規(guī)則的挖掘??蒲谐晒麛?shù)據(jù)的特征如下:成果數(shù)據(jù)是按照項目進程時間節(jié)點進行錄入的,存儲在成果庫中;成果評估方式不統(tǒng)一,對成果的評估應(yīng)采取統(tǒng)一的標(biāo)準;科研成果的數(shù)據(jù)存儲在數(shù)據(jù)庫中,每一個成果都對應(yīng)一條記錄,每一個記錄的屬性都一樣。
以本校論文庫的數(shù)據(jù)為實驗數(shù)據(jù),在論文管理系統(tǒng)中可導(dǎo)出相關(guān)TXT文檔數(shù)據(jù),利用系統(tǒng)成果導(dǎo)入功能,添加到系統(tǒng)中,對數(shù)據(jù)進行統(tǒng)一的處理。選取2012―2015年間,數(shù)學(xué)、物理、計算機、兵器學(xué)科的論文成果數(shù)據(jù)。論文所屬學(xué)科層次劃分到一級子學(xué)科,時間層次按照年學(xué)年,繼續(xù)劃分下去。
(1) 數(shù)據(jù)預(yù)處理
數(shù)據(jù)經(jīng)過清洗,轉(zhuǎn)換,去掉無效的數(shù)據(jù),采用統(tǒng)一的數(shù)據(jù)編碼規(guī)則,用離散字母代替時間層次,同時將學(xué)科按照統(tǒng)一的編碼規(guī)則,重新編碼。進一步按照論文數(shù)量劃分等級,五份為一級,等級越高代表論文數(shù)量越多。
(2) 算法實現(xiàn)
設(shè)置最小支持度 min_sup=4,支持度=40%,置信度=80%,通過Apriori算法計算出的關(guān)聯(lián)規(guī)則信任度見表2。
(3) 結(jié)果分析
采用的實驗數(shù)據(jù)來自于論文數(shù)據(jù)庫,由于學(xué)校畢業(yè)論文按照培養(yǎng)計劃有周期性,學(xué)術(shù)性碩士的培養(yǎng)周期為2.5學(xué)年,所以碩士畢業(yè)多集中于第一學(xué)年3月份左右,工程碩士的培養(yǎng)周期為第二學(xué)年9月份,所以對數(shù)據(jù)的分析結(jié)果多集中于上半年。
規(guī)則1表示,在2012年第一學(xué)年在5篇以內(nèi)且2013年第一學(xué)年畢業(yè)論文在5篇以內(nèi)的學(xué)科專業(yè),則在2013年第二學(xué)年在5篇左右的支持度為40%,信任度為80%。
規(guī)則2表示,在2013年第一學(xué)年在5篇以內(nèi)且2013年第二學(xué)年畢業(yè)論文在5篇以內(nèi)的學(xué)科專業(yè),則在2012年第一學(xué)年在5篇左右的支持度為40%,信任度為80%。
規(guī)則3表示,在2012年第一學(xué)年在5篇以內(nèi)且2013年第一學(xué)年畢業(yè)論文在5篇以內(nèi)的學(xué)科專業(yè),則在2014年第二學(xué)年在5篇左右的支持度為40%,信任度為80%。
3.3 關(guān)聯(lián)規(guī)則說明
由于系統(tǒng)中的測試數(shù)據(jù)多來自網(wǎng)絡(luò)和本校的數(shù)據(jù)庫,對關(guān)聯(lián)規(guī)則的挖掘也許存在偏差,但是整體提供的關(guān)聯(lián)規(guī)則數(shù)據(jù)信息還是符合實際的。簡要介紹以下幾點:
(1) 選取成果完成人的職稱級別和所提交的成果類型與數(shù)量作為關(guān)聯(lián)規(guī)則挖掘的維度,發(fā)現(xiàn)成果完成人職稱較低的數(shù)量較多,存在關(guān)聯(lián)規(guī)則;
(2) 選取固定時間內(nèi)論文數(shù)量和專利數(shù)量進行關(guān)聯(lián)規(guī)則挖掘,發(fā)現(xiàn)時間維度與論文數(shù)量多,關(guān)聯(lián)較高;
(3) 對不同高校的成果數(shù)量進行關(guān)聯(lián)分析,985與211高校的科研論文,期刊發(fā)表數(shù)量多具有關(guān)聯(lián)規(guī)則。
4 界面展示
用戶登陸界面:輸入正確的用戶名和密碼登陸系統(tǒng),用戶可以選擇“記住我”,在下次進入系統(tǒng)時可以免登陸,若是新用戶第一次登陸系統(tǒng),需要注冊,完成注冊后即獲得登陸權(quán)限。
登陸后看到的首頁,左側(cè)導(dǎo)航欄顯示了主要的功能,成果展示系統(tǒng)中的成果數(shù)量以及系統(tǒng)中的成果列表。
5 結(jié) 論
本文在調(diào)研了解科研成果管理的決策分析需求的基礎(chǔ)上,認真研究了數(shù)據(jù)倉庫的有關(guān)技術(shù)知識,聯(lián)機分析處理技術(shù)的應(yīng)用以及數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則算法的原理。提出了基于數(shù)據(jù)倉庫的科研成果管理決策支持系統(tǒng)。
開發(fā)系統(tǒng)應(yīng)用的主要技術(shù)包括OLAP和Apriori算法,將OLAP和Apriori算法結(jié)合運用于實際的系統(tǒng)開發(fā)中,關(guān)聯(lián)規(guī)則計算在OLAP物化了的多維數(shù)據(jù)集基礎(chǔ)上進行,減少了重新計算的時間,使決策分析更加智能化,使數(shù)據(jù)挖掘的步驟更具目標(biāo)化,全面提升輔助決策在科研成果管理中的實用價值。
參考文獻
[1] 賀建英.大數(shù)據(jù)下MongoDB數(shù)據(jù)庫檔案文檔存儲去重研究[J].現(xiàn)代電子技術(shù),2015,38(16):51?55.
[2] SUN Hongmei, JIA Ruisheng. Research on the analysis and design of general test database management system [J]. Procedia engineering, 2012, 29: 489?493.
[3] ESLAMIPOOR R, SEPEHRIAR A. Firm relocation as a potential solution for environment improvement using a SWOT?AHP hybrid method [J]. Process safety and environmental protection, 2014, 92(3): 269?276.
[4] KLAUS S R, NEUBAUER J, GOETZ?NEUNHOEFFER F. Hydration kinetics of CA2 and CA?investigations performed on a synthetic calcium aluminate cement [J]. Cement and concrete research, 2013, 43(1): 62?69.
[5] PENG G Y. Marketing decision and decision support system design based on Web [J]. Advanced materials research, 2013, 850: 1048?1051.
[6] 趙維寧.運用數(shù)據(jù)倉庫技術(shù)構(gòu)建電信企業(yè)經(jīng)營分析系統(tǒng)[J].中文信息,2014(8):22?26.
論文關(guān)鍵詞:中藥材市場,電子商務(wù)平臺,構(gòu)建研究
一、構(gòu)建中藥材電子商務(wù)平臺必要性分析
1、國內(nèi)外市場現(xiàn)狀分析
中醫(yī)藥是祖國傳統(tǒng)文化燦爛寶庫中的重要組成部分,人們普遍應(yīng)用中醫(yī)藥進行保健、醫(yī)療。國外,民眾對中醫(yī)的療效越來越認可和興趣。廣大民眾對中醫(yī)藥的需求,推動了中藥材的種植、加工、儲存、買賣、應(yīng)用。其中,中藥材集約式買賣交易造就了大型的中藥材專業(yè)市場。信息時代,民眾迫切盼望通過網(wǎng)絡(luò)能查詢了解中醫(yī)藥知識,中藥材專業(yè)市場、中藥商、中藥消費者非常希望能利用網(wǎng)絡(luò)查尋掌握中藥材的行情信息,通過網(wǎng)上洽談買賣交易。開發(fā)構(gòu)建規(guī)模大,功能齊全的中醫(yī)藥網(wǎng)絡(luò)信息與交易服務(wù)平臺是中藥材產(chǎn)業(yè)發(fā)展的需要。
2、傳統(tǒng)中藥材市場改革的需要
投巨資建設(shè)的玉林中藥材市場,占地175畝,總建筑面積23萬平方米,鋪面共有3980間。是我國西南地區(qū)最大中藥材集散中心。玉林中藥材市場雖然規(guī)模大,基礎(chǔ)設(shè)施好,但市場交易方式仍停留在傳統(tǒng)的、單一的攤位對手交易,效率低、成本高、信息不暢,不利于客商業(yè)務(wù)擴展電子商務(wù)論文,不利于市場規(guī)范管理。在信息化時代,國內(nèi)外各類市場趨向于電子網(wǎng)絡(luò)商務(wù)的大背景下,玉林中藥材市場沒有構(gòu)建電子信息服務(wù)、網(wǎng)絡(luò)商務(wù),無法與國內(nèi)、國際市場接軌,市場發(fā)展將受到很大的制約,隨著時間的推移,市場優(yōu)勢也將會消失。玉林中藥材市場迫切需要構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)信息應(yīng)用與交易平臺。
目前,國外,主要是西藥網(wǎng)站,以新藥品信息和廣告為主,沒有中藥網(wǎng)站和相關(guān)的平臺。國內(nèi),尚未發(fā)現(xiàn)大型專業(yè)中藥材網(wǎng)絡(luò)信息與交易服務(wù)平臺,多為綜合性藥品網(wǎng)站,中藥材信息是網(wǎng)站的一部分,單獨而專業(yè)的中藥材網(wǎng)站少,規(guī)模小,功能少。構(gòu)建功能強大,集市場信息和查詢、網(wǎng)上洽商和交易、質(zhì)量檢查、商鋪信用評級、市場需求價格分析預(yù)測、行業(yè)培訓(xùn)、商鋪網(wǎng)站、市場管理、中藥材數(shù)據(jù)挖掘、中藥資訊查尋、藥品洽談交易等功能信息服務(wù)平臺,是發(fā)展趨勢。
二、構(gòu)建中藥材電子商務(wù)平臺展望
1、構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺,實體商鋪交易與網(wǎng)絡(luò)商鋪交易并舉,與國內(nèi)國際市場接軌,造就大批現(xiàn)代藥商,業(yè)態(tài)升級,做大做強市場。
玉林中藥材市場構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺,實行網(wǎng)絡(luò)化運作,就走上“業(yè)態(tài)提升、功能擴充、管理升級、產(chǎn)業(yè)促進”的改革之路。改變傳統(tǒng)的、單一的攤位對手交易,實行市場+網(wǎng)絡(luò)商鋪+經(jīng)營業(yè)戶的經(jīng)營模式。使中藥材市場逐步形成藥材集散、價格形成、信息反饋、產(chǎn)業(yè)帶動為一體的現(xiàn)代網(wǎng)絡(luò)化市場。實現(xiàn)長效科學(xué)規(guī)范管理,市場的組織化程度提高,市場的公平性、誠信度提升,市場運作效率提高,市場的活力、競爭力得到增強中國期刊全文數(shù)據(jù)庫。
中藥材網(wǎng)絡(luò)電子商務(wù)平臺將中藥材市場傳統(tǒng)的商務(wù)流程數(shù)字化、電子化、網(wǎng)絡(luò)化,突破時間空間的局限,大大提高商業(yè)運作效率;造就現(xiàn)代藥商電子商務(wù)論文,開闊視野,在駕馭瞬息萬變的市場中始終處于主動和優(yōu)勢。
中藥材網(wǎng)絡(luò)電子商務(wù)平臺可實現(xiàn)遠程實時商務(wù)洽談、交易,為商企低成本拓展全國、東南亞、國際市場鋪就了一條低成本的黃金商道,非常有利于玉林中藥材市場走向全國、全球,從而把市場做大做強。
2、構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺,能提高商業(yè)運作效率、降低流通成本,快捷提供豐富的商業(yè)資訊,創(chuàng)造更多商機,規(guī)避商業(yè)風(fēng)險,增強商企的競爭力。
中藥材網(wǎng)絡(luò)電子商務(wù)平臺,讓商務(wù)流程轉(zhuǎn)化為網(wǎng)絡(luò)化的電子流、信息流,不受時空限制,大大提高商業(yè)運作效率。中藥網(wǎng)絡(luò)信息應(yīng)用與交易平臺可實現(xiàn)遠程實時商務(wù)洽談、交易,簡化了客商之間的流通環(huán)節(jié),最大限度地降低了流通成本,能有效地提高中藥材客商在現(xiàn)代商業(yè)活動中的競爭力。
中藥材網(wǎng)絡(luò)電子商務(wù)平臺為中藥材市場提供一種基于互聯(lián)網(wǎng)的商務(wù)活動,具有開放性、共享性、全球性的特點,可為企業(yè)、個人提供豐富的商業(yè)信息資源,創(chuàng)造更多商業(yè)機會,同時有助于客商規(guī)避商業(yè)風(fēng)險。
中藥材網(wǎng)絡(luò)電子商務(wù)平臺對買賣交易活動頻繁的企業(yè)非常有利,能有效對企業(yè)商業(yè)活動的進行科學(xué)、規(guī)范化管理。
中藥材網(wǎng)絡(luò)電子商務(wù)平臺使中小企業(yè)擁有和大企業(yè)一樣的流通渠道和信息資源,這樣也使中小企業(yè)以與大型企業(yè)相同的成本進行網(wǎng)上交易,高速高效拓展業(yè)務(wù),極大提高了中小企業(yè)的競爭力。
3、中藥材網(wǎng)絡(luò)電子商務(wù)平臺及時提供、準確、可靠、全面的市場供需信息,產(chǎn)銷聯(lián)動,避免盲目種植藥材,保障藥農(nóng)收益,促進中藥種植業(yè)發(fā)展。
玉林中藥材市場的發(fā)展,帶動了周邊地區(qū),乃至中西南部眾多省份中藥材種植,中藥材種植面積逐年擴大,逐步成為農(nóng)民增收的一個途徑。但農(nóng)民種植藥材決策主要來源于市場人員的直覺信息,由于信息缺乏真實性、全面性,從而導(dǎo)致種植的盲目性電子商務(wù)論文,影響藥材種植的收益和積極性,對藥材種植業(yè)帶來消極影響。
中藥材網(wǎng)絡(luò)電子商務(wù)平臺提供及時、準確、可靠、全面的市場供需信息,并提供專家對市場的分析、預(yù)測,有效地幫助藥農(nóng)及時調(diào)整種植品種,產(chǎn)銷緊密結(jié)合,確保中藥種植收益最大化,有利于中藥種植業(yè)良性發(fā)展。
4、中藥材網(wǎng)絡(luò)電子商務(wù)平臺能促進中藥材相關(guān)行業(yè)發(fā)展,創(chuàng)造更多的商機,拓展就業(yè),帶動經(jīng)濟發(fā)展。
中藥材網(wǎng)絡(luò)電子商務(wù)平臺眾多的優(yōu)勢,將推動玉林中藥材市場的快速發(fā)展,交易額大幅上升,市場輻射效應(yīng)加倍擴展,進而帶動中藥材相關(guān)行業(yè),如:加工、物流、旅業(yè)、通訊等二、三產(chǎn)業(yè)的蓬勃發(fā)展,創(chuàng)造更多的商機,增加就業(yè)機會,帶動經(jīng)濟發(fā)展。
三、中藥材網(wǎng)絡(luò)電子商務(wù)平臺的結(jié)構(gòu)與布局
1、中藥材網(wǎng)絡(luò)電子商務(wù)平臺功能規(guī)劃
中藥材市場涉及中藥材的種植、加工、質(zhì)檢、交易、倉儲、物流,技術(shù)服務(wù)等環(huán)節(jié),業(yè)務(wù)范疇廣、流程復(fù)雜,具有鮮明的行業(yè)特點。中藥材網(wǎng)絡(luò)電子商務(wù)平臺應(yīng)該基于一條龍服務(wù)的宗旨進行功能規(guī)劃,從技術(shù)角度來看是一個全面的解決方案。中藥材網(wǎng)絡(luò)電子商務(wù)平臺需要具有如下功能:
(1)向市場提供豐富的商業(yè)信息資源,創(chuàng)造更多商業(yè)機會。(2)網(wǎng)上洽商和交易,簡化了客商之間的流通環(huán)節(jié),提高商業(yè)運作效率,最大限度地降低了流通成本,有效地提高中藥材客商的商業(yè)競爭力。(3)有效對客商、企業(yè)商業(yè)活動的進行科學(xué)、規(guī)范管理,提高市場的組織化程度,增強市場的競爭力。(4)使中藥材市場逐步形成藥材集散、價格形成、信息反饋、產(chǎn)業(yè)帶動為一體的現(xiàn)代網(wǎng)絡(luò)化市場。
2、中藥材網(wǎng)絡(luò)電子商務(wù)平臺子系統(tǒng)的設(shè)置
根據(jù)中藥材網(wǎng)絡(luò)電子商務(wù)平臺的功能規(guī)劃,可考慮設(shè)置九個子系統(tǒng):市場信息和查詢系統(tǒng)、市場需求價格分析預(yù)測系統(tǒng)、網(wǎng)上洽商和交易系統(tǒng)、市場管理系統(tǒng)、質(zhì)量管理系統(tǒng)、商鋪網(wǎng)站系統(tǒng)、商鋪信用評級系統(tǒng)、中藥材數(shù)據(jù)挖掘系統(tǒng)、行業(yè)培訓(xùn)系統(tǒng)等九大功能系統(tǒng)。同時,平臺還建立交易中介擔(dān)保機制和數(shù)據(jù)安全機制。
3、中藥材網(wǎng)絡(luò)電子商務(wù)平臺的功能模塊設(shè)置
對應(yīng)中藥材網(wǎng)絡(luò)電子商務(wù)平臺九個子系統(tǒng)進行功能模塊的規(guī)劃設(shè)置。
(1)市場信息和查詢系統(tǒng)
藥材資訊:行業(yè)動態(tài)、各地快訊、產(chǎn)地信息、藥材展會、招商合作、藥材進出口。
藥材供應(yīng)信息:最新供應(yīng)信息、所有供應(yīng)信息、供應(yīng)信息綜合查詢、供應(yīng)信息反饋統(tǒng)計。
藥材求購信息:最新求購信息、所有求購信息、求購信息綜合查詢、求購信息反饋統(tǒng)計。
藥材價格信息:最新價格變動、全部價格、價格走勢、分析預(yù)測。
藥材排行榜:供應(yīng)金額排行、供應(yīng)數(shù)量排行、求購金額排行、求購數(shù)量排行、成交金額排行、成交數(shù)量排行、價格查詢熱度排行、資訊查詢熱度排行、查詢總熱度排行。
藥材商鋪:商鋪基本信息、商鋪供求信息、商鋪其它信息、商鋪綜合排行、商鋪問詢、推薦商鋪。
(2)市場需求價格分析預(yù)測系統(tǒng):供求分析、供求預(yù)測、價格分析、價格預(yù)測。
(3)網(wǎng)上洽商和交易系統(tǒng):會員管理、網(wǎng)上洽談、網(wǎng)上交易、網(wǎng)上付款、收發(fā)貨管理、貨款撥退。
(4)市場管理系統(tǒng):通知公告、文件流轉(zhuǎn)、租賃管理、合同管理、收費管理。
(5)質(zhì)量管理系統(tǒng):質(zhì)量抽樣檢驗、商品標(biāo)識抽檢、索證備案檢查、進貨臺帳檢查、下柜退市貨物檢查、虛假宣傳檢查、侵權(quán)檢查、檢查綜合評分、排行處理。
(6)商鋪網(wǎng)站系統(tǒng):商鋪網(wǎng)站注冊、商鋪網(wǎng)站模板管理、商鋪網(wǎng)站信息上傳、商鋪網(wǎng)站綜合排行、商鋪網(wǎng)站綜合管理。
(7)商鋪信用評級系統(tǒng):商鋪信用評分、商鋪信用排行、商鋪信用監(jiān)督。
(8)中藥材數(shù)據(jù)挖掘系統(tǒng):數(shù)據(jù)挖掘模型管理、數(shù)據(jù)挖掘、數(shù)據(jù)挖掘結(jié)果儲存、數(shù)據(jù)挖掘結(jié)果顯示、挖掘特點統(tǒng)計。
(9)行業(yè)培訓(xùn)系統(tǒng):中藥材種植技術(shù)培訓(xùn)、中藥材加工技術(shù)培訓(xùn)、中藥材鑒別培訓(xùn)、中藥材儲存知識培訓(xùn)、中藥材醫(yī)用培訓(xùn)、其它知識培訓(xùn)。
四、構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺可行性
網(wǎng)絡(luò)電子商務(wù)平臺的技術(shù)基礎(chǔ)和社會基礎(chǔ):現(xiàn)代社會,網(wǎng)絡(luò)信息技術(shù)發(fā)展迅速,應(yīng)用廣泛電子商務(wù)論文,技術(shù)成熟。有眾多的成功的網(wǎng)絡(luò)信息服務(wù)平臺范例可供借鑒,構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺具有良好的技術(shù)基礎(chǔ)中國期刊全文數(shù)據(jù)庫。隨著計算機網(wǎng)絡(luò)在社會各行各業(yè)、各階層的廣泛應(yīng)用,計算機網(wǎng)絡(luò)已是人們的工作、生活密不可分的工具,社會已普遍形成了應(yīng)用計算機網(wǎng)絡(luò)良好行為習(xí)慣,構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺也具有了廣泛的社會基礎(chǔ)。
五、關(guān)鍵技術(shù)與創(chuàng)新
與一般信息網(wǎng)站、網(wǎng)絡(luò)信息服務(wù)平臺不同,中藥材市場涉及中藥材的種植、加工、質(zhì)檢、交易、倉儲、物流,技術(shù)服務(wù)等環(huán)節(jié),業(yè)務(wù)范疇廣、流程復(fù)雜,行業(yè)特色明顯。因此,中藥材網(wǎng)絡(luò)電子商務(wù)平臺規(guī)模大,集成九大功能系統(tǒng),設(shè)置七十六個模塊,需要解決的關(guān)鍵技術(shù)不少。如:(1)網(wǎng)上交易中,不同企業(yè)、不同技術(shù)標(biāo)準的系統(tǒng)之間實現(xiàn)數(shù)據(jù)實時傳送、接收。(2)使用不同開發(fā)工具的系統(tǒng)集成到一個平臺,并實現(xiàn)數(shù)據(jù)無縫互通。(3)復(fù)雜多樣的業(yè)務(wù)數(shù)據(jù)交換標(biāo)準的研制。(4)巨量數(shù)據(jù)并發(fā)處理機制設(shè)計。(5)多服務(wù)器分布處理響應(yīng)。(6)平臺交易數(shù)據(jù)安全技術(shù)。(7)中藥材數(shù)據(jù)挖掘技術(shù)。(8)多媒體培訓(xùn)課件的設(shè)計與集成等等。
網(wǎng)絡(luò)信息應(yīng)用模式的創(chuàng)新:(1)創(chuàng)建現(xiàn)代網(wǎng)絡(luò)化中藥材市場。(2)中藥材網(wǎng)上交易。(3)創(chuàng)建中藥材網(wǎng)絡(luò)商鋪。(4)中藥材市場信息平臺中的數(shù)據(jù)挖掘技術(shù)應(yīng)用。(5)中藥材交易資訊服務(wù)。(6)中藥材種植資訊服務(wù)。(7)網(wǎng)絡(luò)化市場管理。(8)網(wǎng)絡(luò)多媒體中藥材綜合知識培訓(xùn)等。在實際開發(fā)構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺的過程中,對這些技術(shù)關(guān)鍵,要進行大量的分析研究,逐個攻關(guān)解決。
參考文獻
俞文群,城市公共信息服務(wù)平臺的設(shè)計與實現(xiàn)[J].寧波工程學(xué)院學(xué)報,2006,(2):34-37