一级a一级a爱片免费免会员2月|日本成人高清视频A片|国产国产国产国产国产国产国产亚洲|欧美黄片一级aaaaaa|三级片AAA网AAA|国产综合日韩无码xx|中文字幕免费无码|黄色网上看看国外超碰|人人操人人在线观看|无码123区第二区AV天堂

人工智能網(wǎng)絡(luò)教育

時(shí)間:2023-09-07 17:40:06

導(dǎo)語:在人工智能網(wǎng)絡(luò)教育的撰寫旅程中,學(xué)習(xí)并吸收他人佳作的精髓是一條寶貴的路徑,好期刊匯集了九篇優(yōu)秀范文,愿這些內(nèi)容能夠啟發(fā)您的創(chuàng)作靈感,引領(lǐng)您探索更多的創(chuàng)作可能。

第1篇

關(guān)鍵詞:數(shù)據(jù)挖掘;教學(xué)系統(tǒng);關(guān)聯(lián)規(guī)則;決策樹

中圖分類號(hào):TP301文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)24-6933-02

The Application of Data Mining in Distance Teaching System

WU Bin1,WU Chen2

(1.School of Information Science & Technology, Jiujiang University,Jiujiang 332005,China;2.Shandong Laigang Construction Co. , Ltd, Laiwu 271126, China)

Abstract: With the continuous development of Web technology, the research and use of Web-based distance education system receive increasing attention,Data mining, artificial intelligence technology in distance teaching system has become increasingly widespread, Data mining technology such as association rules,statistics analysis,classification technology etc. can be used in teching system and improve the intelligence of the system, The service of distance teaching system can be improved better, and to help students raise their study efficiency.

Key words: data mining; teaching system; association system; decision tree

隨著網(wǎng)絡(luò)技術(shù)的深入發(fā)展,人們對(duì)于各種網(wǎng)絡(luò)應(yīng)用的需求正在急劇增加,基于網(wǎng)絡(luò)的遠(yuǎn)程教育站點(diǎn)在國內(nèi)外如雨后春筍般迅速崛起。如何充分發(fā)揮網(wǎng)絡(luò)教學(xué)功能,利用現(xiàn)代技術(shù),構(gòu)建功能強(qiáng)大的遠(yuǎn)程教學(xué)系統(tǒng)是現(xiàn)在研究的重點(diǎn)。

在遠(yuǎn)程教育中,會(huì)有海量的信息產(chǎn)生,但這些信息存儲(chǔ)分散,記錄凌亂,數(shù)據(jù)龐大,而采用數(shù)據(jù)挖掘技術(shù)可以從這些大量的數(shù)據(jù)中發(fā)現(xiàn)學(xué)生的訪問習(xí)慣、學(xué)習(xí)興趣、學(xué)習(xí)傾向等,然后根據(jù)學(xué)生的訪問規(guī)律調(diào)整系統(tǒng)的結(jié)構(gòu),動(dòng)態(tài)地為學(xué)生定制個(gè)性化的網(wǎng)站。據(jù)此可以給學(xué)生推薦課程和學(xué)習(xí)資料,也可以將學(xué)生的反饋建議提供給教師,使教師能夠及時(shí)調(diào)整教學(xué)內(nèi)容。總之,數(shù)據(jù)挖掘知識(shí)的采用為現(xiàn)代遠(yuǎn)程教育系統(tǒng)的智能化、個(gè)性化提供了重要的技術(shù)手段[1-2]。

1 數(shù)據(jù)挖掘概念和技術(shù)

1.1 數(shù)據(jù)挖掘概念

數(shù)據(jù)挖掘(Data Mining),是指從大量數(shù)據(jù)中提取隱含的、未知的、非平凡的及有潛在應(yīng)用價(jià)值的信息,這些信息的表現(xiàn)形式為:規(guī)則、概念、規(guī)律及模式等。許多人把數(shù)據(jù)挖掘視為另一個(gè)常用的術(shù)語數(shù)據(jù)中的知識(shí)發(fā)現(xiàn)或KDD的同義詞,而另一些人只是把數(shù)據(jù)挖掘視為知識(shí)發(fā)現(xiàn)過程的一個(gè)基本步驟。數(shù)據(jù)挖掘是一門涉及面很廣的交叉性新興學(xué)科,涉及到數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計(jì)、可視化、并行計(jì)算等領(lǐng)域。通過數(shù)據(jù)挖掘,可以從數(shù)據(jù)庫提取有趣的知識(shí)、規(guī)律等高層信息,并可以從不同的角度觀察或?yàn)g覽他們。發(fā)現(xiàn)的知識(shí)可以用于做決策、過程控制、信息管理和查詢處理[3]。

隨著Internet的發(fā)展,大量的信息都是從Web上獲取的,因此Web挖掘成為一個(gè)新的研究?jī)?nèi)容。Web挖掘指利用數(shù)據(jù)挖掘技術(shù)從Web文檔和訪問數(shù)據(jù)中發(fā)現(xiàn)和抽取知識(shí)。按照挖掘?qū)ο蟮牟煌?將Web數(shù)據(jù)挖掘分為三類:Web內(nèi)容挖掘(Web Content Mining),Web結(jié)構(gòu)挖掘(Web Structure Mining),Web使用挖掘(Web Usage Mining), 如圖1所示。

1.2 數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘的研究融合了多個(gè)不同學(xué)科領(lǐng)域的技術(shù)與成果,使得目前的數(shù)據(jù)挖掘方法表

現(xiàn)出多種多樣的形式。由于數(shù)據(jù)易受噪聲、不一致等因素的影響,所以在進(jìn)行數(shù)據(jù)挖掘前要進(jìn)行數(shù)據(jù)預(yù)處理,以降低原始數(shù)據(jù)的維數(shù),提高數(shù)據(jù)的質(zhì)量和挖掘的速度。知識(shí)發(fā)現(xiàn)類數(shù)據(jù)挖掘技術(shù)是一種與統(tǒng)計(jì)分析類數(shù)據(jù)挖掘技術(shù)完全不同的挖掘技術(shù),包括關(guān)聯(lián)規(guī)則、遺傳算法、決策樹等[4]。

1.2.1 關(guān)聯(lián)規(guī)則

關(guān)聯(lián)規(guī)則是一種簡(jiǎn)單、實(shí)用的分析規(guī)則,它描述了一個(gè)事物中某些屬性同時(shí)出現(xiàn)的規(guī)律和模式,是數(shù)據(jù)挖掘中最成熟的主要技術(shù)之一。

定義1 設(shè)集合I ={i1 , i2 , ..., im },由m個(gè)不同項(xiàng)目組成,事務(wù)數(shù)據(jù)庫記為D,D中的每一條事務(wù)記為T, T?哿I。關(guān)聯(lián)規(guī)則是形如A?圯B的蘊(yùn)涵式,其中A?奐I ,B?奐I,并且A∩B=Φ。

定義2 支持度:如果X?圯Y在T 中的S % 成立,則稱X?圯Y的支持度為S %, 即:S % = (| { t | t 中含有X , Y} | / | T | ) ×100 %;支持度S %表示X?圯Y 中出現(xiàn)的普遍程度[5]。

定義3 置信度C%:Confidence (X?圯Y) = P(Y|X) = P(X∪Y)/P(X), C% = (| { t | t 中含有X , Y} | / | { t | t 中含有X } | ) ×100 %,置信度表征的是規(guī)則的強(qiáng)度[5]。

關(guān)聯(lián)規(guī)則挖掘算法中最基本的算法是Apriori算法。Apriori采用了層次搜索的方法,通過第k-1個(gè)頻繁集搜索生成第k個(gè)頻繁集,同時(shí)使用了Apriori性質(zhì),即頻繁項(xiàng)集的所有非空子集都是頻繁項(xiàng)集,任何非頻繁的(k-1)-項(xiàng)集都不可能是頻繁k-項(xiàng)集的子集[6]。

1.2.2 遺傳算法

遺傳算法是一種受生物進(jìn)化啟發(fā)的學(xué)習(xí)方法,通過變異和重組當(dāng)前己知的最好假設(shè)來生成后續(xù)的假設(shè)。每一步,通過使用目前適應(yīng)性最高的假設(shè)的后代替代群體的某個(gè)部分,來更新當(dāng)前群體的一組假設(shè),來實(shí)現(xiàn)各個(gè)個(gè)體的適應(yīng)性的提高。遺傳算法由三個(gè)基本過程組成:繁殖(選擇)是從一個(gè)舊種群(父代)選出生命力強(qiáng)的個(gè)體,產(chǎn)生新種群(后代)的過程;交叉(重組)選擇兩個(gè)不同個(gè)體(染色體)的部分(基因)進(jìn)行交換,形成新個(gè)體的過程;變異(突變)是對(duì)某些個(gè)體的某些基因進(jìn)行變異的過程。在數(shù)據(jù)挖掘中,可以被用作評(píng)估其他算法的適合度[4]。

1.2.3 決策樹

決策樹是一種通過逼近離散值目標(biāo)函數(shù)的方法,通過把實(shí)例從根結(jié)點(diǎn)排列到某個(gè)葉子結(jié)點(diǎn)來分類實(shí)例,葉子結(jié)點(diǎn)即為實(shí)例所屬的分類。決策樹方法中最為著名的算法是Quinlan提出的ID3算法[7],該算法以信息熵的增益進(jìn)行屬性選擇,增益率能克服增益偏向于多值屬性的特點(diǎn)。決策樹分類的其它算法還有FACT, QUEST,CHAIR及ID3的增量版本ID4和ID5等。

ID3算法的核心思想是在決策樹中各級(jí)節(jié)點(diǎn)上選擇屬性,用信息增益作為屬性選擇標(biāo)準(zhǔn),使得在每一非葉節(jié)點(diǎn)進(jìn)行測(cè)試時(shí),能獲得關(guān)于被測(cè)試?yán)幼畲蟮念悇e信息,使用該屬性將例子集分成子集后,系統(tǒng)的熵值最小。同時(shí),期望非葉節(jié)點(diǎn)到達(dá)各后代葉節(jié)點(diǎn)的平均路徑最短,生成的決策樹平均深度最小,提高分類速度和準(zhǔn)確率。

2 數(shù)據(jù)挖掘在遠(yuǎn)程教學(xué)系統(tǒng)中的應(yīng)用

2.1 遠(yuǎn)程教育概述

現(xiàn)代遠(yuǎn)程教育是隨著現(xiàn)代信息技術(shù)的發(fā)展而產(chǎn)生的一種新型教育方式。計(jì)算機(jī)技術(shù)、多媒體技術(shù)、通信技術(shù)的發(fā)展,特別是Intemet的迅猛發(fā)展,使遠(yuǎn)程教育的手段有了質(zhì)的飛躍,成為高新技術(shù)條件下的遠(yuǎn)程教育?,F(xiàn)代遠(yuǎn)程教育是一種相對(duì)于面授教育、師生分離、非面對(duì)面組織的教學(xué)活動(dòng),它是一種跨學(xué)校、跨地區(qū)的教育體制和教學(xué)模式,它的特點(diǎn)有:學(xué)生與教師分離;學(xué)習(xí)的場(chǎng)所和形式靈活多變等。與面授教育相比,遠(yuǎn)距離教育的優(yōu)勢(shì)在于它可以突破時(shí)空限制,提供更多的學(xué)習(xí)機(jī)會(huì),擴(kuò)大教學(xué)規(guī)模,提高教學(xué)質(zhì)量,降低教學(xué)的成本。網(wǎng)絡(luò)和信息技術(shù)對(duì)現(xiàn)代社會(huì)生活的影響非常大,對(duì)遠(yuǎn)程教育的發(fā)展也有很大的影響。人們?cè)诰W(wǎng)絡(luò)遠(yuǎn)程教學(xué)中很方便地接受知識(shí)、掌握知識(shí),大大提高了效率。由于遠(yuǎn)程教育本身的特征,它的確比其他的教育形式能夠更加滿足終身教育所要求的“任何地方、任何人、任何時(shí)間、任何需要”等特點(diǎn)[8]。

2.2 數(shù)據(jù)挖掘在遠(yuǎn)程教學(xué)系統(tǒng)中的應(yīng)用

在教學(xué)活動(dòng)中,教學(xué)質(zhì)量的好壞除與教學(xué)條件、教師業(yè)務(wù)水平有關(guān)外,更重要的是學(xué)習(xí)的主體-學(xué)生。學(xué)生學(xué)習(xí)成績(jī)好壞除智力因素外,還有多方面的因素,最重要的是學(xué)習(xí)方法。因此,使用關(guān)聯(lián)規(guī)則挖掘出知識(shí)點(diǎn)之間的關(guān)聯(lián)規(guī)則,采用決策樹方法,將學(xué)生按照學(xué)習(xí)成績(jī)進(jìn)行分類,通過此方法來實(shí)現(xiàn)知識(shí)點(diǎn)的主動(dòng)推薦,進(jìn)而達(dá)到幫助學(xué)生提高學(xué)生學(xué)習(xí)成績(jī)的目的[9]。

通過數(shù)據(jù)的收集與描述找出影響學(xué)生學(xué)習(xí)成績(jī)的因素,然后進(jìn)行數(shù)據(jù)采集,將數(shù)據(jù)加以處理進(jìn)行分析;接著通過數(shù)據(jù)預(yù)處理步驟對(duì)包含有噪聲、不完整、不一致數(shù)據(jù)進(jìn)行處理;然后通過關(guān)聯(lián)規(guī)則對(duì)數(shù)據(jù)進(jìn)行分析,挖掘知識(shí)點(diǎn)之間的關(guān)聯(lián)規(guī)則,為學(xué)生推薦某些應(yīng)該學(xué)習(xí)的知識(shí)點(diǎn),幫助學(xué)生提高學(xué)習(xí)效率;通過分類技術(shù)的使用將學(xué)生按照學(xué)習(xí)成績(jī)進(jìn)行分類,當(dāng)學(xué)生通過教學(xué)系統(tǒng)進(jìn)行學(xué)習(xí)時(shí),系統(tǒng)主動(dòng)為其推薦應(yīng)該學(xué)習(xí)的知識(shí)。

3 結(jié)論

伴隨著科學(xué)技術(shù)和教育的不斷發(fā)展,利用互連網(wǎng)進(jìn)行遠(yuǎn)程教育是必然趨勢(shì),尤其是Web數(shù)據(jù)挖掘技術(shù)的應(yīng)用,使個(gè)性化、智能化的遠(yuǎn)程教育成為可能。隨著新的數(shù)據(jù)挖掘方法的不斷出現(xiàn),數(shù)據(jù)挖掘工具也將不斷產(chǎn)生和完善。盡管數(shù)據(jù)挖掘知識(shí)在遠(yuǎn)程教育中的應(yīng)用剛剛起步[10],還有許多理論問題和技術(shù)問題有待于進(jìn)一步的深入探究,但我們相信數(shù)據(jù)挖掘技術(shù)在教育系統(tǒng)中的應(yīng)用前景是非常光明的。

參考文獻(xiàn):

[1] 張震.基于Web的智能網(wǎng)絡(luò)教學(xué)框架模型的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代教育技術(shù),2004,14(3):64-67.

[2] 何典,宋中山.基于Web 挖掘的個(gè)性化網(wǎng)絡(luò)教育研究[J].計(jì)算機(jī)與現(xiàn)代化,2005,(5):100-102.

[3] Jiawei Han,Micheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)[M].2版.北京:機(jī)械工業(yè)出版社,2007,3:3-6.

[4] 王桂芹,黃道.數(shù)據(jù)挖掘技術(shù)綜述[J].電腦應(yīng)用技術(shù),2007,,69: 1-6.

[5] 陳京民.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:電子工業(yè)出版社:2002.11-20.

[6] 黃明,魏靜波,牛娃.對(duì)Apriori算法的進(jìn)一步改進(jìn)[J].大連鐵道學(xué)院學(xué)報(bào),2003,24(4):48-49

[7] J.R.Quinlan. Induction of Decision Trees[J].Machine learning, 1986,(1): 81-106.

[8] 張成,石雪萍,張瑞. 遠(yuǎn)程教育系統(tǒng)在網(wǎng)絡(luò)時(shí)代的應(yīng)用[J].中國成人教育,2008,5:1-2.