基于數(shù)據(jù)挖掘的學(xué)生成績預(yù)警模型研究論文
摘要:本文通過分析得出學(xué)業(yè)預(yù)警的難點(diǎn)在于成績預(yù)警,然后提出了基于數(shù)據(jù)挖掘技術(shù)的成績預(yù)警模型,并對該模型進(jìn)行了詳細(xì)說明。
關(guān)鍵詞:數(shù)據(jù)挖據(jù);成績預(yù)警;模型研究
在我國高校擴(kuò)招的大背景下,高等教育已不再是精英教育,越來越多的高中生得到進(jìn)入高校學(xué)習(xí)的機(jī)會(huì)。隨之而來出現(xiàn)了生源質(zhì)量下降,師資不足,人才培養(yǎng)水平下降等一系列問題。如何幫助學(xué)生避免在學(xué)習(xí)中出現(xiàn)問題和克服學(xué)習(xí)中的各種困難,學(xué)業(yè)預(yù)警機(jī)制就是在這一背景下應(yīng)運(yùn)而生。
1.學(xué)業(yè)預(yù)警的內(nèi)涵
學(xué)業(yè)預(yù)警是學(xué)校將嚴(yán)重影響學(xué)業(yè)的情況,及時(shí)告知學(xué)生本人和家長,并通過學(xué)校、學(xué)生和家長之間的溝通和協(xié)作,從而采取針對性措施,幫助學(xué)生完成學(xué)業(yè)的教育危機(jī)干預(yù)制度。學(xué)業(yè)預(yù)警的對象包括曠課預(yù)警、考試預(yù)警、成績預(yù)警三大類。而如何利用學(xué)生成績中隱含的可用信息,挖掘內(nèi)在聯(lián)系,則是學(xué)業(yè)預(yù)警的難點(diǎn)。
2.成績預(yù)警模型設(shè)計(jì)
通過分析,本文提出了基于數(shù)據(jù)挖掘技術(shù)的成績預(yù)警模型。該模型可以有效發(fā)現(xiàn)偏低型、滑坡型和潛在型三種問題類型。結(jié)合預(yù)警情況的嚴(yán)重性,可將模型劃分為一般預(yù)警、嚴(yán)重預(yù)警、非常嚴(yán)重預(yù)警三個(gè)級別。
3.常見預(yù)警設(shè)計(jì)分析
3.1偏低型預(yù)警設(shè)計(jì)
偏低型預(yù)警主要包含以下兩個(gè)方面:一是不及格門次統(tǒng)計(jì),統(tǒng)計(jì)輸出某一學(xué)期分專業(yè)、年級、班級的不及格門次信息。二是不及格詳情統(tǒng)計(jì),統(tǒng)計(jì)輸出某一學(xué)期分專業(yè)、年級、班級的不及格詳細(xì)情況,如不及格課程名稱。
3.2滑坡型預(yù)警設(shè)計(jì)
傳統(tǒng)計(jì)算成績是否滑坡的依據(jù)是按總分或平均分計(jì)算名次,若名次下降幅度超過某一界限,則認(rèn)為成績滑坡。這種方法計(jì)算簡單、結(jié)果直觀,但不能準(zhǔn)確地反映成績的分布情況。為解決此問題,本文利用聚類技術(shù)把成績分為5個(gè)等次,各等次內(nèi)部的差距最小,等次之間的'差距最大,從而準(zhǔn)確地反映成績的分布情況。具體實(shí)現(xiàn)步驟如下:(1)對上學(xué)期成績用改進(jìn)的加權(quán)Wk-means算法進(jìn)行聚類,設(shè)置簇?cái)?shù)=5,課程權(quán)重=該課程學(xué)分/總學(xué)分?jǐn)?shù),將聚類結(jié)果按質(zhì)心各維加權(quán)平方之和從大到小排列,簇號依次設(shè)為1、2、3、4、5,則所有成績被劃分到A、B、C、D、E5個(gè)等次;(2)本學(xué)期成績作相同處理;(3)比較每名學(xué)生兩學(xué)期成績的聚類結(jié)果,若等次下降或兩學(xué)期都處于第D、E等次,則進(jìn)行預(yù)警,輸出相關(guān)信息。
3.3潛在型預(yù)警設(shè)計(jì)
潛在型預(yù)警是利用關(guān)聯(lián)技術(shù)對學(xué)生歷史成績進(jìn)行挖掘,生成成績關(guān)聯(lián)規(guī)則庫,進(jìn)而預(yù)測學(xué)生今后學(xué)習(xí)中潛在的危機(jī)。潛在型預(yù)警模塊的實(shí)現(xiàn)步驟如下:(1)數(shù)據(jù)預(yù)處理。①從待處理的所有成績記錄中篩選出成績不及格的記錄。②為方便課程排序,將課程的編碼設(shè)置為“學(xué)期”+“課程序號”。某課程成績將被轉(zhuǎn)換成一個(gè)2位數(shù),第一位表示學(xué)期,第二位表示課程序號。如“計(jì)算機(jī)應(yīng)用基礎(chǔ)(1)”被轉(zhuǎn)換成10。③原數(shù)據(jù)庫表數(shù)據(jù)格式為“學(xué)號,姓名,不及格課程名稱”,將數(shù)據(jù)轉(zhuǎn)置變?yōu)椤皩W(xué)號,姓名,不及格課程1,不及格課程2,……”。(2)挖掘頻繁項(xiàng)集。支持度反映項(xiàng)集在數(shù)據(jù)庫中的普遍性。設(shè)置合適的支持度,使得出的關(guān)聯(lián)規(guī)則具有一定的普遍性。(3)生成預(yù)警規(guī)則庫。按照傳統(tǒng)方法生成的關(guān)聯(lián)規(guī)則不能直接作為預(yù)警規(guī)則。因?yàn)闊o用的規(guī)則會(huì)降低預(yù)警的準(zhǔn)確率和效率。為解決此問題特做如下限定:一是設(shè)置合適的置信度。二是按學(xué)期順序規(guī)則前、后件。三是同一學(xué)期的課程成績不能同時(shí)出現(xiàn)在規(guī)則的前件和后件。四是規(guī)則的后件只包含一學(xué)期課程。(4)搜索預(yù)警規(guī)則庫,進(jìn)行匹配。將當(dāng)前學(xué)期成績進(jìn)行預(yù)處理,搜索預(yù)警規(guī)則庫,進(jìn)行匹配,輸出結(jié)果。
4.結(jié)語
及時(shí)發(fā)現(xiàn)偏離正常發(fā)展軌道的學(xué)生,并進(jìn)行有針對性的學(xué)業(yè)干預(yù),有利于高校教學(xué)水平的提升。而成績預(yù)警則是學(xué)業(yè)預(yù)警的核心和難點(diǎn),為此,本文利用數(shù)據(jù)挖掘技術(shù),針對成績預(yù)警設(shè)計(jì)了三種模型,使學(xué)業(yè)預(yù)警更具實(shí)用性和有效性;痦(xiàng)目:安徽省高校質(zhì)量工程項(xiàng)目(編號:2015zjjh051),淮北職業(yè)技術(shù)學(xué)院自然科學(xué)重點(diǎn)項(xiàng)目(編號:2016-A-4)。
參考文獻(xiàn):
[1]李昊,周振華.基于數(shù)據(jù)挖掘的高校學(xué)生成績預(yù)警系統(tǒng)[J]大慶石油學(xué)院學(xué)報(bào),2011(04):91:95
[2]葉福蘭.基于數(shù)據(jù)挖掘的高校學(xué)生成績預(yù)警狀況分析[J]長春師范學(xué)院學(xué)報(bào),2013(10):43-45
[3]楊蕭嶼,高職院校學(xué)生成績預(yù)警管理模式的探究[J]遼寧高職學(xué)報(bào),2014(07):110-112
[4]宋紹云,基于SQLServer數(shù)據(jù)挖掘的學(xué)生成績預(yù)警預(yù)報(bào)研究[J]電腦知識與技術(shù),2015(17):18-20
[5]呂萍麗,基于關(guān)聯(lián)規(guī)則的成績預(yù)警模型的實(shí)現(xiàn)[J]數(shù)字技術(shù)與應(yīng)用,2015(04):105
【基于數(shù)據(jù)挖掘的學(xué)生成績預(yù)警模型研究論文】相關(guān)文章:
基于數(shù)據(jù)挖掘的社交網(wǎng)絡(luò)分析與研究論文01-23
數(shù)據(jù)挖掘技術(shù)的研究論文01-22
一種基于數(shù)據(jù)挖掘技術(shù)的決策信息模型07-21
物聯(lián)網(wǎng)數(shù)據(jù)挖掘研究論文01-23
基于空間特性的地形圖數(shù)據(jù)挖掘研究10-07
基于仿真與數(shù)據(jù)挖掘的故障診斷方法研究10-19
數(shù)據(jù)挖掘論文09-24