數(shù)據(jù)挖掘?qū)W生全口徑接收效果分析論文

時間:2021-06-24 09:43:07 論文范文 我要投稿

數(shù)據(jù)挖掘?qū)W生全口徑接收效果分析論文

  隨著我國高等教育招生規(guī)模的提升,高等教育的大眾化已基本實現(xiàn),研究生的規(guī)模也迅速擴(kuò)大,因此研究生課堂教學(xué)質(zhì)量逐漸成為各大高校關(guān)注的焦點問題之一。而課堂接收效果直接影響研究生課堂教學(xué)質(zhì)量,進(jìn)而影響人才的培養(yǎng)。因此,調(diào)查、了解研究生的課堂狀態(tài),深入研究影響課堂接收效果的因素,對于提升研究生課堂質(zhì)量具有十分重要的現(xiàn)實意義。本文通過調(diào)查東北財經(jīng)大學(xué)研究生課堂行為,挖掘影響大學(xué)課堂效果的相關(guān)因素,歸納出其主要影響因素并從中尋求提升大學(xué)課堂效果的可行性策略。

數(shù)據(jù)挖掘?qū)W生全口徑接收效果分析論文

  一、文獻(xiàn)綜述

  劉華和李瑗[1]通過教學(xué)態(tài)度,教學(xué)內(nèi)容,教學(xué)方法這三個指標(biāo)打分情況,進(jìn)而利用Microsoft決策樹算法,Microsoft關(guān)聯(lián)算法和Microsoft聚類分析法挖掘模型進(jìn)行挖掘分析。駱懿玲[2]基于元規(guī)則約束的關(guān)聯(lián)挖掘進(jìn)行課堂教學(xué)質(zhì)量評價挖掘,并得出分析結(jié)果,給出建議。邵珠艷等[3]利用灰色關(guān)聯(lián)分析,對影響課堂教學(xué)效果的因素打分后進(jìn)行分析。葉勇[4]將云模型引入到遺傳算法,再用改進(jìn)遺傳算法對支持向量機(jī)參數(shù)進(jìn)行優(yōu)化,并與BP神經(jīng)網(wǎng)絡(luò)、多元線性回歸模型比較,以便對課堂教學(xué)質(zhì)量的模型評價效果進(jìn)行評價。袁萬蓮和鄭誠[5]利用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘,得出與教學(xué)質(zhì)量相關(guān)因素是教師的學(xué)歷、職稱以及教齡;職稱為講師、教齡較長或者高級職稱、高學(xué)歷的教師教學(xué)質(zhì)量較好。張震等[6]將評價指標(biāo)大致分為教學(xué)態(tài)度、教學(xué)內(nèi)容、教學(xué)水平以及教師研究能力,利用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖據(jù)。戴俊[7]以教師因素,學(xué)生因素,師生雙方因素以及環(huán)境因素和考試成績作為變量,通過主成分回歸方法對影響課堂教學(xué)效果的因素進(jìn)行分析,為改進(jìn)教學(xué)評價方式與提高課堂教學(xué)效果提供理論參考。許云華等[8]設(shè)計調(diào)查問題為“您最想對課堂教學(xué)提的意見”“改進(jìn)方法”“如何實現(xiàn)從被動學(xué)習(xí)向動吸收知識的轉(zhuǎn)變”,基于扎根理論對上述問題答案進(jìn)行分析并得出分析結(jié)果。柴志賢和邱風(fēng)[9]借鑒過程—成果研究方法,在以往研究的教師職稱、年齡、所教年級、課程類別這些教師背景變量的基礎(chǔ)上,增加教學(xué)素質(zhì)、教學(xué)技能與教學(xué)責(zé)任心這三個影響因子進(jìn)行分析,從而為提高高校課堂教學(xué)效果提供一定經(jīng)驗指導(dǎo)。

  二、理論

 。ㄒ唬┲С窒蛄繖C(jī)(SVM)

  支持向量機(jī)是由CorinnaCortes和Vapnik等在1995年首先提出的,是一種基于統(tǒng)計學(xué)習(xí)原理的數(shù)據(jù)挖掘技術(shù)。支持向量機(jī)分為支持向量回歸機(jī)和支持向量分類機(jī),本文主要應(yīng)用支持向量分類機(jī)進(jìn)行數(shù)據(jù)挖掘。支持向量機(jī)分類的核心是找到兩相互平行并且間隔(margin)最大,并能將屬于不同類別的樣本點正確分開的邊界,位于兩邊界中間位置并與之平行的超平面,稱之為最大邊界超平面,即為最終解。

 。ǘ㏕F-IDFTF-IDF

  是一種判斷詞語在文件中重要性程度的加權(quán)統(tǒng)計方法。一個詞語在文件中出現(xiàn)的頻率越高,它對這個文件來說就越重要;這個詞語在整個語言中出現(xiàn)的頻率越高,它對這個文檔來說越不重要。TF-IDF可以利用計算機(jī)技術(shù)在不需要人工進(jìn)行干預(yù)的情況下提取文件中的關(guān)鍵詞,并快速對詞頻進(jìn)行統(tǒng)計,常被用于文本挖掘和信息檢索等前言領(lǐng)域。TF-IDF的主要思想是:若某個詞在其他文件中很少出現(xiàn),但在這一文件中出現(xiàn)的頻率高,那么它極有可能反映了這一文件的特性,則認(rèn)為它很適合用來分類,因為它具有很好的類別區(qū)分能力。TF-IDF實際上代表的是TF*IDF,TF表示詞頻,IDF表示逆文件頻率。

  三、模型

  (一)數(shù)據(jù)來源

  1.變量選取

  為了獲得教師因素、學(xué)生因素以及環(huán)境因素這三個變量的收稿日期:有效數(shù)據(jù),筆者精心設(shè)計一份調(diào)查問卷,影響因素分為教師、學(xué)生及環(huán)境。教師因素中包括:學(xué)與生互動情況、授課方法、課堂考勤、按時上下課、PPT使用情況、普通話水平、講課聲音大小、作業(yè)布置情況以及課程考查形式。學(xué)生因素包括:出勤狀況、遇到問題交流情況、課下與同學(xué)和老師交流情況、學(xué)習(xí)狀態(tài)、聽課表現(xiàn)、上課做筆記情況、課程內(nèi)容掌握情況以及課堂上的感受。環(huán)境因素包括:上課時周邊環(huán)境、所用教室類型、課程安排上下學(xué)期情況、上機(jī)教學(xué)與否、教學(xué)設(shè)備、授課時間段、授課時長以及教室衛(wèi)生環(huán)境。

  2.數(shù)據(jù)獲取

  在調(diào)查對象的選擇上,我們主要以東北財經(jīng)大學(xué)研究生為調(diào)查對象,發(fā)放線上調(diào)查問卷,讓學(xué)生認(rèn)真對自己所學(xué)課程中某一門課的教學(xué)效果進(jìn)行評價。

 。ǘ⿺(shù)據(jù)挖掘過程及結(jié)果

  (1)讀入數(shù)據(jù)。選擇源選項卡中的excel節(jié)點,將調(diào)查問卷中數(shù)據(jù)導(dǎo)入到clementine中。

 。2)數(shù)據(jù)審核。選擇輸出選項卡中的數(shù)據(jù)審核節(jié)點連接到excel節(jié)點上,由審核結(jié)果可知,Q5變量的類別比為90∶9∶1,單個類別值過大,會影響建模的精確程度,故應(yīng)刪除。

 。3)數(shù)據(jù)分區(qū)。利用分區(qū)節(jié)點將數(shù)據(jù)進(jìn)行分區(qū),其中70%為訓(xùn)練集,其余30%為測試集。

 。4)變量相關(guān)性分析。利用統(tǒng)計量節(jié)點分析變量之間的相關(guān)性,若相關(guān)性高,需要剔除相關(guān)變量,反之則不需剔除。經(jīng)測試,在本文的變量中未發(fā)現(xiàn)高相關(guān)性變量,因此無需剔除變量。

 。5)得分變量重新分類。利用“重新分類”節(jié)點將得分變量分類,其中0—7分為一類,8、9、10分為另一類。

 。6)特征選擇建模。選擇建模選擇項卡中的特征選擇節(jié)點,將其連接到數(shù)據(jù)流的恰當(dāng)位置上。

 。7)支持向量機(jī)建模。提取上一步得到的重要變量,選擇建模選擇項卡中的SVM節(jié)點進(jìn)行建模。

  (8)數(shù)據(jù)測試。測試過程和訓(xùn)練過程是相同的,且得到的準(zhǔn)確率為93%,測試結(jié)果良好。

 。ㄈ┪谋就诰蜻^程及結(jié)果

  1、數(shù)據(jù)清洗。原始調(diào)查問卷數(shù)據(jù)中包括文字,標(biāo)點符號。其中一些信息對關(guān)鍵詞抽取沒有幫助,甚至?xí)䥽?yán)重影響研究。為了方便抽取工作順利開展,有必要先對原始評論數(shù)據(jù)進(jìn)行清洗,如“無”或“好”等,對問卷內(nèi)容沒有幫助,進(jìn)行直接刪除處理。

  2、數(shù)據(jù)預(yù)處理。預(yù)處理可以把句子級別的文本數(shù)據(jù)劃分成可識別的`詞、詞組,主要包括分詞、詞性標(biāo)注和依存句法分析三個部分。在本文中使用LTP進(jìn)行分詞。

  3、關(guān)鍵詞提取。由于人工標(biāo)注會造成主觀干擾,本文為了減小人工標(biāo)注的主觀性影響,要利用TF-IDF算法自動提取關(guān)鍵詞。

  四、結(jié)論及建議

  (一)結(jié)論

  學(xué)生、教師、環(huán)境三方面均對課堂接收效果產(chǎn)生較大影響。數(shù)據(jù)挖掘結(jié)果中,課堂興趣、學(xué)科掌握內(nèi)容為學(xué)生因素,授課方法以及課堂互動屬于教師因素,排在第二位的上課周邊環(huán)境則是環(huán)境因素。文本挖掘結(jié)果中,學(xué)生、課程、認(rèn)真為學(xué)生因素,理論、講課、上課、教學(xué)、案例、互動屬于教師因素,教室則是環(huán)境因素。因此,三種因素均對課堂接收效果產(chǎn)生影響。利用文本挖掘與數(shù)據(jù)挖掘?qū)Ρ确治隹梢缘玫搅己玫难芯拷Y(jié)果。文本挖掘與數(shù)據(jù)挖掘的結(jié)果中均體現(xiàn)出了學(xué)生因素、教師因素以及環(huán)境因素對課堂接收效果產(chǎn)生影響,并且兩種方法的分析結(jié)果中均以高頻率出現(xiàn)“互動”因素,印證了文中使用的兩種方法均可行并可得到較為精準(zhǔn)的結(jié)果。

  (二)建議

  增加課堂小組討論環(huán)節(jié)。集體討論是課堂中不可忽視的環(huán)節(jié),既可以活躍課堂的氣氛,交換意見觀點,拓寬學(xué)習(xí)范圍;又可以活躍學(xué)生思維,多角度展開思考,提升解決問題的能力,避免傳統(tǒng)灌輸式的教學(xué)方式。增加師生課堂互動。加強(qiáng)師生互動,調(diào)動課堂氣氛,并利用實際問題創(chuàng)設(shè)情境,讓學(xué)生給出解決的方案,提高學(xué)生的學(xué)習(xí)興趣。增加課本知識與實際案例的結(jié)合。書本的知識往往是生硬抽象的,而結(jié)合實際的案例后,不僅可以使死板的課本知識更加形象生動,易于理解消化,融會貫通于實際案例中;也可以提高學(xué)生的學(xué)習(xí)興趣,提升學(xué)習(xí)的積極性與主動性。增加課程實踐環(huán)節(jié)。將課本知識用于實際操作中,不僅可以升學(xué)生學(xué)習(xí)的樂趣,還可以使學(xué)生結(jié)合生活經(jīng)驗學(xué)習(xí)相關(guān)知識,更好地將書本知識用于實際學(xué)習(xí)以及未來的工作中,同時在實踐中深化對于課本知識的理解。增加高校課改調(diào)查。

  本文針對東北財經(jīng)大學(xué)研究生的調(diào)查問卷結(jié)果進(jìn)行分析,并提出建議。不同學(xué)校的實際情況會有一定差異,師資力量會有差異,學(xué)生學(xué)習(xí)素質(zhì)不同,院校學(xué)習(xí)氛圍也有一定差異等。不同院校根據(jù)本校情況設(shè)計相應(yīng)的調(diào)查研究方式,會使研究結(jié)果更具可信性,建議更具可行性,為教學(xué)改革提供更加切合實際的方案。

【數(shù)據(jù)挖掘?qū)W生全口徑接收效果分析論文】相關(guān)文章:

大數(shù)據(jù)崛起與數(shù)據(jù)挖掘分析論文11-28

數(shù)據(jù)挖掘論文09-24

聘:數(shù)據(jù)分析 數(shù)據(jù)挖掘01-15

數(shù)據(jù)挖掘分析報告模板02-08

軟件工程數(shù)據(jù)挖掘進(jìn)展分析論文06-01

基于數(shù)據(jù)挖掘的社交網(wǎng)絡(luò)分析與研究論文01-23

網(wǎng)絡(luò)游戲的數(shù)據(jù)挖掘與數(shù)據(jù)分析01-15

數(shù)據(jù)挖掘技術(shù)的研究論文01-22

數(shù)據(jù)分析/挖掘工作的疑惑?01-17