唐娟 潘志安
摘? 要:關(guān)系代數(shù)語(yǔ)言是用傳統(tǒng)的集合運(yùn)算和專門的關(guān)系運(yùn)算來(lái)表達(dá)查詢的抽象語(yǔ)言,提供了一系列的關(guān)系代數(shù)操作,通過這種數(shù)學(xué)運(yùn)行來(lái)指導(dǎo)數(shù)據(jù)庫(kù)在關(guān)系操作上的程序?qū)崿F(xiàn)。場(chǎng)景教學(xué)系統(tǒng)中每一個(gè)場(chǎng)景對(duì)應(yīng)一個(gè)實(shí)際應(yīng)用,場(chǎng)景中設(shè)置了問題,本文以系統(tǒng)數(shù)據(jù)庫(kù)為例,給出了基于關(guān)系代數(shù)運(yùn)算的數(shù)據(jù)統(tǒng)計(jì)分析過程,采用抽取樣本法計(jì)算期望學(xué)習(xí)時(shí)長(zhǎng)和學(xué)習(xí)時(shí)長(zhǎng)標(biāo)準(zhǔn)差,并設(shè)計(jì)了一個(gè)測(cè)算學(xué)習(xí)者投入度的公式,對(duì)評(píng)價(jià)場(chǎng)景教學(xué)具有指導(dǎo)意義。
關(guān)鍵詞:場(chǎng)景教學(xué);數(shù)據(jù)庫(kù);關(guān)系代數(shù)運(yùn)算
中圖分類號(hào):TP391? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
Abstract:The relational algebra language is an abstract language that expresses queries by traditional set operations and special relational operations.It provides a series of relational algebraic operations,which can guide the implementation of relational operations in database.Every scene in the scene teaching system corresponds to a practical application.Questions are set in the scene.Taking the database of the system as an example,this paper presents the statistical analysis process of data based on relational algebraic operation,calculates the standard deviation of expected learning time and learning time by sampling method,and designs a formula to measure learner's engagement,which has directional significance for evaluating the scene teaching.
Keywords:scene teaching;database;relational algebra operations
1? ?引言(Introduction)
1970年,E.F.Codd提出關(guān)系數(shù)據(jù)庫(kù)理論基礎(chǔ),關(guān)系數(shù)據(jù)庫(kù)應(yīng)用數(shù)學(xué)方法來(lái)處理數(shù)據(jù)庫(kù)中的數(shù)據(jù),20世紀(jì)80年代后成為最重要、最流行的數(shù)據(jù)庫(kù)系統(tǒng)。
關(guān)系代數(shù)語(yǔ)言是用傳統(tǒng)的集合運(yùn)算和專門的關(guān)系運(yùn)算來(lái)表達(dá)查詢的抽象語(yǔ)言,提供了一系列的關(guān)系代數(shù)操作:并、差、笛卡爾積、選擇、投影和更名等基本操作,交、連接和關(guān)系除等擴(kuò)展操作。關(guān)系代數(shù)操作以一個(gè)或多個(gè)關(guān)系為輸入,結(jié)果是有一個(gè)新的關(guān)系,具有一定過程性,是學(xué)習(xí)其他數(shù)據(jù)庫(kù)語(yǔ)言,如SQL等的基礎(chǔ)。關(guān)系代數(shù)運(yùn)算主要運(yùn)算符如圖1所示[1]。
場(chǎng)景教學(xué)系統(tǒng)搭設(shè)在云平臺(tái)上,每一個(gè)場(chǎng)景對(duì)應(yīng)一個(gè)實(shí)際應(yīng)用,教師和學(xué)生可以通過網(wǎng)絡(luò)選擇其中一個(gè)場(chǎng)景進(jìn)行交互式學(xué)習(xí)。場(chǎng)景教學(xué)理念為“做中學(xué),學(xué)中做”,學(xué)習(xí)內(nèi)容鑲嵌在具體的操作流程中,場(chǎng)景中設(shè)置的問題,為一個(gè)實(shí)際操作,完成場(chǎng)景內(nèi)的所有操作任務(wù),就解決了一個(gè)實(shí)際問題[2]。本文以場(chǎng)景教學(xué)系統(tǒng)數(shù)據(jù)庫(kù)為例,基于關(guān)系代數(shù)運(yùn)算,對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)與分析。
2? 系統(tǒng)數(shù)據(jù)庫(kù)表結(jié)構(gòu)(Table structure of system database)
數(shù)據(jù)庫(kù)系統(tǒng)是現(xiàn)代計(jì)算機(jī)系統(tǒng)的一個(gè)重要組成部分,現(xiàn)代的管理信息系統(tǒng)幾乎都是以數(shù)據(jù)庫(kù)作為核心的[3]。場(chǎng)景教學(xué)系統(tǒng)數(shù)據(jù)庫(kù)的庫(kù)表結(jié)構(gòu)如下:
3? ?數(shù)據(jù)統(tǒng)計(jì)(Data statistics)
基于云平臺(tái)的場(chǎng)景教學(xué),覆蓋面廣、學(xué)習(xí)者需求復(fù)雜,應(yīng)該注重學(xué)習(xí)測(cè)評(píng)結(jié)果的統(tǒng)計(jì)分析和學(xué)習(xí)測(cè)評(píng)的質(zhì)量分析[4]。針對(duì)設(shè)置的每個(gè)問題,給出平均正確率、平均答題用時(shí)。針對(duì)場(chǎng)景,給出學(xué)習(xí)次數(shù)、平均學(xué)習(xí)時(shí)長(zhǎng)、問題的提交率和平均正確率,針對(duì)整門課程也能給出以上相應(yīng)的參數(shù)。這些參數(shù)可以供系統(tǒng)設(shè)計(jì)者挑選使用,如學(xué)習(xí)者學(xué)完一個(gè)場(chǎng)景,需要生成一個(gè)學(xué)習(xí)報(bào)告,學(xué)習(xí)報(bào)告中可以羅列出本人的學(xué)習(xí)時(shí)長(zhǎng)及答題正確率、場(chǎng)景的平均正確率及平均答題用時(shí)等,以便于學(xué)習(xí)者比對(duì)和參考。
下面列舉出其中幾個(gè)參數(shù)的關(guān)系代數(shù)運(yùn)算過程。
4? ?數(shù)據(jù)分析(Data analysis)
學(xué)習(xí)分析研究正從關(guān)注大數(shù)據(jù)轉(zhuǎn)向有意義數(shù)據(jù)的探索。如何抓取到學(xué)習(xí)活動(dòng)信息流中的關(guān)鍵行為數(shù)據(jù)并解析出學(xué)習(xí)者的個(gè)性學(xué)習(xí)行為特征是今后研究中要解決的一個(gè)問題[5]。故基于場(chǎng)景教學(xué)數(shù)據(jù)庫(kù)表,需要抽取合適的樣本進(jìn)行數(shù)據(jù)分析,以此來(lái)判斷不同場(chǎng)景的教學(xué)效果。
4.1? ?期望學(xué)習(xí)時(shí)長(zhǎng)
數(shù)學(xué)期望(mean)(或均值,亦簡(jiǎn)稱期望)是試驗(yàn)中每次可能結(jié)果的概率乘以其結(jié)果的總和,是最基本的數(shù)學(xué)特征之一[6]。它反映隨機(jī)變量平均取值的大小。一個(gè)場(chǎng)景的期望學(xué)習(xí)時(shí)長(zhǎng)應(yīng)該是學(xué)習(xí)者正常進(jìn)行學(xué)習(xí)時(shí)的學(xué)習(xí)時(shí)長(zhǎng)平均值。針對(duì)答題記錄表中某個(gè)場(chǎng)景所有記錄測(cè)算期望學(xué)習(xí)時(shí)長(zhǎng),并不合理,因?yàn)橛械挠脩艨赡苤皇谴掖覟g覽后離開場(chǎng)景頁(yè)面,也有的用戶可能是停留在該頁(yè)面長(zhǎng)時(shí)間未進(jìn)行學(xué)習(xí)活動(dòng),這些非正常記錄會(huì)干擾正常學(xué)習(xí)時(shí)長(zhǎng)的判定,考慮這兩種情況會(huì)導(dǎo)致學(xué)習(xí)時(shí)長(zhǎng)過短或過長(zhǎng),可以初步定一個(gè)學(xué)習(xí)時(shí)長(zhǎng)的上下限,在此范圍內(nèi)篩選出樣本表。設(shè)場(chǎng)景01的學(xué)習(xí)時(shí)長(zhǎng)樣本表為R1:
為方便數(shù)據(jù)統(tǒng)計(jì),將樣本R1投影為樣本T1,T1中僅有屬性“學(xué)習(xí)時(shí)長(zhǎng)”。
再根據(jù)T1計(jì)算期望學(xué)習(xí)時(shí)長(zhǎng)。將T1中每條記錄的學(xué)習(xí)時(shí)長(zhǎng)看成是一個(gè)獨(dú)立的值,其發(fā)生的概率均等,故可以直接求平均值作為期望學(xué)習(xí)時(shí)長(zhǎng),場(chǎng)景01的期望學(xué)習(xí)時(shí)長(zhǎng)E可以通過公式(1)計(jì)算。
4.2? ?學(xué)習(xí)時(shí)長(zhǎng)標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差表示的就是樣本數(shù)據(jù)的離散程度,通常是相對(duì)于樣本數(shù)據(jù)的平均值而定的,用M±SD來(lái)表示,表示樣本某個(gè)數(shù)據(jù)觀察值相距平均值有多遠(yuǎn)[7]。
μ為均值,計(jì)算標(biāo)準(zhǔn)差理論公式:
通過學(xué)習(xí)時(shí)長(zhǎng)標(biāo)準(zhǔn)差,可以判斷不同學(xué)習(xí)者對(duì)一個(gè)場(chǎng)景的學(xué)習(xí)時(shí)長(zhǎng)是否聚集在期望學(xué)習(xí)時(shí)長(zhǎng)附近。數(shù)據(jù)庫(kù)系統(tǒng)中一般有相應(yīng)函數(shù)計(jì)算標(biāo)準(zhǔn)差,以mySql為例,標(biāo)準(zhǔn)差函數(shù)為STD,則場(chǎng)景01學(xué)習(xí)時(shí)長(zhǎng)的標(biāo)準(zhǔn)差可以通過公式(2)計(jì)算。
現(xiàn)有兩個(gè)場(chǎng)景01和02,分別取樣本T1和T2,兩個(gè)樣本的學(xué)習(xí)時(shí)長(zhǎng)發(fā)生散點(diǎn)圖如圖2所示。
標(biāo)準(zhǔn)差越小,表明數(shù)據(jù)越聚集;標(biāo)準(zhǔn)差越大,表明數(shù)據(jù)越離散。從圖2中可以看到,場(chǎng)景01和場(chǎng)景02比較,場(chǎng)景02學(xué)習(xí)時(shí)長(zhǎng)的聚集度比場(chǎng)景01略高,經(jīng)過計(jì)算標(biāo)準(zhǔn)差值較小。
4.3? ?學(xué)習(xí)者投入度
將文中給出的統(tǒng)計(jì)和分析參數(shù)進(jìn)行組合和加工,可以從不同的維度分析場(chǎng)景教學(xué)效果。如為了比較不同場(chǎng)景的教學(xué)內(nèi)容是否能吸引學(xué)習(xí)者,可以測(cè)算不同場(chǎng)景的學(xué)習(xí)者投入度。學(xué)習(xí)者投入度至少應(yīng)從兩個(gè)參數(shù)進(jìn)行分析:
一是場(chǎng)景的學(xué)習(xí)時(shí)長(zhǎng)標(biāo)準(zhǔn)差。學(xué)習(xí)時(shí)長(zhǎng)標(biāo)準(zhǔn)差越小,則學(xué)習(xí)時(shí)長(zhǎng)聚集度高,這表明學(xué)習(xí)該場(chǎng)景時(shí)學(xué)習(xí)者的學(xué)習(xí)狀態(tài)越一致和越穩(wěn)定。
二是場(chǎng)景問題提交率,其計(jì)算方法前文已述,場(chǎng)景教學(xué)理念是課中邊學(xué)邊做,問題設(shè)置在課中,問題是否提交能很好地判斷學(xué)習(xí)者是否在參與學(xué)習(xí),問題提交率高表明學(xué)習(xí)者的參與度高。
場(chǎng)景的學(xué)習(xí)時(shí)長(zhǎng)標(biāo)準(zhǔn)差和問題提交率兩參數(shù)呈蹺板式,一個(gè)要求越低越好,另一個(gè)要求越高越好,蹺板斜度越大,說(shuō)明該場(chǎng)景的教學(xué)吸引力越強(qiáng),學(xué)習(xí)者的投入度越高。
假設(shè)一個(gè)場(chǎng)景學(xué)習(xí)時(shí)長(zhǎng)方差為σ場(chǎng)景ID,±1/σ場(chǎng)景ID的學(xué)習(xí)者為學(xué)習(xí)投入者,同時(shí)場(chǎng)景中問題提交者也在這部分人群中,M場(chǎng)景ID為問題提交率,則可以設(shè)計(jì)一個(gè)測(cè)算學(xué)習(xí)者投入度att的公式(3)。
計(jì)算結(jié)果表明,場(chǎng)景02的學(xué)習(xí)者投入度比場(chǎng)景01略高。教學(xué)系統(tǒng)中可以設(shè)定一個(gè)標(biāo)準(zhǔn),如某場(chǎng)景學(xué)習(xí)者投入度低于40%,則應(yīng)著重分析該場(chǎng)景教學(xué)的過程和內(nèi)容,做出相應(yīng)的診改。
5? ?結(jié)論(Conclusion)
本文以場(chǎng)景教學(xué)系統(tǒng)數(shù)據(jù)庫(kù)為例,基于關(guān)系代數(shù)運(yùn)算給出了數(shù)據(jù)統(tǒng)計(jì)和分析過程,通過這種數(shù)學(xué)運(yùn)行來(lái)指導(dǎo)數(shù)據(jù)庫(kù)在關(guān)系操作上的程序?qū)崿F(xiàn),熟悉關(guān)系代數(shù)的操作就很容易寫出復(fù)雜的SQL語(yǔ)句。本研究采用抽取樣本法計(jì)算期望學(xué)習(xí)時(shí)長(zhǎng)和學(xué)習(xí)時(shí)長(zhǎng)標(biāo)準(zhǔn)差,設(shè)計(jì)了一個(gè)測(cè)算場(chǎng)景學(xué)習(xí)者投入度的公式,對(duì)評(píng)價(jià)場(chǎng)景教學(xué)具有指導(dǎo)意義。當(dāng)然,分析場(chǎng)景教學(xué)效果應(yīng)從多維度進(jìn)行,如答題效果、訪問量、學(xué)習(xí)者評(píng)價(jià)等等,這些維度本文沒有探討,為后續(xù)研究和其他教學(xué)評(píng)測(cè)人員提供研究思路。
參考文獻(xiàn)(References)
[1] 何玉潔.數(shù)據(jù)庫(kù)原理與應(yīng)用(第三版)[M].北京:機(jī)械工業(yè)出版社,2017(6):31-33.
[2] 唐娟.面向軟件技術(shù)專業(yè)的云平臺(tái)場(chǎng)景教學(xué)應(yīng)用研究[J].軟件工程,2018,21(05):60-62.
[3] 蘇俊.數(shù)據(jù)庫(kù)基礎(chǔ)教程[M].北京:中國(guó)人民大學(xué)出版社,2014:1.
[4] 何曉新,陶水龍,孫志娟.論遠(yuǎn)程開放教育環(huán)境下工科課程的學(xué)習(xí)測(cè)評(píng)模型[J].廣播電視大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2008(04):117-121.
[5] 牟智佳,武法提.MOOC學(xué)習(xí)結(jié)果預(yù)測(cè)指標(biāo)探索與學(xué)習(xí)群體特征分析[J].現(xiàn)代遠(yuǎn)程教育研究,2017(03):58-65.
[6] 陳希孺.概率論與數(shù)理統(tǒng)計(jì)[M].中國(guó)科學(xué)技術(shù)大學(xué)出版社,1992:25.
[7] 劉忠廣.標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤差和估計(jì)標(biāo)準(zhǔn)誤差辨析[J].消費(fèi)導(dǎo)刊,2018(11):203-204.
作者簡(jiǎn)介:
唐? ?娟(1976-),女,碩士,實(shí)驗(yàn)師,講師.研究領(lǐng)域:軟件工程,實(shí)踐教學(xué).
潘志安(1967-),男,碩士,教授.研究領(lǐng)域:計(jì)算機(jī)網(wǎng)絡(luò).