• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      面向學習者畫像的數據采集方法分析

      2021-08-07 14:23:06高廣尚
      現代計算機 2021年17期
      關鍵詞:畫像學習者維度

      高廣尚

      (1.桂林理工大學現代企業(yè)管理研究中心,桂林 541004;2.桂林理工大學商學院,桂林 541004)

      0 引言

      學習者畫像(Learner Profiles)是用戶畫像在教育領域應用中的一種特殊形態(tài),旨在刻畫學習者的學習興趣、認知能力、知識水平、學習風格和綜合能力等諸多特征[1-3]。作為一種描述學習者的有效工具,學習者畫像不僅可以根據某些特定特征來劃分或區(qū)分不同的學習者群體,還可以為學習者提供有針對性的支持服務、實現個性化學習、促進學習目標達成,甚至優(yōu)化教學設計方案等[4]。隨著網絡教育環(huán)境的進一步發(fā)展,特別是大規(guī)模在線開放課程的出現,再加上從傳統(tǒng)學習過程的各環(huán)節(jié)中轉化而來的分散獨立的數據,學習者有關的數據基本上呈現爆發(fā)式增長態(tài)勢且勢頭不減。這些數據通常具有量大(上萬或幾十萬名學習者)、多維(學習者的不同方面)、時間序列短(數據采集時間間隔短)、時間跨度長(數據采集周期長)和一定的理論深度(理論意涵)等特征[5]。這無疑給學習者數據的有效采集帶來較大難度,同時也給學習者畫像的有效構建帶來嚴峻挑戰(zhàn)。

      為能采集到學習者在學習活動過程中近乎真實的狀態(tài)、行為數據,現有研究提出了一些數據采集方法[6-9],但這些方法仍存在一些問題:一是數據采集過程中未充分利用新興信息技術,從而導致復雜學習環(huán)境下所采集到的數據在及時性、準確性和完整性等方面難以得到保證;二是數據采集過程中未充分考慮到學習者的狀態(tài)、行為可能會受到其他諸多因素影響,從而導致采集到大量無效的數據;三是數據采集過程中未全面認識到所采集到的數據在數量、質量和類型等方面仍需進一步擴展和加強,從而導致數據難以在源頭上真正得到滿足。

      1 學習者畫像的特征維度及數據

      從理論上而言,學習者在學習過程中的一舉一動、一言一行都可以轉化為數據,這些數據反過來又可從本質上刻畫學習者的某方面特征。因此,如何根據學習者特征來對這些數據進行語義層面上的預先劃分或歸類,以使其在給學習者進行畫像時能作為某些特征維度的數據,將是構建完整的學習者畫像時所要考慮的首要關鍵因素??紤]到如何預先劃分哪些特征維度來描述學習者,與將要對學習者的整個學習過程所開展的有針對性的動態(tài)追蹤研究密切相關,因此筆者首先分析學習者畫像的特征維度的劃分依據,然后在此基礎上深入探討各特征維度下可使用的數據來源、所表達的主要信息等內容。

      1.1 學習者畫像的特征維度

      通常情況下,采用什么特征維度來描述學習者可能取決于我們的經驗、理性分析和直覺等因素。在這種背景下,為盡可能實現對學習者的多維度、全方位描述,筆者在分析學習者畫像概念及其內涵的基礎上,總結出被業(yè)界認可的八種主要特征維度,分別是基本信息、內容偏好、學習風格、學習狀態(tài)、學習行為、學習狀態(tài)、社交互動、學習環(huán)境和個人發(fā)展等。事實上,能描繪學習者的特征維度可能多達數千個。鑒于學習者數據本身具有來源廣泛性和類型多樣性等一系列復雜的特性,因此,筆者認為在劃分特征維度時應重點考慮以下三個方面:①所有特征維度的劃分都應根據相關性原則,并結合具體實際情形需求和業(yè)務目標來分別加以確定;②在確保準確性、時效性的前提下,特征維度的劃分并非越豐富越好,而是越細化越好;③特征維度劃分本身是一個復雜多變的動態(tài)過程,有著一定的自身內在規(guī)律,并可能存在一系列的影響因素,例如,我們無法僅從獲取的外部數據來完全了解學習者的內心世界等,因此應盡可能避免劃分模糊的情形出現。

      1.2 特征維度下的相應數據

      就數據事實性而言,學習者的特征維度數據可分為靜態(tài)數據(直接數據)和動態(tài)數據(間接數據)這兩類。其中,靜態(tài)數據是指那些隨時間推移但仍保持相對穩(wěn)定的學習者的基本信息、狀態(tài)等數據;動態(tài)數據是指那些由學習者的一系列學習行為所產生的數據,例如瀏覽時長等。一般認為,特征維度數據的來源大致分為三類:一是學習者本身所具有的廣泛的基本屬性數據;二是數字化教學環(huán)境下自然而然地產生的數據;三是傳統(tǒng)學習環(huán)境下直接產生的數據。事實上,屬于不同特征維度的不同來源數據之間本質上存在著較大差異,鑒于此,筆者從數據來源、主要信息、性質和采集方式這四個方面來對其進行對比分析,如表1所示。

      表1 特征維度數據的具體內容

      2 學習者畫像的多維度數據采集

      實踐證明,為能客觀有效地采集到足夠全面的多維度數據,我們需要綜合運用與之相適應的技術、方式或途徑,因為它們在采集標準、范圍和重點等方面有所不同。鑒于此,筆者從以下三個方面來對學習者數據采集的實現方法展開詳細分析:新興信息類技術、管理平臺類技術和傳統(tǒng)線下類方式。

      2.1 新興信息類技術采集法

      該類技術主要包括大數據技術、云計算技術、深度學習技術、情感識別技術和可穿戴設備技術等。

      (1)大數據技術

      大數據技術能夠持續(xù)記錄、跟蹤和分析學習者的各方面數據信息,包括即時性、過程性的行為與現象,例如在某時間點或某時間段中的行為或心理數據、學習者檢索資源的次數、閱讀資源的時長等。相較于傳統(tǒng)方式所獲得的數據,大數據技術采集到的數據將更加全面、真實和準確,同時具有實時、誤差較小和多元化等特征。

      (2)云計算技術

      不同于傳統(tǒng)的計算機,云計算技術引入了一種全新的方便人們使用計算資源的模式,即云計算能讓人們方便、快捷地自助使用遠程計算資源?;谠朴嬎慵夹g的教育基礎數據的采集能夠達到實時共享的目的,且數據服務更加全面[10]。此外,它為課堂教學過程中的一系列“可量化”奠定了基礎,例如教學過程的可量化、校園管理的可量化、教育評價的可量化等[11]。

      (3)深度學習技術

      深度學習技術是將原始的數據特征通過多步的特征轉換得到一種特征表示,并進一步輸入到預測函數得到最終結果[12]。近年來,深度學習技術在教育應用領域頗受重視,因為它可以在歷史數據較少的情況下擴大現有數據。例如,通過將高校各類過程化、結果化的數據作為訓練集,并經過不斷的“訓練”學習后,深度學習技術就可很好地對有關學習者的新數據進行自行預測(計算)并得出結果,這些結果將能更精準實時反映學習者的學習行為和學習成果等狀態(tài)。

      (4)情感識別技術

      情感識別是識別人類情感的過程,最常見的是來自面部表情以及言語表達,其中,面部表情含有豐富的情感信息,能反映出人的心理狀態(tài)和情緒變化。目前,主流的情感識別技術是基于面部表情特征的情感計算,該技術通過攝像頭來實時采集學習者的臉部五官位置、肌肉運動等表情特征值以進行情緒識別。更具體地說,為能實現學習過程中學習者情感識別,情感識別技術首先要明確識別哪些情感及每種情感所對應的面部表情特征是什么,例如高興、憤怒、厭煩、恐懼、悲傷和驚訝等[13]。

      (5)可穿戴設備技術

      可穿戴設備技術為自然采集學習者的生理數據提供了可能,例如,通過佩戴相關設備,人們可以實時記錄學習者的運動狀態(tài)、呼吸量、血壓、運動量和睡眠質量等生理狀態(tài)數據,以及學習的時間、內容、地點和使用設備等學習信息??傊褂每纱┐髟O備,人們可在任何時間和任何地點獲取數據。

      2.2 管理平臺類技術采集法

      該類技術主要包括在線學習與管理平臺技術、日志搜索分析技術、移動App技術、網絡爬蟲技術和API接口調用技術。

      (1)在線學習與管理平臺技術

      在線學習與管理平臺是學習者數據采集的重要載體,可以采集學習者線上學習過程中的大部分數據,例如提交作業(yè)、瀏覽資源、討論區(qū)發(fā)言,以及學習者與學習管理系統(tǒng)的交互和點擊等行為數據[14]??傊ㄟ^特定的平臺既可以形成學習者特有的電子檔案,又可以跟蹤學習者不同階段學習狀態(tài)的變化。

      (2)日志搜索分析技術

      Web服務器所產生的日志文件中記錄了學習者的每一次操作行為,例如系統(tǒng)登錄次數、登錄時間、增刪查改等基本訪問數據,以及學習者與課程交互活動的次數、學習者對課程內容的訪問、訪問時間、訪問位置、瀏覽路徑等重要的行為數據[15]。事實上,日志搜索分析技術通過日志管理工具來從海量的日志數據中挖掘出有價值的信息或篩選出有用的信息,進而為學習者的個性化學習、差異化學習和畫像的構建等提供強有力的數據支撐。

      (3)移動App技術

      通過移動App來獲取學習者線上學習過程中的數據已逐漸成為在線數據采集的一種關鍵技術[16]。移動App技術本質上與在線學習與管理平臺技術類似,但前者的采集渠道主要是智能移動終端設備,而且采集方式更加靈活、多樣。事實上,通過結合移動終端的定位技術,移動App技術能實時采集學習者的學習地點、學習時間、學習內容和學習狀態(tài)等信息。此外,移動終端應用的安裝情況和活動頻次也可以用來揭示學習者的興趣和愛好等[17]。

      (4)網絡爬蟲技術

      網絡爬蟲技術可以實現從簡單的文本、圖像和視頻到更復雜的動態(tài)信息的采集[18]。它不僅能從網頁中提取非結構化數據,將其存儲為統(tǒng)一的本地數據文件并以結構化方式存儲,而且支持文件、音頻、視頻、其他文件或附件的信息采集,并且附件和文本可以自動關聯。此外,針對特定網站的特定數據采集需求,我們可結合開源系統(tǒng)來自行開發(fā)爬蟲工具(例如八爪魚采集器、網頁抓取軟件等),這將使得采集過程具有更高的自由性和自主性。隨著互聯網新媒體(例如門戶網站、微博和微信等)的興起,教育領域的信息傳播也將呈現出傳播速度快、波及范圍廣和內容多樣化等特點,與此同時,網絡爬蟲技術也可被用來定期實時采集教育領域網絡輿情數據等[19]。

      (5)API接口調用技術

      API的全稱為Application Programming Interface,是網站管理者為了使用者方便而編寫的一種程序接口(一些預先定義的函數),它屏蔽了網站的底層復雜算法。通過簡單調用API接口,第三方程序能輕松實現對數據的請求。事實上,利用網站自身提供的API接口進行數據采集時可以很好地解決數據針對性的問題。隨著越來越多的教育類網站推出開放平臺并提供豐富的API接口,在已獲授權的情況下,第三方程序可通過這些API接口直接獲取相關數據[20]。重要的是,通過API接口獲取的數據通常以JSON、XML格式呈現,因而具有較清晰的數據結構形式,這便于第三方程序直接進行數據抽取。此外,美國高級分布式學習(Advanced Distributed Learning,ADL)組織發(fā)布了Experience API(xAPI)規(guī)范,它是一種收集、存儲數據的標準,具有獨立性和可擴展性,且不依附于其他平臺[21]。實踐中,基于xAPI的交互技術可以實現教學內容的設置、學生與學習系統(tǒng)的交互性和學習方法的定制化等。

      工業(yè)革命之前,技術進步非常緩慢,一個人一生幾乎感受不到技術的進步,沿著同樣的技術路徑勞動和生活,可謂天經地義。工業(yè)革命以后,尤其是20世紀下半葉以來,一個人可以感受到技術的明顯進步。1980年代以來,每十年甚至每年都可以感受到技術的明顯進步。

      2.3 傳統(tǒng)線下類方式采集法

      該類方式主要包括在問卷調查方式、深度訪談方式、小組座談方式和課堂觀察方式等。

      (1)問卷調查方式

      問卷調查可以在較大范圍內讓眾多被訪問者同時填寫,因而能夠在較短時間內采集到大量數據(定量數據)。問卷調查是一種比較傳統(tǒng)但卻非常有效的手段,通過問卷調查我們可以采集到學習者對學習過程的態(tài)度、需求和建議等。值得說明的是,通過問卷調查獲取的數據可能存在很多質量問題,這些數據可以作為參考,但要以質疑的眼光看待。

      (2)深度訪談方式

      深度訪談通過面對面溝通、電話等方式來與學習者直接進行交流,它具有操作方便、適應性強等特點,它可以深入地探索被訪者的內心與看法,且容易達到理想的效果。值得說明的是,深度訪談方式的兩個關鍵步驟是:訪談之前要列好訪談提綱,圍繞學習者的一系列學習行為而展開,例如學習者的觀點、想法等;訪談之后要能采取關鍵詞提煉法,對每個學習者對每個問題的回答進行關鍵詞提煉、共性詞匯總等。

      (3)小組座談方式

      (4)課堂觀察方式

      課堂觀察方式是通過借助主觀感覺器官、其他研究工具等以從一線課堂中采集數據或其他研究材料的方法[22]。課堂觀察方式涉及的研究工具包括各類課堂觀察量表,例如學生學習行為量表、學生活動等級量表和師生互動等級量表等。這些不同的觀察量表分別具有不同的制定標準,且關注點也各不相同,但均需通過觀察者主觀觀察來得到相應的數據[23]。事實上,我們可使用多媒體設備來代替?zhèn)鹘y(tǒng)課堂的教學環(huán)境數據采集方法,例如通過多機位的課堂錄像來多角度記錄課堂行為,這樣我們可隨時隨地根據研究需要查看或點播所需的課堂錄像信息[23]。

      綜上所述,通過傳統(tǒng)線下類方式采集數據時具有較強的人為主觀性,且難以保證所采集數據的真實性。事實上,傳統(tǒng)線下類方式因采集難度大、采集量小而一直被業(yè)界所忽視,盡管它能對線上數據的采集進行有效的補充。

      3 結語

      學習者數據的高質量采集將是教育行業(yè)目前和今后最重要的工作之一,也是有效構建學習者畫像的基礎性、先導性工作[24]。

      為能進行科學、全面和持續(xù)的數據采集積累,以得到具有分析利用價值的學習者數據,進而使構建的學習者畫像更為精準有效,筆者認為在學習者數據采集方面未來仍有一些開放性問題值得探討:

      (1)實施全方位、全過程的數據采集

      現有方法采集到的學習者數據中還存在著一些問題,例如稀疏性、缺失性、偏差性和時效性等,這不僅讓學習者復雜多變的狀態(tài)無法得以有效細致地描述,更會直接導致學習者畫像模型的精準度偏低。因此,為讓采集積累的數據盡可能更加優(yōu)質可靠,便于有效利用,我們需要對足夠全面的屬性、維度和參與指標等方面的數據進行全方位、全過程采集[8]。例如,在采集學習者行為數據的同時,最好也能采集和學習者行為相關的場景數據,以便后續(xù)能據此進行有效的數據分析。

      (2)實施線上、線下相結合的數據采集

      信息技術、互聯網技術的發(fā)展進步打破了時空限制,使得線上線下相結合的數據采集方式變得更為必要。事實上,線上線下相結合的數據采集方式不僅能有效采集到學習者最真實的學習狀態(tài),更能克服單純根據某一受限指標(例如短期興趣、長期興趣等)來采集線上數據或線下數據時所存在的弊端。更為重要的是,線上線下相結合的數據采集方式還能較為準確地獲取到學習者學習過程中心理與認知等方面較難采集到的數據[25]。

      猜你喜歡
      畫像學習者維度
      威猛的畫像
      “00后”畫像
      畫像
      你是哪種類型的學習者
      學生天地(2020年15期)2020-08-25 09:22:02
      十二星座是什么類型的學習者
      淺論詩中“史”識的四個維度
      中華詩詞(2019年7期)2019-11-25 01:43:00
      漢語學習自主學習者特征初探
      光的維度
      燈與照明(2016年4期)2016-06-05 09:01:45
      “五個維度”解有機化學推斷題
      潛行與畫像
      双江| 钟祥市| 兴隆县| 徐水县| 华安县| 呼伦贝尔市| 肥城市| 西峡县| 阳泉市| 繁昌县| 九龙城区| 连云港市| 广德县| 颍上县| 翁源县| 余姚市| 财经| 花垣县| 珲春市| 光山县| 邳州市| 轮台县| 来宾市| 龙山县| 寿光市| 海淀区| 金秀| 建阳市| 宜黄县| 柳林县| 潢川县| 定州市| 蒙山县| 循化| 浦东新区| 东辽县| 沂南县| 甘德县| 宜川县| 遂昌县| 佛山市|