• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)為基礎(chǔ),應(yīng)用為先導(dǎo)

      2019-10-30 09:00李維明
      中國(guó)信息技術(shù)教育 2019年18期
      關(guān)鍵詞:爬蟲(chóng)分析法網(wǎng)民

      李維明

      “數(shù)據(jù)處理與應(yīng)用”是《普通高中信息技術(shù)課程標(biāo)準(zhǔn)(2017年版)》(簡(jiǎn)稱《標(biāo)準(zhǔn)》)“必修模塊1:數(shù)據(jù)與計(jì)算”中的重要內(nèi)容之一,主要包括數(shù)據(jù)的采集與整理、分析與應(yīng)用等幾個(gè)方面。在實(shí)踐中應(yīng)當(dāng)以數(shù)據(jù)為基礎(chǔ),應(yīng)用為先導(dǎo),展開(kāi)數(shù)據(jù)處理的教學(xué)。

      ● 明確數(shù)據(jù)需求,科學(xué)采集與整理

      要處理數(shù)據(jù),必須采集數(shù)據(jù)。數(shù)據(jù)的來(lái)源渠道眾多,數(shù)據(jù)的類型也多種多樣,我們可以根據(jù)需求進(jìn)行采集。例如,開(kāi)展類似“中學(xué)生移動(dòng)學(xué)習(xí)現(xiàn)狀調(diào)查”活動(dòng)了解“中學(xué)生移動(dòng)學(xué)習(xí)的基本情況”,則需要采集學(xué)生的“移動(dòng)設(shè)備的使用時(shí)間”“移動(dòng)設(shè)備的使用頻率”“常用資源類型”等方面的數(shù)據(jù)。又如,欲了解“哪些因素影響中學(xué)生的移動(dòng)學(xué)習(xí)”,則需要采集“學(xué)生對(duì)移動(dòng)學(xué)習(xí)的態(tài)度”“家長(zhǎng)是否支持”“移動(dòng)設(shè)備擁有情況”等方面的數(shù)據(jù)。只有明確了需求,才能采集到需要的數(shù)據(jù)。教學(xué)中必須讓學(xué)生明確地了解自己的需求,從而有目的地設(shè)計(jì)數(shù)據(jù)采集方案。

      數(shù)據(jù)的來(lái)源通常有紙媒數(shù)據(jù)(如問(wèn)卷調(diào)查數(shù)據(jù))、傳感器輸入數(shù)據(jù)、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)數(shù)據(jù)等。我們必須根據(jù)數(shù)據(jù)的特點(diǎn)及來(lái)源途徑,選用合適的方法及工具進(jìn)行采集。對(duì)于紙媒數(shù)據(jù),可以使用人工或掃描的方法將其錄入計(jì)算機(jī),從而完成數(shù)據(jù)采集;對(duì)于數(shù)據(jù)庫(kù)的數(shù)據(jù),由于已有規(guī)律存放,則可以用數(shù)據(jù)庫(kù)處理工具進(jìn)行采集;而對(duì)于傳感器采集的數(shù)據(jù),則要根據(jù)傳感器的類型和輸出的方式不同而采用不同的方法采集數(shù)據(jù)。通常情況下,傳感器輸出的是一個(gè)電信號(hào),這個(gè)電信號(hào)值會(huì)隨被測(cè)量的變化而變化,采集到這些電信號(hào)的數(shù)值,就可以研究被測(cè)量變化的規(guī)律,從而加以利用。但在實(shí)際應(yīng)用場(chǎng)合,傳感器往往自帶了一個(gè)簡(jiǎn)單的轉(zhuǎn)換器,將電信號(hào)自動(dòng)轉(zhuǎn)換為數(shù)字信號(hào)以方便人們采集應(yīng)用。例如,機(jī)器人中的光敏傳感器在黑色表面時(shí)會(huì)輸出一個(gè)數(shù)值為100的數(shù)字信號(hào),而在白色表面則輸出一個(gè)數(shù)值為0的數(shù)字信號(hào),在其他表面則輸出0~100的不同數(shù)值,人們可以通過(guò)機(jī)器人軟件系統(tǒng)采集這些數(shù)據(jù)作為利用的基礎(chǔ)。

      在互聯(lián)網(wǎng)高度發(fā)達(dá)的今天,網(wǎng)絡(luò)更是信息的海洋。通過(guò)網(wǎng)絡(luò)獲取數(shù)據(jù)的方法很多,“在線問(wèn)卷”“搜索引擎”都是其中重要的方法。對(duì)于這兩類工具的使用方法,在初中甚至小學(xué)都有涉及,不必過(guò)多糾纏,更重要的是了解其中原理,如“網(wǎng)絡(luò)爬蟲(chóng)”等?!熬W(wǎng)絡(luò)爬蟲(chóng)”(又被稱為網(wǎng)頁(yè)蜘蛛、網(wǎng)絡(luò)機(jī)器人等),是一種按照一定的規(guī)則,自動(dòng)地抓取互聯(lián)網(wǎng)信息的程序。由于它可以作為一種工具自動(dòng)地獲取網(wǎng)頁(yè)數(shù)據(jù),因而也就成了不少“搜索引擎”的重要組成部分。從目前使用的教材來(lái)看,有關(guān)“網(wǎng)絡(luò)爬蟲(chóng)”的內(nèi)容,多數(shù)教材有所涉及,但出現(xiàn)的位置有所不同,有的在“單元3:算法與程序?qū)崿F(xiàn)”學(xué)習(xí)之前,有的在此之后,所以教學(xué)時(shí)采用的方法也就迥異。學(xué)習(xí)“單元3:算法與程序?qū)崿F(xiàn)”之前講“網(wǎng)絡(luò)爬蟲(chóng)”只能略講、定性地了解,而學(xué)習(xí)之后講則可以用“算法與程序?qū)崿F(xiàn)”“網(wǎng)絡(luò)爬蟲(chóng)”的功能,教學(xué)策略完全不一樣。教學(xué)時(shí)可根據(jù)學(xué)生情況及學(xué)習(xí)進(jìn)度,靈活地掌握教學(xué)尺度,重在講清“網(wǎng)絡(luò)爬蟲(chóng)”特點(diǎn),而這種特點(diǎn)正是互聯(lián)網(wǎng)條件下解決問(wèn)題的特有的思維方式和解決辦法,這正是計(jì)算思維培育的關(guān)鍵之處。

      采集到的數(shù)據(jù)需要對(duì)其進(jìn)行簡(jiǎn)單的整理,主要是對(duì)原始數(shù)據(jù)進(jìn)行校驗(yàn)處理,使之系統(tǒng)化、標(biāo)準(zhǔn)化,也就是要對(duì)采集的數(shù)據(jù)進(jìn)行“數(shù)據(jù)清洗”,過(guò)濾那些不符合要求的數(shù)據(jù),如不完整數(shù)據(jù)、錯(cuò)誤值或異常值、重復(fù)記錄等,為數(shù)據(jù)的分析處理打好基礎(chǔ)。教學(xué)中應(yīng)當(dāng)重視這一環(huán)節(jié),讓學(xué)生養(yǎng)成規(guī)范處理采集數(shù)據(jù)的習(xí)慣。

      ● 根據(jù)數(shù)據(jù)用途,正確分析與表達(dá)

      數(shù)據(jù)用途是指我們使用數(shù)據(jù)的目的。一般包括“了解事物現(xiàn)狀”“剖析事物發(fā)展”“預(yù)測(cè)事物的未來(lái)走向”等,與前述“數(shù)據(jù)需求”緊密相關(guān),即用途決定需求,需求決定數(shù)據(jù),數(shù)據(jù)決定用途,“中學(xué)生移動(dòng)學(xué)習(xí)現(xiàn)狀調(diào)查”就是“了解事物現(xiàn)狀”的一個(gè)實(shí)例。該實(shí)例根據(jù)學(xué)校促進(jìn)移動(dòng)學(xué)習(xí)健康發(fā)展的用途,產(chǎn)生出“了解中學(xué)生移動(dòng)學(xué)習(xí)基本情況”這一需求,采集了學(xué)生的“移動(dòng)設(shè)備的使用時(shí)間”“移動(dòng)設(shè)備的使用頻率”“常用資源類型”等方面的數(shù)據(jù),運(yùn)用分析工具即可得出分析結(jié)果,這些結(jié)果決定了“學(xué)校促進(jìn)移動(dòng)學(xué)習(xí)健康發(fā)展”的措施的形成。所以,“用途”“需求”“數(shù)據(jù)”既相輔相成又相互制約,在教學(xué)中必須明確它們的關(guān)系。

      如何正確地進(jìn)行分析,需要根據(jù)數(shù)據(jù)本身的特性,選用適合的工具,采用恰當(dāng)?shù)姆椒ǘ鵀橹?。常用的分析方法有三類:?duì)比分析法、平均分析法和結(jié)構(gòu)分析法。

      對(duì)比分析法通常是把兩個(gè)相互聯(lián)系的指標(biāo)數(shù)據(jù)進(jìn)行比較,從數(shù)量上展示和說(shuō)明研究對(duì)象規(guī)模的大小、水平的高低、速度的快慢,以及各種關(guān)系是否協(xié)調(diào)等。例如,需要了解我國(guó)網(wǎng)民規(guī)模的發(fā)展,可以使用歷年網(wǎng)民人數(shù)進(jìn)行對(duì)比分析,由此可以明顯地觀察到網(wǎng)民人數(shù)的逐年遞增(如圖1)。

      在對(duì)比分析中,選擇合適的對(duì)比標(biāo)準(zhǔn)是十分關(guān)鍵的步驟,選擇合適,才能做出客觀的評(píng)價(jià)。圖1選取的是同一國(guó)家(中國(guó))、同一量值(網(wǎng)民人數(shù)),所以能從數(shù)據(jù)中分析出其發(fā)展變化的程度。

      平均分析法是利用平均數(shù)指標(biāo)來(lái)反映某一特征數(shù)據(jù)總體的一般水平,圖2是平均分析法的一個(gè)實(shí)際案例。從圖2可以看出全國(guó)居民人均可支配收入逐年增加,人均消費(fèi)支出也隨之增加,而同一年內(nèi)居民人均消費(fèi)的總量始終低于人均可支配收入,說(shuō)明年年有余。

      結(jié)構(gòu)分析法是在統(tǒng)計(jì)分組的基礎(chǔ)上,計(jì)算各組成部分所占比重,就是將各部分與總體進(jìn)行對(duì)比,以分析事物的內(nèi)部結(jié)構(gòu),了解部分與整體的關(guān)系等。圖3就清晰地反映了某時(shí)段網(wǎng)民的學(xué)歷結(jié)構(gòu)以及各學(xué)歷段網(wǎng)民占網(wǎng)民總數(shù)的比例。

      需要注意的是,由于結(jié)構(gòu)分析法所分析的是部分與總量的關(guān)系,所以各部分之和必須與總量相等。這一點(diǎn)在教學(xué)過(guò)程中必須注意,而且并不是所有的數(shù)據(jù)都可以使用結(jié)構(gòu)分析法進(jìn)行分析處理。

      從以上案例可以看到,無(wú)論是對(duì)比分析法、平均分析法還是結(jié)構(gòu)分析法,呈現(xiàn)方式都不是枯燥的數(shù)據(jù),而是使用了圖表,這個(gè)過(guò)程就是數(shù)據(jù)的可視化表達(dá)。數(shù)據(jù)可視化就是借助于圖形化手段,清晰有效地傳達(dá)數(shù)據(jù)、溝通信息。

      綜上所述,對(duì)于本單元的教學(xué),其重點(diǎn)是抓住“數(shù)據(jù)”這條線,“采集”“清洗”“分析”“可視化”,科學(xué)采集、正確分析,即可付諸應(yīng)用。當(dāng)然,這里僅僅是從其教學(xué)內(nèi)容入手進(jìn)行了粗略的分析,提出了一些相關(guān)的建議,但愿對(duì)大家有所幫助。至于具體的教學(xué)方法及步驟,在本期欄目的相關(guān)文章中會(huì)有詳細(xì)敘述,請(qǐng)各位仔細(xì)閱讀。

      猜你喜歡
      爬蟲(chóng)分析法網(wǎng)民
      基于Python的網(wǎng)絡(luò)爬蟲(chóng)和反爬蟲(chóng)技術(shù)研究
      Python反爬蟲(chóng)設(shè)計(jì)
      “臺(tái)獨(dú)聯(lián)署”被島內(nèi)網(wǎng)民嘲
      基于層次分析法的智慧城市得分比較
      基于層次分析法的智慧城市得分比較
      基于Scrapy框架的分布式網(wǎng)絡(luò)爬蟲(chóng)的研究與實(shí)現(xiàn)
      基于層次分析法的投資性住房選擇模型
      基于層次分析法的投資性住房選擇模型
      誰(shuí)搶走了低價(jià)機(jī)票
      電化學(xué)發(fā)光分析法測(cè)定糖尿病相關(guān)二肽
      行唐县| 景泰县| 娄底市| 阜新| 扬州市| 宜良县| 洪雅县| 博罗县| 文安县| 大城县| 和龙市| 那坡县| 泰兴市| 夏河县| 广宗县| 连江县| 尼木县| 额尔古纳市| 罗定市| 邹平县| 嘉义市| 烟台市| 乡城县| 高要市| 天门市| 镇沅| 丽水市| 闽清县| 黑水县| 玉树县| 丰镇市| 榕江县| 麻城市| 鲜城| 常德市| 长岛县| 靖宇县| 福安市| 岢岚县| 沙田区| 临安市|