• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      海關(guān)大數(shù)據(jù)分析教學(xué)研究

      2023-01-14 08:21:03鄭鵬飛李菁菁

      鄭鵬飛 李菁菁

      關(guān)鍵詞:海關(guān)大數(shù)據(jù);GTA;R語(yǔ)言教學(xué)

      1引言

      對(duì)貿(mào)易數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和分析,是我國(guó)海關(guān)的傳統(tǒng)重要職能之一。2021年,我國(guó)貨物進(jìn)出口總額突破39萬(wàn)億元,比上年增長(zhǎng)21 .4%。其中,出口21.7萬(wàn)億元,增長(zhǎng)21.2%;進(jìn)口17.4萬(wàn)億元,增長(zhǎng)21. 5%。進(jìn)出口貿(mào)易規(guī)模飛速增長(zhǎng),對(duì)海關(guān)統(tǒng)計(jì)分析人員的數(shù)據(jù)處理能力提出了更高的要求。然而,依據(jù)我國(guó)的海關(guān)統(tǒng)計(jì)制度,海關(guān)貿(mào)易數(shù)據(jù)的采集依賴各海關(guān)日常業(yè)務(wù)中產(chǎn)生的海量報(bào)關(guān)單,匯總以后具有來(lái)源廣、字段多、跨度大、體量大等特征,原始數(shù)據(jù)經(jīng)常會(huì)到達(dá)數(shù)百萬(wàn)行甚至上億行,面對(duì)如此規(guī)模的數(shù)據(jù),傳統(tǒng)的Excel,Tableau等辦公軟件基本很難使用或者無(wú)法使用,需要使用新的工具才能實(shí)現(xiàn)“快、廣、深”的目標(biāo)[1]。

      作為一種綜合分析、科學(xué)預(yù)測(cè)的技術(shù)手段,大數(shù)據(jù)技術(shù)為構(gòu)建統(tǒng)籌全局、系統(tǒng)集成、協(xié)同高效的海關(guān)數(shù)據(jù)分析體系提供了可能[2]。歐美發(fā)達(dá)國(guó)家海關(guān)的實(shí)踐已經(jīng)表明,大數(shù)據(jù)技術(shù)可以成為海關(guān)數(shù)據(jù)分析的“效率倍增器”。例如,美國(guó)海關(guān)開(kāi)發(fā)的“全球自動(dòng)布控系統(tǒng)”能夠迅速將旅客、艙單等信息與其他數(shù)據(jù)庫(kù)進(jìn)行綜合比對(duì),大幅提升了對(duì)“高風(fēng)險(xiǎn)旅客”的篩查效率。

      鑒于此,《“十四五”海關(guān)發(fā)展規(guī)劃》將“科技興關(guān)動(dòng)力強(qiáng)勁,創(chuàng)新應(yīng)用能力大幅提升”作為主要目標(biāo)之一,強(qiáng)調(diào)要“以大數(shù)據(jù)驅(qū)動(dòng)風(fēng)險(xiǎn)防控、通關(guān)監(jiān)管、稅收征管、檢驗(yàn)檢疫等海關(guān)主要業(yè)務(wù)運(yùn)行,形成大數(shù)據(jù)智能應(yīng)用生態(tài),提升大數(shù)據(jù)輔助治理能力。”

      2統(tǒng)計(jì)軟件R語(yǔ)言特征

      為使人才培養(yǎng)符合大數(shù)據(jù)處理的需求,目前很多高校都開(kāi)設(shè)了諸多統(tǒng)計(jì)軟件課程[3],如Python,R,Stata,SAS,SPSS,MATLAB等。其中,R語(yǔ)言是一種功能強(qiáng)大、被諸多高校所青睞的課程,它具有以下幾個(gè)基本特征。

      (1)R是開(kāi)源軟件[4]??梢栽谒木W(wǎng)站及其鏡像中下載任何有關(guān)的安裝程序、源代碼、程序包及其源代碼、文檔資料。標(biāo)準(zhǔn)的安裝文件自身就帶有許多模塊和內(nèi)嵌統(tǒng)計(jì)函數(shù),安裝好后可以直接實(shí)現(xiàn)許多常用的統(tǒng)計(jì)功能。

      (2)R是一種可編程的語(yǔ)言。作為一個(gè)開(kāi)放的統(tǒng)計(jì)編程環(huán)境,語(yǔ)法通俗易懂,很容易學(xué)會(huì)和掌握語(yǔ)言的語(yǔ)法。而且學(xué)會(huì)之后,我們可以編制自己的函數(shù)來(lái)擴(kuò)展現(xiàn)有的語(yǔ)言。這也就是為什么它的更新速度比一般統(tǒng)計(jì)軟件(如SPSS,SAS等)快得多。大多數(shù)最新的統(tǒng)計(jì)方法和技術(shù)都可以在R中直接得到。

      (3)所有R的函數(shù)和數(shù)據(jù)集是保存在程序包里面的[5]。只有當(dāng)一個(gè)包被載人時(shí),它的內(nèi)容才可以被訪問(wèn)。一些常用、基本的程序包已經(jīng)被收入標(biāo)準(zhǔn)安裝文件中,隨著新的統(tǒng)計(jì)分析方法的出現(xiàn),標(biāo)準(zhǔn)安裝文件中所包含的程序包也隨著版本的更新而不斷變化。在另外版安裝文件中,已經(jīng)包含的程序包有:base-R的基礎(chǔ)模塊、mle-極大似然估計(jì)模塊、ts-時(shí)間序列分析模塊、mva-多元統(tǒng)計(jì)分析模塊、survival-生存分析模塊等。

      (4)R具有很強(qiáng)的互動(dòng)性[6]。如圖1所示,除了圖形輸出是在另外的窗口處,它的輸入輸出窗口都是在同一個(gè)窗口進(jìn)行的,輸入語(yǔ)法中如果出現(xiàn)錯(cuò)誤會(huì)馬上在窗口中得到提示,對(duì)以前輸入過(guò)的命令有記憶功能,可以隨時(shí)再現(xiàn)、編輯修改,以滿足用戶的需要。輸出的圖形可以直接保存為JPG,BMP,PNG等圖片格式,還可以直接保存為PDF文件。另外,和其他編程語(yǔ)言與數(shù)據(jù)庫(kù)之間有很好的接口。

      綜上所述.R語(yǔ)言是一門適合大數(shù)據(jù)分析的強(qiáng)大工具。然而,凡事都有其兩面性,與圖形界面豐富的傳統(tǒng)統(tǒng)計(jì)軟件相比,R語(yǔ)言具有一定的學(xué)習(xí)門檻,初學(xué)者往往需要輸入至少一萬(wàn)行代碼才能入門[7],而且很多程序包的學(xué)習(xí)甚至比R語(yǔ)言本身還要復(fù)雜(如ggplot2軟件包)。

      3教學(xué)難點(diǎn)

      在當(dāng)前的R語(yǔ)言類課程教學(xué)中,主要存在兩個(gè)難點(diǎn)。

      (1)教學(xué)時(shí)長(zhǎng)偏短。在大多數(shù)高校的人才培養(yǎng)方案中,R語(yǔ)言類課程的教學(xué)時(shí)長(zhǎng)都是16周、32學(xué)時(shí),教學(xué)內(nèi)容多聚焦于數(shù)據(jù)結(jié)構(gòu)、基本語(yǔ)法,難以使學(xué)生快速掌握大數(shù)據(jù)分析能力[8]。

      (2)難以獲取數(shù)據(jù)來(lái)源。海關(guān)高度重視數(shù)據(jù)保密工作,海關(guān)采集并保有的很多數(shù)據(jù)都涉及國(guó)家機(jī)密。雖然海關(guān)統(tǒng)計(jì)部門也通過(guò)其數(shù)據(jù)公布平臺(tái)定期發(fā)布海關(guān)數(shù)據(jù)(如圖2所示),但其體量與“大數(shù)據(jù)”的特征存在較大的差距[9]。

      除海關(guān)數(shù)據(jù)外,很多其他來(lái)源的大數(shù)據(jù)都涉及商業(yè)機(jī)密,既難以供學(xué)生在課堂上操作實(shí)踐,也可能與海關(guān)數(shù)據(jù)分析的主題相去甚遠(yuǎn)。

      4基于GTA數(shù)據(jù)的教學(xué)案例

      GTA是全球關(guān)貿(mào)數(shù)據(jù)庫(kù)(Global Trade Atlas)的簡(jiǎn)稱,它將全球200多個(gè)國(guó)家和地區(qū)海關(guān)所提供的進(jìn)出口統(tǒng)計(jì)信息整合成一個(gè)全面的、雙邊的商品貿(mào)易數(shù)據(jù)庫(kù),使全球貿(mào)易分析人員按需搜索并下載所需數(shù)據(jù)成為可能。該數(shù)據(jù)庫(kù)同時(shí)提供逐筆的貿(mào)易信息,數(shù)據(jù)來(lái)源廣、體量大、跨度久,是用來(lái)進(jìn)行海關(guān)大數(shù)據(jù)分析教學(xué)的絕佳數(shù)據(jù)。

      4.1分析目標(biāo)

      驗(yàn)證“十三五”期間我國(guó)優(yōu)勢(shì)出口產(chǎn)業(yè)是否發(fā)生了明顯地向其他國(guó)家轉(zhuǎn)移。

      4.2解決思路

      第一階段:基于GTA數(shù)據(jù)庫(kù),將我國(guó)2015年的全部出口報(bào)關(guān)單按6位數(shù)HS編碼進(jìn)行分組并匯總金額,按倒序排列,取出前200位HS編碼(TOP 200商品)作為我國(guó)2015年優(yōu)勢(shì)產(chǎn)業(yè)代碼。

      第二階段:計(jì)算2015年,全世界各個(gè)國(guó)家和地區(qū)的TOP 200商品出口金額,計(jì)算包括我國(guó)在內(nèi)的各個(gè)國(guó)家和地區(qū)這200種商品的出口份額(Share2015)。

      第三階段:基于GTA數(shù)據(jù)庫(kù),查找2019年全世界各個(gè)國(guó)家和地區(qū)TOP 200商品的出口金額,計(jì)算包括我國(guó)在內(nèi)的各個(gè)國(guó)家和地區(qū)這200種商品的出口份額(Share2019)。

      也可以繪制成圖形,更清晰直觀地展示5年內(nèi)我國(guó)在TOP 200商品出口份額的變化情況,如圖3所示。

      計(jì)算結(jié)果如表1所列(局部),不僅能得到在目標(biāo)5年內(nèi)TOP 200商品中國(guó)的市場(chǎng)份額變化情況,還能得到該商品市場(chǎng)份額增加的前5名國(guó)家和減少的后5名國(guó)家(因篇幅限制,此處僅顯示前1和后1),即回答了“我們的份額是從誰(shuí)那搶來(lái)的”或者“我們的份額被誰(shuí)搶走了”的現(xiàn)實(shí)問(wèn)題。

      總體來(lái)看,在TOP 200商品中,我國(guó)出口份額增加的商品有95種,減少的有105種,基本保持穩(wěn)定,即2015~2019年間,我國(guó)并未發(fā)生明顯的產(chǎn)業(yè)鏈流失。

      5結(jié)束語(yǔ)

      在大數(shù)據(jù)人才培養(yǎng)過(guò)程中,統(tǒng)計(jì)軟件R語(yǔ)言等可編程開(kāi)源軟件是較為普遍的選擇。然而,由于海關(guān)數(shù)據(jù)的特殊性和難以獲取性,貼近海關(guān)數(shù)據(jù)分析實(shí)際的實(shí)踐教學(xué)相對(duì)困難。本文以GTA數(shù)據(jù)為例,利用難度不高的代碼對(duì)海關(guān)統(tǒng)計(jì)分析領(lǐng)域的一個(gè)常見(jiàn)問(wèn)題進(jìn)行了較為清晰的解答,為海關(guān)大數(shù)據(jù)分析教學(xué)提供了新的思路。

      太湖县| 龙海市| 嵩明县| 林西县| 本溪市| 蓬莱市| 灯塔市| 石林| 阿坝县| 开阳县| 辽源市| 泰来县| 宣武区| 偃师市| 宜兰市| 蚌埠市| 盐源县| 栖霞市| 朝阳县| 长垣县| 南华县| 兴隆县| 远安县| 洛浦县| 光泽县| 清水县| 岐山县| 昌平区| 舒城县| 伊春市| 双牌县| 论坛| 黄平县| 台南市| 当雄县| 静安区| 洛宁县| 虞城县| 环江| 盘山县| 铅山县|