發(fā)言人:曹高輝 華中師范大學(xué)信息管理學(xué)院
袁平鵬 華中科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院
鄧勝利 武漢大學(xué)信息管理學(xué)院
洪 亮 武漢大學(xué)信息管理學(xué)院
黃 穎 武漢大學(xué)信息管理學(xué)院
毛 進(jìn) 武漢大學(xué)信息管理學(xué)院
整理:汪 璠 武漢大學(xué)信息管理學(xué)院
錢倩文 武漢大學(xué)信息管理學(xué)院
2022 年武漢大學(xué)“大數(shù)據(jù)管理與應(yīng)用”暑期學(xué)校期間,舉辦了“圖書情報(bào)與數(shù)據(jù)科學(xué)理論與前沿論壇”,六位受邀專家從人才培養(yǎng)、社會(huì)服務(wù)、學(xué)習(xí)方法等多個(gè)方面對(duì)數(shù)據(jù)科學(xué)的理論與前沿進(jìn)行了探討和交流。
目前,國(guó)內(nèi)各大高校數(shù)據(jù)科學(xué)類專業(yè)的課程體系建設(shè)方向主要分為三類。①課程體系建設(shè)主要采取數(shù)學(xué)與計(jì)算機(jī)科學(xué)結(jié)合的方式,通過(guò)計(jì)算機(jī)搭建數(shù)學(xué)模型,解決社會(huì)中存在的一些重大問(wèn)題。數(shù)據(jù)科學(xué)專業(yè)與計(jì)算機(jī)類專業(yè)的主要區(qū)別為:傳統(tǒng)計(jì)算機(jī)類專業(yè)還需要學(xué)習(xí)計(jì)算機(jī)組成原理等這些偏體系結(jié)構(gòu)的知識(shí),而數(shù)據(jù)科學(xué)專業(yè)開設(shè)的課程主要為數(shù)據(jù)挖掘、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)等偏數(shù)學(xué)計(jì)算的知識(shí)。該類課程體系建設(shè)方式的代表性高校包括北京大學(xué)和武漢大學(xué)。②課程體系建設(shè)側(cè)重于對(duì)大數(shù)據(jù)的管理與應(yīng)用,主要是將大數(shù)據(jù)與經(jīng)濟(jì)、管理、宏觀統(tǒng)計(jì)和宏觀決策相結(jié)合。開設(shè)的課程除了信息技術(shù)類課程,還包括大數(shù)據(jù)管理、數(shù)據(jù)治理、領(lǐng)域大數(shù)據(jù)應(yīng)用等偏管理應(yīng)用的課程。③在課程體系建設(shè)方面與計(jì)算機(jī)類專業(yè)近似,主要開設(shè)大數(shù)據(jù)應(yīng)用技術(shù)的相關(guān)課程。
針對(duì)數(shù)據(jù)科學(xué)類專業(yè)的人才培養(yǎng)現(xiàn)狀,袁平鵬教授提出了三個(gè)重要問(wèn)題:①數(shù)據(jù)科學(xué)專業(yè)的課程體系應(yīng)該是什么樣的?②不同層次的高校、不同學(xué)科方向培養(yǎng)出的眾多數(shù)據(jù)科學(xué)人才是否符合市場(chǎng)的需求?職業(yè)定位是怎樣的?是有自己的就業(yè)方向,還是和計(jì)算機(jī)類一樣,從事互聯(lián)網(wǎng)、編程相關(guān)的工作?③數(shù)據(jù)科學(xué)人才培養(yǎng)更應(yīng)該偏管理還是偏技術(shù)?
袁平鵬教授在這些問(wèn)題上也給出了建議。在學(xué)術(shù)課程體系的建設(shè)方面,不同層次的高校都開設(shè)了數(shù)據(jù)科學(xué)專業(yè),并分別在三個(gè)不同的方向有所側(cè)重。每個(gè)學(xué)校都應(yīng)該結(jié)合自身的學(xué)科特點(diǎn)和師資力量,構(gòu)建一個(gè)適合自身的課程體系。此外,高等教育機(jī)構(gòu)還應(yīng)該考慮所培養(yǎng)的大數(shù)據(jù)相關(guān)人才是否能滿足市場(chǎng)的需求。在人才培養(yǎng)方面,不同類型的高等教育機(jī)構(gòu)也應(yīng)該充分發(fā)揮自身的學(xué)科優(yōu)勢(shì),有側(cè)重點(diǎn)地制定自己的培養(yǎng)方案。以側(cè)重于信息資源管理方向的學(xué)校為例,袁平鵬教授指出,此類培養(yǎng)單位在制定數(shù)據(jù)科學(xué)專業(yè)培養(yǎng)方案時(shí)應(yīng)該從大數(shù)據(jù)的管理角度出發(fā),而不是過(guò)分聚焦大數(shù)據(jù)技術(shù)開發(fā)和實(shí)施,充分發(fā)揮信息資源管理方面的學(xué)科特色,以更好地培養(yǎng)該方向下相關(guān)學(xué)生的計(jì)算思維和邏輯分析能力。
曹高輝教授針對(duì)就業(yè)導(dǎo)向型的碩士研究生人才培養(yǎng)模式提出了三個(gè)問(wèn)題。①就業(yè)導(dǎo)向的學(xué)生是否需要寫論文?當(dāng)前,就業(yè)市場(chǎng)對(duì)數(shù)據(jù)科學(xué)人才的綜合素質(zhì)要求很高,同時(shí)論文的錄用難度也在加大。在當(dāng)前需要研究生發(fā)表資格論文的培養(yǎng)模式下,研究生發(fā)表論文需要投入科研的時(shí)間也更多。在這種困境下,研究生如何合理安排自己的時(shí)間,以兼顧就業(yè)與科研?②就業(yè)能力應(yīng)該由誰(shuí)來(lái)培養(yǎng)?究竟是老師來(lái)培養(yǎng)研究生的求職能力,還是研究生自學(xué)來(lái)提升自己的求職能力?同時(shí),由于數(shù)據(jù)科學(xué)是一種新興專業(yè),該專業(yè)人才培養(yǎng)的經(jīng)驗(yàn)較少。數(shù)據(jù)科學(xué)類專業(yè)的師生更應(yīng)該思考,導(dǎo)師需要承擔(dān)什么樣的角色?③就業(yè)導(dǎo)向型學(xué)生是否要多聽(tīng)學(xué)術(shù)報(bào)告?以及如何利用學(xué)術(shù)報(bào)告提升自身科研能力?
針對(duì)曹高輝教授提出的問(wèn)題,黃穎老師發(fā)表了自己的兩個(gè)觀點(diǎn):①就業(yè)導(dǎo)向型碩士研究生也應(yīng)該撰寫學(xué)術(shù)論文;②就業(yè)導(dǎo)向型研究生也應(yīng)該參加學(xué)術(shù)報(bào)告。
第一,撰寫論文之前需要對(duì)數(shù)據(jù)進(jìn)行收集、清洗、處理和分析,此過(guò)程和論文撰寫過(guò)程能夠鍛煉學(xué)生的諸多能力,而這些能力與就業(yè)能力是一脈相通的。同時(shí),國(guó)內(nèi)論文錄用難度的增大會(huì)鞭策和激勵(lì)研究生學(xué)習(xí)新的技術(shù)、方法和軟件。研究生通過(guò)應(yīng)對(duì)數(shù)據(jù)分析和論文的撰寫、投稿、返修等各種類型的壓力,能夠?qū)W習(xí)到多元的知識(shí)、提升多方面的能力。因此,就業(yè)導(dǎo)向型碩士研究生也應(yīng)該撰寫學(xué)術(shù)論文。
第二,研究生通過(guò)參加學(xué)術(shù)報(bào)告,能夠提高自身的信息捕捉能力。數(shù)據(jù)科學(xué)是一類理論與實(shí)踐結(jié)合較為密切的專業(yè),參加學(xué)術(shù)會(huì)議能夠了解最新的學(xué)術(shù)動(dòng)向,能夠提高學(xué)生對(duì)就業(yè)方向的把握。另外,在當(dāng)前需要研究生發(fā)表資格論文的培養(yǎng)模式下,研究生提前撰寫論文和多參加學(xué)術(shù)報(bào)告,在應(yīng)對(duì)畢業(yè)論文時(shí),會(huì)游刃有余,更加輕松。綜上,就業(yè)導(dǎo)向型研究生應(yīng)該撰寫學(xué)術(shù)論文和參加學(xué)術(shù)報(bào)告。
第一,數(shù)據(jù)科學(xué)類專業(yè)的課程體系該如何設(shè)計(jì)?目前,國(guó)內(nèi)對(duì)信息資源管理學(xué)科視角下數(shù)據(jù)科學(xué)的研究集中在數(shù)據(jù)素養(yǎng)、人才培養(yǎng)目標(biāo)、課程體系、實(shí)踐應(yīng)用等方面[1]。吳丹教授研究團(tuán)隊(duì)回顧全球圖書情報(bào)學(xué)科所開設(shè)的數(shù)據(jù)科學(xué)專業(yè),發(fā)現(xiàn)除了計(jì)算機(jī)科學(xué)等數(shù)據(jù)科學(xué)技術(shù)課程外,信息倫理、信息隱私、算法公平課程也是課程所關(guān)注的亮點(diǎn)。在圖情領(lǐng)域內(nèi)數(shù)據(jù)科學(xué)的專業(yè)教育不單單是學(xué)術(shù)性人才的培養(yǎng),還強(qiáng)調(diào)培養(yǎng)面向企業(yè)應(yīng)用的實(shí)踐型人才[2]。閆慧[3]、陶俊[4]等學(xué)者對(duì)iSchools 聯(lián)盟中開設(shè)數(shù)據(jù)科學(xué)教育項(xiàng)目的14所院校進(jìn)行分析發(fā)現(xiàn),大部分學(xué)校重視對(duì)學(xué)生實(shí)踐能力的培養(yǎng),人才培養(yǎng)定位集中在商業(yè)智能分析師、數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師、數(shù)據(jù)分析師、數(shù)據(jù)架構(gòu)師等。
第二,數(shù)據(jù)科學(xué)與圖書情報(bào)的關(guān)系。數(shù)據(jù)科學(xué)(Data Science)術(shù)語(yǔ)及其定義由著名計(jì)算機(jī)科學(xué)家、圖靈獎(jiǎng)獲得者Peter Naur于1974年在其著作Concise Survey of Computer Methods中首次提出,他認(rèn)為數(shù)據(jù)科學(xué)是一門基于數(shù)據(jù)處理的科學(xué)[5]。吳丹教授研究團(tuán)隊(duì)通過(guò)對(duì)諸多文獻(xiàn)的梳理,認(rèn)為數(shù)據(jù)科學(xué)是一門具有跨學(xué)科屬性的科學(xué),其核心問(wèn)題是從數(shù)據(jù)中提取知識(shí)以獲得對(duì)問(wèn)題或現(xiàn)象的重要見(jiàn)解,涉及收集、管理、分析、呈現(xiàn)等大數(shù)據(jù)生命周期的理論、方法和技術(shù)[2]。數(shù)據(jù)科學(xué)與信息資源管理學(xué)科具有天然聯(lián)系,數(shù)據(jù)科學(xué)作為以研究數(shù)據(jù)為核心的新興學(xué)科,將其引入信息資源管理學(xué)科,將帶來(lái)全面深刻的影響,主要體現(xiàn)在信息資源管理學(xué)科研究對(duì)象的細(xì)化和深入、研究?jī)?nèi)容的擴(kuò)充、解決方案的優(yōu)化以及理論的變革與建構(gòu)[6]。
第三,數(shù)據(jù)科學(xué)學(xué)生需要掌握的能力與技能。數(shù)據(jù)科學(xué)專業(yè)旨在培養(yǎng)掌握具有大數(shù)據(jù)思維、運(yùn)用大數(shù)據(jù)思維及分析應(yīng)用技術(shù)的高層次大數(shù)據(jù)人才,從計(jì)算機(jī)理論、大數(shù)據(jù)處理技術(shù)和大數(shù)據(jù)應(yīng)用三個(gè)主要層面(即數(shù)據(jù)管理、系統(tǒng)開發(fā)、海量數(shù)據(jù)分析與挖掘)系統(tǒng)地培養(yǎng)學(xué)生[7]。王東波等發(fā)現(xiàn)數(shù)據(jù)分析、數(shù)據(jù)挖掘和處理能力等數(shù)據(jù)技能較為重要[8]。
此外,洪亮老師認(rèn)為我們需要進(jìn)一步思考如下問(wèn)題:①?gòu)膶W(xué)生視角應(yīng)該有哪些課程?從大數(shù)據(jù)專家角度認(rèn)為數(shù)據(jù)科學(xué)專業(yè)應(yīng)該開設(shè)哪些課程?從就業(yè)市場(chǎng)角度又需要哪些課程?②數(shù)據(jù)科學(xué)的內(nèi)涵是什么?數(shù)據(jù)科學(xué)與信息資源管理的關(guān)系是什么?③數(shù)據(jù)科學(xué)人才需要哪些技能?
針對(duì)現(xiàn)有研究的基礎(chǔ)和當(dāng)前的問(wèn)題,洪亮老師從碩博的數(shù)據(jù)科學(xué)專業(yè)培養(yǎng)方案制定方面發(fā)表了自己的觀點(diǎn)。培養(yǎng)方案的設(shè)計(jì)是專業(yè)人才培養(yǎng)的重點(diǎn),各個(gè)學(xué)校和專業(yè)的人才培養(yǎng)思路與課程方案設(shè)計(jì)均有所側(cè)重與差異,各具特色。洪亮教授認(rèn)為在制定數(shù)據(jù)科學(xué)人才培養(yǎng)方案時(shí),需要注意:①根據(jù)本學(xué)院的學(xué)科基礎(chǔ)制定培養(yǎng)方案;②在課程設(shè)計(jì)上需兼顧管理科學(xué)、計(jì)算機(jī)科學(xué)、大數(shù)據(jù)等學(xué)科領(lǐng)域的課程,形成基礎(chǔ)思維類、技術(shù)類、大數(shù)據(jù)類課程三足鼎立型培養(yǎng)體系;③由于數(shù)據(jù)科學(xué)專業(yè)的學(xué)生來(lái)自于計(jì)算機(jī)、信息資源管理等不同專業(yè)背景,因此課程設(shè)計(jì)還需要兼顧學(xué)生專業(yè)背景的差異性,既要為學(xué)生補(bǔ)充部分基礎(chǔ)性知識(shí),又需要根據(jù)實(shí)際情況定期動(dòng)態(tài)調(diào)整培養(yǎng)方案;④需要從學(xué)生、大數(shù)據(jù)專家、就業(yè)市場(chǎng)等多個(gè)視角進(jìn)行課程設(shè)計(jì)的考慮。
第一,數(shù)據(jù)科學(xué)就是管理數(shù)據(jù)的科學(xué),大數(shù)據(jù)時(shí)代需要數(shù)據(jù)科學(xué)。從宏觀層面來(lái)看,數(shù)據(jù)的采集、管理、治理(諸如國(guó)家、企業(yè)、互聯(lián)網(wǎng)的數(shù)據(jù)安全治理)都需要數(shù)據(jù)科學(xué);從微觀層面來(lái)看,數(shù)據(jù)質(zhì)量會(huì)影響機(jī)器學(xué)習(xí)模型,數(shù)據(jù)科學(xué)可探索數(shù)據(jù)質(zhì)量如何影響機(jī)器學(xué)習(xí)的性能等各個(gè)方面指標(biāo)。
第二,數(shù)據(jù)科學(xué)就是運(yùn)用數(shù)據(jù)的科學(xué),數(shù)據(jù)科學(xué)可面向不同領(lǐng)域,從數(shù)據(jù)中提煉、挖掘價(jià)值,這便涉及到其與情報(bào)學(xué)的關(guān)系。從這個(gè)角度來(lái)看,我們需要思考學(xué)生要具備一些怎樣的思維和技能才能幫助其處理數(shù)據(jù)。一方面,學(xué)生需要數(shù)據(jù)思維,具備數(shù)據(jù)采集、清洗、挖掘、分析、可視化等能力和技能。所謂數(shù)據(jù)思維,就是在解決問(wèn)題的過(guò)程中使用數(shù)據(jù)方法(也稱量化方法),通過(guò)可衡量、可評(píng)估的量化數(shù)據(jù)解決問(wèn)題[9]。大數(shù)據(jù)環(huán)境下數(shù)據(jù)科學(xué)的人才培養(yǎng)秉承多“源”異“構(gòu)”理念[10],要求利用多種本源學(xué)科,具備差異化知識(shí)結(jié)構(gòu),培養(yǎng)復(fù)合型人才。教學(xué)實(shí)踐表明,培養(yǎng)學(xué)生(本科生)的大數(shù)據(jù)技術(shù)能力并不難,在開源工具包的環(huán)境下,技術(shù)入門也較為容易;數(shù)據(jù)科學(xué)專業(yè)的學(xué)生也可以從事技術(shù)工作,因此我們不必有畏難情緒。另一方面,大數(shù)據(jù)環(huán)境下,學(xué)生不僅需要數(shù)據(jù)思維,還需要模型思維。相較于數(shù)據(jù)思維,模型思維更關(guān)注通過(guò)建模理解事物本身的規(guī)律。小理查茲?霍耶爾認(rèn)為,情報(bào)分析先由概念驅(qū)動(dòng),然后才是數(shù)據(jù)驅(qū)動(dòng),概念框架是解讀數(shù)據(jù)信息的基礎(chǔ)和依據(jù),這種概念框架可以被看成是一種容納了過(guò)去知識(shí)、當(dāng)前情況的思維模型[11]。雖然現(xiàn)階段數(shù)據(jù)思維即可解決很多問(wèn)題,但對(duì)于數(shù)據(jù)科學(xué)專業(yè)來(lái)說(shuō),模型思維同樣重要。例如傳染病傳播研究需要建模,只有理解了傳染病的傳播機(jī)制,才能更好地建模,而僅僅了解數(shù)據(jù)挖掘的方法和技術(shù)是無(wú)法完成這個(gè)任務(wù)的。因此大數(shù)據(jù)時(shí)代下需要數(shù)據(jù)思維與模型思維相結(jié)合,需要設(shè)置一些數(shù)據(jù)建模課程來(lái)培養(yǎng)學(xué)生的模型思維。
在大數(shù)據(jù)時(shí)代,科學(xué)研究逐漸向數(shù)據(jù)密集型轉(zhuǎn)變。一個(gè)直觀的感受便是論文越來(lái)越難發(fā),那么發(fā)論文為什么變難?科學(xué)研究正逐步向數(shù)據(jù)密集型驅(qū)動(dòng)的研究范式發(fā)展??蒲泄ぷ餍枰钥煽康臄?shù)據(jù)作為支撐,大數(shù)據(jù)量在科研中變得越來(lái)越重要。相比之前注重因果關(guān)系的理論型研究,數(shù)據(jù)密集型驅(qū)動(dòng)的研究范式因其在挖掘事物之間關(guān)聯(lián)關(guān)系方面的優(yōu)勢(shì)而成為當(dāng)前科學(xué)研究的主流。然而,以數(shù)據(jù)為基礎(chǔ)的科學(xué)研究需要更多的工作量,它需要經(jīng)過(guò)大數(shù)據(jù)的獲取、處理到分析的完整過(guò)程,這種工作的負(fù)擔(dān)導(dǎo)致了科研人員發(fā)論文變得更加困難??傊瑪?shù)據(jù)密集型驅(qū)動(dòng)的研究范式成為科學(xué)研究的主流后,所需要的工作量使得發(fā)表質(zhì)量高的科研論文變得更加具有挑戰(zhàn)性。
那么如何才能做出高價(jià)值的研究呢?鄧勝利教授認(rèn)為需要遵循“四個(gè)面向”和“三度”。具體而言,學(xué)者需要堅(jiān)持面向世界科技前沿、堅(jiān)持面向經(jīng)濟(jì)主戰(zhàn)場(chǎng)、堅(jiān)持面向國(guó)家重大需求、堅(jiān)持面向人民生命健康,真正著眼于國(guó)家所需,緊緊抓住時(shí)代切實(shí)問(wèn)題,從而做出高價(jià)值的研究。高價(jià)值的科學(xué)研究需要具備三個(gè)特征。①研究有高度。研究需與國(guó)家重大戰(zhàn)略息息相關(guān),比如圍繞數(shù)字經(jīng)濟(jì)、數(shù)字文化、國(guó)民健康等國(guó)家重大需求開展研究。2020 年,JASIS&T 期刊專家將健康危機(jī)事件切入到了信息危機(jī)事件,給我們后來(lái)的研究指引了方向,即研究需要著眼時(shí)代重大問(wèn)題。②研究有深度。目前高質(zhì)量期刊上刊發(fā)了很多跨學(xué)科的研究文章,這些文章一方面借助其他學(xué)科理論作為支撐,另一方面利用海量的數(shù)據(jù)揭示事物的表征、規(guī)律、行為機(jī)理,結(jié)論更可信、更科學(xué)。③研究有溫度。技術(shù)發(fā)展及其在各個(gè)領(lǐng)域的應(yīng)用也會(huì)帶來(lái)諸多負(fù)面效應(yīng)和社會(huì)問(wèn)題。當(dāng)前研究日益重視特定群體(如社交媒體用戶等)、邊緣人群(比如老年人、殘障人士、兒童等)在互聯(lián)網(wǎng)信息化時(shí)代的問(wèn)題,涉及對(duì)大數(shù)據(jù)殺熟、信息泄露等社會(huì)問(wèn)題的探究。我們不僅僅關(guān)注科技帶來(lái)的便利,還應(yīng)關(guān)注科技是否向善、是否具有積極的影響及其負(fù)面效應(yīng)。
毛進(jìn):對(duì)于數(shù)據(jù)科學(xué)專業(yè)的學(xué)生,知道如何使用公式、知道什么算法解決什么問(wèn)題比較重要,而了解算法公式本身的原理并不那么重要,對(duì)數(shù)學(xué)的掌握要求并不需要那么高。算法公式推導(dǎo)過(guò)程的難度與大學(xué)本科階段《高等數(shù)學(xué)》課程內(nèi)容的難度基本相當(dāng),若有同學(xué)對(duì)于算法鉆研感興趣,可以通過(guò)國(guó)內(nèi)外的慕課平臺(tái)進(jìn)行學(xué)習(xí)。簡(jiǎn)而言之,數(shù)據(jù)科學(xué)專業(yè)并不需要高深的數(shù)學(xué)知識(shí),同學(xué)們具有基礎(chǔ)的高等數(shù)學(xué)、線性代數(shù)與概率論知識(shí)即可,對(duì)于一些新興的技術(shù),確保會(huì)用,知道其是做什么即可。
曹高輝:對(duì)算法和公式等技術(shù)知識(shí)的學(xué)習(xí)與要求,更多體現(xiàn)在論文撰寫中的研究方法闡述部分,很多學(xué)生表示在數(shù)學(xué)公式的推導(dǎo)撰寫時(shí)比較困難。但是數(shù)據(jù)科學(xué)專業(yè)不應(yīng)該強(qiáng)調(diào)如何使用LDA等算法和公式,而是注重使用某種算法做什么事情、實(shí)現(xiàn)什么功能、得到什么結(jié)果以及如何揭示這個(gè)結(jié)果,這樣同學(xué)們的學(xué)習(xí)壓力就會(huì)小很多。
袁平鵬:每個(gè)學(xué)科具有自身的優(yōu)勢(shì)和特點(diǎn),每個(gè)學(xué)科做自己擅長(zhǎng)的事情即可。對(duì)于數(shù)據(jù)科學(xué)學(xué)科而言,我們不做改進(jìn)算法的事情,而是注重算法的使用,充分發(fā)揮其優(yōu)勢(shì)才能做出更好的研究。此外,很多在ACM等計(jì)算機(jī)類期刊上刊載的論文更關(guān)注想法和模型,而不是作者使用了什么編程語(yǔ)言等。數(shù)據(jù)科學(xué)學(xué)科的研究?jī)?nèi)容和信息資源管理有一定關(guān)系,比如我所在團(tuán)隊(duì)主要做三個(gè)方面的研究:①通過(guò)對(duì)文獻(xiàn)數(shù)據(jù)的抽取和清洗以獲取數(shù)據(jù)的不同特征,這與信息資源管理領(lǐng)域做的研究較為相似;②分析和處理數(shù)據(jù),涉及到圖情領(lǐng)域的數(shù)據(jù)庫(kù)、信息資源管理等問(wèn)題;③改進(jìn)算法、定義模型,模型性能要好、速度要快,研究?jī)?nèi)容要新。相較于計(jì)算機(jī)等學(xué)科領(lǐng)域的原始創(chuàng)新(方法和應(yīng)用都是新的),數(shù)據(jù)科學(xué)的研究側(cè)重于把方法用到新的領(lǐng)域,實(shí)現(xiàn)某種技術(shù)或方法的應(yīng)用創(chuàng)新,通過(guò)數(shù)據(jù)分析與挖掘,從而得到有價(jià)值的研究結(jié)論。
總之,數(shù)據(jù)科學(xué)專業(yè)更注重技術(shù)的使用而不是原理的掌握,注重技術(shù)的運(yùn)用而不是僅僅在技術(shù)方法上的創(chuàng)新,注重分析結(jié)果的揭示而不是分析過(guò)程的闡述,注重研究問(wèn)題本身的價(jià)值而不是采用技術(shù)的創(chuàng)新,注重研究問(wèn)題的解決而不是研究方法的改進(jìn)。
洪亮:數(shù)據(jù)科學(xué)專業(yè)設(shè)在信息資源管理領(lǐng)域,原因有兩個(gè):①數(shù)據(jù)科學(xué)可以支撐用數(shù)據(jù)的方法研究科學(xué),用數(shù)據(jù)分析方式為學(xué)科服務(wù)。這與信息資源管理領(lǐng)域用數(shù)據(jù)分析的方式做知識(shí)管理并為學(xué)科服務(wù)是類似的。②數(shù)據(jù)科學(xué)是用科學(xué)的方法去研究數(shù)據(jù),用數(shù)據(jù)發(fā)現(xiàn)與揭示現(xiàn)實(shí)生活中的規(guī)律,如通過(guò)在線社區(qū)的數(shù)據(jù)發(fā)現(xiàn)用戶行為的一些規(guī)律。這些與信息資源管理領(lǐng)域的研究是一脈相通的,在我們領(lǐng)域,學(xué)習(xí)一定的數(shù)據(jù)分析等技術(shù)能力也是比較容易實(shí)現(xiàn)的。因此,數(shù)據(jù)科學(xué)開設(shè)在信息資源管理領(lǐng)域是非常合適的。
此外,數(shù)據(jù)科學(xué)專業(yè)培養(yǎng)的更應(yīng)當(dāng)是數(shù)據(jù)科學(xué)家,是培養(yǎng)兼具行業(yè)領(lǐng)域問(wèn)題意識(shí)和計(jì)算機(jī)能力的人才,是具有學(xué)科交叉點(diǎn)的復(fù)合型人才,以達(dá)到“1+1>2”的效果。數(shù)據(jù)科學(xué)家與數(shù)據(jù)分析師的研究對(duì)象都是數(shù)據(jù),但也存在區(qū)別,數(shù)據(jù)科學(xué)家是從數(shù)據(jù)中發(fā)現(xiàn)未知的問(wèn)題并開展研究,而數(shù)據(jù)分析師是研究確定的問(wèn)題。此外,我們不能“拿著錘子找釘子”,切忌用技術(shù)導(dǎo)向貫穿學(xué)科研究,而是要以問(wèn)題導(dǎo)向指導(dǎo)科研。因此,數(shù)據(jù)科學(xué)家需要樹立正確的數(shù)據(jù)觀,認(rèn)識(shí)到研究的難度不取決于技術(shù)的難度,而是取決于所研究問(wèn)題的難度,即使需要對(duì)所用技術(shù)進(jìn)行一定的改進(jìn)和改良,但仍需以問(wèn)題為中心。
黃穎:信息資源管理學(xué)科本身就是一種交叉學(xué)科,融合了計(jì)算機(jī)等專業(yè)的知識(shí)。目前交叉學(xué)科研究領(lǐng)域主要研究有以下幾個(gè)方面:①定義好學(xué)科的基準(zhǔn)是什么?做好學(xué)科的分類,從而衡量研究的跨學(xué)科性。②交叉性與促進(jìn)團(tuán)隊(duì)合作的關(guān)系是什么?如物理學(xué)領(lǐng)域和情報(bào)學(xué)領(lǐng)域科研人員的合作與計(jì)算機(jī)領(lǐng)域和信管領(lǐng)域科研人員的合作肯定是不一樣的。這也從一個(gè)角度回答了為何數(shù)據(jù)科學(xué)專業(yè)開在信息資源管理學(xué)科下更合適。③如何培養(yǎng)交叉學(xué)科的人才?很多國(guó)家已然意識(shí)到交叉學(xué)科人才培養(yǎng)的重要性,但尚未提出可行的培養(yǎng)方案和落實(shí)措施。④多大程度上的學(xué)科交叉才是合適的?即對(duì)交叉學(xué)科的評(píng)價(jià)進(jìn)行研究,衡量交叉學(xué)科對(duì)創(chuàng)新的影響。我們不能為了跨學(xué)科而跨學(xué)科,需要研究學(xué)科跨度到多大才算合適,可以最大效益地激勵(lì)科研。
毛進(jìn):相較于數(shù)據(jù)科學(xué),數(shù)據(jù)治理側(cè)重于對(duì)數(shù)據(jù)進(jìn)行治理。國(guó)家層面關(guān)注用數(shù)據(jù)進(jìn)行社會(huì)治理;企業(yè)層面關(guān)注企業(yè)數(shù)據(jù)治理,比如對(duì)不同數(shù)據(jù)庫(kù)進(jìn)行規(guī)范融合。
鄧勝利:宏觀層面的數(shù)據(jù)治理,旨在建設(shè)數(shù)據(jù)治理體系、構(gòu)建數(shù)據(jù)治理模型。數(shù)據(jù)安全問(wèn)題日益凸顯,諸多數(shù)據(jù)問(wèn)題已經(jīng)演變成社會(huì)問(wèn)題,比如數(shù)據(jù)泄露、隱私安全、國(guó)家安全、大數(shù)據(jù)殺熟、算法殺熟等一系列的問(wèn)題。數(shù)據(jù)治理是針對(duì)宏觀層面數(shù)據(jù)的治理,如對(duì)國(guó)家、企業(yè)層面的數(shù)據(jù)治理,其目的不僅僅是確保數(shù)據(jù)的高效應(yīng)和實(shí)現(xiàn)企業(yè)價(jià)值,還是為了提升政府公共管理能力和國(guó)家治理能力,正如清華大學(xué)江小娟教授所言“數(shù)據(jù)治理需要體現(xiàn)社會(huì)價(jià)值,具有一定的社會(huì)屬性。”
洪亮:以研究問(wèn)題為導(dǎo)向,逐步學(xué)習(xí)涉及到的工具及方法,在解決一個(gè)一個(gè)問(wèn)題的過(guò)程中學(xué)習(xí)、培養(yǎng)發(fā)現(xiàn)問(wèn)題和解決問(wèn)題的能力,提升自身的科研水平。從學(xué)科發(fā)展來(lái)看,當(dāng)前數(shù)據(jù)驅(qū)動(dòng)的第四范式的研究已經(jīng)很成熟了。人、機(jī)、物深度的協(xié)同和交互式研究是第五范式,創(chuàng)新性的研究需要將機(jī)器、環(huán)境與人的協(xié)同考慮進(jìn)去。因此,大數(shù)據(jù)專業(yè)類學(xué)生需要努力成為復(fù)合型人才,既要掌握相關(guān)方法和技術(shù),也要有正確的數(shù)據(jù)觀,并圍繞自己的研究方向逐步拓寬視野。
黃穎:以自身的研究領(lǐng)域與方向?yàn)橹?,與其他專業(yè)的學(xué)者和學(xué)生合作,開展跨學(xué)科的研究;重點(diǎn)圍繞所解決的問(wèn)題,面向領(lǐng)域?qū)W科,提高研究立意,避免技術(shù)至上。
曹高輝:方法和技術(shù)的學(xué)習(xí)只是開展科學(xué)研究的一個(gè)方面,目前方法驅(qū)動(dòng)的論文已經(jīng)過(guò)了紅利期。學(xué)生在科研過(guò)程中應(yīng)該多看前沿的文章,多與計(jì)算機(jī)專業(yè)或其他專業(yè)的學(xué)者合作;關(guān)注方法的適用性(計(jì)算機(jī)方法并不能夠解決全部的問(wèn)題);加強(qiáng)對(duì)數(shù)據(jù)分析結(jié)果的解讀,計(jì)算機(jī)技術(shù)與方法生成的結(jié)果不能代表完全正確的觀點(diǎn)。
毛進(jìn):做科研需要做到“大處著眼,小處抓力”。“大處著眼”指科研需要圍繞“四個(gè)面向”,將自己的研究與四個(gè)面向結(jié)合。“小處抓力”指在研究過(guò)程中應(yīng)當(dāng)通過(guò)拆解問(wèn)題,得到最終的解決方案。
鄧勝利:學(xué)生做科研應(yīng)當(dāng)注意以下幾點(diǎn)。①提高問(wèn)題意識(shí)。在方法層出不窮的今天,學(xué)生需提高問(wèn)題意識(shí),多參加學(xué)術(shù)報(bào)告與學(xué)術(shù)會(huì)議,多讀最新的文獻(xiàn)資料,關(guān)注所開展的科學(xué)研究是否解決現(xiàn)實(shí)問(wèn)題。②選擇合適自己的方法。不必要刻意地追求花哨的方法與技術(shù),而是根據(jù)自己的興趣和能力,選擇適合自己的研究方法。③提高換位思考能力。從評(píng)審專家/審稿人的角度,閱讀自己撰寫的論文,從邏輯、研究?jī)r(jià)值、研究意義、是否提出創(chuàng)新性的研究問(wèn)題與是否符合“四個(gè)面向”等方面深入剖析自己的論文??傊?,數(shù)據(jù)科學(xué)類的科研需要樹立正確的數(shù)據(jù)觀,堅(jiān)持以問(wèn)題為導(dǎo)向,確定主要研究方向,選取合適研究方法,注重團(tuán)隊(duì)成員合作,加強(qiáng)跨學(xué)科交叉協(xié)作,學(xué)習(xí)高質(zhì)量期刊立意方向,緊緊圍繞“四個(gè)面向”,提高換位思考能力,做出具有實(shí)踐價(jià)值和理論意義的高質(zhì)量科研成果。