摘 要:和傳統(tǒng)數(shù)據(jù)相比較,大數(shù)據(jù)挖掘和分析技術(shù)在各方面都有著很大的不同,具體主要表現(xiàn)在規(guī)模、質(zhì)量、類型以及邏輯等,在這樣的背景下,社會(huì)研究學(xué)在迎來更光明的前景同時(shí),也迎來了更為嚴(yán)峻的挑戰(zhàn)。其光明的發(fā)展前景主要表現(xiàn)在大數(shù)據(jù)能夠給更多社會(huì)現(xiàn)象的探索創(chuàng)造相應(yīng)的可能性,所以有很大概率可以出現(xiàn)暫新的社會(huì)學(xué)分支學(xué)科,這樣便能夠在社會(huì)現(xiàn)象的描述、社會(huì)發(fā)展規(guī)律的認(rèn)識(shí)以及后續(xù)社會(huì)發(fā)展的趨勢上創(chuàng)造了更多機(jī)遇。而大數(shù)據(jù)時(shí)代背景下社會(huì)學(xué)研究所面臨的挑戰(zhàn)主要有以下幾個(gè)方面:樣本偏差、相關(guān)公共數(shù)據(jù)整合困難等。本文主要對大數(shù)據(jù)時(shí)代社會(huì)學(xué)研究的機(jī)遇和挑戰(zhàn)進(jìn)行分析和探討。
關(guān)鍵詞:大數(shù)據(jù);社會(huì)研究學(xué);機(jī)遇與挑戰(zhàn)
引言:近些年來,我國信息技術(shù)、計(jì)算機(jī)技術(shù)以及互聯(lián)網(wǎng)技術(shù)發(fā)展的速度一直在不斷地加快,伴隨著各種高新技術(shù)的快速發(fā)展,人們也逐漸步入到了大數(shù)據(jù)時(shí)代。在這樣的背景下,許多國內(nèi)和國外的相關(guān)科學(xué)家分析和探討了大數(shù)據(jù)給人們生活帶來的改變以及其后續(xù)的發(fā)展趨勢。
1.大數(shù)據(jù)時(shí)代社會(huì)學(xué)研究的機(jī)遇
大數(shù)據(jù)時(shí)代所具有的海量信息數(shù)據(jù)和分析方法為社會(huì)學(xué)的發(fā)展帶了更加光明的前景,其在以下幾個(gè)方面都能夠促進(jìn)社會(huì)學(xué)學(xué)科獲得更進(jìn)一步的發(fā)展。
首先,大數(shù)據(jù)時(shí)代在未知社會(huì)現(xiàn)象的探索上創(chuàng)造了更多的可能性,所以會(huì)有很大概率衍生出嶄新的社會(huì)學(xué)分支學(xué)科。根據(jù)社會(huì)學(xué)研究的主要目標(biāo)對其進(jìn)行劃分能夠分為以下幾個(gè)方面:探索性研究、描述性研究以及解釋性研究。社會(huì)學(xué)研究基本上都是對相應(yīng)一體的探究,從而對該議題有一個(gè)相應(yīng)的認(rèn)識(shí),能夠?qū)π碌纳鐣?huì)現(xiàn)象有一個(gè)相應(yīng)的了解。探索性研究的主要目的為以下幾個(gè)方面:滿足相關(guān)研究人員的好奇心和對事物了解的欲望;評價(jià)一個(gè)議題的可行性;探討對其開展后續(xù)研究過程中的有效方法。大數(shù)據(jù)時(shí)代下,相關(guān)的社會(huì)學(xué)研究人員能夠獲得更多的社會(huì)數(shù)據(jù)以及信息,通過對所獲取信息的深入探索,便能夠更進(jìn)一步地了解人類社會(huì)的復(fù)雜行為模式。
1.1 在社會(huì)現(xiàn)象的全面描述、社會(huì)發(fā)展規(guī)律的更進(jìn)一步認(rèn)識(shí)以及后續(xù)社會(huì)發(fā)展趨勢的研究方面創(chuàng)造了更好的機(jī)會(huì)。描述性研究具體來說就是相關(guān)的社會(huì)學(xué)研究人員將自身所觀察和感知到的社會(huì)事物加以描述,準(zhǔn)確地表達(dá)出社會(huì)的現(xiàn)象以及社會(huì)的特征。對于傳統(tǒng)的社會(huì)學(xué)定量來說,其所開展的研究工作主要是對社會(huì)相應(yīng)的現(xiàn)象在研究總體當(dāng)中表現(xiàn)出的情況進(jìn)行調(diào)查和研究,并且從相應(yīng)的抽樣框當(dāng)中抽取樣本,利用描述或者是統(tǒng)計(jì)等相應(yīng)的手段,來獲取樣本當(dāng)中各個(gè)變量之間所存在的相應(yīng)聯(lián)系,將其作為主要的依據(jù)來進(jìn)一步判斷出變量的整體之間所存在的狀況。而在當(dāng)下的大數(shù)據(jù)背景下,和傳統(tǒng)研究之間所存在的不同之處就是不涉及到傳統(tǒng)社會(huì)學(xué)定量研究當(dāng)中的隨機(jī)抽樣,而是直接將研究的總體規(guī)劃到相應(yīng)的分析框架當(dāng)中,利用這樣的方式所得出的變量關(guān)系便不需要進(jìn)行任何的檢驗(yàn)工作,其可以直接將總體之中變量的情況有效地反映出來。換句話來說,大數(shù)據(jù)下的樣本數(shù)更加接近總體,這便為社會(huì)現(xiàn)象的系統(tǒng)化以及全面性的描述創(chuàng)造了更多的可能。
1.2 大數(shù)據(jù)背景下,公共政策和社會(huì)政策的制定以及完善方面也獲得了相應(yīng)的數(shù)據(jù)基礎(chǔ)。并且大數(shù)據(jù)在現(xiàn)代化的國家治理能力、智能化城市以及政府的建立方面戰(zhàn)略的實(shí)施上帶來了更有效的數(shù)據(jù)支撐以及決策依據(jù)。社會(huì)學(xué)的重要使命主要在于對當(dāng)前階段國家戰(zhàn)略的實(shí)施以及完善方面提供相應(yīng)的力量和支持。大數(shù)據(jù)為相關(guān)的社會(huì)學(xué)研究人員提供了海量的有關(guān)社會(huì)各方面的動(dòng)態(tài)數(shù)據(jù),將這些數(shù)據(jù)作為主要的依據(jù),便能夠?yàn)閲抑卫砟芰ㄔO(shè)以及智能型城市與智能型政府建設(shè)評估方面的科學(xué)性提供有效的保障。
2.大數(shù)據(jù)時(shí)代社會(huì)學(xué)研究面臨的挑戰(zhàn)
在當(dāng)前企業(yè)、政府以及社會(huì)各界迎來大數(shù)據(jù)時(shí)代的背景下,對其開展更為深入和理性地探索和研究具有非常重要的意義。當(dāng)前,怎樣能夠有效地突破社會(huì)學(xué)方法論以及所采用的研究方法方面的問題還是社會(huì)科學(xué)家所密切關(guān)注的話題。因此,大數(shù)據(jù)時(shí)代背景下,社會(huì)學(xué)科的發(fā)展在迎來更光明的前景同時(shí),也迎來了較為嚴(yán)峻的挑戰(zhàn)。
2.1 樣本偏差問題
和傳統(tǒng)的社會(huì)學(xué)定量分析做比較,大數(shù)據(jù)的樣本在數(shù)量方面和總體之間的距離更小,但是所謂的總體還是具有相應(yīng)的偏差性和局限性。在相關(guān)社會(huì)學(xué)研究者實(shí)際開展研究的過程中,通常都是將一個(gè)或者是幾個(gè)門戶網(wǎng)站后臺(tái)所具有的相關(guān)數(shù)據(jù)作為主要的分析資料,實(shí)際上此種大數(shù)據(jù)單單是對此網(wǎng)站進(jìn)行應(yīng)用的用戶數(shù)據(jù),所以對其所開展的分析和探索結(jié)果和其他網(wǎng)民之間的聯(lián)系并不大,所以將其推論全民缺乏合理性。所以,相關(guān)的社會(huì)學(xué)研究人員一定要意識(shí)到大數(shù)據(jù)總體的局限性和偏差性,對于不能夠應(yīng)用大數(shù)據(jù)而抓取的個(gè)體便不能夠?qū)⑵渲苯右暈檠芯繉ο蠖鴮⑵湟?guī)劃到總體當(dāng)中。所以,相關(guān)研究結(jié)論的推論只有其包含在總體當(dāng)中才能夠保證其有效性以及可靠性;另外,互聯(lián)網(wǎng)網(wǎng)民的個(gè)人活躍度之間有很大的不同,并且其活動(dòng)以及活動(dòng)痕跡被抓取的概率也不一樣,所以說互相網(wǎng)大數(shù)據(jù)的形成并不是抽樣或者是隨機(jī),其存在著相應(yīng)的偶然性。
2.2 重要變量的缺失問題
雖然在網(wǎng)站后臺(tái)數(shù)據(jù)能夠獲取相關(guān)網(wǎng)民的有關(guān)信息,比如其姓名、性別以及年齡。但是這些所自我填報(bào)的信息很可能會(huì)存在相應(yīng)的虛假成分?;ヂ?lián)網(wǎng)和現(xiàn)實(shí)之間存在的一個(gè)非常重要的特征就是互聯(lián)網(wǎng)具備較強(qiáng)的虛擬性。對于網(wǎng)絡(luò)世界來說,網(wǎng)民身份的可靠性是不能夠得到保證的。而開展社會(huì)學(xué)定量分析工作,如果其中的關(guān)鍵信息不夠真實(shí),那么最終所獲取的結(jié)果的可靠性也是空談。
2.3 相關(guān)關(guān)系解釋性不強(qiáng)
依據(jù)相關(guān)關(guān)系分析之后所獲取的結(jié)論,其在解釋性研究當(dāng)中所具有的效度并不高。存在很大一部分的大數(shù)據(jù)統(tǒng)計(jì)分析都為相關(guān)關(guān)系而并非因果關(guān)系。相關(guān)的統(tǒng)計(jì)學(xué)者或多或少都會(huì)了解到,相關(guān)的數(shù)據(jù)樣本在達(dá)到一定程度之后,即使是本來沒有任何聯(lián)系的兩個(gè)變量都很有可能產(chǎn)生較為密切的關(guān)聯(lián)。因此在控制變量的應(yīng)用上還存在相應(yīng)的不足,當(dāng)前的大數(shù)據(jù)社會(huì)學(xué)統(tǒng)計(jì)分析在高級統(tǒng)計(jì)模型的因果分析成果上還沒有給予正式地應(yīng)用。從實(shí)際上來說,除了相關(guān)關(guān)系分析之外,還存在著較多的因果模型同樣能夠在解釋性研究當(dāng)中發(fā)揮著非常重要的作用,比如中介模型、多元回歸模型以及曲線模型等。
2.4 大數(shù)據(jù)的整合方面存在相應(yīng)的困難
雖然當(dāng)下公共數(shù)據(jù)的開放以及共享成為了一種非常重要的趨勢,但是實(shí)際上的互聯(lián)網(wǎng)門戶網(wǎng)站以及相應(yīng)的互聯(lián)網(wǎng)公司開放的數(shù)據(jù)還是存在一定的粗放性以及有限性,存在許多的數(shù)據(jù)都是相關(guān)的研究工作人員直接在網(wǎng)絡(luò)上所抓取的沒有經(jīng)過加工和處理的原始數(shù)據(jù)。這種現(xiàn)狀的存在除了會(huì)導(dǎo)致出現(xiàn)數(shù)據(jù)資源浪費(fèi)的情況之外,還很有可能導(dǎo)致對同類數(shù)據(jù)的反復(fù)挖掘以及分析,這在大數(shù)據(jù)整合方面增加了相應(yīng)的難度。
結(jié)束語:總的來說,在當(dāng)前大數(shù)據(jù)時(shí)代引起相關(guān)領(lǐng)域變革的過程中,相關(guān)的社會(huì)學(xué)研究者還需要在大數(shù)據(jù)技術(shù)在社會(huì)學(xué)研究方面所造成的影響進(jìn)行更加深入的探索和研究,改變傳統(tǒng)的社會(huì)學(xué)研究內(nèi)容以及所采用的方式,使社會(huì)學(xué)認(rèn)識(shí)論以及方法論獲得更進(jìn)一步的突破與發(fā)展。
參考文獻(xiàn):
[1]楊大威. 大數(shù)據(jù)時(shí)代社會(huì)學(xué)研究的機(jī)遇和挑戰(zhàn)[J]. 黑龍江社會(huì)科學(xué),2019(01):158-159.
[2]楊茗. 大數(shù)據(jù)時(shí)代社會(huì)學(xué)研究的機(jī)遇和挑戰(zhàn)——評《社會(huì)學(xué)概論》[J]. 新聞愛好者,2019(09):110.
[3]張文宏. 大數(shù)據(jù)時(shí)代社會(huì)學(xué)研究的機(jī)遇和挑戰(zhàn)[J]. 社會(huì)科學(xué)輯刊,2018(04):89-94.
[4]趙超越. 本體性意義與學(xué)科反思:大數(shù)據(jù)時(shí)代社會(huì)學(xué)研究的回應(yīng)[J]. 社會(huì)科學(xué)文摘,2019,(07):62-64.
作者簡介:
鄒偉(1983-)男,籍貫:湖南株洲,學(xué)歷:本科,職稱:講師,研究方向:社會(huì)學(xué)結(jié)合計(jì)算機(jī)。