清研智庫 | 大數據時代定量社會研究方法的革新與挑戰
大數據時代的到來不但深刻影響了人們對社會世界的認識,而且也為定量社會研究方法的革新提供了極大可能性。社會學研究通過與大數據的創新結合,將有可能重塑傳統社會學定量研究的范式,開拓新的研究領域與方向。
大數據帶來定量社會研究方法革新
隨著現代信息技術的發展,我們已進入“數字時代”。大數據的出現和廣泛使用正深刻改變著傳統的社會研究,給定量研究方法的發展與革新帶來了顯著影響。
第一,大數據讓我們對社會研究數據有了全新認識。社會學研究長期以來受實證主義方法論影響,非常重視定量數據資料,而傳統的定量數據主要是基于個體樣本的調查數據。這類結構化數據雖然在代表性大樣本條件下具有推論性和解釋性,但因受調查研究條件等因素的影響,樣本規模總是有局限性。而大數據的出現完全改變了數據的性質,讓我們對社會研究的數據有了全新認識。
所謂“大數據”,通常與云計算相關,是以海量數字為計量的以非結構化和半結構化為主要形式的數據,其主要特征包括數據量極大、數據類型多樣、時效性高、應用價值廣泛等。馬修·薩爾加尼克在《計算社會學》中指出,大數據有利于社會研究的突出特征是海量性、持續性和不反應性。這些特征都是傳統定量數據所不具備的。以往社會研究即使有足夠多的大樣本,但在數量上也是很有限的。而利用大數據可輕易獲取幾十萬甚至更多分析對象的數據信息。正如薩爾加尼克所說:“不斷增加的海量大數據意味著我們已經從一個缺乏行為數據的世界進入一個行為數據極其豐富的世界。”

第二,大數據拓展了社會研究數據獲取途徑。傳統定量社會研究數據主要依靠問卷調查或實驗研究等專門法獲取,方式有限且受多種研究條件的制約。進入大數據時代,我們獲取數據的途徑大大拓展。目前社會大數據存在于社會活動的各個領域,專門開發大數據的機構也越來越多,數據存儲、挖掘和開發技術也在不斷進步。這為我們獲取和利用大數據提供了極大便利。
在大數據時代開展社會研究遇到的難題,已經不同于傳統社會研究常常受困于數據獲取,越來越多的研究者感到數據或信息太多,面臨難以取舍的問題。
第三,大數據極大地發展了定量研究方法。近幾十年來定量社會研究方法雖然不斷發展進步,但總是存在一定的局限性。隨著現代計算機技術和“云計算”的快速發展,分析方法和技術不斷更新,從而極大地豐富和發展了定量社會研究方法。比如,基于互聯網、物聯網的數據挖掘與分析技術已有廣泛應用。因此,在新的計算技術和方法基礎上的社會科學研究,已在數據處理與分析方式上發生了重大變化,新的計算社會學與傳統的定量社會學存在非常大的不同。也可以說,大數據及相關新技術的發展與社會科學研究的結合,形成了具有學科交叉性的計算社會科學,這為定量社會研究方法的創新提供了方向和可能性。
合理運用大數據促進社會研究方法的整合與創新
大數據的出現既為定量社會研究帶來了前所未有的機遇,同時也帶來了極大變革與挑戰。有的學者甚至把與大數據相關的計算社會科學的興起稱為社會研究的一次“范式革命”。與此同時,這一發展也引起了學術界關于大數據的激烈爭論,出現了一些相對立的觀點。其實自從實證主義發展以來,關于定量研究與定性研究之間的爭論就沒有停止過,目前有關大數據之爭是其新的表現形式。當然,我們已邁入數字化新時代,因此需要對相關問題形成新的認識。
首先,社會研究應以開放和積極的態度對待大數據。當前我們已進入數字化的信息社會階段,各領域信息的數字化已成為普遍的發展趨勢,這就需要社會研究以更開放和積極的態度去對待大數據。從這個意義上說,掌握了數據也就有了“發言權”。定量社會研究離不開數據,更離不開大數據。當然,大數據既具有利于社會研究的性質,也有不利于研究的方面。比如,薩爾加尼克指出其不利性包括數據的不完整性、難以獲取、不具代表性、算法問題、“臟數據”及敏感性等。
盡管大數據及其應用存在一定問題,但這不足以影響當前社會科學研究對大數據的關注與使用。維克托·邁爾-舍恩伯格和肯尼斯·庫克耶在《大數據時代:生活、工作與思維的大變革》中指出:“大數據時代將要釋放出的巨大價值使得我們選擇大數據的理念和方法不再是一種權衡,而是通往未來的必然改變。”這就要求我們重視大數據,以開放和專門化的方式接受和利用大數據。

其次,社會研究還需以合理的方式利用大數據。利用大數據,不但要加深對其的認識,同時在實際研究思路與設計上也需革新,注意處理好如下兩方面關系。
一是處理好社會研究的目的與工具之間的關系。傳統社會學定量研究的基本程序是預先提出研究假設,按照自己設計的研究框架收集定量數據資料進行分析。這種演繹式的研究邏輯主要是“理論導向型”的。而新的以大數據為主的社會研究邏輯看起來是“數據驅動型”的,即這種研究所依賴的大數據不是研究者按照事先設計的方法獲取的,而是從其他途徑直接獲取的。由此,有學者指出大數據未必能夠符合研究者的研究目的,甚至僅限于數據本身做分析會有很大局限性;或者存在“現實生活被裁剪”“社會情境被忽視”、社會研究的主體性缺失等問題。盡管有可能存在類似問題,但是我們也應從研究需求出發,注重對數據的甄別選擇與利用。我們需要重視大數據利用,但不能完全陷于大數據之中。
二是處理好傳統定量社會研究與大數據方法之間的關系。近年來社會學在研究范式上出現了一些新的變化趨勢,研究方法的整合創新已成為重要發展方向。立足于中國社會學的發展創新,正如陳云松在《當代社會學定量研究的宏觀轉向》一文中所指出的,基于大數據的“宏觀定量社會學”處于當代中國社會學研究轉向的前列,對拓展學科疆域和構建中國特色社會學話語體系具有重要意義。
由大數據帶來的這一定量社會學研究轉向正在匯成一股強大潮流,不但沖擊了傳統社會學的研究方式,而且通過研究方法的融合創新正在重塑定量社會研究的范式,從而為社會學研究開辟新的研究領域和方向。因此,我們需要重視大數據開發和利用,通過研究方法的整合創新,促進中國社會學不斷發展。
作者:林聚任 山東大學社會學系
來源:中國社會科學網