隨著信息技術(shù)迅猛發(fā)展,新型信息分析技術(shù)被應(yīng)用到政治學(xué)研究中來。許多政治學(xué)研究者采用當(dāng)前比較成熟的大數(shù)據(jù)爬取、大數(shù)據(jù)文本分析等技術(shù),獲取新的研究素材并進(jìn)行分析整理。同時(shí),以億萬(wàn)為量級(jí)單位的大數(shù)據(jù)本身就具有政治學(xué)研究?jī)r(jià)值??梢哉f,大數(shù)據(jù)為政治學(xué)帶來研究方法上的創(chuàng)新,也進(jìn)一步拓展了政治學(xué)研究領(lǐng)域。
基于大數(shù)據(jù)對(duì)網(wǎng)絡(luò)民意進(jìn)行研究。網(wǎng)絡(luò)上有許多現(xiàn)成數(shù)據(jù)可以用于對(duì)網(wǎng)絡(luò)民意和政府部門回應(yīng)進(jìn)行研究。一些政治學(xué)研究者常把兩類網(wǎng)絡(luò)大數(shù)據(jù)用作分析素材:一類是政府網(wǎng)絡(luò)問政平臺(tái)上的群眾留言及相關(guān)部門回復(fù)信息,另一類是主流媒體網(wǎng)站以及微博、微信等社交媒體平臺(tái)上的網(wǎng)民發(fā)帖信息。這些數(shù)據(jù)都可通過數(shù)據(jù)爬取技術(shù)直接獲取。第一類數(shù)據(jù)經(jīng)過分析處理后,可以反映群眾關(guān)注的議題類型分布、政府相關(guān)部門回應(yīng)的特點(diǎn)和問題解決程度。還可以進(jìn)一步分析特定類型群體在什么時(shí)期大致提出哪些類型的訴求。第二類數(shù)據(jù)主要用于分析網(wǎng)民對(duì)某一具體事件的看法和態(tài)度。對(duì)微博等社交媒體的數(shù)據(jù)分析,不僅關(guān)注具體話題,還將話題和情感、偏好等因素分析相結(jié)合,呈現(xiàn)網(wǎng)絡(luò)民意對(duì)某個(gè)具體事件的態(tài)度演變過程及影響網(wǎng)絡(luò)民意變化的具體因素??梢哉f,網(wǎng)絡(luò)大數(shù)據(jù)的應(yīng)用極大豐富了政治學(xué)對(duì)網(wǎng)絡(luò)民意的研究方式。
對(duì)文本轉(zhuǎn)換后的大數(shù)據(jù)進(jìn)行分析。在網(wǎng)絡(luò)大數(shù)據(jù)之后,研究者嘗試挖掘其他非現(xiàn)成的、更具獨(dú)特性的大數(shù)據(jù)信息。這類信息主要有兩種,一種是從公開平臺(tái)獲取的大數(shù)據(jù)文本。這類數(shù)據(jù)通過數(shù)據(jù)爬取技術(shù)獲得,但發(fā)布這些數(shù)據(jù)的平臺(tái)并非人人皆知,需要研究者去搜尋。目前,政治學(xué)研究者較多關(guān)注并取得研究進(jìn)展的大數(shù)據(jù)主要有:從裁判文書網(wǎng)獲取的司法大數(shù)據(jù),從人大代表的議案建議庫(kù)和政協(xié)委員的提案庫(kù)中獲得的文本大數(shù)據(jù)等。隨著政府信息公開力度加大,這類可供研究的信息資源會(huì)越來越豐富。另一種數(shù)據(jù)需要先進(jìn)行文本轉(zhuǎn)換才可使用,如對(duì)歷史資料的研究。相當(dāng)數(shù)量的歷史資料是以圖片形式而非文本形式存在的,這就需要通過識(shí)別技術(shù)將圖片信息轉(zhuǎn)換為文字文本,然后進(jìn)行大數(shù)據(jù)分析。這類數(shù)據(jù)的獲取難度較高,不過一旦形成數(shù)據(jù)庫(kù),對(duì)政治學(xué)研究則有較大幫助。
大數(shù)據(jù)為政治學(xué)提供新的研究素材和分析技術(shù),但并未改變政治學(xué)研究的本質(zhì)。面對(duì)層出不窮的新素材和新工具,政治學(xué)研究者需要保持清醒頭腦,不能陷入對(duì)數(shù)據(jù)和方法的盲目追求中。同時(shí),應(yīng)結(jié)合政治學(xué)研究本身的特點(diǎn),發(fā)揮大數(shù)據(jù)技術(shù)優(yōu)勢(shì),推動(dòng)信息技術(shù)在政治學(xué)研究應(yīng)用中取得更多突破。一是開發(fā)更多樣化的大數(shù)據(jù)類型。目前,政治學(xué)研究分析的大多是文本形式的大數(shù)據(jù)。文本信息只是浩瀚信息世界中的一種,還有圖片、音頻、視頻等大量信息類型有待開發(fā)利用。這些類型的大數(shù)據(jù)有的在商業(yè)領(lǐng)域已有較成熟的應(yīng)用,研究者可考慮以合適方式將其應(yīng)用于政治學(xué)研究。二是探索更前沿的大數(shù)據(jù)分析技術(shù)?,F(xiàn)有的分析技術(shù)還離不開人工標(biāo)注,需要政治學(xué)研究者從大數(shù)據(jù)中抽出很小一部分,對(duì)這部分?jǐn)?shù)據(jù)進(jìn)行人工閱讀和標(biāo)注,然后利用機(jī)器學(xué)習(xí)的方法,讓計(jì)算機(jī)基于人工標(biāo)注的數(shù)據(jù)去分析剩下的大量數(shù)據(jù),嘗試得出相應(yīng)結(jié)論。由于人工標(biāo)注的數(shù)量不等,分析的效果也參差不齊。在文本挖掘上,需要進(jìn)一步開發(fā)更先進(jìn)的技術(shù)。三是實(shí)現(xiàn)更復(fù)雜的大數(shù)據(jù)分析目標(biāo)。現(xiàn)有的大數(shù)據(jù)分析主要是對(duì)數(shù)據(jù)所體現(xiàn)的政治現(xiàn)象進(jìn)行描述,尚未具備解釋政治現(xiàn)象、發(fā)現(xiàn)運(yùn)行規(guī)律以及進(jìn)行預(yù)測(cè)的功能,這需要更進(jìn)一步的技術(shù)支持和研究突破。從這個(gè)角度看,大數(shù)據(jù)的開發(fā)利用在政治學(xué)研究領(lǐng)域還有更為廣闊的發(fā)展前景。
(作者為中山大學(xué)政治與公共事務(wù)管理學(xué)院教授)