5.2.2政治宣言的人群編碼

編碼政治宣言,一些通常由專家完成的,可以通過產生更大的再現性和柔軟性的人計算項目來執行。

類似星系動物園,存在社會研究者要代碼,分類或標記的圖像或文本片段許多情況。這種研究的一個例子是政治宣言的編碼。在選舉中,政黨產生描述他們的政策立場和指導哲學宣言。例如,這裡是一片工黨在英國從2010年的宣言:

“數以百萬計的人在我們的公共服務工作體現英國的最佳值,從而有助於使人們充分利用他們自己的生活,同時保護他們免受他們不應該承擔自己的風險。正如我們需要有關政府在使市場公平工作中的作用更大膽,我們還需要政府的大膽改革。“

這些宣言包含政治學家有價值的數據,特別是研究選舉和政策辯論的動態。為了系統地提取這些信息的宣言,研究人員創建了該宣言項目 ,其中有組織的政治科學家從近1000方在50個國家代碼4000的宣言。在每個宣言每個句子已使用56類方案的專家進行編碼。這一合作努力的結果是一個巨大的數據集,總結嵌入在這些宣言的信息,此數據集已在200多篇科學論文被使用。

肯尼斯·貝努瓦和他的同事(2015)決定把此前已通過專家執行的宣言編碼任務,並把它變成一個人的計算項目。其結果是,他們創造的編碼處理是更可再現的和更靈活的,更不用說更便宜和更快。

同期間,最近在英國6選舉產生的18宣言的工作中,Benoit和他的同事使用的拆分申請,結合了來自微任務勞動力市場的勞動者策略(亞馬遜的Mechanical Turk和CrowdFlower有微任務勞動力市場的例子;有關詳細微任務的勞動力市場,見第四章)。研究人員把每一個宣言,並將其分割成句子。接著,人的評級被施加到每個句子。特別是,如果這句話涉及政策聲明,它是沿著兩個維度編碼:經濟(從最左到最右側)和社會(從自由派到保守派)(圖5.5)。每個句子是由約5不同的人編碼。最後,這些評級被使用的佔為個人評價者效果和句子效果難以統計模型相結合 。在所有中,Benoit和他的同事收集了約1500工人20萬的收視率。

圖5.5:從伯努瓦等編碼方案。 (2015)(圖1)。

圖5.5:從編碼方案Benoit et al. (2015)圖1)。

為了評估人群編碼的質量中,Benoit和他的同事還對10名專家,教授和研究生政治學率用類似方法相同的宣言。儘管從人群成員的收視率比專家的收視率更變的共識人群評級曾與共識專家評價(圖5.6),顯著的協議。這一比較顯示,與星系動物園,人類的計算項目可以生產出高品質的結果。

圖5.6:專家估計(X軸)和人群估計數(Y軸)的編碼從英國18黨宣言時(伯努瓦等人2015年)均顯著一致。編碼的宣言來自三個政黨(保守黨,工黨,自由民主黨)和六個選舉(1987年,1992年,1997年,2001年,2005年,2010年)。

圖5.6:專家估計(X軸)和人群估計數(Y軸)的編碼從英國18黨的宣言時,均顯著協議(Benoit et al. 2015) 。編碼的宣言來自三個政黨(保守黨,工黨,自由民主黨)和六個選舉(1987年,1992年,1997年,2001年,2005年,2010年)。

這個結果的基礎上,貝努瓦和同事們用他們的人群編碼系統做研究,與宣言項目是不可能的。例如,宣言項目沒有移民的話題,因為當編碼方案在80年代中期被開發,這不是一個突出的話題編寫的宣言。並且,在這一點上,它是後勤不可行的宣言項目回去重新編碼其宣言來捕獲該信息。因此,這樣看來,對研究移民的政治研究者的運氣。然而,伯努瓦和他的同事們能夠利用自己的人腦運算系統來做到這一點的編碼定制自己的研究問題,迅速和容易。

為了研究移民政策,他們的編碼宣言8個締約方在2010年大選在英國。在每個宣言每個句子被編碼為它是否涉及移民,如果是這樣,無論是親移民,中性或反移民。在5小時內推出自己的項目,結果。他們已經為$ 360總成本收集超過22000的反應。此外,從人群的測算結果顯示有專家早期的調查顯著的協議。然後,作為最終的測試,兩個月後,研究者再現他們的人群編碼。在幾個小時內,他們已經創造了一個新的人群編碼的數據集緊密匹配其原始人群編碼的數據集。換句話說,人類計算使他們能夠產生與專家評估一致並且是可重複的政治文本的編碼。此外,由於人類的計算是快,價格便宜,很容易為他們定制自己的數據收集到關於移民其具體的研究問題。