3.4.2非概率樣本:權重

與非概率的樣品,權重可以撤消引起的假定採樣過程的扭曲。

在研究人員從概率的樣品重量的反應相同的方式,他們還可以加權來自非概率的樣品的響應。例如,作為替代的CPS,假設您放置在數以千計的網站橫幅廣告招募參與者估計失業率的調查。當然,你會懷疑你的樣品的平均簡單將失業率的一個很好的估計。你懷疑可能是因為你認為一些人更容易完成的調查比其他人。例如,誰不花大量的時間在網絡上的人是不太可能完成的調查。

正如我們在上一節中所看到的,但是,如果我們知道怎麼樣選擇,因為我們做的概率樣本,那麼我們就可以撤銷由採樣過程中的扭曲。不幸的是,與非概率樣品時,我們不知道如何選擇的樣本。但是,我們可以對採樣過程假設,然後以相同的方式應用的加權。如果這些假設是正確的,那麼權重將撤消由採樣過程中的扭曲。

例如,假設在響應您的橫幅廣告,你招募10萬的受訪者。但是,你不相信,這些10萬受訪者的美國成年人簡單隨機樣本。事實上,當你比較的受訪者對美國的人口,你會發現一些州(如紐約)的人的比例過大以及人們從一些國家(例如,阿拉斯加)的代表性不足。因此,樣品的失業率很可能是在目標人群失業率的糟糕的估計。

撤消,在採樣過程中發生的失真的一種方法是分配權重給每個人;較低的權重,以人的狀態樣品(如紐約)和較高的權重,以人民在超限額從樣品(例如,阿拉斯加)在低於限額的國家。更具體地,對於每個受訪重量與他們患病相對樣品中它們在美國人群患病。這種加權過程稱為後分層 ,並在羅德島的受訪者分別給予體重低於加州受訪者體重的想法應該提醒你的例子在第3.4.1節。事後分層要求您知道足以把你的受訪者為組,並了解目標人群的每一組中的比例。

雖然概率的樣品和非概率樣本的加權是相同的數學(見技術附件),它們在不同的情況下工作得很好。如果研究者擁有完善的概率抽樣(即,沒有覆蓋的錯誤和沒有非響應),那麼權重將產生在所有情況下的所有特徵的無偏估計。這種強大的理論保證是為什麼概率樣本的倡導者發現他們如此大的吸引力。另一方面,加權非概率的樣品將僅產生用於所有性狀無偏估計,如果響應傾向是為大家各組中的相同。換句話說,回想起我們的例子中,採用分層後會產生無偏估計如果每個人都在紐約參加了,每個人都在阿拉斯加有參與等方面的相同的概率的概率相同。這種假設被稱為均質響應傾向-組內的假設,和它在明知起著關鍵的作用,如果分層後會與非概率樣品很好地工作。

不幸的是,在我們的例子中,均質響應傾向,組內的假設似乎不太可能是真的。也就是說,這似乎不太可能,每個人都在阿拉斯加擁有在您的調查是相同的概率。但是,有要記住關於分層後三個重要點,所有這一切使它看起來更有前途。

首先,均質響應傾向,組內的假設變得群體數量的增加更合理。和,研究人員不局限於只基於單個地理維度基。例如,我們可以基於狀態,年齡,性別和教育程度創建組。這似乎更合理,有組內18-29齊響應傾向,女性,大學畢業生生活在阿拉斯加比群生活在阿拉斯加所有的人的範圍內。因此,作為用於分層後增加組的數量,假設需要支持它變得更合理。鑑於這一事實,這似乎是一個研究人員希望創建分層後群體數量龐大。但是,由於基數量的增加,研究者遇到不同的問題:數據稀疏。如果只有人每組一個小數目,那麼估計會更明朗,而在極端情況下,那裡是一個沒有受訪者一組,然後分層後完全分解。有兩種方法進行homogeneous-響應傾向性組內的假設的合理性,並為每個組合理的樣本量的需求之間的這種內在張力。一種方法是移動到一個更複雜的統計模型,用於計算權重和其它是收集一個更大,更多樣化的樣品,這有助於確保每個組中合理樣本大小。而且,有時研究人員都做,因為我將在下面介紹更多的細節。

與非概率樣本後分層工作時,第二個考慮是,概率分析樣品時均相反應,傾向性的組內的假設已經被頻繁地進行。在實踐中是需要的概率的樣品這種假設的原因是概率樣品具有不答复,以及用於調節用於非反應的最常見的方法是如上所述的後分層。當然,僅僅是因為許多研究人員做出了一定的假設並不意味著你也應該這樣做。但是,這並不意味著,在實踐非概率樣本進行比較概率樣本時,我們必須牢記,都依賴於假設和輔助信息以產生估計。在最現實的設置,根本就沒有免費的假設的方法進行推理。

最後,如果你關心在大約一個特定的估計,在我們的例子失業率,那麼你就需要比均相反應,傾向性的組內的假設較弱的條件。特別是,你不需要假設,每個人都有同樣的反應傾向,你只需要假定有各組內的反應傾向和失業率之間沒有相關性。當然,即使本較弱條件不會在某些情況下成立。例如,假設估計是做志願工作的美國人的比例。如果人們誰做志願工作更有可能同意參與調查,然後研究人員將系統地高估志願的數量,即使他們分層後的調整,已經由經驗證明結果Abraham, Helms, and Presser (2009)

正如我剛才所說,非概率樣本由社會科學家觀察以極大的懷疑態度,部分原因是因為他們的一些調查研究的初期最尷尬的失敗中的作用。我們是如何走到今天用非概率樣本一個明顯的例子是王煒,大衛·羅斯柴爾德,沙拉德·戈埃爾,以及安德魯·格爾曼的,使用美國的Xbox用戶的非概率抽樣正確地恢復了2012年美國大選結果的研究-a決然非隨機的美國人樣品(Wang et al. 2015)研究人員招募了受訪者從Xbox遊戲系統,正如你所預料的,在Xbox樣品傾斜男性和扭曲年輕:18 - 29歲的年輕人佔全體選民的19%,但在Xbox樣本的65%,男性佔47%的選民和Xbox樣品(圖3.4)的93%。因為這些強大的人口偏見,原始的Xbox數據是選舉申報書的一個貧窮的指標。據預測羅姆尼在美國總統奧巴馬強烈的勝利。再次,這是原始的,未經調整的非概率樣本的危險的另一個例子,是讓人想起了文藝文摘慘敗。

圖3.4:在王等人的受訪者人口。 (2015)。由於受訪者從招募的Xbox,他們更可能是年輕的,更可能是男性,相對於選民在2012年大選。

圖3.4:在受訪者人口Wang et al. (2015)由於受訪者從招募的Xbox,他們更可能是年輕的,更可能是男性,相對於選民在2012年大選。

不過,王和同事們意識到這些問題,並試圖加權受訪者以糾正採樣過程。特別是,他們所使用的分層後我告訴你一個更複雜的形式。這是值得我們學習更加一下他們的做法,因為它建立關於分層後的直覺,以及所使用的特定版本與同事王某是最令人興奮的方法來加權非概率樣本之一。

在我們對3.4.1節估計失業率簡單的例子,我們基於居住的州分的人口分組。相比之下,與同事王某劃分人口納入到由定義176256組:性別(2類),種族(4類),年齡(4類),教育(4類),州(51類),方ID(3類),思想(3類)和2008票(3類)。隨著越來越多的群體,研究人員希望,這將是越來越有可能在每個組中,反應傾向是不相關對奧巴馬的支持。接下來,而非構建個人層面的權重,因為我們在我們的例子一樣,王某和同事使用了一種複雜的模型來估計每個組會投票支持奧巴馬的人的比例。最後,他們結合每個組的已知大小的支持,這些集團估計產生的支撐,估計整體水平。換句話說,他們砍了人口分成不同的組,每個組中估計奧巴馬的支持,然後拿著組測算的加權平均產生的總體估計。

因此,在他們的方法的一大挑戰是估計奧巴馬的支持在每個176256組。雖然他們的小組成員包括345858獨特的參與者,由選舉投票的標準數量龐大,有為此Wang和同事們幾乎沒有受訪者很多,許多團體。因此,估計他們使用的技術,每個組被稱為多層次的回歸與分層後,研究者它親切地稱呼P.先生從本質上講,一個特定的組內估計奧巴馬的支持,P先生集合許多信息的支持密切相關的群體。例如,考慮估計女性,西班牙裔對奧巴馬的支持所帶來的挑戰,18-29歲之間,誰是大學本科畢業,誰註冊的民主黨人,誰自我認定為溫和派,誰在2008年投票支持奧巴馬此是一個非常,非常具體的基團,並且可以存在與這些特徵的樣品中的任何人。因此,為了使這個組的估計,P先生一起池從人非常相似的群體估計。

使用這種分析策略,王和他的同事們能夠使用Xbox非概率樣本非常密切地估計,奧巴馬在2012年大選中獲得全面支持(圖3.5)。事實上他們的估計比民意調查的聚合更加準確。因此,在這種情況下,加權特異性先生P.-似乎做好校正非概率數據的偏差;偏見,當你從未經調整的Xbox數據的估計是可見的。

圖3.5:從Wang等人的估計。 (2015)。未經調整的Xbox試樣產生不準確的估計。但是,加權的Xbox樣品產生了比平均基於概率的電話調查更準確的估計。

圖3.5:從估計Wang et al. (2015)未經調整的Xbox試樣產生不準確的估計。但是,加權的Xbox樣品產生了比平均基於概率的電話調查更準確的估計。

有來自Wang及其同事的研究中兩個主要的教訓。首先,未經調整的非概率樣本可能會導致不良的估計;這是許多研究人員之前聽說過一個教訓。但是,第二個教訓是,非概率樣本,正確加權,實際上可以產生相當不錯的估計。事實上,他們的估計比從pollster.com,更傳統的選舉投票的集合的估計更準確。

最後,有什麼我們可以從這個具體的研究學習重要的限制。正因為後分層在這種特殊情況下運作良好,也不能保證它會在其他情況下正常工作。事實上,選舉也許最簡單的設置之一,因為民意調查機構一直在研究選舉近100年,還有定期的反饋(我們可以看到誰贏得選舉),以及政黨認同和人口特徵都比較預測投票。在這一點上,我們缺乏堅實的理論和實際經驗,知道什麼時候加權調整非概率樣本將產生足夠精確的估計。有一點是明確的,但是,是如果你是被迫與非概率樣本的工作,然後有足夠的理由相信,調整後估計會比未調整的估計更好。