不是所有的非概率的樣品是相同的。我們可以在前端添加更多的控制權。
該方法王某和用於估計2012年美國總統大選的結果同事完全取決於數據分析的改進。也就是說,他們收集到盡可能多的響應,因為他們可以,然後試圖重新重它們。對用非概率抽樣工作的補充策略是有對數據採集過程中加以控制。
部分控制的非概率抽樣方法最簡單的例子是配額抽樣 ,可以追溯到調查研究初期的技術。在配額抽樣,研究者劃分人群分成不同的群體(例如,年輕人,年輕婦女等)和人數再設置配額每組中被選中。受訪者在一個偶然的方式選擇,直到研究員每組滿足其配額。由於配額制的,由此產生的樣品看起來更像是目標人群比將是真實的,否則,而是因為包容的概率是未知的許多研究人員都懷疑配額抽樣的。事實上,配額抽樣是的原因在1948年美國總統選舉“杜威擊敗杜魯門”的錯誤。因為它提供了在採樣過程中的一些控制,然而,可以看出配額採樣如何可能有超過一個完全不受控制的數據收集一些優勢。
超越配額抽樣,更現代的方法來控制非概率抽樣的過程,現在是可能的。這樣的一種方法被稱為樣本匹配 ,並且它被一些商業在線面板供應商。在其最簡單的形式中,樣品匹配需要兩個數據源:1)人口的整個寄存器和2)的志願者的大面板。該志願者不需要來自任何人口概率樣本是重要的;強調的是,有可供選擇沒有要求到面板,我會打電話給它一個骯髒的面板 。另外,無論是人口寄存器和臟面板必須包括關於每個人的一些輔助信息,在本例中,我會考慮年齡和性別,但在現實的情況下,這種輔助信息可能會更加詳細。樣本匹配的訣竅是在生產的樣品看起來像概率樣本的方式來選擇一個骯髒的面板樣品。
當一個模擬的概率樣本是從人口登記採取樣本匹配開始;這個模擬的樣品成為目標樣本 。然後,根據該輔助信息中,目標樣品中的情況下,在臟面板相匹配的人,以形成匹配的樣品 。例如,如果有一個25歲的女性目標樣品中,那麼研究者發現從臟面板一個25歲的女性為匹配樣本。最後, 匹配的樣品的成員面談,以產生最後一組受訪者。
雖然匹配的樣品看起來像目標樣本,需要記住的是匹配的樣本不是概率抽樣是非常重要的。匹配樣本只能匹配的已知的輔助信息(例如,年齡和性別)的目標樣品,但不能在未測量的特徵。例如,如果人們臟面板上的往往是較差的,畢竟,一個原因加入調查小組是為了賺錢,那麼就算匹配的樣品看起來像目標樣品中的年齡和性別仍然會有條款對貧困人群的偏見。真正的概率抽樣的魔力是排除上測量和不可測的特性的問題(一個點,與我們從第2章中的觀察性研究因果推理匹配的討論一致)。
在實踐中,樣本匹配取決於有一個大的和多樣化的面板急於完成調查,因此它主要由公司能夠負擔得起的開發和維護這樣一個小組完成的。另外,在實踐中,可以有與匹配(有時良好匹配的人靶樣品在面板上不存在)和非應答(有時人匹配的樣品中拒絕參與調查)的問題。因此,在實踐中,研究人員在做樣品匹配也執行某種分層後調整,以使估計。
這是很難提供有關樣品匹配有用的理論保證,但在實踐中它可以表現良好。例如,斯蒂芬Ansolabehere和布賴恩·沙夫納(2014)郵件,電話,並使用樣本匹配和分層後調整互聯網面板:採用三種不同的採樣和面試方法相比,在2010年進行的約1000人三個平行的調查。從三種方法的估計十分相似,從高品質的基準,如當前人口調查(CPS)和國民健康訪問調查(NHIS)的估計。更具體地講,無論是互聯網和郵件調查是關閉的平均3個百分點,在電話調查是關閉的4個百分點。這個錯誤大約為什麼人會從約1000人樣本的期望。雖然沒有產生顯著更好的數據這兩種模式,無論是互聯網和電話調查(其中花費數天或數週)均大大快於較場郵件調查(這花了8個月),和互聯網調查,其中使用的樣本匹配,比其他兩種模式更便宜。
總之,社會科學家和統計學家是令人難以置信的懷疑從這些非概率樣本推斷,部分原因是它們與調查研究的一些令人尷尬的失敗,如文學文摘民意調查有關。在某種程度上,我同意這種懷疑:未經調整的非概率樣本可能產生不好的估計。但是,如果研究人員可以調整在採樣過程中(例如,分層後)的偏見或稍微控制採樣過程(如,樣本匹配),它們可以產生更好的估計,甚至足夠的質量對於大多數用途的估計。當然,這將是更好地做到完美執行的概率抽樣,但是這似乎不再是一個現實的選擇。
兩個非概率樣品和概率樣品中的質量變化,並且目前很可能從概率的樣品最估計比由非概率的樣品的估計更值得信賴的情況。但是,即使是現在,從實施良好的非概率樣本估計可能比不良的概率進行估計的樣本更好。此外,非概率樣品基本上便宜。因此,看來,概率與非概率抽樣提供了一個成本 - 質量權衡(圖3.6)。展望未來,我期望從做得好的非概率樣本估計會變得更便宜,更好。此外,由於在座機電話調查和不答复率持續上升的崩潰,我預計概率樣本將變得更加昂貴和低質量的。因為這些長期趨勢,我認為非概率抽樣將成為調查研究的第三代越來越重要。