活動

  • 難度:容易簡單 ,中等中 ,很難硬 , 很難很難
  • 需要數學( 需要數學
  • 需要編碼( 需要編碼
  • 數據採集 ( 數據採集
  • 我最喜歡的 ( 我的最愛
  1. [ 硬需要數學 ]在本章中,我對後分層非常積極。但是,這並不總能提高估算的質量。構建分層後可能會降低估算質量的情況。 (有關提示,請參閱Thomsen (1973) 。)

  2. [ 硬數據採集需要編碼 ]設計並對亞馬遜機械土耳其人進行非概率調查,詢問槍支所有權和對槍支管制的態度。為了將您的估算值與概率樣本得出的估算值進行比較,請直接從皮尤研究中心(Pew Research Center)運行的高質量調查中復制問題文本和響應選項。

    1. 您的調查需要多長時間?它要多少錢?您的樣本的人口統計數據與美國人口的人口統計數據相比如何?
    2. 使用您的樣本對槍支所有權的原始估計是多少?
    3. 使用後分層或其他技術糾正樣本的非代表性。現在對槍支所有權的估計是多少?
    4. 您的估算值與基於概率的樣本的最新估算值相比如何?如果存在差異,您認為如何解釋這些差異?
    5. 重複問題(b) - (d)對槍支管制的態度。您的發現有何不同?
  3. [ 很難數據採集需要編碼 Goel及其同事(2016)管理了49項來自一般社會調查(GSS)的多項選擇態度問題,並選擇皮尤研究中心對來自亞馬遜機械土耳其人的受訪者的非概率抽樣調查。然後,他們使用基於模型的後分層調整了數據的非代表性,並將調整後的估計值與基於概率的GSS和Pew調查的估算值進行了比較。對亞馬遜機械土耳其人進行同樣的調查,並嘗試通過比較調整後的估計值與最近一輪GSS和皮尤調查的估計值來複製圖2a和圖2b。 (有關49個問題的清單,請參閱附錄表A2。)

    1. 將您的結果與Pew和GSS的結果進行比較和對比。
    2. 將您的結果與Goel, Obeng, and Rothschild (2016)的Mechanical Turk調查結果進行比較和對比。
  4. [ 中數據採集需要編碼許多研究使用自我報告的手機使用措施。這是一個有趣的環境,研究人員可以將自我報告的行為與記錄的行為進行比較(參見例如Boase and Ling (2013) )。要問的兩個常見行為是打電話和發短信,兩個常見的時間框架是“昨天”和“過去一周”。

    1. 在收集任何數據之前,您認為哪種自我報告措施更準確?為什麼?
    2. 招募五位朋友參加您的調查。請簡要總結這五位朋友的樣本。這個抽樣程序可能會在您的估算中產生特定的偏差嗎?
    3. 向他們詢問以下微觀調查問題:
    • “你昨天多少次用手機給別人打電話?”
    • “你昨天發了多少短信?”
    • “在過去的七天裡,你有多少次使用手機給別人打電話?”
    • “在過去七天內,您使用手機多少次發送或接收短信/短信?”
    1. 完成此微觀測量後,請檢查他們的電話或服務提供商記錄的使用數據。自我報告使用情況與日誌數據相比如何?哪個最準確,哪個最不准確?
    2. 現在將您收集的數據與您班級中其他人的數據相結合(如果您正在為一個班級執行此活動)。使用這個更大的數據集,重複部分(d)。
  5. [ 中數據採集 ] Schuman和Presser (1996)認為問題順序對兩類問題很重要:部分問題,其中兩個問題具有相同的特異性水平(例如,兩個總統候選人的評級);並且整體問題是一般問題跟隨一個更具體的問題(例如,詢問“你對你的工作有多滿意?”,然後是“你對自己的生活有多滿意?”)。

    它們進一步表徵了兩種類型的問題順序效應:一致性效應發生在對後一個問題的回答(比其他情況下)更接近於先前問題的回答時;當對兩個問題的回答之間存在較大差異時,會出現對比效應。

    1. 創建一對您認為會產生大量問題效果的零件問題;你認為會產生大量訂單效應的一對完整問題;和一對你認為無關緊要的問題。在Amazon Mechanical Turk上運行調查實驗以測試您的問題。
    2. 你能創造出多大的零件效應?它是一致性還是對比效果?
    3. 你能創造出多大的整體效果?它是一致性還是對比效果?
    4. 您的配對中是否存在問題訂單效應,您認為訂單不重要?
  6. [ 中數據採集基於Schuman和Presser的工作, Moore (2002)描述了問題順序效應的一個單獨維度:加法和減法效應。雖然受訪者對這兩個項目相互評估的結果產生了對比和一致性效應,但當受訪者對提出問題的更大框架更敏感時,會產生加性和減性效應。閱讀Moore (2002) ,然後在MTurk上設計並運行一項調查實驗,以證明加法或減法效應。

  7. [ 硬數據採集 ] Christopher Antoun及其同事(2015)進行了一項研究,比較了從四個不同的在線招聘來源獲得的便利樣本:MTurk,Craigslist,Google AdWords和Facebook。設計一個簡單的調查,並通過至少兩個不同的在線招聘來源招募參與者(這些來源可能與Antoun et al. (2015)使用的四個來源不同)。

    1. 比較不同來源之間的每個招聘成本 - 金錢和時間。
    2. 比較從不同來源獲得的樣品的組成。
    3. 比較樣本之間的數據質量。有關如何衡量受訪者數據質量的想法,請參閱Schober et al. (2015)
    4. 您首選的來源是什麼?為什麼?
  8. [ 中為了預測2016年歐盟公投(即英國退歐)的結果,YouGov--一家基於互聯網的市場研究公司 - 對英國約80萬受訪者組成的小組進行了在線調查。

    有關YouGov統計模型的詳細說明,請訪問https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/。粗略地說,YouGov根據2015年大選投票選擇,年齡,資格,性別,面試日期以及他們所居住的選區,將選民劃分為不同類型。首先,他們使用從YouGov小組成員那裡收集的數據,在投票的人中估算出每個選民類型中打算投票的人的比例。他們通過使用2015年英國選舉研究(BES)來評估每種選民類型的投票率,這是一項選舉後的面對面調查,該調查驗證了選民名冊的投票率。最後,根據最新的人口普查和年度人口調查(以及其他數據來源的一些補充信息),他們估計了選民中每種選民的人數。

    在投票前三天,YouGov表現出兩分領先優勢。在投票前夕,民意調查表明結果太接近於召喚(49/51保留)。最後的當天研究預測48/52支持Remain(https://yougov.co.uk/news/2016/06/23/yougov-day-poll/)。事實上,這個估計錯過了最終結果(52/48離開)4個百分點。

    1. 使用本章中討論的總調查錯誤框架來評估可能出錯的地方。
    2. 選舉後YouGov的回應(https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/)解釋說:“這似乎在很大程度上是由於投票率 - 我們一直認為對於這種精細平衡的種族的結果至關重要。我們的投票率模型部分基於受訪者是否在上屆大選中投票,而投票率高於大選的投票水平,尤其是在北方。“這是否會改變你對(a)部分的回答?
  9. [ 中需要編碼 ]編寫一個模擬來說明圖3.2中的每個表示錯誤。

    1. 創建這些錯誤實際抵消的情況。
    2. 創建錯誤相互複合的情況。
  10. [ 很難需要編碼 Blumenstock及其同事(2015)涉及建立一個機器學習模型,該模型可以使用數字跟踪數據來預測調查反應。現在,您將使用不同的數據集嘗試相同的操作。 Kosinski, Stillwell, and Graepel (2013)發現Facebook喜歡可以預測個人特徵和屬性。令人驚訝的是,這些預測甚至可以比朋友和同事更準確(Youyou, Kosinski, and Stillwell 2015)

    1. 閱讀Kosinski, Stillwell, and Graepel (2013) ,並複製圖2.他們的數據可在http://mypersonality.org/上獲得。
    2. 現在,複製圖3。
    3. 最後,在您自己的Facebook數據上嘗試他們的模型:http://applymagicsauce.com/。它對你有多好?
  11. [ 中 ] Toole et al. (2015)使用來自手機的呼叫詳細記錄(CDR)來預測總體失業趨勢。

    1. 比較和對比Toole et al. (2015)的研究設計Toole et al. (2015)Blumenstock, Cadamuro, and On (2015)
    2. 您是否認為CDR應取代傳統調查,補充或不用於政府決策者追踪失業?為什麼?
    3. 有什麼證據可以說服CDR可以完全取代傳統的失業率指標?