Bit By Bit - 提問

這種翻譯是由一個計算機創建。 ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

活動

鍵：

難度：容易，中硬，很難
需要數學（ $需要數學$ ）
需要編碼（）
數據採集（）
我最喜歡的（）

[ ， $需要數學$ 在這一章，我正要後分層非常積極的。然而，它並不總是提高估值的質量。構造的情況下可以事後分層可降低估計的質量。（對於一個提示，請參閱Thomsen (1973)
[ ，， ]開展亞馬遜MTurk非概率調查設計和詢問槍支所有權（“你，或有沒有人在你的家庭，擁有一支槍，步槍或手槍？那是你或你的家庭別的嗎？”），並對槍支管制的態度（“那你覺得更重要的是，以保護美國人擁有槍支，或控制擁有槍支的權利？”）。
1. 多長時間您的調查需要？它要多少錢？如何樣品的人口統計數據比較了美國人口的變動？
2. 什麼是使用你的樣品擁有槍支的粗略估計？
3. 正確使用事後分層或其他技術樣品的非代表性。那麼什麼是擁有槍支的估計？
4. 如何你的估計比較從皮尤研究中心的最新估計是多少？你認為解釋的差異，如果有任何？
5. 重複對槍支管制的態度行使2-5。如何你的發現有什麼不同？
[ ，， ]戈埃爾和他的同事(2016)投與由亞馬遜MTurk皮尤研究中心從綜合社會調查（GSS），並選擇調查得出49多項選擇題態度問題，基於非概率調查。然後，他們調整用於使用基於模型的後分層（P先生）的數據的非代表性，並比較與那些使用基於概率的GSS /皮尤調查所估計的調整的估計值。開展關於MTurk同樣的調查，並嘗試通過從最近幾輪GSS /皮尤的估計比較調整後的估計複製圖2a和圖2b（見附錄表A2為49問題的列表）。
1. 比較和對比你的結果與皮尤和GSS的結果。
2. 比較和對比你的結果從MTurk調查結果Goel, Obeng, and Rothschild (2016)
[ ，，許多研究使用手機的活動數據的自我報告的措施。這是一個有趣的環境，研究人員可以比較記錄的行為自我報告的行為（見例如， Boase and Ling (2013)兩種常見的行為，詢問是打電話和發短信和兩個共同的時間框架是“昨天”和“過去一周”。
1. 收集的任何數據，你認為哪自我報告的措施，更準確過嗎？為什麼？
2. 招募你的朋友5在你的調查。請簡要地總結這5個朋友是如何取樣。可能這個抽樣程序誘導特異性偏見的估計？
3. 請詢問他們以下的微調查：
- “多少次你用手機撥打他人昨天？”
- “有多少短信你昨天送？”
- “多少次你用你的手機撥打他人在過去七天？”
- “很多時候你怎麼會用你的手機發送或在過去七天內接收短信/ SMS？”一旦調查完成後，請檢查其使用的數據通過自己的手機或服務提供商的身份登錄。
1. 如何自我報告的使用比較日誌數據？這是最準確的，這是不準確的？
2. 下面結合您已經與其他人在你的類收集的數據（如果你正在做這個活動的一類）的數據。有了這個大的數據集，重複（d）部分。
[ ， ]舒曼和壓(1996)認為，問題的訂單將此事兩類問題之間的關係的：一部分部分問題，其中兩個問題是在特異性相同的水平（例如兩位總統候選人的評級）;並在一個一般性的問題如下一個更具體的問題部分與整體的問題（例如：問：“是否滿意你的工作？”，其次是“滿意度如何，你有你的生活？”）。

他們進一步刻畫兩類問題順序效應：當到以後的問題的回答被帶到接近（比他們原本定）給前面一個問題的出現一致性效果;對比時，有兩個問題響應之間有較大的差異產生的影響。
1. 創建一個對您認為將有一個大的問題順序的影響，一副你認為將有一個大訂單影響部分 - 整體的問題，和另一對的順序您認為無關緊要的問題部分的部分問題。在MTurk運行的調查實驗，以測試你的問題。
2. 如何大是部分部分效果是你能夠創建？這是一場一致性和對比度的效果呢？
3. 如何大是部分與整體的效果是你能夠創建？這是一場一致性和對比度的效果呢？
4. 有沒有在你對一個問題順序的影響，你沒有想到的秩序將有關係嗎？
[ ， ]建立在舒曼和壓，工作Moore (2002)描述的問題順序影響一個單獨的維度：加分和扣分。而對比度和一致性效果產生為受訪者的兩個項目的評價的結果在相對於彼此，添加劑和當受訪者作出在其內的問題是所帶來的更大的框架更敏感減色效應產生的。閱讀Moore (2002) ，然後設計和MTurk進行問卷調查實驗來證明相加或相減的效果。
[ ， ]克里斯托弗Antoun先生和他的同事(2015)進行了一項研究，比較了來自四個不同的網絡招聘渠道獲得的便利性樣本：MTurk，Craigslist網站，谷歌的AdWords和Facebook。設計簡單的調查，並通過在至少兩個不同網絡招聘源招募參加者（它們可以是從所用的四個來源不同來源Antoun et al. (2015)
1. 比較每招的費用，在金錢和時間上，不同來源之間。
2. 比較不同來源獲得的樣品的組合物。
3. 比較樣品之間的數據的質量。有關如何衡量受訪者數據質量的想法，看到Schober et al. (2015)
4. 什麼是您的首選來源？為什麼？
[ ] YouGov的，基於互聯網的市場研究公司，進行了在英國約有80萬受訪面板的網上投票和使用P.先生預測歐盟的公投（即Brexit）的結果中，英國選民投票要么留在或離開歐盟。

YouGov的的統計模型的詳細描述在這裡（https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/）。粗略地說，YouGov的劃分選民成基於2015年大選中投票選擇，年齡，學歷，性別，面試的日期，以及他們居住。首先，他們用從YouGov的小組成員收集的數據選區來估算，這些中間類型誰投票，是誰打算投票離開每個選民類型的人的比例。他們利用2015年英國選舉研究（BES）選舉後的臉對臉調查，確認投票從選民名冊估計每個選民型道岔。最後，他們估計有多少人在選民每個選民類型的基於最新的人口普查和年度人口調查（從BES一些附加信息，來自各地的換屆選舉，以及信息YouGov的調查數據上有多少人投了贊成票在每個選區每個政黨）。

在投票前三天，YouGov的表現請假兩分的領先優勢。在投票前夕，民調顯示分不出（49-51保留）。最後上了天的研究有利於餘緒（https://yougov.co.uk/news/2016/06/23/yougov-day-poll/）預測48/52。事實上，這種估計四個百分點之差無緣決賽的結果（52-48假期）。
1. 使用本章中所討論的調查總誤差框架來評估什麼可能出了錯。
2. 選（https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/）後YouGov的響應解釋說：“這似乎在很大程度上是由於投票率 - 這是我們一直說會是這樣一個微妙平衡的比賽的結果至關重要。我們的投票率模型是基於，部分是否在受訪者在上次大選投了贊成票，並高於大選的投票率水平打亂模型，特別是在北方。“這是否你的答案更改為（a）部分？
[ ， ]撰寫模擬演示圖3.1每一代表錯誤。
1. 創建的情況下，這些錯誤實際上抵消。
2. 創建的情況下的錯誤化合物彼此。
[ ， ] Blumenstock和他的同事的研究(2015)涉及構建可以使用數字跟踪數據來預測調查的答复機器學習模型。現在，你要嘗試用不同的數據集同樣的事情。 Kosinski, Stillwell, and Graepel (2013)發現，Facebook的喜歡可以預測個人特質和屬性。出人意料的是，這些預測可能比那些朋友和同事更準確(Youyou, Kosinski, and Stillwell 2015) 。
1. 閱讀Kosinski, Stillwell, and Graepel (2013) ，並複製圖2.他們的數據都可以在這裡：http://mypersonality.org/
2. 現在，複製如圖3所示。
3. 最後，嘗試他們對自己的Facebook數據模型：http://applymagicsauce.com/。它是如何為你工作？
[ ] Toole et al. (2015)使用呼叫細節從手機記錄（CDR）來預測總失業率的趨勢。
1. 比較和對比的設計Toole et al. (2015)與Blumenstock, Cadamuro, and On (2015) 。
2. 你認為應該的CDR取代傳統的調查，補充他們或不是為政府決策者用來追踪失業？為什麼？
3. 什麼證據來說服你的CDR可以完全替代失業率的傳統措施？