[ 、 ]この章では、層別化について非常に肯定的でした。しかし、これは必ずしも見積りの質を改善するとは限らない。事後成層が見積りの質を低下させる可能性のある状況を構築する。 (ヒントについては、 Thomsen (1973)参照してくださいThomsen (1973) 。
[ 、 、 ]アマチュアメカニカル・タークの非確率調査をデザインし、銃の所有と銃規制に対する態度について質問する。推定値を確率サンプルから導かれたものと比較できるように、ピューリサーチセンターで実行されるような高品質の調査から質問テキストと回答オプションを直接コピーしてください。
[ 、 、 Goelら(2016)は、General Social Survey(GSS)から抽出された多肢選択式の49の質問を管理し、Pew Research CenterによるAmazon Mechanical Turkの回答者の非確率サンプルへの調査を選択した。次に、モデルベースの事後階層化を使用してデータの非代表性を調整し、その調整後の見積もりを確率ベースのGSSおよびPew調査の見積もりと比較しました。 Amazon Mechanical Turkについても同様の調査を行い、調整後の見積もりとGSSおよびPew調査の最新ラウンドの見積もりとを比較して、図2aと図2bを複製してみてください。 (49の質問のリストについては、付録の表A2を参照してください)。
[ 、 、 ]多くの研究では、自己報告した携帯電話使用の測定値を使用しています。これは、研究者が自己報告行動と記録された行動を比較できる興味深い設定です( Boase and Ling (2013)参照)。尋ねる2つの一般的な行動は、呼び出しと文字送信であり、2つの共通の時間枠は「昨日」と「過去1週間」です。
[ 、 ] Schuman and Presser (1996)は、問題の順序は2つのタイプの問題、すなわち2つの質問が同じレベルの特異性(例えば、2人の大統領候補者の評価)であるパートパートの質問については問題であると主張する。 (例えば、あなたの仕事にどれくらい満足していますか?」、「あなたの人生にはどれくらい満足していますか?」など)を入力してください。
彼らはさらに、次の2つのタイプの質問順序効果を特徴づける。一貫性効果は、後の質問への応答が、以前の質問に与えられたものに近い(そうでなければそうであろう)コントラスト効果は、2つの質問に対する応答の差が大きい場合に発生します。
[ 、 ] Schuman and Presserの研究に基づいて、 Moore (2002)は質問順序効果の別次元を述べている:加法効果と減法効果。コントラストと一貫性の影響は、回答者が相互に関連して2つの項目を評価した結果として生成されますが、回答者が質問が提起されるより大きな枠組みに対してより敏感になると、 Moore (2002)を読んだ後、MTurkの調査実験を設計して実行し、加減算効果を実証してください。
[ 、 ] Christopher Antounと同僚(2015)は、4つの異なるオンライン求人サイト(MTurk、Craigslist、Google AdWords、Facebook)から入手した便利なサンプルを比較した調査を実施しました。簡単なアンケートを作成し、少なくとも2つの異なるオンライン求人情報源(これらの情報源はAntoun et al. (2015)使用されている4つの情報源とは異なる場合があります)を通じて参加者を募集します。
[ ]インターネットベースの市場調査会社YouGovは、2016年のEU国民投票(Brexit)の結果を予測するために、英国の約80万人の回答者を対象にオンライン投票を実施しました。
YouGovの統計モデルの詳細については、https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/を参照してください。大まかに言えば、YouGovは投票者を2015年の総選挙投票の選択、年齢、資格、性別、面接日、および彼らが住んでいた選挙区に基づいて分類しました。第1に、YouGovパネリストから収集したデータを使用して、投票した人の中で、Leaveを投票しようとした各投票者タイプの人の割合を見積もりました。彼らは、選挙ロールからの投票率を検証した選挙後の対面調査である2015英国選挙研究(BES)を用いて各投票者の投票率を推定した。最後に、最新の国勢調査と年次人口調査(他のデータソースからの追加情報をもとに)に基づいて、有権者の各投票者タイプがどれくらいの人数であるかを推定しました。
投票3日前、YouGovはLeaveの2点リードを示した。投票前夜、投票結果は電話には近すぎると示された(49/51 Remain)。最終的なオンデイ日の調査では、Remain(https://yougov.co.uk/news/2016/06/23/yougov-day-poll/)に有利な48/52が予測された。実際、この推定値は最終結果(52/48 Leave)を4%ポイント逸していました。
[ 、 ]図3.2の表現エラーのそれぞれを説明するシミュレーションを作成します。
[ 、 ] Blumenstockとその同僚(2015)の研究には、デジタルトレースデータを使用して調査回答を予測できる機械学習モデルを構築することが含まれていました。さて、別のデータセットで同じことを試してみましょう。 Kosinski, Stillwell, and Graepel (2013)は、Facebookの好みが個々の特性や属性を予測できることを発見しました。驚いたことに、これらの予測は、友人や同僚のものよりもさらに正確です(Youyou, Kosinski, and Stillwell 2015) 。
[ ] Toole et al. (2015) 、携帯電話からのコール・ディテール・レコード(CDR)を使用して、失業傾向全体を予測しました。