活動

キー:

  • 難易度:簡単簡単に 、 ミディアムミディアム 、ハードハード 、非常に難しいです一生懸命
  • (数学を必要とします数学を必要とします
  • (コーディングが必要ですコー​​ディングが必要です
  • データ収集 ( データ収集
  • 私のお気に入り ( お気に入り
  1. [ ハード数学を必要とします ]章では、私はポスト成層について非常に肯定的でした。しかし、それは常に推定値の品質は向上しません。 -投稿成層ができ推定値の品質を低下させることができる状況を構築します。 (ヒントについては、 Thomsen (1973)

  2. [ ハードデータ収集コー​​ディングが必要です ]設計と銃の所有権について尋ねるためにアマゾンMTurk上の非確率調査を実施(「あなたが実行したり、あなたの家庭で誰を行い、銃、ライフルやピストルを所有する?あなたやあなたの世帯の誰かことはありますか?」)と銃規制に対する態度( "あなたはより重要-する銃を所有するアメリカ人の権利を保護する、または銃の所有権を制御することは何だと思いますか?」)。

    1. あなたの調査はどのくらいかかりますか?それはどれくらいしますか?どのようにあなたのサンプルの人口統計は、米国の人口の人口統計と比較するのですか?
    2. あなたのサンプルを使用して、銃の所有者の生の推定値は何ですか?
    3. ポスト成層またはいくつかの他の技術を使用して、サンプルの非代表の正しいです。今銃の所有権の推定値は何ですか?
    4. どのようにあなたの推定値は、ピュー・リサーチ・センターから最新の推定値と比較するのですか?もしあれば、あなたは、矛盾を説明どう思いますか?
    5. 銃規制に対する態度のためのエクササイズ2-5を繰り返します。あなたの調査結果はどう違うのですか?
  3. [ 一生懸命データ収集コー​​ディングが必要です ] Goelさんと同僚ら(2016)アマゾンMTurkに関するピュー・リサーチ・センターによって一般社会調査(GSS)とセレクト調査から引き出された49複数の選択肢の態度の質問からなる非確率ベースの調査を投与。そして、彼らはモデルベースの​​ポスト成層(ミスターP)を使用して、データの非代表のために調整し、確率ベースのGSS /ピュー調査を用いて推定したものと調整推定値を比較します。 MTurk上の同じ調査を実施し、GSS /ピューの最新のラウンドからの見積もりを使用して調整された推定値を比較することによって、図2aおよび図2bを複製しようとする(49の質問のリストについては、付録表A2を参照してください)​​。

    1. 比較し、ピューとGSSからの結果にあなたの結果を対比。
    2. 比較とでMTurk調査の結果にあなたの結果を対比Goel, Obeng, and Rothschild (2016)
  4. [ ミディアムデータ収集コー​​ディングが必要です ]多くの研究は、携帯電話の活動データの自己報告尺度を使用しています。これは、研究者がログに記録された行動と自己申告の挙動を比較することができ、興味深い設定です(例えば参照、 Boase and Ling (2013)呼び出し、テキストメッセージ、および2つの一般的な時間枠されている尋ねるために2つの一般的な行動は「過去の週に。」「昨日」としています

    1. あなたがより正確であると思います自己報告の措置任意のデータを収集する前に?どうして?
    2. あなたの調査であることをあなたの友人の5を募集。簡単にこれらの5人がサンプリングされた方法をまとめてください。このサンプリング手順は、見積もりの​​特定のバイアスを誘発する可能性がありますか?
    3. それ以下のミクロ調査依頼してください。
    • 「何回昨日他の人を呼び出すために携帯電話を使用しましたか?」
    • 「どのように多くのテキストメッセージは、あなたが昨日送ったのですか?」
    • 「何回は、過去7日間に他の人を呼び出すために携帯電話を使用しましたか?」
    • 調査が完了すると、「何回あなたは最後の7日間でテキストメッセージ/ SMSを送信または受信するために携帯電話を使用しましたか? "、自分の携帯電話またはサービスプロバイダによって記録されたとして、その使用量データを確認するように依頼。
    1. どのように自己報告に使用すると、データをログに記録するように比較しますか。どれが最も正確である、最も正確なのですか?
    2. (このクラスにこの活動を行っている場合は)今、あなたはあなたのクラスの他の人たちからのデータで収集したデータを結合します。これより大きなデータセットでは、一部の(d)を繰り返します。
  5. [ ミディアムデータ収集 ]シューマンと押え(1996)その質問の注文が質問間の関係の2つのタイプには関係でしょう主張:二つの質問は、特異性の同じレベルにある一部の部分の質問(例えば、2つの大統領候補の評価)。そして、一般的な質問は、より具体的な質問(例えば尋ねる "あなたはあなたの仕事にしているどのように満足して?」「あなたはあなたの人生にしているどの程度満足?"が続く)に続く部分 - 全体の質問。

    彼らはさらに、問題の順序効果の2つのタイプを特徴付ける:整合性効果が後で質問への応答は(彼らが本来よりも)近い以前の質問に与えられたものになっているときに発生します。二つの質問への応答の間の大きな差があるときに発生する効果を対比。

    1. あなたが大規模な質問順序効果、あなたが大規模な順序効果を持っているとは思わ部分 - 全体の質問のペア、および順序あなたが問題ではないだろうと思う質問の別のペアを持っているだろうと思い、部分部分の質問のペアを作成します。あなたの質問をテストするMTurkに関する調査実験を実行します。
    2. 部分部分の効果は、作成することができましたどのように大規模でしたか?それは一貫性やコントラスト効果ましたか?
    3. 部分 - 全体の効果は、作成することができましたどのように大規模でしたか?それは一貫性やコントラスト効果ましたか?
    4. あなたは順序が問題になるとは思わなかったあなたのペアの質問の順序効果はありましたか?
  6. [ ミディアムデータ収集 ]シューマンと押えの仕事、上に構築Moore (2002) 、添加剤及び減法:質問順序効果の別々の次元を説明します。コントラストと一貫性の効果が互いに関連した2項目の回答者の評価の結果として生産されているが、回答者は質問が提起されている範囲内で、より大きな枠組みに敏感に行われた場合、添加剤および減法効果が生成されます。読むMoore (2002)添加剤又はサブトラクティブ効果を実証するためにMTurkに関する調査実験を設計し、実行し、。

  7. [ ハードデータ収集 ]クリストファーAntounや同僚(2015) MTurk、Craigslistのは、Googleアドワーズ広告とFacebook:四つの異なるオンライン募集源から入手した利便性のサンプルを比較した研究を行いました。簡単な調査を設計し、少なくとも二つの異なるオンライン募集源を通じて参加者を募集(それらが使用される4つのソースからの異なるソースすることができますAntoun et al. (2015)

    1. 異なるソース間で、お金と時間の面で、新兵あたりのコストを比較してください。
    2. 異なるソースから得られた試​​料の組成を比較してください。
    3. サンプル間のデータの品質を比較します。回答者からのデータ品質を測定する方法についてのアイデアについては、 Schober et al. (2015)
    4. お好みのソースは何ですか?どうして?
  8. [ ミディアム ] YouGov、インターネットベースの市場調査会社は、英国で約800,000回答者のパネルのオンライン世論調査を実施し、英国の有権者は投票のいずれかのままにEUの国民投票(すなわち、Brexit)の結果を予測するために氏P.を使用しましたまたは欧州連合(EU)のままにしておきます。

    YouGovの統計モデルの詳細な説明はここにある(https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/)。大雑把に言えば、YouGovは、2015年の総選挙の投票の選択、年齢、資格、性別、面接の日だけでなく、彼らが住んで選挙に基づくタイプに有権者を仕切る。まず、彼らはそれらの間で、推定するYouGovのパネリストから収集したデータを使用しました投票者、休暇を投票する各有権者のタイプの人々の割合。彼らは、2015年イギリスの選挙調査(BES)選挙人名簿から投票率を検証し、選挙後の対面調査を、使用して、各投票者タイプの投票率を推定します。最後に、彼らは、最新の国勢調査とBESからいくつかの追加情報との年次人口調査(、総選挙の周りからYouGovの調査データ、そして人々が投票どのように多くの情報に基づいて有権者に各有権者のタイプであるどのように多くの人々見積もり各選挙区における各当事者)。

    三日投票の前に、YouGovは休暇のための2つのポイントのリードを示しました。投票の前夜に、世論調査では(49-51が残る)予断を許さない示しました。最終的なオン・日研究が残る(https://yougov.co.uk/news/2016/06/23/yougov-day-poll/)の賛成で48/52を予測しました。実際には、この推定値は4%ポイント最終結果(52から48まで休暇を)逃しました。

    1. 間違っている可能性が何を評価するために、この章で説明総調査エラーフレームワークを使用してください。
    2. 選挙後のYouGovの応答(https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/)は説明した: "これが原因で投票率に大部分がそうです - その何かを我々は、このような微細にバランスのとれたレースの結果に非常に重要であろうすべてに沿って述べています。私たちの投票率モデルは、ベース部分には、回答者が総選挙の上記の最後の総選挙と投票率のレベルで投票したかどうかに特に北で、モデルを混乱させるた。「これは一部の(a)にあなたの答えを変更していますか?
  9. [ ミディアムコー​​ディングが必要です図3.1に表現エラーのそれぞれを説明するためのシミュレーションを書きます。

    1. これらのエラーは、実際に相殺状況を作成します。
    2. エラーがお互いを化合物の状況を作成します。
  10. [ 一生懸命コー​​ディングが必要です ] Blumenstockや同僚の研究(2015)アンケートの回答を予測するために、デジタルトレースデータを使用することができる機械学習モデルを構築関与しました。さて、あなたは別のデータセットと同じことをしようとしている。 Kosinski, Stillwell, and Graepel (2013) Facebookは、個々の特性および属性を予測することができる好きなことがわかりました。驚くべきことに、これらの予測がより正確な友人や同僚のものよりもすることができます(Youyou, Kosinski, and Stillwell 2015)

    1. 読むKosinski, Stillwell, and Graepel (2013) http://mypersonality.org/:彼らのデータはここで利用可能であり、図2を複製
    2. さて、図3を複製します。
    3. http://applymagicsauce.com/:最後に、あなた自身のFacebookのデータに彼らのモデルを試してみてください。どれだけそれはあなたのために動作しますか?
  11. [ ミディアム ] Toole et al. (2015)集計失業の動向を予測するために、携帯電話からの通話詳細記録(CDR)を使用します。

    1. 設計比較対照Toole et al. (2015)Blumenstock, Cadamuro, and On (2015)
    2. あなたは、CDRは、伝統的な調査を交換し、それらを補完するか、失業を追跡するために、政府の政策立案者のためのすべてで使用すべきではないと思いますか?どうして?
    3. どのような証拠CDRは、完全失業率の伝統的な措置を置き換えることができることを納得させるでしょうか?