この章のテーマの多くは、 Dillman (2002) 、 Newport (2011) 、 Santos (2014) 、 Link (2015) Santos (2014)ような米国の世論調査研究会(AAPOR) Link (2015) 。
調査研究と詳細なインタビューの違いについては、 Small (2009)参照してください。綿密なインタビューに関連するのは民族誌と呼ばれる一連のアプローチです。民族誌研究では、一般的に研究者は自然環境の参加者ともっと多くの時間を費やしています。エスノグラフィと詳細なインタビューの違いについては、 Jerolmack and Khan (2014)参照してください。デジタル民族誌の詳細については、 Pink et al. (2015) 。
調査研究の歴史についての私の記述は、行われたエキサイティングな発展の多くを含めるにはあまりにも短すぎる。より歴史的な背景については、 Smith (1976) 、 Converse (1987) 、 Igo (2008)参照してください。調査研究の3つの時代のアイデアについては、 Groves (2011)とDillman, Smyth, and Christian (2008) (3つの時代を少し違うものにする)を参照してください。
Groves and Kahn (1979)は、対面と電話調査の詳細な比較を行い、調査研究の第1期から第2期への移行を俯瞰している。 ( ??? )は、ランダム桁ダイヤルサンプリング方法の歴史的展開を振り返ります。
社会の変化に対応して過去に調査研究がどのように変化したかについては、 Tourangeau (2004) 、 ( ??? ) 、and Couper (2011)参照してください。
Jerolmack and Khan (2014) 、 Maynard (2014) 、 Cerulo (2014) 、 Vaisey (2014) )などの心理学者( Baumeister, Vohs, and Funder (2007) )と社会学者によって議論されてきた。例えば、研究者は、アイスクリームを食べるか、ジムに行くかを回答者に問いかけることができます(例えば、 Vaisey (2014) ; Jerolmack and Khan (2014) Hausman (2012)記載されているように、経済学における特定のタイプの嗜好データについて深い懐疑的な意見があります。
これらの議論の主なテーマは、報告された行動が必ずしも正確ではないということです。しかし、第2章で説明したように、大きなデータソースは正確ではないかもしれませんし、関心のあるサンプルで収集されず、研究者がアクセスできない場合もあります。したがって、状況によっては、報告された行動が有用であると私は考える。さらに、これらの討論の第2の主なテーマは、感情、知識、期待、および意見に関する報告が必ずしも正確ではないということです。しかし、これらの内部状態に関する情報が研究者によって必要とされている場合は、何らかの行動を説明するのに役立つか説明することが必要です。もちろん、質問をして内部の状態について学ぶことは、回答者自身が内部状態を認識していないことがあるため、問題になる可能性があります(Nisbett and Wilson 1977) 。
Groves (2004)第1章は、アンケート研究者が時には一貫性のない用語を調和させ、アンケートの全体的なエラーフレームワークを記述する優れた仕事をしています。総調査誤差枠組みの書物長の扱いについては、 Groves et al. (2009) 、歴史的概要についてはGroves and Lyberg (2010)参照してください。
誤差を偏りと分散に分解するという考え方も、機械学習に現れます。たとえば、 Hastie, Tibshirani, and Friedman (2009)セクション7.3を参照してください。これにより、研究者はしばしば「バイアス分散」のトレードオフについて話すことになります。
表現の面では、非応答性および非応答性の偏見の問題への大きな紹介は、社会科学調査の非応答:研究アジェンダ(2013) 。 Groves (2006)もう一つの有用な概要が提供されています。また、 「公式統計誌」、 「四半期公募」 、 「米国政治社会科学アカデミー 」の特集号が、非回答のテーマとして掲載されている。最後に、実際には応答率を計算するさまざまな方法があります。これらのアプローチは、世論研究者のアメリカ連合(AAPOR)による報告書に詳細に記載されている( ??? )
1936 文学ダイジェスト世論調査の詳細については、 Bryson (1976) Squire (1988) Cahalan (1989)およびLusinchi (2012)この世論調査の不安定なデータ収集に対するGayo-Avello (2011)的な警告としての別の議論については、 Gayo-Avello (2011)参照してください。 1936年、George Gallupはより洗練されたサンプリング形式を採用し、はるかに小さなサンプルでより正確な推定値を生成することができました。 GallupのLiterary Digestに対する成功は、@ converse_survey_1987の第3章で説明されている調査研究の発展のマイルストーンでした。 Ohmer (2006)第4章。 @ igo_averaged_2008の第3章を参照してください。
測定に関して、アンケートを設計するための最初の大きなリソースはBradburn, Sudman, and Wansink (2004)です。より高度な治療法については、特に姿勢の質問に焦点を当てたSchuman and Presser (1996) 、より一般的なSaris and Gallhofer (2014)を参照してください。 ( ??? )説明されているように、精神測定では少し異なる測定方法が採用されています。プレステスターに関する詳細は、 Presser and Blair (1994) 、 Presser et al. (2004) 、およびGroves et al. (2009)第8章Groves et al. (2009) 。調査実験の詳細については、 Mutz (2011)参照してください。
コストの面では、サーベイコストとサーベイエラーのトレードオフの古典的な書籍長の扱いはGroves (2004)です。
スタンダード確率サンプリングと推定の古典的な2つの標準的な治療法は、 Lohr (2009) (入門)とSärndal, Swensson, and Wretman (2003) (より高度)です。ポスト層別化および関連する方法の古典的な書籍長の扱いは、 Särndal and Lundström (2005)です。いくつかのデジタル時代の設定では、研究者は非回答者についてかなり知っています。 Kalton and Flores-Cervantes (2003)とSmith (2011)ように、研究者がKalton and Flores-Cervantes (2003)者に関する情報を持っている場合、さまざまな形の無反応調整が可能です。
W. Wang et al. (2015)によるXboxの研究W. Wang et al. (2015)は、多数のグループがある場合でも集団平均を推定することを可能にする多レベル回帰と後層別化( "P氏")という手法を使用しています。この手法の見積もりの質についていくつかの議論がありますが、それは探求する有望な分野のようです。この手法は、 Park, Gelman, and Bafumi (2004)で初めて使用されPark, Gelman, and Bafumi (2004)以後の使用と議論が行われました(Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) 。個々の体重と群体重の関係については、 Gelman (2007)参照してください。
ウェブ調査に重みを付ける他のアプローチについては、 Schonlau et al. (2009) 、 Bethlehem (2010) 、 Valliant and Dever (2011)ます。オンラインパネルは、確率サンプリングまたは非確率サンプリングのいずれかを使用することができる。オンラインパネルの詳細については、 Callegaro et al. (2014) 。
時には、確率サンプルと非確率サンプルが類似の品質(Ansolabehere and Schaffner 2014)推定値をもたらすが、他の比較では、非確率サンプルが悪化することが分かった(Malhotra and Krosnick 2007; Yeager et al. 2011) 。これらの違いの理由の1つは、時間の経過とともに非確率サンプルが改善されたことです。非確率サンプリング手法のより悲観的な見方については、非確率サンプリングに関するAAPORタスクフォース(Baker et al. 2013) al。2013)を参照してください(Baker et al. 2013)また、要約レポートに続く解説を読むことをお勧めします。
Conrad and Schober (2008)は未来のアンケートインタビューを題材にした編集された巻で、質問の未来について様々な視点を提供しています。 Couper (2011)は同様のテーマに取り組んでおり、 Schober et al. (2015)は、新しい設定に合わせたデータ収集方法がより高品質のデータをもたらす方法の良い例を示しています。 Schober and Conrad (2015)は、社会の変化に合わせて調査研究のプロセスを調整し続けるという、より一般的な議論を提供している。
Tourangeau and Yan (2007)は、敏感な質問における社会的望ましさバイアスの問題をレビューし、 Lind et al. (2013)は、コンピュータ管理のインタビューで人々がより機密情報を開示する可能性がある理由をいくつか示しています。アンケート調査での参加率の上昇に対する人間の面接者の役割については、 Maynard and Schaeffer (1997) 、 Maynard, Freese, and Schaeffer (2010) 、 Conrad et al. (2013) 、 Schaeffer et al. (2013) 。混合モード調査の詳細については、 Dillman, Smyth, and Christian (2014)参照してください。
Stone et al. (2007)は、生態学的瞬間評価と関連する方法の本の長さの扱いを提供している。
アンケートを参加者にとって楽しくて貴重な体験にするためのアドバイスについては、Tailored Design Method (Dillman, Smyth, and Christian 2014)作業を参照してください。社会科学調査のためのFacebookアプリを使用する別の興味深い例については、 Bail (2015)参照してください。
Judson (2007)は、アンケートと管理データを「情報統合」として結合するプロセスを説明し、このアプローチのいくつかの利点といくつかの例を提供する。
豊かな尋問に関して、投票を検証する多くの以前の試みがあった。その文献の概要については、 Belli et al. (1999) 、 Ansolabehere and Hersh (2012) 、 Hanmer, Banks, and White (2014) Berent, Krosnick, and Lupia (2016) Ansolabehere and Hersh (2012)結果のより懐疑的な見解についてはBerent, Krosnick, and Lupia (2016)を参照してください。
AnsolabehereとHershはCatalystのデータの質に勇気づけられましたが、他の商用ベンダーの評価はあまり熱心ではありませんでした。 Pasek et al. (2014)は、調査のデータをMarketing Systems Groupの消費者ファイル(Acxiom、Experian、InfoUSAの3つのプロバイダのデータを統合したもの)と比較すると、品質が悪いことが判明しました。つまり、データファイルは、研究者が正しいと予想した調査回答と一致せず、消費者ファイルには多数の質問のデータが欠落しており、欠落したデータパターンは報告された調査値と相関していました(つまり、データは系統的で無作為ではなかった)。
アンケートと管理データの間のレコード連鎖の詳細については、 Sakshaug and Kreuter (2012)およびSchnell (2013)参照してください。一般的なレコードリンケージについては、 Dunn (1946)とFellegi and Sunter (1969) (歴史的)とLarsen and Winkler (2014) (現代)を参照してください。同様のアプローチが、データ重複排除、インスタンス識別、名前照合、重複検出、重複レコード検出(Elmagarmid, Ipeirotis, and Verykios 2007)などの名前でコンピュータサイエンスでも開発されています。また、個人識別情報の送信を必要としない連鎖を記録するためのプライバシー保護の手法もあります(Schnell 2013) 。 Facebookの研究者は、記録を投票行動に確率的に関連付ける手続きを開発した(Jones et al. 2013) 。このリンクは、第4章で述べる実験を評価するために行われました(Bond et al. 2012) 。レコードリンケージの同意を得るための詳細については、 Sakshaug et al. (2012) 。
政府の行政記録に大規模な社会調査を関連付けるもう1つの例は、健康と退職に関する調査と社会保障管理から来ています。同意の手続きに関する情報を含むその研究の詳細については、Olson (1996, 1999) 。
管理レコードの多くのソースを、カタリストが採用しているプロセスであるマスターデータファイルに結合するプロセスは、いくつかの国家政府の統計局で共通しています。統計スウェーデンの2人の研究者がこのトピックに関する詳細な本を書いている(Wallgren and Wallgren 2007) 。米国( Sauver et al. (2011)州オルムステッド郡、メイヨークリニックの本拠地)の1つの郡でのこのアプローチの例については、 Sauver et al. (2011) 。管理レコードに表示されるエラーの詳細については、 Groen (2012)参照してください。
研究者が調査研究で大きなデータソースを使用できるもう1つの方法は、特定の特性を持つ人々のためのサンプリングフレームです。残念なことに、このアプローチはプライバシーに関連する問題を(Beskow, Sandler, and Weinberger 2006)可能性がある(Beskow, Sandler, and Weinberger 2006) 。
増幅された質問に関して、このアプローチは、私がそれを記述した方法から現れるかもしれないほど新しいものではありません。モデルベースの事後階層化(Little 1993) 、帰属(Rubin 2004) 、小領域推定(Rao and Molina 2015) 3つの大きな領域、また、医学研究における代理変数の使用にも関連している(Pepe 1992) 。
Blumenstock, Cadamuro, and On (2015)のコストと時間の見積もりでは、1回の追加調査の費用である可変コストと、コールデータのクリーニングと処理のコストなどの固定コストは含まれていません。一般に、増幅された質問はおそらく、デジタル実験のような高い固定費と低い変動費を有するであろう(第4章参照)。開発途上国における携帯電話に基づく調査の詳細については、 Dabalen et al. (2016) 。
増幅された質問をより良くする方法については、複数の帰属についてもっと学ぶことをおすすめします(Rubin 2004) 。また、研究者が個体レベルの形質ではなく総集計に関心を持つように求める場合、 King and Lu (2008)とHopkins and King (2010)のアプローチが有用かもしれません。最後に、 Blumenstock, Cadamuro, and On (2015)の機械学習アプローチの詳細については、 James et al. (2013) (より入門的)またはHastie, Tibshirani, and Friedman (2009) (より高度な) Hastie, Tibshirani, and Friedman (2009) )。
増幅質問に対する1つの倫理的問題は、 Kosinski, Stillwell, and Graepel (2013)記載されているように、人々が調査で明らかにしKosinski, Stillwell, and Graepel (2013)ない機密性の高い特性を推測するために使用できることです。