この付録では、この章のアイデアのいくつかを少しだけ数学的な形で説明します。ここでの目標は、調査研究者が使用する表記法や数学的枠組みに慣れ親しみ、これらのトピックで書かれたより技術的な資料に移行できるようにすることです。私は確率サンプリングを導入してから、無応答の確率サンプリングに移動し、最後に無確率サンプリングに移ります。
確率サンプリング
実行例として、米国の失業率を見積もるという目標を考えてみましょう。目標人口を\(U = \{1, \ldots, k, \ldots, N\}\)とし、人\(k\)の結果変数の値を\(y_k\)する。この例では\(y_k\)は人\(k\)が失業しているかどうかです。最後に、 \(F = \{1, \ldots, k, \ldots, N\}\)フレーム母集団とすると、単純化のために目標母集団と同じであると仮定される。
基本的なサンプリング設計は、置換えのない単純なランダムサンプリングです。この場合、各人物はサンプル\(s = \{1, \ldots, i, \ldots, n\}\)等しく含まれる可能性があります。このサンプリングデザインでデータを収集すると、研究者は標本平均で人口失業率を推定することができます。
\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]
ここで、 \(\bar{y}\)は人口の失業率であり、 \(\hat{\bar{y}}\)は失業率の推定値である( \(\hat{ }\)は一般に見積もりを示すのに使用される)。
現実には、研究者は単純な無作為標本採取法を使用することはほとんどありません。いろいろな理由で(そのうちの1つを今すぐに説明します)、研究者はしばしば、等しくない可能性のあるサンプルを作成します。例えば、研究者は、フロリダ州の人々を、カリフォルニア州の人よりも高い可能性で選択するかもしれない。この場合、標本平均(式3.1)は良い推定値ではないかもしれません。代わりに、含まれる確率が等しくない場合、研究者は
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]
ここで、 \(\hat{\bar{y}}\)は失業率の推定値であり、 \(\pi_i\)は人\(i\)の包含確率である。標準的な慣行に従って、私は推定式をeq。 3.2 Horvitz-Thompson推定量。 Horvitz-Thompson推定は、任意の確率サンプリング設計(Horvitz and Thompson 1952)バイアスのない推定につながるため、非常に有用です。 Horvitz-Thompson推定量は非常に頻繁に出てくるので、それは次のように書き直すことができます。
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]
ここで、 \(w_i = 1 / \pi_i\)です。式3.3が示すように、Horvitz-Thompson推定量は、重みが選択の確率に反比例する重み付けされた標本平均である。換言すれば、サンプル中に人が含まれる可能性が低いほど、その人が見積もりに入るべき重みが大きくなる。
先に説明したように、研究者はしばしば、不等確率の包含を有する人々をサンプリングする。不等確率の包含をもたらす可能性がある設計の一例は層別サンプリングであり、それは事後層化と呼ばれる推定手順に密接に関連するため、理解することが重要である。階層化サンプリングでは、研究者は、対象集団を互いに排他的かつ徹底的なグループに分割する\(H\) 。これらのグループは階層と呼ばれ、 \(U_1, \ldots, U_h, \ldots, U_H\)として示されます。この例では、階層は状態です。グループのサイズは\(N_1, \ldots, N_h, \ldots, N_H\)ます。研究者は、州ごとの失業見積もりを作成するのに十分な人が各州にあることを確認するために層別サンプリングを使用することができます。
人口が地層に分割されると、研究者は各地層とは無関係に、サイズ\(n_h\)を置き換えずに単純なランダムサンプルを選択すると仮定する。さらに、サンプルで選択された全員が回答者になったとします(次のセクションでは無回答を処理します)。この場合、包含確率は
\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]
これらの確率は人によって異なる可能性があるため、このサンプリング設計から推定する際、研究者は、Horvitz-Thompson推定量(式3.2)を使用して、それぞれの被験者にその包含確率の逆数を重み付けする必要があります。
Horvitz-Thompson推定器はバイアスされていなくても、サンプルを補助情報と組み合わせることにより、より正確な(すなわち、分散の低い)推定値を生成することができます 。確率サンプリングを完全に実行しても、これが当てはまるというのは驚くべきことです。補助情報を使用するこれらの手法は、後で説明するように、非応答サンプルと非確率サンプルからの推定サンプルを作成するために補助情報が重要であるため、特に重要です。
補助情報を利用するための1つの一般的な技術は、 層別化 ( post-stratification)である 。たとえば、研究者が50州の男性と女性の数を知っているとします。これらのグループサイズを\(N_1, N_2, \ldots, N_{100}\)ます。この補助情報をサンプルと組み合わせるために、研究者はサンプルを\(H\)グループ(この場合は100)に分割し、各グループの見積もりを行い、これらのグループ平均の加重平均を作成することができます。
\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]
大まかに、式3.5は、不均衡なサンプルが選択された場合に推定値を補正するために、既知の母集団情報\(N_h\)を使用するため、より正確になる可能性があります。それを考える方法の1つは、ポスト層別化は、データがすでに収集された後の層別化を近似化することに似ていることです。
結論として、このセクションでは、いくつかのサンプリング設計について説明しました。置き換えのない単純なランダムサンプリング、不等確率でのサンプリング、層別サンプリングです。また、推定に関する2つの主要な考え方、すなわちHorvitz-Thompson推定量と層別化後の推定についても説明しています。確率サンプリングデザインのより正式な定義については、 Särndal, Swensson, and Wretman (2003)第2章を参照してください。層別サンプリングのより正式で完全な処理については、 Särndal, Swensson, and Wretman (2003)セクション3.7を参照してください。 Horvitz-Thompson推定量の特性に関する技術的説明については、 Horvitz and Thompson (1952) 、 Overton and Stehman (1995) 、または@ sarndal_model_2003の2.8節を参照してください。ポスト層別化のより公式な扱いについては、 Holt and Smith (1979) 、 Smith (1991) 、 Little (1993) 、 Särndal, Swensson, and Wretman (2003) 7.6節を参照。
無応答での確率サンプリング
ほとんどすべての実際の調査は無応答である。つまり、標本集団のすべての人がすべての質問に答えるわけではありません。非応答には主に2つの種類があります: 項目非応答と単位非応答です。回答していない項目では、一部の回答者は回答しません(たとえば、回答者が敏感であると回答したくないなど)。単位が無応答の場合、サンプル集団に選ばれた人々の中には、調査に全く反応しないものもあります。ユニットレスレスの2つの最も一般的な理由は、サンプリングされた人に連絡をとることができず、サンプルの人に連絡が取られているが、参加を拒否しているということです。このセクションでは、ユニットレスポンスに焦点を当てます。非応答の項目に興味を持つ読者は、LittleとRubin (2002)を参照する必要があります。
研究者は、2段階のサンプリングプロセスとして、ユニットレスポンスのアンケートについて考えることがよくあります。第1段階では、研究者は各人が\(\pi_i\) ( \(0 < \pi_i \leq 1\) )の包含確率を持つようにサンプル\(s\)を選択する。次に、第2段階では、サンプルに選択された人々は確率\(\phi_i\) ( \(0 < \phi_i \leq 1\) )で応答します。この2段階のプロセスの結果、回答者の最終セットになります。 \(r\) 。これらの2つの段階の重要な違いは、研究者がサンプルを選択するプロセスを制御することですが、サンプリングされた人々のどれが回答者になるかを制御しないということです。これら2つのプロセスをまとめると、誰かが回答者になる確率は
\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]
単純化のために、元のサンプルデザインが置き換えのない単純なランダムサンプリングであるケースを検討します。研究者が\(n_s\)サンプルを選択して\(n_r\)人の回答を得た場合、そして研究者が無回答を無視して回答者の平均を使用する場合、推定の偏りは次のようになります。
\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]
ここで、 \(cor(\phi, y)\)は応答傾向と結果(例:失業状況)との間の母集団相関であり、 \(S(y)\)は結果の母集団標準偏差ステータス)、 \(S(\phi)\)応答性向の母集団の標準偏差であり、 \(\bar{\phi}\)応答性向平均集団である(Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) 。
式3.7は、以下のいずれかの条件が満たされていれば、非応答でバイアスが導入されないことを示しています。
残念ながら、これらの条件のどれもそうではないようです。雇用状態に変化はなく、また反応の傾向にも変化はないとは考えにくい。このように、 3.7は相関関係です。 \(cor(\phi, y)\) 。例えば、失業者が反応する可能性が高い人がいる場合、推定雇用率は上方に偏っています。
応答がない場合に推定を行うのは、補助情報を使用することです。たとえば、補助情報を使用できる1つの方法は、層別化(上から3.5を呼び出す)です。事後成層推定のバイアスは次のようになることが分かった。
\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]
ここで\(cor(\phi, y)^{(h)}\) \(S(y)^{(h)}\) \(S(\phi)^{(h)}\) \(\bar{\phi}^{(h)}\)は上記のように定義されていますが、グループ\(h\)人に限定されています(Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) 。したがって、各層別後群のバイアスが小さい場合、全体のバイアスは小さくなる。各階層化後のグループでバイアスを小さくすることについて考えるのが2つあります。第1に、応答傾向( \(S(\phi)^{(h)} \approx 0\) )と結果( \(S(y)^{(h)} \approx 0\) )。第2に、あなたが見る人が見えない人のようなグループ( \(cor(\phi, y)^{(h)} \approx 0\)を形成したいとします。式を比較する。 3.7およびeq。 3.8は、層別化が非応答によって引き起こされた偏りを減らすことができるときを明確にするのに役立つ。
結論として、このセクションでは、無応答での確率サンプリングのモデルを提供し、無応答では層別調整なしでも導入でも導入できるバイアスを示しています。 Bethlehem (1988)は、より一般的なサンプリング設計のための非応答によって引き起こされるバイアスの導出を提供する。非応答を調整するためのポスト層別化の使用については、 Smith (1991)およびGelman and Carlin (2002)参照してください。事後層別化は、校正見積もりと呼ばれるより一般的な技術の一部である。記事長の扱いについてはZhang (2000) 、本の長さの扱いについてはSärndal and Lundström (2005)を参照。他の他の重み付け方法については、 Kalton and Flores-Cervantes (2003) 、 Brick (2013) 、 Särndal and Lundström (2005) 。
非確率サンプリング
非確率サンプリングには、膨大な種類のデザインが含まれています(Baker et al. 2013) 。 (W. Wang et al. 2015) \(\pi_i\)のXboxユーザーのサンプルを中心に、サンプリングデザインの重要な部分が\(\pi_i\)はないと考えることができます研究者主導の包含確率)であるが、 \(\phi_i\) (応答主導の応答傾向)である。当然、 \(\phi_i\)が不明なので、これは理想的ではありません。しかし、Wangらが示したように、このようなオプトインサンプル(膨大なカバレッジエラーを伴うサンプリングフレームであっても)は、研究者がこれらの問題を説明するための優れた補助情報と優れた統計モデルを持っていれば致命的である必要はありません。
Bethlehem (2010)は、非応答とカバレッジ・エラーの両方を含むように、層別化についての上記の導出の多くを拡張している。ポスト成層に加えて、カバレッジ・エラーと無応答-含むサンプル一致する非確率サンプルアンド確率サンプルを操作するための他の技術(Ansolabehere and Rivers 2013; ??? )傾向スコア重み付け(Lee 2006; Schonlau et al. 2009) 、および較正(Lee and Valliant 2009) 。これらの技術の1つの共通のテーマは、補助情報の使用です。