Dalam apendiks ini, saya akan menjelaskan beberapa gagasan dari bab dalam bentuk yang sedikit lebih matematis. Tujuannya di sini adalah untuk membantu Anda merasa nyaman dengan notasi dan kerangka matematis yang digunakan oleh peneliti survei sehingga Anda dapat beralih ke materi yang lebih teknis yang ditulis pada topik ini. Saya akan mulai dengan memperkenalkan sampling probabilitas, kemudian pindah ke sampling probabilitas dengan nonresponse, dan akhirnya, non-probability sampling.
Pengambilan sampel kemungkinan
Sebagai contoh yang berjalan, mari kita mempertimbangkan tujuan memperkirakan tingkat pengangguran di Amerika Serikat. Biarkan \(U = \{1, \ldots, k, \ldots, N\}\) menjadi populasi target dan biarkan \(y_k\) dengan nilai variabel hasil untuk orang \(k\) . Dalam contoh ini \(y_k\) adalah apakah orang \(k\) menganggur. Akhirnya, biarkan \(F = \{1, \ldots, k, \ldots, N\}\) menjadi populasi bingkai, yang demi kesederhanaan diasumsikan sama dengan populasi target.
Desain sampling dasar adalah sampling acak sederhana tanpa penggantian. Dalam hal ini, setiap orang memiliki kemungkinan yang sama untuk dimasukkan dalam sampel \(s = \{1, \ldots, i, \ldots, n\}\) . Ketika data dikumpulkan dengan desain sampling ini, seorang peneliti dapat memperkirakan tingkat pengangguran populasi dengan mean sampel:
\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]
di mana \(\bar{y}\) adalah tingkat pengangguran dalam populasi dan \(\hat{\bar{y}}\) adalah perkiraan tingkat pengangguran ( \(\hat{ }\) umumnya digunakan untuk menunjukkan estimator).
Pada kenyataannya, peneliti jarang menggunakan sampling acak sederhana tanpa penggantian. Untuk berbagai alasan (salah satunya akan saya jelaskan sebentar), peneliti sering membuat sampel dengan probabilitas inklusi yang tidak sama. Misalnya, peneliti mungkin memilih orang di Florida dengan probabilitas inklusi yang lebih tinggi daripada orang di California. Dalam hal ini, mean sampel (Persamaan 3.1) mungkin bukan estimator yang baik. Sebaliknya, ketika ada probabilitas inklusi yang tidak sama, peneliti menggunakan
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]
di mana \(\hat{\bar{y}}\) adalah perkiraan tingkat pengangguran dan \(\pi_i\) adalah orang \(i\) kemungkinan inklusi. Mengikuti praktik standar, saya akan memanggil estimator dalam persamaan. 3.2 estimator Horvitz-Thompson. Penaksir Horvitz-Thompson sangat berguna karena mengarah pada estimasi yang tidak bias untuk setiap desain sampling probabilitas (Horvitz and Thompson 1952) . Karena estimator Horvitz-Thompson muncul begitu sering, akan sangat membantu untuk memperhatikan bahwa itu dapat ditulis ulang sebagai
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]
di mana \(w_i = 1 / \pi_i\) . Sebagai eq. 3,3 mengungkapkan, estimator Horvitz-Thompson adalah sampel berbobot berarti di mana bobot berbanding terbalik dengan probabilitas seleksi. Dengan kata lain, semakin kecil kemungkinan seseorang untuk dimasukkan dalam sampel, semakin banyak orang yang harus mendapatkan dalam perkiraan.
Seperti yang dijelaskan sebelumnya, para peneliti sering mengambil sampel orang-orang dengan probabilitas inklusi yang tidak sama. Salah satu contoh desain yang dapat menyebabkan probabilitas inklusi yang tidak sama adalah sampling bertingkat , yang penting untuk dipahami karena sangat terkait dengan prosedur estimasi yang disebut pasca-stratifikasi . Dalam stratified sampling, peneliti membagi populasi sasaran dalam \(H\) kelompok yang saling eksklusif dan lengkap. Kelompok-kelompok ini disebut strata dan ditunjukkan sebagai \(U_1, \ldots, U_h, \ldots, U_H\) . Dalam contoh ini, strata adalah status. Ukuran grup ditunjukkan sebagai \(N_1, \ldots, N_h, \ldots, N_H\) . Seorang peneliti mungkin ingin menggunakan sampling bertingkat untuk memastikan bahwa dia memiliki cukup banyak orang di setiap negara bagian untuk membuat perkiraan tingkat pengangguran negara bagian.
Setelah populasi terpecah menjadi strata , anggaplah bahwa peneliti memilih sampel acak sederhana tanpa penggantian ukuran \(n_h\) , secara terpisah dari setiap strata. Selanjutnya, anggap bahwa semua orang yang dipilih dalam sampel menjadi responden (saya akan menangani non-respons di bagian berikutnya). Dalam hal ini, kemungkinan inklusi adalah
\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]
Karena probabilitas ini dapat bervariasi dari orang ke orang, ketika membuat perkiraan dari desain sampling ini, peneliti perlu mempertimbangkan setiap responden dengan kebalikan dari probabilitas mereka untuk dimasukkan menggunakan estimator Horvitz-Thompson (persamaan 3.2).
Meskipun estimator Horvitz-Thompson tidak bias, peneliti dapat menghasilkan perkiraan yang lebih akurat (yaitu, varians lebih rendah) dengan menggabungkan sampel dengan informasi tambahan . Beberapa orang merasa heran bahwa ini benar bahkan ketika ada sampling probabilitas yang dilakukan dengan sempurna. Teknik-teknik ini menggunakan informasi tambahan sangat penting karena, seperti yang akan saya tunjukkan nanti, informasi tambahan sangat penting untuk membuat perkiraan dari sampel probabilitas dengan nonresponse dan dari sampel non-probabilitas.
Salah satu teknik umum untuk memanfaatkan informasi tambahan adalah pasca-stratifikasi . Bayangkan, misalnya, bahwa seorang peneliti mengetahui jumlah pria dan wanita di masing-masing dari 50 negara bagian; kita dapat menunjukkan ukuran grup ini sebagai \(N_1, N_2, \ldots, N_{100}\) . Untuk menggabungkan informasi tambahan ini dengan sampel, peneliti dapat membagi sampel menjadi kelompok \(H\) (dalam kasus ini 100), membuat perkiraan untuk setiap kelompok, dan kemudian membuat rata-rata tertimbang dari kelompok ini berarti:
\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]
Kira-kira, estimator dalam persamaan. 3,5 kemungkinan lebih akurat karena menggunakan informasi populasi yang diketahui — \(N_h\) —untuk mengoreksi perkiraan jika sampel yang tidak seimbang terjadi untuk dipilih. Salah satu cara untuk berpikir tentang hal ini adalah bahwa post-stratification adalah seperti mendekati stratifikasi setelah data telah dikumpulkan.
Kesimpulannya, bagian ini telah menjelaskan beberapa desain sampling: sampling acak sederhana tanpa penggantian, sampling dengan probabilitas yang tidak sama, dan sampling bertingkat. Ini juga menggambarkan dua ide utama tentang estimasi: estimator Horvitz-Thompson dan pasca-stratifikasi. Untuk definisi yang lebih formal dari desain sampling probabilitas, lihat bab 2 dari Särndal, Swensson, and Wretman (2003) . Untuk pengobatan yang lebih formal dan lengkap dari sampling bertingkat, lihat bagian 3.7 dari Särndal, Swensson, and Wretman (2003) . Untuk deskripsi teknis tentang sifat-sifat estimator Horvitz-Thompson, lihat Horvitz and Thompson (1952) , Overton and Stehman (1995) , atau bagian 2.8 dari @ sarndal_model_2003. Untuk pengobatan pasca-stratifikasi yang lebih formal, lihat Holt and Smith (1979) , Smith (1991) , Little (1993) , atau bagian 7.6 dari Särndal, Swensson, and Wretman (2003) .
Probabilitas sampling dengan nonresponse
Hampir semua survei nyata tidak menanggapi; artinya, tidak semua orang dalam populasi sampel menjawab setiap pertanyaan. Ada dua jenis utama nonresponse: item nonresponse dan unit nonresponse . Dalam item nonresponse, beberapa responden tidak menjawab beberapa item (misalnya, terkadang responden tidak ingin menjawab pertanyaan yang mereka anggap sensitif). Di unit nonresponse, beberapa orang yang dipilih untuk populasi sampel tidak menanggapi survei sama sekali. Dua alasan paling umum untuk unit nonresponse adalah bahwa orang yang dicuplik tidak dapat dihubungi dan orang sampel dihubungi tetapi menolak untuk berpartisipasi. Pada bagian ini, saya akan fokus pada unit nonresponse; pembaca yang tertarik pada item nonresponse harus melihat Little and Rubin (2002) .
Para peneliti sering berpikir tentang survei dengan unit non-respon sebagai proses sampling dua tahap. Pada tahap pertama, peneliti memilih sampel \(s\) sedemikian rupa sehingga setiap orang memiliki probabilitas penyertaan \(\pi_i\) (di mana \(0 < \pi_i \leq 1\) ). Kemudian, pada tahap kedua, orang yang dipilih menjadi sampel akan merespons dengan probabilitas \(\phi_i\) (di mana \(0 < \phi_i \leq 1\) ). Proses dua tahap ini menghasilkan set akhir responden \(r\) . Perbedaan penting antara kedua tahap ini adalah bahwa peneliti mengontrol proses pemilihan sampel, tetapi mereka tidak mengontrol yang mana dari orang-orang yang dijadikan sampel menjadi responden. Dengan menggabungkan kedua proses ini, kemungkinan bahwa seseorang akan menjadi responden
\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]
Demi kesederhanaan, saya akan mempertimbangkan kasus di mana desain sampel asli adalah sampling acak sederhana tanpa penggantian. Jika seorang peneliti memilih sampel dengan ukuran \(n_s\) yang menghasilkan \(n_r\) responden, dan jika peneliti mengabaikan non-respons dan menggunakan mean dari responden, maka bias perkiraan akan menjadi:
\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]
di mana \(cor(\phi, y)\) adalah korelasi populasi antara kecenderungan respon dan hasil (misalnya, status pengangguran), \(S(y)\) adalah standar populasi deviasi dari hasil (misalnya, pengangguran status), \(S(\phi)\) adalah standar populasi deviasi dari kecenderungan respon, dan \(\bar{\phi}\) adalah kecenderungan populasi rata-rata respon (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .
Persamaan 3.7 menunjukkan bahwa nonresponse tidak akan memperkenalkan bias jika salah satu kondisi berikut terpenuhi:
Sayangnya, tidak ada satu pun dari kondisi ini yang tampaknya memungkinkan. Tampaknya tidak masuk akal bahwa tidak akan ada variasi dalam status pekerjaan atau bahwa tidak akan ada variasi dalam kecenderungan tanggapan. Dengan demikian, istilah kunci dalam persamaan. 3.7 adalah korelasinya: \(cor(\phi, y)\) . Misalnya, jika orang yang menganggur lebih mungkin untuk merespons, maka perkiraan tingkat pekerjaan akan bias ke atas.
Trik untuk membuat perkiraan ketika ada nonresponse adalah dengan menggunakan informasi tambahan. Sebagai contoh, salah satu cara di mana Anda dapat menggunakan informasi tambahan adalah pasca-stratifikasi (ingat eq. 3,5 dari atas). Ternyata bias dari estimator pasca-stratifikasi adalah:
\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]
di mana \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) , dan \(\bar{\phi}^{(h)}\) didefinisikan seperti di atas tetapi terbatas pada orang dalam grup \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) . Dengan demikian, bias keseluruhan akan kecil jika bias pada setiap kelompok pasca-stratifikasi kecil. Ada dua cara yang saya suka berpikir tentang membuat bias kecil di setiap kelompok pasca-stratifikasi. Pertama, Anda ingin mencoba untuk membentuk grup homogen di mana ada sedikit variasi dalam kecenderungan respons ( \(S(\phi)^{(h)} \approx 0\) ) dan hasilnya ( \(S(y)^{(h)} \approx 0\) ). Kedua, Anda ingin membentuk kelompok di mana orang-orang yang Anda lihat seperti orang-orang yang tidak Anda lihat ( \(cor(\phi, y)^{(h)} \approx 0\) ). Membandingkan eq. 3,7 dan eq. 3,8 membantu memperjelas ketika pasca-stratifikasi dapat mengurangi bias yang disebabkan oleh nonresponse.
Sebagai kesimpulan, bagian ini telah menyediakan model untuk pengambilan sampel probabilitas dengan non-respon dan menunjukkan bias bahwa nonresponse dapat memperkenalkan baik tanpa dan dengan penyesuaian pasca-stratifikasi. Bethlehem (1988) menawarkan derivasi bias yang disebabkan oleh nonresponse untuk desain sampling yang lebih umum. Untuk lebih lanjut tentang penggunaan pasca-stratifikasi untuk menyesuaikan diri dengan tanggapan nonresponse, lihat Smith (1991) dan Gelman and Carlin (2002) . Post-stratifikasi adalah bagian dari keluarga yang lebih umum dari teknik yang disebut penduga kalibrasi, lihat Zhang (2000) untuk pengobatan artikel-panjang dan Särndal and Lundström (2005) untuk perawatan buku-panjang. Untuk lebih lanjut tentang metode pembobotan lain untuk menyesuaikan untuk tidak Kalton and Flores-Cervantes (2003) , lihat Kalton and Flores-Cervantes (2003) , Brick (2013) , dan Särndal and Lundström (2005) .
Non-probability sampling
Non-probability sampling mencakup berbagai macam desain (Baker et al. 2013) . Berfokus khusus pada sampel pengguna Xbox oleh Wang dan rekan (W. Wang et al. 2015) , Anda dapat menganggap sampel semacam itu sebagai salah satu bagian kunci dari desain sampling bukan \(\pi_i\) ( probabilitas inklusi yang didorong oleh peneliti) tetapi \(\phi_i\) (kecenderungan respons yang digerakkan oleh responden). Secara alami, ini tidak ideal karena \(\phi_i\) tidak dikenal. Tetapi, seperti yang ditunjukkan Wang dan rekannya, jenis sampel opt-in ini — bahkan dari kerangka sampling dengan kesalahan cakupan yang sangat besar — tidak perlu menjadi bencana jika peneliti memiliki informasi tambahan yang baik dan model statistik yang bagus untuk menjelaskan masalah ini.
Bethlehem (2010) memperluas banyak derivasi di atas tentang pasca-stratifikasi untuk memasukkan kesalahan baik nonresponse maupun cakupan. Selain pasca-stratifikasi, teknik lain untuk bekerja dengan sampel non-probabilitas — dan sampel probabilitas dengan kesalahan cakupan dan nonresponse — termasuk pencocokan sampel (Ansolabehere and Rivers 2013; ??? ) , bobot skor kecenderungan (Lee 2006; Schonlau et al. 2009) , dan kalibrasi (Lee and Valliant 2009) . Salah satu tema umum di antara teknik-teknik ini adalah penggunaan informasi tambahan.