Tidak semua sampel non-probabilitas yang sama. Kita dapat menambahkan lebih banyak kontrol di ujung depan.
Pendekatan Wang dan rekan digunakan untuk memperkirakan hasil pemilihan presiden AS 2012 tergantung sepenuhnya pada perbaikan dalam analisis data. Artinya, mereka dikumpulkan sebanyak tanggapan yang mereka bisa dan kemudian mencoba untuk kembali berat badan mereka. Sebuah strategi pelengkap untuk bekerja dengan non-probability sampling adalah untuk memiliki kontrol atas proses pengumpulan data.
Contoh paling sederhana dari proses pengambilan sampel non-probabilitas sebagian dikendalikan adalah quota sampling, teknik yang kembali ke hari-hari awal penelitian survei. Dalam quota sampling, peneliti membagi populasi ke dalam kelompok yang berbeda (misalnya, pemuda, perempuan muda, dll) dan kemudian ditetapkan kuota untuk jumlah orang yang akan dipilih di masing-masing kelompok. Responden yang dipilih secara serampangan sampai peneliti telah memenuhi kuota mereka di masing-masing kelompok. Karena kuota, sampel yang dihasilkan terlihat lebih seperti populasi sasaran daripada yang benar jika tidak, tapi karena probabilitas inklusi tidak diketahui banyak peneliti yang skeptis dari quota sampling. Bahkan, quota sampling adalah penyebab dari "Dewey Mengalahkan Truman" error di tahun 1948 jajak pendapat Presiden AS. Karena memberikan kontrol atas proses pengambilan sampel, bagaimanapun, orang dapat melihat bagaimana quota sampling mungkin memiliki beberapa keunggulan dibandingkan koleksi data yang benar-benar tidak terkendali.
Bergerak di luar quota sampling, pendekatan yang lebih modern untuk mengendalikan proses pengambilan sampel non-probabilitas sekarang mungkin. Salah satu pendekatan tersebut disebut sampel pencocokan, dan digunakan oleh beberapa penyedia panel komersial online. Dalam bentuk yang paling sederhana, cocok sampel membutuhkan dua sumber data: 1) register lengkap penduduk dan 2) panel besar relawan. Adalah penting bahwa para relawan tidak perlu menjadi sampel probabilitas dari populasi apapun; untuk menekankan bahwa tidak ada persyaratan untuk seleksi masuk panel, saya akan menyebutnya sebuah panel kotor. Juga, baik penduduk mendaftar dan panel kotor harus menyertakan beberapa informasi tambahan tentang setiap orang, dalam contoh ini, saya akan mempertimbangkan usia dan jenis kelamin, tetapi dalam situasi yang realistis informasi tambahan ini bisa menjadi jauh lebih rinci. Trik pencocokan sampel untuk memilih sampel dari sebuah panel yang kotor dengan cara yang menghasilkan sampel yang terlihat seperti sampel probabilitas.
Sampel pencocokan dimulai ketika sampel probabilitas simulasi diambil dari populasi register; sampel simulasi ini menjadi target sampel. Kemudian, berdasarkan informasi tambahan, kasus di sampel target dicocokkan dengan orang-orang di panel kotor untuk membentuk sampel cocok. Sebagai contoh, jika ada seorang wanita berusia 25 tahun di sampel target, maka peneliti menemukan wanita berusia 25 tahun dari panel kotor berada di sampel cocok. Akhirnya, anggota sampel cocok diwawancarai untuk menghasilkan set terakhir responden.
Meskipun sampel cocok terlihat seperti sampel target, penting untuk diingat bahwa sampel cocok tidak sampel probabilitas. sampel cocok hanya dapat mencocokkan sampel target pada informasi tambahan yang dikenal (misalnya, usia dan jenis kelamin), tapi tidak pada karakteristik terukur. Misalnya, jika orang-orang di panel kotor cenderung lebih miskin-setelah semua, salah satu alasan untuk bergabung dengan panel survei adalah untuk mendapatkan uang-kemudian bahkan jika sampel cocok terlihat seperti sampel target dalam hal usia dan jenis kelamin masih akan memiliki bias terhadap orang miskin. Keajaiban probability sampling yang benar adalah untuk menyingkirkan masalah pada kedua karakteristik diukur dan terukur (titik yang konsisten dengan diskusi kami cocok untuk inferensi kausal dari studi observasional pada Bab 2).
Dalam prakteknya, pencocokan sampel tergantung pada memiliki panel besar dan beragam bersemangat untuk menyelesaikan survei, dan dengan demikian itu terutama dilakukan oleh perusahaan yang mampu mengembangkan dan mempertahankan panel tersebut. Juga, dalam prakteknya, bisa ada masalah dengan pencocokan (kadang-kadang cocok untuk seseorang dalam sampel target tidak ada pada panel) dan non-respon (kadang-kadang orang dalam sampel cocok menolak untuk berpartisipasi dalam survei). Oleh karena itu, dalam prakteknya, para peneliti melakukan sampel cocok juga melakukan beberapa jenis penyesuaian pasca-stratifikasi untuk membuat estimasi.
Sulit untuk memberikan jaminan teoritis berguna tentang pencocokan sampel, namun dalam prakteknya dapat melakukan dengan baik. Misalnya, Stephen Ansolabehere dan Brian Schaffner (2014) dibandingkan tiga survei paralel dari sekitar 1.000 orang yang dilakukan pada tahun 2010 dengan menggunakan tiga sampel yang berbeda dan metode wawancara: mail, telepon, dan panel internet menggunakan sampel pencocokan dan penyesuaian pasca-stratifikasi. Perkiraan dari tiga pendekatan yang cukup mirip dengan perkiraan dari tolok ukur berkualitas tinggi seperti Survey sekarang Penduduk (CPS) dan National Health Interview Survey (NHIS). Lebih khusus, baik internet dan email survei yang turun rata-rata 3 poin persentase dan survei telepon off oleh 4 poin persentase. Kesalahan besar ini sekitar apa yang diharapkan dari sampel dari sekitar 1.000 orang. Meskipun, tidak satupun dari mode ini menghasilkan data jauh lebih baik, baik internet dan telepon survei (yang mengambil hari atau minggu) secara substansial lebih cepat ke lapangan daripada mail survey (yang mengambil delapan bulan), dan survei Internet, yang digunakan sampel yang cocok, lebih murah daripada dua mode lainnya.
Kesimpulannya, ilmuwan sosial dan statistik yang sangat skeptis terhadap kesimpulan dari sampel non-probabilitas ini, sebagian karena mereka berhubungan dengan beberapa kegagalan memalukan dari penelitian survei seperti polling Literary Digest. Pada bagian, saya setuju dengan skeptisisme ini: disesuaikan sampel non-probabilitas cenderung menghasilkan perkiraan yang buruk. Namun, jika peneliti dapat menyesuaikan untuk bias dalam proses pengambilan sampel (misalnya, pasca-stratifikasi) atau mengontrol proses pengambilan sampel agak (misalnya, sampel pencocokan), mereka dapat menghasilkan perkiraan yang lebih baik, dan bahkan perkiraan kualitas yang cukup untuk sebagian besar tujuan. Tentu saja, akan lebih baik untuk melakukan dengan sempurna dieksekusi probability sampling, tapi itu tidak lagi muncul menjadi pilihan yang realistis.
Kedua sampel non-probabilitas dan sampel probabilitas bervariasi dalam kualitas mereka, dan saat ini ada kemungkinan kasus yang paling perkiraan dari sampel probabilitas lebih dipercaya daripada perkiraan dari sampel non-probabilitas. Tapi, bahkan sekarang, perkiraan dari sumur-dilakukan sampel non-probabilitas yang mungkin lebih baik daripada perkiraan dari sampel probabilitas buruk-dilakukan. Selanjutnya, sampel non-probabilitas secara substansial lebih murah. Dengan demikian, tampak bahwa probabilitas vs non-probability sampling menawarkan kualitas-biaya trade-off (Gambar 3.6). Ke depan, saya berharap bahwa perkiraan dari baik dilakukan sampel non-probabilitas akan menjadi lebih murah dan lebih baik. Selanjutnya, karena kerusakan dalam survei telepon darat dan meningkatnya tingkat non-respon, saya berharap bahwa sampel probabilitas akan menjadi lebih mahal dan berkualitas rendah. Karena tren jangka panjang ini, saya berpikir bahwa non-probability sampling akan menjadi semakin penting di era ketiga penelitian survei.