Perwakilan adalah tentang membuat kesimpulan daripada responden anda kepada penduduk sasaran anda.
Untuk memahami jenis kesilapan yang boleh berlaku apabila menyimpulkan dari responden kepada penduduk yang lebih besar, mari kita tentukan Polling tabung Literary Digest yang cuba meramalkan hasil pilihan raya presiden AS 1936. Walaupun ia berlaku lebih daripada 75 tahun yang lalu, kebingungan ini masih mempunyai pengajaran penting untuk mengajar para penyelidik hari ini.
Literary Digest adalah majalah umum yang popular, dan bermula pada tahun 1920, mereka mula menjalankan pemilihan jagung untuk meramalkan hasil pemilihan presiden. Untuk membuat ramalan-ramalan ini, mereka akan menghantar surat kepada banyak orang dan kemudian mengumpul jumlah undi yang telah dikembalikan; Literary Digest bangganya melaporkan bahawa kertas undi yang mereka terima adalah tidak "wajaran, diselaraskan, atau ditafsirkan." Prosedur ini betul meramalkan pemenang pilihan raya pada tahun 1920, 1924, 1928 dan 1932. Pada tahun 1936, di tengah-tengah Kemelesetan Besar, sastera Digest menghantar undi kepada 10 juta orang, yang namanya didominasi dari direktori telefon dan rekod pendaftaran kereta. Inilah cara mereka menerangkan metodologi mereka:
"Mesin berjalan lancar DIGEST bergerak dengan kepantasan cepat tiga puluh tahun pengalaman untuk mengurangkan tebakan kepada fakta-fakta yang sukar ... Minggu ini 500 pena mencairkan lebih daripada seperempat juta alamat sehari. Setiap hari, di sebuah bilik besar di atas Fourth Avenue di New York, di New York, 400 pekerja mencatatkan satu juta keping bahan bercetak-cukup untuk membuka empat puluh blok bandar-ke dalam envelops yang ditujukan. Setiap jam, di Substation Pejabat Pos sendiri DIRI, tiga mesin pemeteran pos perletakan dimeteraikan dan dicap bujur putih; pekerja pos mahir membalikkan mereka ke dalam pos meletup; trak DIGEST armada memacu mereka untuk meluahkan mel kereta api. . . Minggu depan, jawapan pertama dari sepuluh juta ini akan memulakan arus masuk undi yang ditandatangani, untuk disemak tiga kali, disahkan, lima kali silang dan diklasifikasikan. Apabila angka terakhir telah dipecahkan dan diperiksa, jika pengalaman masa lalu adalah kriteria, negara akan mengetahui dalam pecahan 1 peratus undi popular yang sebenarnya sebanyak empat puluh juta [pengundi]. "(22 Ogos 1936)
Saiz fetishization Literary Digest segera dikenali kepada mana-mana penyelidik "data besar" hari ini. Daripada 10 juta undi diedarkan, 2.4 juta yang menakjubkan telah dikembalikan - iaitu kira-kira 1,000 kali lebih besar daripada pemilihan politik moden. Dari 2.4 juta responden, keputusan itu jelas: Alf Landon akan mengalahkan Franklin Roosevelt yang hadir. Tetapi sebenarnya, Roosevelt mengalahkan Landon dalam keadaan longsor. Bagaimanakah Literary Digest dapat salah dengan begitu banyak data? Pemahaman moden kami tentang persampelan membuat kesilapan Literary Digest jelas dan membantu kami mengelakkan melakukan kesilapan yang sama di masa depan.
Berfikir secara jelas mengenai pensampelan memerlukan kita untuk mempertimbangkan empat kumpulan yang berbeza (angka 3.2). Kumpulan pertama adalah penduduk sasaran ; ini adalah kumpulan yang ditakrifkan oleh penyelidik sebagai penduduk yang berminat. Dalam kes Literary Digest , penduduk sasaran adalah pengundi dalam pilihan raya presiden 1936.
Selepas menentukan populasi sasaran, seorang penyelidik perlu membangunkan senarai orang yang boleh digunakan untuk persampelan. Senarai ini dipanggil bingkai pensampelan dan orang-orang di atasnya dipanggil populasi bingkai . Sebaik-baiknya, populasi sasaran dan populasi kerangka akan sama, tetapi dalam praktiknya ini sering kali tidak berlaku. Sebagai contoh, dalam kes Literary Digest , populasi bingkai adalah 10 juta orang yang namanya didominasi dari direktori telefon dan rekod pendaftaran kereta. Perbezaan antara populasi sasaran dan populasi bingkai disebut ralat liputan . Kesilapan liputan tidak, dengan sendirinya, menjamin masalah. Walau bagaimanapun, ia boleh menyebabkan kecenderungan liputan jika orang dalam populasi bingkai berbeza secara sistematik daripada orang dalam populasi sasaran yang tidak berada dalam populasi bingkai. Inilah, sebenarnya, apa yang berlaku dalam tinjauan Literary Digest . Orang-orang dalam populasi bingkai mereka lebih cenderung untuk menyokong Alf Landon, sebahagiannya kerana mereka lebih kaya (ingat bahawa kedua-dua telefon dan kereta agak baru dan mahal pada tahun 1936). Jadi, dalam tinjauan Literary Digest , kesilapan liputan membawa kepada kecenderungan liputan.
Selepas menentukan populasi bingkai , langkah seterusnya adalah untuk seorang penyelidik untuk memilih populasi sampel ; ini adalah orang yang akan diteliti oleh penyelidik. Jika sampel mempunyai ciri-ciri yang berbeza daripada populasi bingkai, maka pensampelan boleh memperkenalkan kesilapan sampling . Dalam kes kegagalan Literary Digest , bagaimanapun, sebenarnya tidak ada sampelan-majalah untuk menghubungi semua orang dalam populasi kerangka-dan oleh itu tidak ada kesilapan sampling. Ramai penyelidik cenderung menumpukan kepada kesilapan sampelan-ini biasanya satu-satunya jenis kesilapan yang ditangkap oleh margin ralat yang dilaporkan dalam kaji selidik-tetapi kegagalan Literary Digest mengingatkan kita bahawa kita perlu mempertimbangkan semua sumber kesilapan, secara rawak dan sistematik.
Akhir sekali, selepas memilih populasi sampel, seorang penyelidik cuba untuk mewawancarai semua anggotanya. Orang-orang yang berjaya ditemuramah dipanggil responden . Sebaik-baiknya, populasi sampel dan responden akan sama persis, tetapi dalam amalan terdapat respons yang tidak bertanggungjawab. Iaitu, orang yang dipilih dalam sampel kadang-kadang tidak mengambil bahagian. Sekiranya orang yang bertindak balas berbeza dengan mereka yang tidak bertindak balas, maka boleh jadi sikap tidak bertanggungjawab . Biasalah yang tidak bertanggungjawab merupakan masalah utama kedua dengan pengundian Literary Digest . Hanya 24% daripada orang yang menerima undi menjawab, dan ternyata orang yang menyokong Landon lebih cenderung untuk bertindak balas.
Selain menjadi contoh untuk memperkenalkan idea-idea perwakilan, pengkajian Literary Digest adalah perumpamaan yang sering diulang, memperingati penyelidik tentang bahaya kesilapan sampling. Malangnya, saya fikir bahawa pelajaran yang diambil oleh ramai orang dari cerita ini adalah yang salah. Moral yang paling umum dalam kisahnya ialah penyelidik tidak dapat belajar apa-apa daripada sampel bukan kebarangkalian (contohnya, sampel tanpa peraturan berasaskan kebarangkalian yang ketat untuk memilih peserta). Tapi, seperti yang akan saya tunjukkan pada bab ini, ini tidak betul. Sebaliknya, saya fikir ada dua moral dalam cerita ini; akhlak yang benar seperti sekarang pada tahun 1936. Pertama, sejumlah besar data yang terkumpul secara serentak tidak menjamin anggaran yang baik. Pada umumnya, mempunyai sejumlah besar responden mengurangkan varians anggaran, tetapi tidak semestinya mengurangkan berat sebelah. Dengan banyak data, para penyelidik kadangkala dapat memperoleh perkiraan yang tepat tentang perkara yang salah; mereka boleh menjadi tepat tidak tepat (McFarland and McFarland 2015) . Pelajaran utama kedua dari kegagalan Literary Digest ialah penyelidik perlu memikirkan bagaimana sampel mereka dikumpulkan ketika membuat anggaran. Dalam erti kata lain, kerana proses pensampelan dalam pengundian Literary Digest secara sistematik ditujukan kepada beberapa responden, para penyelidik perlu menggunakan proses pengiraan yang lebih rumit yang membebani responden lebih daripada yang lain. Kemudian dalam bab ini, saya akan menunjukkan kepada anda satu prosedur pembobakan-post-stratification-yang membolehkan anda membuat anggaran yang lebih baik dari sampel-sampel yang bersifat serasi.