Temsil hedef nüfusa için katılımcıların çıkarımlar yapıyor.
Daha büyük nüfusa katılımcıların dan çıkarım zaman olabilir hataların türlerini daha iyi anlayabilmek için, 1936 ABD Başkanlık seçimlerinin sonucunu tahmin etmeye çalıştı Edebiyat Digest saman anket düşünelim. daha fazla 75 yıl önce olmasına rağmen, bu fiyasko günümüzde araştırmacılar öğretmek için önemli bir ders vardır.
Edebiyat Digest popüler genel faiz dergisi oldu ve 1920 yılında başlayan bu Cumhurbaşkanlığı Seçimlerinin sonuçlarını tahmin etmek saman anketler yayınlanmaya başladı. Onlar birçok kişi için oy pusulalarını göndermek ve daha sonra sadece döndürülen oy pusulalarını uydurmak istiyorum bu tahminleri yapmak için, Edebiyat Digest gururla aldıkları oy pusulaları ne "., Ağırlıklı ayarlanır, ne de yorumlanır" Bu prosedür doğru kazanan tahmin olduğunu bildirdi 1920 1924, 1928 ve 1932 1936 yılında seçimlerin, Büyük Buhran ortasında, Edebiyat Digest isimleri ağırlıklı olarak telefon rehberi ve otomobil tescil kayıtlarından gelen 10 milyon insanlara oy pusulalarını gönderdi. İşte onların metodoloji açıklanan nasıl:
"Otuz yıllık tecrübesi hızlı hassasiyetle Digest pürüzsüz çalışan makine hamle sert gerçekler varsayımları azaltmak için. . . .Bu Hafta 500 kalem bir milyondan fazla adres çeyrek günde bir dışarı çizik. Her gün, New York'ta motor fiyonklu Dördüncü Caddesi üzerinde yüksek bir büyük oda içinde, 400 işçi ustalıkla madde yeterince kırk şehir blokları-içine ele Zarf [sic] döşemek için basılı bir milyon adet kaydırın. Her saat, Digest'S kendi Postane Trafo içinde, üç çatırtı pul ölçüm makineleri mühürlü ve beyaz oblongs damgalı; yetenekli posta çalışanları mailsacks şişkin içine çevirdi; filo DIGEST kamyonlar onları posta trenler ifade etmek hızlandırdı. . . Gelecek hafta, bu on milyon ilk cevaplar, belirgin oyların gelen gelgit başlayacak üçlü kontrol beş kat çapraz sınıflandırılmış doğrulanmış ve gerçekleşti olmak. son rakam totted ve kontrol edildikten sonra geçmiş tecrübeler bir kriter ise, ülke yüzde 1 kırk milyon [seçmen] gerçek halk oy bir kısmını içinde bilecek. "(1936 22 Ağustos)
boyutu Digest Fetişleştirme herhangi bir "büyük veri" araştırmacı bugün hemen tanınabilir. 10 milyon oy pusulası dağıtılan, inanılmaz bir 2,4 milyon oy pusulası iade-o vardı kabaca modern siyasal anketlerde 1.000 kat daha büyük olduğunu. Bu 2,4 milyon katılımcıların itibaren karar açıktı: Edebiyat Digest rakibi Alf Landon görevdeki Franklin Roosevelt'e yenmek için gittiğini tahmin. Ama, aslında, tam tersi oldu. Roosevelt heyelan Landon yendi. Nasıl Edebiyat Digest çok veri ile yanlış gidebiliriz? Örnekleme Modern anlayış Edebiyat Digest hataları belirginleştirir ve bize gelecekte benzer hataları yapmaktan kaçınmak yardımcı olur.
örnekleme hakkında açıkça düşünme insanlar dört farklı grupları (Şekil 3.1) dikkate etmemizi gerektirir. Insanların ilk grup hedef nüfusu; Bu araştırma ilgi nüfusunun olarak tanımladığı grubudur. Edebiyat Digest durumunda hedef nüfusu 1936 Cumhurbaşkanlığı seçimlerinde seçmen oldu. Bir hedef kitleyi karar verdikten sonra, bir araştırmacı bir sonraki örnekleme için kullanılabilecek kişilerin bir listesini geliştirmesi gerekmektedir. Bu liste, örnekleme çerçevesi olarak adlandırılır ve örnekleme çerçevesi nüfus kare nüfus denir. Edebiyat Digest durumunda çerçeve nüfus isimleri telefon rehberleri ve otomobil tescil kayıtlarından baskın geldi 10 milyon kişi oldu. İdeal hedef nüfusu ve çerçeve nüfus aynı olurdu, ama pratikte bu böyle değil genellikle. Hedef nüfus ve çerçeve nüfus arasındaki farklar kapsama hatası denir. Kapsama hatası, tek başına sorunları garanti etmez. Ama, çerçevesi, nüfusun insanlar insanlardan sistematik farklı değilse çerçevesi, nüfusun kapsama önyargı olacaktır. Kapsam hatası Edebiyat Digest anket ile büyük kusurları ilk oldu. Onlar seçmen-oldu hakkında öğrenmek istedim onların hedef nüfus ancak telefon rehberleri ve otomobil kayıtlarının, kaynaklardan ağırlıklı bir örnekleme çerçevesi inşa zengin aşırı temsil ettiği bu teknolojilerin de o Alf Landon (hatırlama desteklemek için daha fazlaydı Amerikalılar, yaygın olan olan bugün, zaman ve) ABD Büyük Buhran ortasında olduğunu nispeten yeni.
Çerçeve nüfus tanımladıktan sonra, bir sonraki adım örnek nüfusu seçmek için bir araştırmacı içindir; Bu araştırmacı görüşme çalışacaktır insanlardır. Örnek çerçevesi, nüfusun farklı özellikler varsa, o zaman örnekleme hatası tanıtabilirsiniz. Bu genellikle tahminleri eşlik hata marjı içinde sayısal hata türüdür. Edebiyat Digest fiyasko durumunda, aslında hiçbir örnek yoktu; Onlar çerçevesi, nüfusun herkesi temasa çalıştı. hiçbir örnekleme hatası var olmasına rağmen, hala açıkçası hata oluştu. Bu genellikle anketlerden tahminleri ile bildirilen hataların marjları genellikle yanıltıcı küçük açıklık getirmektedir; Onlar hata tüm kaynakları dahil değildir.
Son olarak, bir araştırmacı örneklem herkes röportaj çalışır. Başarıyla görüşülen olan insanlar katılımcıların denir. İdeal olarak, örnek nüfus ve katılımcılar tam olarak aynı, ancak pratikte olmayan tepki var olacaktır. Bu numunede seçilen insanlar katılmayı reddetme vardır. Cevap insanlar cevap vermeyen olanlardan farklı ise, o zaman olmayan tepki önyargı olabilir. Sigara tepki önyargı Edebiyat Digest anket ile ikinci ana sorun oldu. Bir oylama alınan insanların sadece% 24 yanıt verdi ve Landon desteklenen insanlar cevap daha olası olduğunu ortaya çıktı.
Sadece temsil fikirlerini tanıtmak için bir örnek olmanın ötesinde, Edebiyat Digest anketi Gelişigüzel örnekleme tehlikeleri konusunda araştırmacıları uyarıda, bir sık sık tekrarlanan bir örnektir. Ne yazık ki, birçok kişi bu hikayenin çizmek ders yanlış biri olduğunu düşünüyorum. Hikayenin en yaygın ahlaki araştırmacılar (katılımcı seçmeye yönelik sıkı olasılık tabanlı kurallar olmadan, yani örneklerin) olasılık dışı örneklerinden hiçbir şey öğrenemez olmasıdır. Daha sonra bu bölümde göstereceğim gibi, bu çok doğru değil. Bunun yerine, bu hikayenin iki ahlak gerçekten olduğunu düşünüyorum; Onlar 1936 First olduğu gibi bugün de doğrudur ahlak, gelişigüzel toplanan verilerin büyük miktarda iyi tahmin garanti vermez. İkinci olarak, araştırmacılar ondan tahminler yapıyoruz kendi veri toplanmıştır nasıl hesaba gerek. Edebiyat Digest anket veri toplama süreci sistematik bazı katılımcıların eğilmiş çünkü başka deyişle, araştırmacılar diğerlerinden daha o ağırlıkları bazı katılımcılar daha daha karmaşık bir tahmin süreci kullanmak gerekir. Daha sonra bu bölümde, ben böyle bir ağırlık prosedürü-sonrası tabakalaşma-olmayan olasılık örnekleri ile daha iyi tahminler yapmak için etkinleştirebilirsiniz göstereceğim.