Rəqəmsal yaş, praktikada daha çox ehtimal nümunəsi yaradır və qeyri-ehtimal olunan nümunə üçün yeni imkanlar yaradır.
Nümunə tarixində iki rəqabət yanaşması olmuşdur: ehtimalların nümunə üsulları və qeyri-ehtimal olunan nümunə üsulları. Hər iki yanaşma nümunənin ilk günlərində istifadə olunsa da, ehtimal nümunəsi üstünlük təşkil edir və çoxlu sosial tədqiqatçılar qeyri-ehtimal olunan nümunəni böyük şübhə ilə nəzərdən keçirmək üçün tədris olunur. Lakin, aşağıda təsvir edəcəyəm ki, rəqəmsal yaşa görə yaradılan dəyişikliklər tədqiqatçıların qeyri-ehtimal olunan nümunələrin yenidən nəzərdən keçirilməsinin vaxtıdır. Xüsusilə, ehtimal nümunələri praktikada çətinləşir və qeyri-ehtimal nümunəsi daha sürətli, daha ucuz və daha yaxşılaşır. Daha sürətli və daha ucuz tədqiqatlar yalnız özləri ilə bitmir: daha tez-tez araşdırma və daha böyük nümunə ölçüsü kimi yeni imkanlar təmin edir. Məsələn, qeyri-ehtimal üsulları ilə Kooperativ Konqresinin Seçki Tədqiqatı (CCES) ehtimal nümunəsi istifadə edərək əvvəlki araşdırmalara nisbətən təxminən 10 qat daha çox iştirakçıya sahib ola bilər. Bu daha böyük nümunə siyasi tədqiqatçılara alt qruplar və sosial kontekstlərdə münasibət və davranış dəyişikliyi öyrənməyə imkan verir. Bundan əlavə, bu əlavə miqyasın hamısı qiymətləndirmələrin keyfiyyətində (Ansolabehere and Rivers 2013) azalma olmadan gəldi.
Hal-hazırda, sosial tədqiqatlar üçün nümunəyə üstünlük verən yanaşma ehtimal nümunəsi . Ehtimalda nümunə olaraq, hədəf populyasiyanın bütün üzvləri nümunə olmağının bilinməyən, sıfır olmayan ehtimalı var və nümunə olan bütün insanlar anketə cavab verirlər. Bu şərtlər yerinə yetirildikdə, zərif riyazi nəticələr tədqiqatçıın nümunəni hədəf nüfusla bağlı fərziyyələr yaratmaq qabiliyyətinə dair sübut təmin edir.
Ancaq real dünyada bu riyazi nəticələrin altında yatan şərtlər nadir hallarda qarşılanır. Məsələn, tez-tez əhatə olunan səhvlər və cavab vermirlər. Bu problemlər üzündən tədqiqatçılar nümunələrindən hədəf populyasiyasına çıxmaq üçün müxtəlif statistik dəyişikliklər aparırlar. Belə ki, belə bir zəmanət təklif edir və statistik düzəlişlər bir sıra asılıdır praktikada güclü nəzəri zəmanət var nəzəri ehtimal seçmə, və ehtimal seçmə, ayırmaq üçün vacibdir.
Vaxt keçdikcə, ehtimal nümunəsinin nəzəriyyə və ehtimal nümunəsi ilə praktikada fərqləri artır. Məsələn, yüksək keyfiyyətli, qiymətli tədqiqatlarda (məsələn, 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) cavabsızlıq dərəcələri daim artır. Cavab vermə dərəcələri kommersiya telefon sorğularında daha yüksəkdir - bəzən də 90% -ə qədər (Kohut et al. 2012) . Təsadüfi olmayan bu artımlar təxminlərin keyfiyyətinə təhlükə yaradır, çünki təxminlər getdikcə tədqiqatçılar cavab verməmək üçün tənzimləmək üçün istifadə etdiyi statistik modellərə əsaslanır. Bundan əlavə, keyfiyyətin bu azalması tədqiqatçıların yüksək reaksiya dərəcələrini saxlamaq üçün gedən bahalı səylərinə baxmayaraq baş vermişdir. Bəzi insanlar keyfiyyət və artan xərclərin azalması bu ikitərəfli tendensiyalar tədqiqat tədqiqatının təməlini təhlükə altına qoymaqdan qorxur (National Research Council 2013) .
Eyni zamanda, ehtimalların seçilməsi metodları üçün çətinliklər artır, qeyri-ehtimal olunan nümunə üsullarında maraqlı hadisələr də mövcuddur. Olmayan ehtimalların seçilməsi metodlarının müxtəlif üslubları var, amma ümumi bir şey onlar ehtimal nümunəsinin riyazi çərçivəsinə asanlıqla uyğun gəlməməsidir (Baker et al. 2013) . Başqa sözlə, qeyri-ehtimal edilən nümunə üsullarında hər kəsin daxil olma ehtimalı bilinmir və qeyri-mümkündür. Qeyri-ehtimal edilən nümunə üsulları, ictimai tədqiqatçılar arasında qorxunc bir ünsürə malikdir və onlar Ədəbi Digest fiyaskosu (əvvəllər müzakirə edilmiş) və "Dewey Truman" kimi tədqiqatçıların ən dramatik uğursuzluqları ilə əlaqəli olurlar. ABŞ-da yanlış proqnoz 1948-ci il prezident seçkiləri (rəqəm 3.6).
Rəqəmsal yaşa xüsusi uyğun olmayan nümunələrin bir forması onlayn panellərin istifadəidir. Online panellərdən istifadə edən tədqiqatçılar bəzi panel təminatçısına - adətən bir şirkət, hökumət və ya universitet - tədqiqatçılar üçün cavabdeh kimi xidmət göstərməyi qəbul edən böyük, müxtəlif qrup qurmaq üçün bağlıdır. Bu panel iştirakçıları tez-tez online banner reklamları kimi müxtəlif ad hoc metodlardan istifadə edərək işə götürülür. Daha sonra tədqiqatçı istənilən xüsusiyyətləri olan respondentlərin nümunəsinə (məsələn, yetkinlərin milli nümayəndəsi) daxil olmaq üçün panel təminatçısını ödəyə bilər. Bu onlayn panellər qeyri-ehtimal üsullarıdır, çünki hər kəsin daxil olma ehtimalı qeyri-mümkündür. Qeyri-ehtimal olunan onlayn panellər artıq sosial tədqiqatçılar tərəfindən istifadə olunur (məsələn, CCES), onlardan gələn təxminlərin keyfiyyəti ilə bağlı bəzi müzakirələr hələ də davam edir (Callegaro et al. 2014) .
Bu müzakirələrə baxmayaraq, məncə, sosial tədqiqatçıların qeyri-ehtimal olunan nümunələrin yenidən nəzərdən keçirilməsi üçün vaxtın düzgün olması iki səbəbdən ibarətdir. Birincisi, rəqəmsal dövrdə qeyri-ehtimal nümunələrinin toplanması və təhlilində bir çox hadisələr olmuşdur. Bu yeni üsullar keçmişdə problemlərə səbəb olan üsullardan kifayət qədər fərqlidir və mən düşünürəm ki, bunları "qeyri-ehtimal olunan nümunə 2.0" kimi düşünmək məntiqlidir. İkinci səbəb isə tədqiqatçıların qeyri-ehtimal nümunəsinin yenidən nəzərdən keçirilməsidir, çünki ehtimal nümunəsi təcrübə daha da çətinləşir. Cavab verilməyən yüksək dərəcələr olduqda - indi real tədqiqatlarda olduğu kimi, respondentlərin daxil olma ehtimalı məlum deyil və beləliklə, bir çox tədqiqatçı inanırdı ki, ehtimal nümunələri və qeyri-ehtimal nümunələri fərqli deyil.
Daha əvvəl dediyim kimi qeyri-ehtimal nümunələri bir çox sosial tədqiqatçı tərəfindən böyük bir şübhə ilə izlənilir, bəzən anket tədqiqatının başlanğıcında ən utanc verici uğursuzluqlardakı rolundan görə. Qeyri-ehtimal nümunələri ilə nə qədər gəldiyimizə dair aydın bir nümunə, Wei Wang, David Rothschild, Sharad Goel və (2015) ci ildə ABŞ seçkilərinin nəticələrini doğru bir şəkildə bərpa edən Andrew Gelmanın (2015) qeyri-ehtimal nümunəsi Amerikalı Xbox istifadəçiləri - amerikalıların qətiyyətsiz bir nümunəsi. Tədqiqatçılar XBox oyun sistemindən respondentləri işə götürdilər və gözlədiyiniz kimi, Xbox nümunəsi kişiləri ağladı və gəncləri sıxdı: 18-29 yaş arası seçicilərin 19% -ni, lakin Xbox nümunəsinin 65% -ni və kişiləri seçicilərin 47% -ni, lakin Xbox nümunəsinin 93% -ni təşkil edir (rəqəm 3.7). Bu güclü demoqrafik xarakterlərdən ötəri xammal Xbox məlumatları seçkilərin yekunlarının pis göstəricisiydi. Barak Obamaya Mitt Romni üçün güclü bir qələbə öngördü. Yenə də, bu ham, düzensiz qeyri-ehtimal nümunələrinin təhlükələrinə bir nümunədir və Ədəbi Digest fiyaskosunu xatırladır.
Lakin, Wang və həmkarları bu problemlərdən xəbərdardılar və təxminləri verərkən qeyri-təsadüfi seçmə prosesi üçün düzəliş etməyə çalışdılar. Xüsusilə, onlar post-təbəqələşdirmə , əhatə səhvləri və cavab verməmə ehtimalı nümunələrini tənzimləmək üçün geniş istifadə olunan bir texnikadan istifadə edirdilər.
Post-təbəqələşdirmənin əsas ideyası nümunədən gələn təxminləri yaxşılaşdırmaq üçün hədəf əhali haqqında köməkçi məlumatlardan istifadə etməkdir. Olmayan ehtimal nümunələrindən hesablamalar aparmaq üçün post-təbəqə istifadə edərkən, Wang və iş yoldaşları əhalini fərqli qruplara ayırdılar, hər qrupda Obama üçün olan dəstəyi qiymətləndirdilər və sonra ümumi qiymətləndirməni hazırlamaq üçün qrup hesablamalarının ağırlıqlı ortalamasını aldılar. Məsələn, əhalini iki qrup (kişilər və qadınlar) halına saldıra bilərdi, Obama-nın kişilər və qadınlar arasında dəstəklərini qiymətləndirdilər, sonra da qadınları qadınların meydana gətirməsini hesablamaq üçün ağırlıqlı bir orta alaraq Obamanın ümumi dəstəyini qiymətləndirdilər seçicilərin 53% -ni və kişilərin 47% -ni təşkil edir. Təbii ki, post-təbəqələşmə qrupların ölçüləri haqqında köməkçi məlumatlar gətirməklə balanslaşdırılmış nümunənin düzəldilməsinə kömək edir.
Post-təbəqənin açarı doğru qrupları formalaşdırmaqdır. Əgər əhalini homojen qruplara ayırsanız, cavab qrupları hər bir qrupda hər kəs üçün eyni olarsa, post-təbəqələşdirmə obyektiv təxminlər verəcəkdir. Başqa sözlə desək, cinsiyyətə görə post-təbəqələşdirmə, bütün kişilərin cavab meylinə sahib olmasına və bütün qadınların eyni reaksiya meylinə sahib olmasına qarşı obyektiv təxminlər verəcəkdir. Bu fərziyyəyə homojen cavab-propensiyalar-içərisində qrup fərziyyələri adlanır və mən bu fəslin sonunda riyazi qeydlərdə bir az daha təsvir edirəm.
Əlbəttə ki, bütün kişilər və qadınlar üçün cavabdehliklərin eyni olması ehtimalı görünmür. Bununla birlikdə, qrupların sayı artdığına görə homojen-cavab-propensiyalar-qrup içərisində fərziyyələr daha məqbul olur. Daha çox qrup yaratdığınız təqdirdə, əhalini homojen qruplara buraxmaq daha asan olur. Misal üçün, bütün qadınların eyni cavaba meyl göstərməsi qeyri-mümkün görünə bilər, ancaq 18-29 yaşlarında olan, kollecni bitirən və Kaliforniya ştatında yaşayan bütün qadınlar üçün eyni cavabı meylli olduğu daha məqbul görünə bilər. . Beləliklə, post-təbəqələşmədə istifadə olunan qrupların sayı artdıqca, metodu dəstəkləmək üçün lazım olan fərziyyələr daha məqbul olur. Bu həqiqəti nəzərə alaraq, tədqiqatçılar tez-tez təbəqələşmələr üçün çox sayda qrup yaratmaq istəyirlər. Lakin, qrupların sayı artdıqca, tədqiqatçılar fərqli bir problemə düşürlər: məlumatların azlığı. Hər bir qrupda yalnız az sayda insan varsa, təxminlər daha qeyri-müəyyən olacaq və heç bir cavabdeh olmayan qrup olduqda həddindən artıq vəziyyətdə, post-təbəqələşmə tamamilə pozulur.
Homojen-cavab-meylli-qrup içərisində fərziyyənin və hər bir qrupdakı ağlabatan nümunə ölçüsünə olan tələbatın məqsədəuyğunluğu arasında bu doğuran gərginliyin iki yolu var. Birincisi, tədqiqatçılar hər bir qrupda ağlabatan nümunə ölçülərini təmin etməyə kömək edən daha geniş, daha müxtəlif nümunə toplaya bilərlər. İkincisi, qruplar daxilində qiymətləndirmələr etmək üçün daha mürəkkəb bir statistik model istifadə edə bilərlər. Və, əslində, bəzən tədqiqatçılar, həm də Wang və həmkarları Xboxdan respondentləri istifadə edərək seçdikləri araşdırma ilə etdilər.
Kompüterlə idarə olunan müsahibələr ilə qeyri-ehtimal olunan nümunə üsulunu istifadə etdikləri üçün (3.5 bölməsində kompüter idarəedən müsahibələr haqqında daha çox söhbət edəcəyəm), Wang və həmkarları 345,858 unikal iştirakçıdan məlumat toplamağa imkan verən çox ucuz məlumat toplayıblar , seçki sandığının standartlarına görə çox sayda. Bu kütləvi nümunə ölçüsü onlara post-təbəqələşmə qruplarının çoxlu sayını yaratmağa imkan verdi. Post-təbəqələşdirmə adətən əhalini yüzlərlə qrup halına gətirməklə məşğul olsa da, Wang və həmkarları əhalini gender (2 kateqoriyalar), irq (4 kateqoriya), yaş (4 kateqoriya), təhsil (4 kateqoriya), dövlət tərəfindən müəyyən edilmiş 176,256 (51 kateqoriya), şəxsiyyət vəsiqəsi (3 kateqoriya), ideologiya (3 kateqoriya) və 2008-ci ildə səsvermə (3 kateqoriyalı). Başqa sözlə, aşağı qiymətli məlumatların toplanması ilə effektiv olan böyük nümunə ölçüsü onları qiymətləndirmə prosesində daha məqbul bir fərziyyə yaratmağa imkan verdi.
Ancaq 345,858 unikal iştirakçı ilə hətta hələ də Wang və həmkarlarının demək olar ki, heç bir respondentə malik olmadığı bir çox qrup var idi. Buna görə, hər qrupdakı dəstəyi qiymətləndirmək üçün çox səviyyəli regression adlı bir texnikadan istifadə etdilər. Əslində, Obamanın müəyyən bir qrup daxilində dəstəyini qiymətləndirmək üçün, çoxsəviyyəli regressiya çox yaxından əlaqəli qrupların məlumatlarını birləşdirdi. Məsələn, Obamanın 18-29 yaş arası qadınlar arasında, Obamaya qeydə alınmış Demokratlar, moderatorluq edən və 2008-ci ildə Obamaya səs verən qeydiyyatdan keçən qadınlar arasında Obama üçün dəstəyi qiymətləndirməyə çalışın. , çox xüsusi bir qrupdur və bu xüsusiyyətləri olan nümunədə heç kim yoxdur. Buna görə, bu qrup haqqında təxminlər etmək üçün, çoxsəviyyəli regressiya çox oxşar qruplardakı insanlardan təxminləri birləşdirmək üçün statistik bir model istifadə edir.
Beləliklə, Wang və həmkarları çox səviyyəli reqressiya və post-təbəqələşmə birləşdirən bir yanaşma istifadə edərək, strategiyasını çox qatlamlı reqressiyanı post-təbəqələşdirmə və ya daha sevən bir şəkildə adlandırdılar. P. "Wang və həmkarları XBox qeyri-ehtimal nümunəsindən qiymətləndirmələr etmək üçün cənab P. istifadə etdikdə, Obama 2012-ci ildə keçirilən seçkidə aldıqları ümumi dəstəyə çox yaxın təxminlər çıxardı (şəkil 3.8). Əslində onların qiymətləndirmələri ənənəvi ictimai rəy sorğularından daha dəqiq idi. Beləliklə, bu vəziyyətdə, statistik tənzimləmələr, xüsusilə cənab P., ehtimal olunan olmayan məlumatlarda yanlışlığı düzəldən yaxşı bir iş görür; düzəlişsiz Xbox məlumatlarından təxminlərə baxdığınız zaman aydın görünürdü.
Wang və iş yoldaşlarının işindən iki əsas dərs var. Birincisi, düzensiz qeyri-ehtimal nümunələri pis qiymətləndirmələrə səbəb ola bilər; bu bir çox tədqiqatçı daha əvvəl eşitmiş bir dərsdir. İkinci dərs isə, qeyri-ehtimal nümunələrinin düzgün analiz edildikdə həqiqətən yaxşı qiymətləndirmələrə səbəb ola bilməsi; qeyri-ehtimal nümunələri Avtomatik olaraq ədəbi Digest fiyaskosu kimi bir şeyə səbəb olmur.
Bir ehtimal nümunəsi yanaşması və qeyri-ehtimal nümunəsi yanaşması arasında qərar verməyə çalışdığınız təqdirdə çətin bir seçimlə qarşılaşırsınız. Bəzən tədqiqatçılar sürətli və sərt bir qayda istəməlidirlər (məsələn, həmişə ehtimalların seçilməsi üsulları), lakin belə bir qayda təklif etmək getdikcə daha çətin olur. Tədqiqatçılar, daha ucuz və daha sürətli, lakin daha az tanış və daha çox müxtəlif olan istifadəsi və qeyri-ehtimal olunan nümunə üsullarını əsaslandırdıqları nəzəri nəticələrdən uzaq olan və getdikcə bahalı olan təcrübədə ehtimal olunan nümunə üsulları arasında çətin seçim edirlər. Bununla yanaşı aydındır ki, qeyri-ehtimal nümunələri və ya qeyri-təmsiledici böyük məlumat mənbələri ilə işləməyə məcbur olduqda (2-ci fəsilə nəzər salın), ondan sonra post-təbəqələşmə və əlaqədar texnika düzəldilməmiş, xammal ehtimallarından daha yaxşı olacaq.