ციფრული ასაკი ახდენს ალბათობის შერჩევას პრაქტიკაში და ქმნის ახალ შესაძლებლობებს არამარტო ალბათობის შერჩევისთვის.
შერჩევის ისტორიის მანძილზე, არსებობს ორი კონკურენტული მიდგომა: ალბათობის შერჩევის მეთოდები და არამატერიალური შერჩევის მეთოდები. მიუხედავად იმისა, რომ ორივე მიდგომა იქნა გამოყენებული ადრეულ ეტაპზე შერჩევის, ალბათობა შერჩევის დადგა დომინირებს, და ბევრი სოციალური მკვლევარები ასწავლიან, რომ არ ალბათობა შერჩევის დიდი სკეპტიციზმი. თუმცა, როგორც ქვემოთ აღვწერ, ციფრული ასაკის მიერ შექმნილი ცვლილებები ნიშნავს იმას, რომ მკვლევართა დროა, რომ გადახედოს არასასურველი სინჯების გადახედვას. კერძოდ, ალბათობის შერჩევა პრაქტიკულად რთულია, და არა ალბათობა შერჩევისას უფრო სწრაფად, იაფი და უკეთესია. სწრაფი და იაფი კვლევები არ არის მხოლოდ თავისთავად მთავრდება: ისინი საშუალებას აძლევენ ახალ შესაძლებლობებს, როგორიცაა უფრო ხშირი კვლევები და უფრო დიდი ნიმუში ზომები. მაგალითად, კოეფიციენტური კონგრესის არჩევნების შემსწავლელი (CCES) კოეფიციენტური მეთოდების გამოყენებით შეუძლია 10-ჯერ მეტი მონაწილეს ჰქონდეს შესაძლებლობა, ვიდრე ადრე სწავლა ალბათობის შერჩევის გამოყენებით. ეს ბევრად უფრო დიდი ნიმუში საშუალებას აძლევს პოლიტიკურ მკვლევარებს შეისწავლონ ვარიაცია დამოკიდებულების და ქცევის ქვე-ჯგუფებში და სოციალურ კონტექსტში. გარდა ამისა, ყველა ამ დამატებითი მასშტაბი მოვიდა შეფასების ხარისხის შემცირების გარეშე (Ansolabehere and Rivers 2013) .
ამჟამად, სოციალური კვლევის შერჩევის დომინანტური მიდგომა არის ალბათობის შერჩევა . ალბათობის შერჩევისას, სამიზნე მოსახლეობის ყველა წევრს აქვს გაანალიზებული სინამდვილეში არსებითი, არანჟირების ალბათობა და ყველა ადამიანი, რომელიც სინჯებს პასუხობს. როდესაც ეს პირობები დაკმაყოფილებულია, ელეგანტური მათემატიკური შედეგები უზრუნველყოფს მკვლევარის შესაძლებლობების შესახებ სავარაუდო გარანტიებს, რათა გამოიყენონ ნიმუში, რათა შეიტანონ მიზნები სამიზნე მოსახლეობის შესახებ.
რეალურ სამყაროში, თუმცა, ამგვარი მათემატიკური შედეგების პირობები იშვიათად ხვდება. მაგალითად, ხშირია გაშუქების შეცდომები და არარელეოზი. ამ პრობლემების გამო, მკვლევარებმა ხშირად უნდა გამოიყენონ სტატისტიკური კორექტირების მრავალფეროვნება, რათა მათი ნიმუშიდან მათი სამიზნე მოსახლეობის დასკვნის გაკეთება. აქედან გამომდინარე, მნიშვნელოვანია განასხვავოს თეორიის ალბათობა , რომელსაც გააჩნია ძლიერი თეორიული გარანტიები და პრაქტიკაში ალბათობის სიმპტომი , რომელიც არ იძლევა ასეთი გარანტიებს და დამოკიდებულია სხვადასხვა სტატისტიკურ კორექტირებაზე.
დროთა განმავლობაში, განსხვავებები იზრდება ალბათობის შერჩევისას თეორიულად და ალბათობის პრაქტიკაში პრაქტიკაში. მაგალითად, არარეალისტური განაკვეთები სტაბილურად იზრდება, მაღალი ხარისხის, ძვირადღირებული კვლევებისა (ფიგურა 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) . არარეზონანსი განაკვეთები გაცილებით მაღალია კომერციული სატელეფონო გამოკითხვაში, ზოგჯერ კი 90% (Kohut et al. 2012) . არაჯანსაღების ეს გაზრდა შეფასების ხარისხს საფრთხეს უქმნის, ვინაიდან შეფასებები სულ უფრო მეტად დამოკიდებულია სტატისტიკურ მოდელებზე, რომლებიც მკვლევარებს არ იყენებენ რეგულაციისთვის. გარდა ამისა, ხარისხის შემცირება მოხდა მიუხედავად იმისა, რომ კვლევის მკვლევარებმა უფრო ძვირი ძალისხმევა შეძლეს მაღალი საპასუხოდ. ზოგიერთი ადამიანი შიშობს, რომ ამ twin ტენდენციები შემცირების ხარისხი და მზარდი ღირებულება საფრთხეს უქმნის კვლევის კვლევის (National Research Council 2013) .
ამავე დროს, არსებობს მზარდი სირთულეების ალბათობა შერჩევის მეთოდები, ასევე საინტერესო მოვლენების არასამთავრობო ალბათობა შერჩევის მეთოდები . არსებობს არაერთი ალბათობის შერჩევის მეთოდების მრავალფეროვანი სტილი, მაგრამ ერთი რამ, რაც მათ საერთო აქვთ, ალბათ ვერ შეესაბამება ალბათობის შერჩევის მათემატიკურ ჩარჩოში (Baker et al. 2013) . სხვა სიტყვებით რომ ვთქვათ, არანორმალურად შერჩევის მეთოდებში ყველას არ აქვს ცნობილი და შეუსაბამო ალბათობა. არასასურველი შერჩევის მეთოდები სოციალურ მკვლევარებს შორის საშინელი რეპუტაციაა და ისინი დაკავშირებულია კვლევის მკვლევართა ზოგიერთი დრამატული წარუმატებლობით, როგორიცაა ლიტერატურული დაიჯესტი ფიასკო (ადრე განიხილეს) და "დუეი დაამარცხა ტრუმენი", არასწორი პროგნოზირება აშშ-ს შესახებ 1948 წლის საპრეზიდენტო არჩევნები (ფიგურა 3.6).
არანორმალური შერჩევის ერთ-ერთი ფორმა, რომელიც სპეციალურად შესაფერისია ციფრული ასაკისთვის, არის ონლაინ პანელების გამოყენება . ონლაინ პანელების გამოყენებით მკვლევარები დამოკიდებულნი არიან ზოგიერთ პანელის პროვაიდერთან, როგორც წესი, კომპანიას, მთავრობას ან უნივერსიტეტს, რათა შექმნან დიდი, მრავალფეროვანი ადამიანების ჯგუფი, რომლებიც ეთანხმებიან რესპონდენტების კვლევას. ეს პანელი მონაწილეები ხშირად დაკომპლექტებულია სხვადასხვა სარეკლამო მეთოდების გამოყენებით, როგორიცაა ონლაინ ბანერი რეკლამები. შემდეგ, მკვლევარს შეუძლია გადაიხადოს პანელი პროვაიდერისთვის სასურველი მახასიათებლების მქონე რესპონდენტების ნიმუშის ხელმისაწვდომობა (მაგალითად, მოზარდების ეროვნული წარმომადგენელი). ეს ონლაინ პანელები არ არის ალბათობის მეთოდები, რადგან ყველას არ აქვს ცნობილი, არ აქვს ჩართულობის ალბათობა. მიუხედავად იმისა, რომ არ არსებობს ალბათობის ონლაინ პანელები სოციალური მკვლევარები (მაგ., CCES), ჯერ კიდევ არსებობს გარკვეული დებატები შეფასების ხარისხზე, რაც მათგან მოდის (Callegaro et al. 2014) .
მიუხედავად ამ დებატებისა, მე ვფიქრობ, რომ არსებობს ორი მიზეზი, თუ რატომ არის სწორი სოციალური მკვლევარებისთვის გადახედვა არასტაბილურობის შერჩევისთვის. პირველი, ციფრულ ასაკში, არ ყოფილა ბევრი მოვლენათა შეგროვება და ანალიზი არასასურველი ნიმუშები. ეს ახალი მეთოდები განსხვავებულია იმ მეთოდებისაგან, რომლებიც წარსულში პრობლემებს წარმოადგენენ, ვფიქრობ, რომ მათ აზრით, "არა-ალბათობის შერჩევა 2.0". მეორე მიზეზი, რის გამოც მკვლევარებმა უნდა განიხილონ არასასურველი სინჯები, რადგან ალბათობა პრაქტიკა სულ უფრო რთულია. როდესაც რეაგირების მაღალი მაჩვენებლები არსებობს, როგორც რეალურ კვლევებშია - რესპონდენტების ჩართულობის რეალური ალბათობა არ არის ცნობილი და ამდენად, ალბათობის ნიმუშები და არასტაბილური ნიმუშები არ არის ისეთივე განსხვავებული, როგორც ბევრი მკვლევარი მიიჩნევს.
როგორც ზემოთ ნათქვამი იყო, არასასურველი ნიმუშები დიდი სკეპტიციზმით განიხილება მრავალი სოციალური მკვლევარი, ნაწილობრივ იმიტომ, რომ მათი როლი კვლევის კვლევის ადრეულ დღეებში ყველაზე უხერხულ მდგომარეობაში აღმოჩნდა. უკიდურესი მაგალითი იმისა, თუ რამდენად შორს ვართ ჩვენთან მოტივი ნიმუშებით Wei Wang, David Rothschild, Sharad Goel და Andrew Gelman (2015) რომელიც სწორად გამოსწორდა 2012 წლის აშშ-ის არჩევნების შედეგების არასასურველი ნიმუშის გამოყენებით ამერიკელი Xbox მომხმარებლები - ამერიკელების აშკარად არანორმალური ნიმუში. მკვლევარებმა დაკომპლექტეს XBox სათამაშო სისტემის რესპონდენტები და, როგორც მოგეხსენებათ, Xbox ნიმუში სკეპტირებული მამაკაცი და ჩახშობილი ახალგაზრდა: 18- დან 29 წლამდე ასაკის 19% შეადგენს, მაგრამ Xbox ნიმუშის 65% და მამაკაცები შეადგინოს ელექტორატის 47%, მაგრამ Xbox ნიმუშის 93% (ფიგურა 3.7). ამ ძლიერი დემოგრაფიული მიკერძოების გამო, ნედლეული Xbox მონაცემები არჩევნების დაბრუნების ცუდი მაჩვენებელია. მან იწინასწარმეტყველა ძლიერი გამარჯვება მიტ რომნის ბარაკ ობამასთან დაკავშირებით. კიდევ ერთხელ, ეს კიდევ ერთი მაგალითია საფრთხეების უმიზეზოდ, დაუსაბუთებელი არასტაბილურობის ნიმუშებისა და ლიტერატურული დაიჯესტი ფაზის მოგონებები.
თუმცა, ვანგი და კოლეგები ამ პრობლემების შესახებ იცოდნენ და ცდილობდნენ, რომ არათანმიმდევრული შერჩევის პროცესისთვის შეცვალონ შეფასებები. კერძოდ, ისინი იყენებდნენ პოსტ-სტრატიფიკაციას , ტექნიკას, რომელიც ფართოდ გამოიყენება ფართოდ გავრცელების ნიმუშების შესაცვლელად, რომლებსაც აქვთ დაფარვის შეცდომები და უპასუხოდ.
პოსტ-სტრატიფიკაციის ძირითადი იდეა მიზნად ისახავს მიზნობრივი მოსახლეობის შესახებ დამხმარე ინფორმაციას, რათა დაეხმაროს ნიმუშისგან მიღებულ შეფასებას. პოსტ-სტრატიფიკაციის გამოყენებისას მათი არასტაბილურობის ნიმუშის შეფასებისას, ვანგმა და კოლეგმა სხვადასხვა ჯგუფად შეაგროვეს, თითოეულ ჯგუფში ობამას მხარდაჭერა შეაფასეს და შემდეგ შეაფასეს ჯგუფის საშუალო წლიური შეფასება. მაგალითად, მათ შეეძლოთ მოსახლეობის გაყოფა ორ ჯგუფად (მამაკაცები და ქალები), დაასკვნა ობამას მხარდაჭერა მამაკაცებსა და ქალებს შორის, შემდეგ კი ობამას საერთო მხარდაჭერა აღინიშნა იმისთვის, რომ ქალთა რაოდენობა ამომრჩეველთა 53% და მამაკაცები 47%. უხეშად, პოსტ-სტრატიფიკაცია ხელს უწყობს ემბარგონულ ნიმუშს სწორი ჯგუფების ზომების შესახებ დამხმარე ინფორმაციის შემოტანაში.
პოსტ-სტრატიფიკაციის გასაღები სწორი ჯგუფების ჩამოყალიბებაა. თუ თქვენ შეგიძლიათ პოპულაცია მოსახლეობის ერთგვაროვან ჯგუფებად ჩამოყალიბდეს, ისიც, რომ რეაგირება თითოეული მათგანისთვის ყველასთვის ერთნაირია, ხოლო პოსტ-სტრატიფიკაცია მიუკერძოებელ შეფასებებს მოამზადებს. სხვა სიტყვებით რომ ვთქვათ, გენდერულმა პოსტ-სტრატიფიცირება მიუკერძოებელი შეფასებებით გამოიმუშავებს, თუ ყველა ადამიანს აქვს რეაგირება და ყველა ქალს აქვს იგივე რეაგირება. ეს ვარაუდი ეწოდება ჰომოგენურ-რეაგირებას - პროპენციებს, რომელთა ვარაუდებს ვარაუდობენ და მე უფრო მეტს აღწერენ ამ თავის ბოლოს მათემატიკურ შენიშვნებში.
რა თქმა უნდა, ნაკლებად სავარაუდოა, რომ საპასუხო მიდრეკილებები იქნება ყველა მამაკაცი და ყველა ქალი. თუმცა, ჰომოგენური რეაგირების- propensities- ფარგლებში ჯგუფების ვარაუდი უფრო plausible როგორც რაოდენობის ჯგუფების იზრდება. უთუოდ, ხდება უფრო მეტად მოხდეს მოსახლეობის გაერთიანება ერთგვაროვან ჯგუფებად, თუ უფრო მეტი ჯგუფის შექმნა. მაგალითად, შეიძლება, როგორც ჩანს, სავარაუდოა, რომ ყველა ქალს აქვს იგივე რეაგირება, მაგრამ შეიძლება უფრო დამაჯერებელი აღმოჩნდეს, რომ არსებობს იგივე რეაქცია, რომელიც ყველა ქალს, რომლებიც 18-29 წლის ასაკში ცხოვრობენ, დაამთავრა კოლეჯში და ვინ ცხოვრობს კალიფორნიაში . ამდენად, როგორც პოსტ სტრატიფიკაციაში გამოყენებული ჯგუფების რიცხვი უფრო დიდია, მეთოდების დასახმარებლად საჭირო ვარაუდები უფრო გონივრულია. ამ ფაქტის გათვალისწინებით, მკვლევარები ხშირად ქმნიან დიდი რაოდენობით ჯგუფებს პოსტ-სტრატიფიკაციისთვის. თუმცა, როგორც ჯგუფების რიცხვი იზრდება, მკვლევარები სხვადასხვა პრობლემას ატარებენ: მონაცემთა სპარტეციულობა. თუ თითოეულ ჯგუფში მხოლოდ მცირე რაოდენობის ადამიანები არიან, მაშინ შეფასებები უფრო გაურკვეველია და უკიდურეს შემთხვევაში, სადაც არ არის ჯგუფი, რომელსაც არ აქვს რესპონდენტი, მაშინ პოსტ-სტრატიფიკაცია მთლიანად არღვევს.
არსებობს ორი გზა ამ თანდაყოლილი დაძაბულობისგან ერთგვაროვანი რეაგირების plausibility შორის propensity- ფარგლებში ჯგუფების ვარაუდი და მოთხოვნა გონივრული ნიმუში ზომის თითოეულ ჯგუფში. პირველ რიგში, მკვლევარებს შეუძლიათ შეაგროვოს უფრო დიდი, უფრო მრავალფეროვანი ნიმუში, რომელიც უზრუნველყოფს თითოეულ ჯგუფში გონივრულ ნიმუშს. მეორე, მათ შეუძლიათ გამოიყენონ უფრო დახვეწილი სტატისტიკური მოდელი, რათა შეფასდეს ჯგუფის ფარგლებში. სინამდვილეში, ხანდახან მკვლევარებმა ორივე გააკეთეს, რადგანაც ვანგი და კოლეგები აკეთებდნენ არჩევნების შესწავლას არჩევნებში მონაწილეობის მისაღებად.
იმის გამო, რომ ისინი იყენებდნენ კომპიუტერის ადმინისტრირებულ ინტერვიუებთან შედარებით არასასურველი შერჩევის მეთოდით (მე უფრო მელაპარაკებდი კომპიუტერის ადმინისტრირებულ ინტერვიუზე 3.5 სექციაში), Wang- ს და კოლეგებს ძალიან ძვირი მონაცემთა შეგროვება ჰქონდათ, რამაც შესაძლებელი გახადა ინფორმაციის შეგროვება 345,858 უნიკალური მონაწილეებისგან , უზარმაზარი ნომერი საარჩევნო კენჭისყრის სტანდარტების მიხედვით. ეს მასიური ნიმუშის ზომა საშუალებას მისცემდა მათ შექმნან უზარმაზარი პოსტი სტრატიფიკაციის ჯგუფები. ვინაიდან პოსტ-სტრატიფიკაცია ჩვეულებრივ მოიცავს ასობით ჯგუფს, ვანგმა და კოლეგებმა გაითქვა მოსახლეობა 176,256 ჯგუფებად, რომლებიც განსაზღვრულია გენდერი (2 კატეგორია), რასის (4 კატეგორია), ასაკი (4 კატეგორია), განათლება (4 კატეგორია), სახელმწიფო (51 კატეგორია), პარტიის ID (3 კატეგორიის), იდეოლოგია (3 კატეგორია) და 2008 წლის ხმის (3 კატეგორია). სხვა სიტყვებით რომ ვთქვათ, მათი უზარმაზარი ნიმუშის ზომა, რომელიც საშუალებას აძლევდა დაბალ მონაცემების შეგროვებას, მათ საშუალებას მისცემდა უფრო დამაჯერებელი ვარაუდი გაეაზრებინათ მათი შეფასების პროცესში.
მაშინაც კი, 345.858 უნიკალური მონაწილეები, თუმცა ჯერ კიდევ ბევრი იყო, ბევრი ჯგუფები, რომელთათვისაც Wang და კოლეგებს თითქმის არ რესპონდენტები. ამიტომაც, ისინი იყენებდნენ ტექნიკას, რომელსაც მრავალჯერადი რეგრესია ეყრდნობოდა თითოეული ჯგუფის მხარდაჭერას. არსებითად, კონკრეტული ჯგუფის ფარგლებში ობამას მხარდაჭერის დასადგენად, მრავალმხრივი რეგრესია გაეცნო ინფორმაციას მჭიდროდ დაკავშირებული ჯგუფებისგან. მაგალითად, წარმოიდგინეთ, რომ ობამას დახმარებით, 18 წლის და 29 წლის ასაკში ქალი Hispanics- ის მხარდაჭერით ცდილობენ, რომლებიც კოლეჯდამთავრებულები არიან დარეგისტრირებულნი, რომლებიც დარეგისტრირებულ დემოკრატიებად არიან და რომლებიც 2008 წლის ობამას ხმა მისცეს. , ძალიან კონკრეტული ჯგუფი, და შესაძლებელია, რომ ამ ნიმუშების ნიმუშში არავინ არ არის. აქედან გამომდინარე, ამ ჯგუფის შესახებ შეფასების მიზნით, მრავალსართულიანი რეგრესია იყენებს სტატისტიკურ მოდელს ერთმანეთის მსგავსი ჯგუფების შეფასებით.
ამგვარად, ვანგმა და კოლეგებმა გამოიყენეს მიდგომა, რომელიც მრავალმიზნურ რეგრესიას და პოსტ-სტრატიფიკაციას აერთიანებდა, რის შემდეგაც მათ სტრატეგია მრავალწლიანი რეგრესიის შემდგომი პოსტი-სტრატიფიკაციით ან უფრო სიყვარულით "უწოდეს. P. "როდესაც Wang და კოლეგებმა გამოიყენეს ბატონი P. რათა შეფასებები XBox არასამთავრობო ალბათობა ნიმუში, ისინი წარმოებული შეფასებები ძალიან ახლოს საერთო მხარდაჭერა, რომ ობამამ მიიღო 2012 საარჩევნო (ფიგურა 3.8). სინამდვილეში მათი შეფასებები უფრო ზუსტი იყო, ვიდრე ტრადიციული საზოგადოებრივი აზრის გამოკითხვა. ამრიგად, ამ შემთხვევაში, სტატისტიკური კორექცია, კერძოდ, ბატონი პ.-ს, როგორც ჩანს, კარგ საქმეს აკეთებდა არასწორი მონაცემების არასწორად შედგენა; მიკერძოება, რომელიც აშკარად ჩანს, როდესაც თქვენ გადახედეთ შეფასებულებს დაუკმაყოფილებელ Xbox მონაცემებს.
ვანგისა და კოლეგების შესწავლის ორი ძირითადი გაკვეთილი არსებობს. პირველი, unadjusted არასამთავრობო ალბათობა ნიმუშები შეიძლება გამოიწვიოს ცუდი შეფასებები; ეს არის გაკვეთილი, რომ ბევრი მკვლევარი მოვისმინე ადრე. თუმცა მეორე გაკვეთილი არის ის, რომ არასასურველი ნიმუშები, როდესაც სწორად გაანალიზებულია, ნამდვილად აფასებს კარგ შეფასებას; არამატერიალური ნიმუშები არ სჭირდება ავტომატურად გამოიწვიოს ლიტერატურული დაიჯესტი ფიასკო.
წინსვლა, თუ თქვენ ცდილობთ გადაწყვიტოს შორის ალბათობა შერჩევის მიდგომა და არასამთავრობო ალბათობა შერჩევის მიდგომა თქვენ წინაშე რთული არჩევანი. ხანდახან მკვლევარებს სურთ სწრაფი და მკაცრი წესი (მაგ. ყოველთვის იყენებენ ალბათობის შერჩევის მეთოდებს), მაგრამ ეს წესი უფრო რთულია. მკვლევარებმა პრაქტიკაში რთული შერჩევის მეთოდებს შორის იყვნენ, რაც უფრო ძვირია და ბევრად უფრო ძვირია თეორიული შედეგებისგან, რომლებიც ამართლებენ თავიანთ გამოყენებას და არა ალბათობის შერჩევის მეთოდებს, რომლებიც უფრო იაფი და სწრაფია, მაგრამ ნაკლებად ნაცნობი და უფრო მრავალფეროვანია. თუმცა, ერთი რამ, რაც ნათელია, არის ის, რომ თუ თქვენ იძულებითი ნიმუშებით ან უპასუხისმგებლო დიდი მონაცემთა წყაროებით მუშაობას იძულებიან (იხ. თავი 2), მაშინ არსებობს ძლიერი საფუძველი იმისა, რომ შეფასდეს პოსტ-სტრატიფიკაციის გამოყენებით დაკავშირებული ტექნიკის უკეთესი იქნება unadjusted, ნედლეული შეფასებით.