Цифрлық жас практикада ықтималдылықты таңдауды әлдеқайда қатал етеді және ықтималдылықтан іріктеу үшін жаңа мүмкіндіктер жасайды.
Таңдаудың тарихында екі бәсекелес көзқарас болды: ықтималдықпен іріктеу әдісі және ықтималдылықсыз іріктеу әдісі. Екі әдіс іріктеудің алғашқы күндерінде қолданылғанымен, ықтималдықтың іріктеуі басым болды және көптеген әлеуметтік зерттеушілер үлкен ықтималдықпен іріктеуді үлкен скептицизммен көруге үйретеді. Дегенмен, төменде сипатталғандай, сандық ғасыр жасаған өзгерістер зерттеушілердің ықтималдылықтың іріктеуін қайта қараудың уақыты келді. Атап айтқанда, ықтималдықпен іріктеу іс жүзінде қиынға түсуде, ал ықтималдықтың іріктеуі жылдам, арзан және жақсы болып келеді. Тезірек және арзан сауалнамалар өздігінен аяқталмайды: олар жиірек сауалнама және іріктемелі өлшемдер сияқты жаңа мүмкіндіктерге мүмкіндік береді. Мысалы, Ықтималдылық әдістерін пайдалана отырып, Координациялық Конгресс сайлау зерттеуі (CCES) ықтималдылықты іріктеуді қолдана отырып, бұрынғы зерттеулерге қарағанда шамамен 10 есе көп қатысушыларды алады. Бұл әлдеқайда үлкен үлгі саяси зерттеушілерге ішкі топтар мен әлеуметтік контексттердегі қатынастар мен мінез-құлқының өзгеруін зерттеуге мүмкіндік береді. Бұдан басқа, осы қосымша шкала бағалаудың сапасы төмендеген жоқ (Ansolabehere and Rivers 2013) .
Қазіргі уақытта әлеуметтік зерттеулерге іріктеудің басымдықты тәсілі - ықтималдықтың іріктеуі . Мүмкіндігінше іріктеу кезінде мақсатты топтың барлық мүшелері белгілі нөлдік ықтималдылыққа ие және іріктеп алынған барлық адамдар сауалнамаға жауап береді. Бұл шарттар орындалған кезде, талғампаз математикалық нәтижелер зерттеушінің мақсатты халық туралы тұжырымдама жасау үшін үлгіні қолдану қабілетін дәлелдейді.
Алайда нақты әлемде бұл математикалық нәтижелерге негізделген шарттар сирек кездеседі. Мысалы, жиі қамту қателіктері және жауап бермеу. Осы проблемалардың арқасында зерттеушілер көбінесе өздерінің іріктемесін мақсатты халыққа шығару үшін түрлі статистикалық түзетулерді қолдануы керек. Осылайша, ол күшті теориялық кепілдіктер бар теориясы, және ешқандай мұндай кепілдіктер ұсынады және статистикалық түзетулерге байланысты алуан іс жүзінде ықтималдығы сынамаларды іріктеу, ықтималдылық сынамаларды іріктеу ажырата маңызды.
Уақыт өте келе, теория мен ықтималдық сынақтарының ықтималдылық үлгілеуі арасындағы айырмашылық іс жүзінде артып келеді. Мысалы, жоғары сапалы, қымбат зерттеулерде (3.5 суретте) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) . Коммерциялық телефондағы сауалнамаға жауап бермеу көрсеткіштері әлдеқайда жоғары - кейде 90% -ға дейін (Kohut et al. 2012) . Бағалаудың өсуі бағалаудың сапасына қауіп төндіреді, себебі бағалаулар зерттеушілер жауап бермеу үшін түзету үшін пайдаланатын статистикалық модельдерге тәуелді болады. Бұдан басқа, сападағы бұл азаюлар зерттеушілердің жоғары жауап беру жылдамдығын сақтауы үшін қымбатқа түсетін күштерге қарамастан. Кейбір адамдар сапаның төмендеу үрдісі мен құнның өсуі зерттеу зерттеулерінің негізіне қауіп төндіреді деп қорқады (National Research Council 2013) .
Ықтималдық сынамаларды іріктеу әдістері қиындықтар бар артып келеді, бұл сол уақытта, сондай-ақ, қолма-ықтималдығы дискретизация әдістерін қызықты оқиғалар болды. Ықтималдылықтан іріктеу әдістерінің әр түрлі стилі бар, бірақ олардың ортақ нәрсе - олар ықтималдық сынамасының математикалық негізіне оңай бейімделе алмайтындығы (Baker et al. 2013) . Басқаша айтқанда, ықтималдылықпен іріктеу әдістерінде әркімнің белгілі бір және нөлге тең емес ықтималдығы бар. Ықтималдылықпен іріктеу әдісі әлеуметтік зерттеушілер арасында үлкен беделге ие және олар зерттеушілердің ең әдемі сәтсіздіктерімен байланысты, мысалы, әдеби Digest фиаско (бұрын талқыланған) және «Dewey Defuys Truman», АҚШ туралы дұрыс емес болжау. 1948 жылғы президенттік сайлау (3.6-сурет).
Сандық ғасырға қолайлы ықтималдылықтан іріктеудің бір түрі - онлайн панельдерді пайдалану болып табылады. Интернеттегі панельдерді қолданатын зерттеушілер сауалнамаға қатысқан респонденттер ретінде қызмет етуге келісетін үлкен, әртүрлі топты құру үшін, кейбір панелдік провайдерге, әдетте, компания, үкімет немесе университетке байланысты. Бұл панельдің қатысушылары жиі желілік баннерлік жарнамалар сияқты көптеген арнайы әдістерді қолданады. Содан кейін зерттеуші панелдік провайдерді қажетті сипаттамалары бар респонденттердің үлгісіне (мысалы, ересектердің ұлттық өкілі) қол жеткізу үшін төлей алады. Бұл онлайн-панельдер ықтимал емес әдістер болып табылады, өйткені әрқайсысы белгілі емес, нөлден тыс қосылу мүмкіндігі бар. Интернеттегі ықтималдылықсыз панельдер əлеуметтік зерттеушілер (мысалы, CCES) пайдаланып отырғанымен, олардан шыққан бағалау сапасы туралы даулар бар (Callegaro et al. 2014) .
Осы пікірталастарға қарамастан, әлеуметтік зерттеушілерге ықтималдықтың іріктеуін қайта қараудың уақыты дұрыс деп санаймын. Алдымен, сандық дәуірде ықтимал емес үлгілерді жинау мен талдауда көптеген өзгерістер болды. Бұл жаңа әдістер бұрынғы проблемаларды туындатқан әдістерден жеткілікті түрде ерекшеленеді, сондықтан оларды «ықтималдықпен іріктеу 2.0» деп ойлаймын деп ойлаймын. Зерттеушілер ықтималдылықтың іріктеуін қайта қарастыруға тиіс екінші себеп - бұл ықтималдылықтың іріктеуі тәжірибе барған сайын қиынға түседі. Жауап берілудің жоғары қарқыны болған кезде - қазіргі уақытта нақты сауалнамаларда болғандықтан, респонденттерге енгізудің нақты ықтималдығы белгісіз, сондықтан ықтималдық үлгілері мен ықтималдық үлгілері көптеген зерттеушілердің пікірінше әр түрлі емес.
Бұрын айтқанымдай, зерттеудің алғашқы күндеріндегі ең ыңғайсыз сәтсіздіктердегі рөлі себебінен көптеген ықтимал үлгілер көптеген әлеуметтік зерттеушілердің үлкен скептицизмімен қаралады. Ықтималдылық үлгілерімен қаншалықты алысқа өткеніміз туралы айқын мысал - Вэй Ванг, Дэвид Ротшильд, Шарад Гоул және Эндрю Гелман (2015) , АҚШ-та 2012 жылғы сайлаудың нәтижесін дұрыс қалпына келтірген зерттеулер. Американдық Xbox қолданушылары - американдықтардың мүлде кездейсоқ үлгісі. Зерттеушілер ХБокс ойын жүйесінен респонденттерді тартты және сіз күткендей, Xbox үлгісі ерлерді кішірейтіп, жастарды кішірейтеді: 18-ден 29-ға дейінгі жастағы адамдар сайлаушылардың 19% -ын құрайды, бірақ Xbox үлгісінің 65% -ы және ерлер сайлаушылардың 47% құрайды, бірақ Xbox үлгісінің 93% (3.7-сурет). Осы күшті демографиялық қиянаттарға байланысты, Xbox деректерінің шикізаты сайлау нәтижелерінің нашар көрсеткіші болды. Ол Барак Обаманы Митт Ромнидің жеңіске жетуін болжады. Қайтадан, бұл шикізат, түзетілмеген ықтималдық үлгілерінің қауіптіліктерінің тағы бір мысалы және әдеби диджей фиаскасын еске түсіреді.
Дегенмен, Ванг және әріптестер бұл мәселелерді біліп, бағалауды жасаған кезде кездейсоқ емес іріктеу процесіне бейімделуге тырысты. Атап айтқанда, олар пост-стратификацияны қолданды, сонымен қатар жабу қателіктері мен жауап бермейтін ықтималдық үлгілерін түзету үшін кеңінен қолданылатын әдіс.
Пост стратификацияның негізгі идеясы үлгіден келетін бағалауды жақсарту үшін мақсатты халық туралы қосымша ақпаратты пайдалану болып табылады. Ванг пен әріптестер өздерінің ықтималдық үлгісіне баға беру үшін пост стратификацияны пайдаланған кезде, халықты түрлі топтарға бөлді, әр топтағы Обамаға қолдау көрсетті, содан кейін жалпы бағалауды жасау үшін топтық бағалаудың орташа мәнін алды. Мысалы, олар халықты екі топқа бөлді (ерлер мен әйелдер), Обамаға ерлер мен әйелдердің қолдауын бағалады, содан кейін Обама үшін жалпы қолдауды бағалады, бұл әйелдердің әйелдерді электораттың 53% және ерлердің 47%. Кейінгі стратификация топтардың өлшемдері туралы қосалқы ақпарат беру арқылы теңгерімсіз үлгіні түзетуге көмектеседі.
Пост стратификацияның кілті оң топтарды қалыптастыру болып табылады. Егер сіз халықты біртекті топтарға бөле алсаңыз, жауап топтарының әрқайсысы үшін бірдей болса, онда кейінгі стратификация объективті бағалау жүргізеді. Басқаша айтқанда, егер гендер бойынша пост-стратификация барлық адамдар ерлер мен әйелдердің реакцияға бейімділігі бар болса және барлық әйелдер бірдей жауап беруге бейімді болса, объективті бағалар жасайды. Бұл болжам біртекті-жауап-нақтылық-топ ішіндегі болжамдар деп аталады, мен оны осы тараудың соңындағы математикалық жазбаларда біразырақ сипаттайды.
Әрине, барлық ерлер мен әйелдердің бәріне бірдей әсер етуі мүмкін екені екіталай көрінеді. Дегенмен, біртекті-жауап-нақтылық-ішіндегі топтардың болжамдары топтардың саны арта түсетіндіктен, барынша ақылға қонымды болып келеді. Көптеген топтар жасасаңыз, халықты біртекті топтарға бөлу жеңілдейді. Мысалы, барлық әйелдердің бірдей әрекет ету қабілетіне ие болуы мүмкін емес сияқты көрінуі мүмкін, бірақ 18-29 жас аралығындағы, колледжді бітірген және Калифорнияда тұратын барлық әйелдер үшін бірдей реакцияның бар екендігін дәлелдейтін көрінеді . Осылайша, пост стратификацияда пайдаланылатын топтардың саны арта түсетіндіктен, әдісті қолдауға қажетті болжамдар ақылға қонымды болады. Осы фактіні ескере отырып, зерттеушілер көбінесе пост стратификация үшін көптеген топтарды құрғылары келеді. Дегенмен, топтардың саны артып келе жатқандықтан, зерттеушілер басқа мәселеге айналып отырады: деректердің аздығы. Егер әр топта тек аздаған адамдар болса, онда бағалау дұрыс емес болады, ал респондент жоқ топтың төтенше жағдайда, кейінгі стратификация толығымен бұзылады.
Біртекті-жауап-өрескел-топ ішіндегі болжамдардың және әрбір топтағы ақылға қонымды іріктеу өлшемдерінің сұранысының арасындағы шынайы кернеудің екі жолы бар. Біріншіден, зерттеушілер әр топта ақылға қонымды үлгілерді қамтамасыз етуге көмектесетін үлкенірек, әртүрлі үлгі жинай алады. Екіншіден, олар топтар ішінде бағалау жасау үшін неғұрлым күрделі статистикалық модельді пайдалана алады. Және, шын мәнінде, кейде зерттеушілер Ванг және әріптестер Xbox-тан респонденттерді пайдаланып, сайлау туралы зерттеуді жүргізгендей.
Компьютермен басқарылатын сұхбатпен ықтималдықпен іріктеу әдісін қолданғандықтан (3.5 бөлімінде компьютермен басқарылатын сұхбат туралы көбірек әңгімелесемін), Ванг және әріптестері 345,858 бірегей қатысушыдан ақпарат жинауға мүмкіндік беретін өте қымбат емес деректерді жинады , сайлау учаскелері бойынша дауыс беру стандарттарының үлкен саны. Үлкен үлгінің мөлшері олардан кейінгі стратификация топтарын құруға мүмкіндік берді. Пост стратификация әдетте жүздеген топтарға популяцияны таратумен айналысады, ал Ванг және әріптестер халықты гендерлік (2 санат), нәсіл (4 санат), жас (4 санат), білім (4 санат), мемлекеттік (17) санаттағы 176256 топқа бөледі (51 санат), партиялық анықтама (3 санат), идеология (3 санат) және 2008 жылғы дауыс беру (3 санат). Басқаша айтқанда, олардың құндылығы туралы деректер жинаумен қамтамасыз етілген олардың үлгілік өлшемі оларды бағалау үдерісінде неғұрлым нақты болжам жасауға мүмкіндік берді.
Дегенмен, 345 858 бірегей қатысушылары болса да, Ванг пен әріптестердің дерлік респонденттері болмаған көптеген топтар болған. Сондықтан әр тобында қолдауды бағалау үшін көп деңгейлі регрессия деп аталатын әдісті қолданды. Шындығында, Обаманың нақты топтағы қолдауын бағалау үшін көп деңгейлі регрессия көптеген тығыз байланысты топтардан ақпарат жинады. Мысалы, 2008 жылы Барак Обамаға дауыс берген демократиялық партияны бітірген, 18 жастан 29 жасқа дейінгі әйелдер арасында, Обамаға қолдау көрсетуді бағалауға тырысыңыз. , өте нақты топ, және осы сипаттамалары бар үлгіде ешкім жоқ. Сондықтан, осы топ туралы бағалау жасау үшін, көп деңгейлі регрессия статистикалық модельді өте ұқсас топтардағы адамдардан бағалауды біріктіру үшін пайдаланады.
Осылайша, Ванг пен әріптестер көп сатылы регрессия мен пост стратификацияны біріктіретін тәсіл қолданды, сондықтан олар стратегиясын көп деңгейлі регрессияны пост стратификациялаумен немесе мейірімділікпен деп атады. «Ванг пен әріптестер П-ны XBox ықтималдық үлгісінен бағалау жасау үшін қолданғанда, олар Обаманың 2012 жылғы сайлауда алған жалпы қолдауына өте жақын баға берді (3.8-сурет). Іс жүзінде олардың бағалауы дәстүрлі қоғамдық пікірді сауалнамалар жиынтығынан гөрі дәлірек болды. Осылайша, бұл жағдайда статистикалық түзетулер, атап айтқанда П. мырза, ықтималдықтар туралы деректердің алдын-ала түзетулерін түзететін жақсы жұмыс жасайды; түзетілмеген Xbox деректерінен бағалауды қараған кезде анық көрінеді.
Ван мен әріптестерін зерттеуден екі негізгі сабақ бар. Біріншіден, түзетілмеген ықтималдық үлгілері жаман бағалауға әкелуі мүмкін; бұл көптеген зерттеушілер бұрын естіген сабақ. Екінші сабақ, ықтималдық үлгілері дұрыс талданып жатқанда шын мәнінде жақсы бағалау жүргізе алады; Ықтималдылық үлгілері автоматты түрде Literary Digest фиаско сияқты нәрсеге әкелмейді.
Егер сіз ықтималдылықтың іріктеу әдісін пайдалану туралы шешім қабылдауға тырысып жатсаңыз және ықтималдылықпен іріктеу әдісі болсаңыз, сіз қиын таңдау жасайсыз. Кейде зерттеушілер тез және қатаң ережелерді талап етеді (мысалы, әрқашан ықтималдылықтан іріктеу әдістерін қолданады), бірақ мұндай ережені ұсыну қиынға соғуда. Зерттеушілер тәжірибедегі ықтималдық сынамаларын таңдау әдістерін таңдауда қиындықтарға тап болады - олар қымбатқа түседі және теориялық нәтижелерден әлдеқайда арзан және тезірек, бірақ аз танымал және әртүрлі болып табылатын олардың пайдалану және ықтималдықпен іріктеу әдістерін негіздейтін нәтижелерден алыс. Алайда, белгілі бір ықтималдық үлгілерімен жұмыс істеуге мәжбүр болған болсаңыз, немесе үлкен емес деректер көздерімен жұмыс істеуге мәжбүр болсаңыз (2-тарауға назар аударыңыз), онда бағалаудан кейінгі стратификация және тиісті әдістер түзетілмеген, шикізат бағалардан жақсы болады.