Емес ықтималдығы үлгілерімен, салмағы болжануда дискретизация процесін туындаған бұрмалау болдырмауға болады.
зерттеушілер ықтималдығы үлгілердегі жауап салмағы Дәл сол сияқты, олар сондай-ақ азық-ықтималдығы үлгілердегі жауап салмағы болады. Мысалы, ХҚО балама ретінде, сіз жұмыссыздық деңгейін бағалау үшін сауалнама қатысушылардың тартуға сайттардың мыңдаған баннерлер орналастырылды деп елестетіңіз. Әрине, сіз үлгідегі қарапайым орташа жұмыссыздық жақсы сметалық болады деп күмәнмен болар еді. Егер сіз кейбір адамдар басқаларға қарағанда сіздің сауалнама аяқтау неғұрлым ықтимал деп ойлаймын, себебі сіздің шүбә мүмкін болып табылады. Мысалы, вебтегі көп уақыт жұмсайды емес адам сіздің сауалнама аяқтау үшін кем ықтимал.
біз өткен бөлімінде көрген ретінде біз үлгісі таңдалған-ақ қалай біз ықтималдығы үлгілерді-, содан кейін істеу білсеңіз, алайда, біз дискретизация процесін туындаған бұрмалау болдырмауға болады. емес ықтималдығы үлгілерімен жұмыс істеу кезінде Өкінішке орай, біз үлгісі таңдалды білмеймін, қалай. Бірақ, біз дискретизация процесі туралы жорамалдар жасауға, содан кейін сол жолмен мөлшерлеуді қолдануға болады. Осы жорамалдар дұрыс болса, онда салмақ дискретизация процесін туындаған бұрмалау жояды.
Мысалы, сіздің баннерлік жарнама жауап, сіз 100000 респондент жалданады делік. Алайда, сіз осы 100000 респонденттер американдық ересектер қарапайым кездейсоқ үлгісі болып табылады деп ойламаймын. Егер сіз АҚШ халыққа сіздің респонденттер салыстыру кезінде шын мәнінде, сіз кейбір мемлекеттердің (мысалы, Нью-Йорк) адамдар атынан-ден астам және кейбір мемлекеттердің (мысалы, Аляска) адамдар астында-ұсынылған екенін екенін. таба Осылайша, сіздің үлгідегі жұмыссыздық деңгейі халықтың нысаналы топтары жұмыссыздық жаман бағалау болуы мүмкін.
Сынамаларды іріктеу процесінде орын алған бұрмалау болдырмау үшін бір жолы әр адамның салмағы тағайындауға болып табылады; астында-ұсынылған үлгідегі (мысалы, Аляска) болып табылады мемлекеттердің адамдарға үлгідегі аса ұсынылған мемлекеттер (мысалы, Нью-Йорк) және жоғары салмақ адамдарға төмен салмағы. Нақтырақ айтқанда, әрбір респондентке арналған салмақ АҚШ халықтың өз таралуы сіздің үлгідегі қатысты олардың таралуы байланысты. Бұл салмақ рәсімі кейінгі стратификация деп аталады, және салмағы идеясы Род-Айленд респонденттер Калифорниядан респонденттердің кем салмағы берілді бөлімде 3.4.1 мысалы сіздердің естеріңізге тиіс. Post-стратификациялау сіз топқа сіздің респонденттерді қоюға және әрбір топта халықтың нысаналы үлесін білу жеткілікті білеміз талап етеді.
ықтималдығы үлгідегі және емес ықтималдығы үлгідегі салмақ (техникалық қосымшаны қараңыз) математикалық бірдей болғанымен, олар әр түрлі жағдайларда жақсы жұмыс істейді. зерттеуші тамаша ықтималдығы үлгісі (яғни, жоқ қамту қате және ешқандай емес жауап) бар болса, онда салмақ барлық жағдайларда барлық белгілерінің үшін объективті сметасын шығаратын болады. ықтималдығы үлгілерін қорғаушылар оларға тартымды таба неге Бұл күшті теориялық кепілі болып табылады. жауап бейімділігін әр топта барлық адамдар үшін бірдей болса, басқа жағынан, емес ықтималдығы үлгілерін салмағы тек барлық белгілерінің үшін объективті сметасын шығаратын болады. Басқаша айтқанда, Нью-Йоркте әркім қатысатын ықтималдығы бар сол бір және Аляска әркім т.б. қатысушы және сол ықтималдығы бар болса, кейінгі стратификациясы объективті бағалаулар өндіретін болады пайдаланып, бұрын біздің Мысалы ойлау. Бұл жорамал біртекті-жауап-бейімділігін ішіндегі топтардың жорамал деп аталатын, және кейінгі стратификация емес ықтималдығы үлгілерін жақсы жұмыс істейтін болады, егер ол білмей маңызды рөл атқарады.
Өкінішке орай, біздің мысалымызда, біртекті-жауап-бейімділігін ішіндегі топтардың болжам дұрыс болуы екіталай сияқты. Яғни, бұл Аляска әркім өз сауалнамаға болу ықтималдығы бар сол бір екіталай сияқты. Бірақ, ол көп перспективалы етіп барлық оның кейінгі стратификация туралы есте ұстау үшін үш маңызды нүктелері бар.
Біріншіден, біртекті-жауап-бейімділігін ішіндегі топтардың болжам топтар санының артуына әңгіме болып отыр. Ал, зерттеушілер бір ғана географиялық өлшем негізінде топтарға шектелмейді. Мысалы, біз мемлекеттік, жасына, жынысына, және білім деңгейіне негізделген топтарды жасау мүмкін. Ол біртекті жауап бейімділігін Аляска тұратын барлық адамдардың тобының ішінде қарағанда 18-29 тобының, әйел, Аляска тұратын колледж түлектерінің ішінде бар екенін әңгіме сияқты. Осылайша, кейінгі стратификация артады үшін пайдаланылатын топтардың саны сияқты, жорамал ол неғұрлым ақылға қонымды болуға қолдау үшін қажетті. Бір зерттеушілер кейінгі стратификация топтардың үлкен санын жасау керек еді сияқты осы ескерсек, бұл, меніңше. деректер аздығы: Бірақ, топтар саны ұлғаюда, зерттеушілер әр түрлі проблемасына тап. адамдар аз ғана саны әр топта бар болса, онда сметаларды одан да көп белгісіз болады, және ешқандай респондент бар топ бар экстремалды жағдайда, онда кейінгі стратификациясы толығымен істен. homogeneous- жауап-бейімділігін ішіндегі топтардың болжамға және әрбір топта ақылға қонымды өлшемді үлгілер сұраныстың ЧБНЛ арасында осы тән шиеленіс екі жолы бар. Бір көзқарас салмағы есептеу және басқа да неғұрлым күрделі статистикалық моделін жылжыту үшін әр топта ақылға қонымды үлгісі өлшемдерін қамтамасыз етуге көмектеседі үлкен, көп алуан түрлі үлгісі, жинау болып табылады. Мен төменде толығырақ сипаттау алатындарыңыз ретінде, ал кейде зерттеушілер, екеуін де.
емес ықтималдығы үлгілердегі кейінгі стратификация жұмыс істейтін екінші қарастыру ықтималдығы үлгілерін талдау кезінде біртекті-жауап-бейімділігін ішіндегі топтардың болжам қазірдің өзінде жиі жасалған болып табылады. бұл болжам тәжірибеде ықтималдығы үлгілері үшін қажет екенін себебі ықтималдық үлгілері емес жауап бар, және жоғарыда сипатталғандай емес жауап реттеу үшін ең көп тараған әдіс кейінгі стратификациясы болып табылады. Әрине, жай, өйткені көптеген зерттеушілер белгілі бір болжам сізге де істеу керек дегенді білдірмейді жеткізіңіз. Бірақ, бұл іс жүзінде ықтималдығы үлгілерді емес ықтималдығы үлгілерін салыстыру кезінде, біз екі сметасын өндіру мақсатында жорамалдар және қосалқы ақпаратты байланысты екенін есте ұстауымыз керек екенін білдіреді. ең шынайы параметрлерінде, шығару үшін ешқандай болжам-еркін тәсіл ғана бар.
Егер сіз жұмыссыздық деңгейі-, содан кейін біздің мысалымызда, атап айтқанда-бір бағалаудағы қамқорлық Соңында, егер сіз біртекті-жауап-бейімділігін ішіндегі топтардың болжамға қарағанда әлсіз жағдайын қажет. Атап айтқанда, Сіз әркім сол жауап бейімділік бар делік қажеті жоқ, сіз тек әр топтың ішінде жауап бейімділік және жұмыссыздық арасындағы корреляция бар екенін болжауға қажет. Әрине, тіпті осы әлсіз жағдайы кейбір жағдайларда, ұстап емес. Мысалы, волонтерлік жұмыс істеуге американдықтар үлесін бағалау елестету. Волонтерлік жұмыс істеу адам сауалнамаға болуы келісесіз неғұрлым ықтимал болса, онда зерттеушілер тарапынан эмпирикалық көрсетілді волонтерлік, олар кейінгі стратификациясы түзетулер істеу, тіпті егер нәтижесінде сомасын бағалауға астам-болады жүйелі Abraham, Helms, and Presser (2009) .
Жоғарыда айтып өткендей, азық-ықтималдығы үлгілері, өйткені зерттеу зерттеудің алғашқы күндері ең ыңғайсыз істен кейбір олардың рөлін бөлігінде, әлеуметтік ғалымдар үлкен күмәнмен қарайды. біз емес ықтималдығы үлгілерімен келді қаншалықты нақты мысал дұрыс американдық Xbox пайдаланушылардың емес ықтималдығы үлгісін пайдаланып 2012 АҚШ сайлау нәтижесін қалпына Вэй Wang, Дэвид Ротшильд, мында хабарласыңыз Sharad Goel және Эндрю Гельман зерттеу болып табылады американдықтардың -a батыл емес кездейсоқ үлгісі (Wang et al. 2015) . зерттеушілер XBox ойын жүйесінен респонденттерді жалданады, және сіз күтуге мүмкін, Xbox үлгісі ер және қисайған жас қисайып: 18 - 29 жазғы сайлаушылардың 19%, бірақ Xbox үлгідегі 65% құрайды және ерлер 47% құрайды электораттың және Xbox үлгідегі (сурет 3.4) 93%. Себебі, бұл күшті демографиялық предубеждений, шикізат Xbox деректер сайлау нәтижесін кедей көрсеткіші болды. Ол Барак Обама астам Митт Ромни үшін күшті жеңіске болжаған. Тағы да, бұл шикізат, түзетілмеген емес ықтималдығы үлгілерін қауіп тағы бір мысалы болып табылады және әдеби Дайджест фиаско еске болып табылады.
Алайда, Ван мен әріптестер осы проблемаларды хабардар болды және таңдама процесі үшін түзету үшін респонденттер салмағы тырысты. Атап айтқанда, олар туралы мен саған айттым кейінгі стратификация неғұрлым күрделі нысанын пайдаланылады. ол кейінгі стратификация туралы түйсігі салып, және Ван мен әріптестер пайдаланылатын, атап айтқанда нұсқасы салмақтық емес ықтималдығы үлгілерін ең қызықты тәсілдерді бірі болып табылады, өйткені ол олардың көзқарас туралы сәл астам оқыту тұр.
3.4.1-бөлiм жұмыссыздықты бағалау туралы Біздің қарапайым мысалда біз тұрғылықты мемлекет негізінде топқа бөлінеді халықты. Керісінше, Ван мен әріптестер анықталады 176.256 топқа бөлінеді халықты:, жынысына (2 санат), нәсіліне (4 санат), жасы (4 санат), білім беру (4 санат), мемлекеттік (51 санат) партиялық ID (3 санат), идеология (3 санат) және 2008 дауыс (3 санат). одан топтардың, зерттеушілер оның әрбір топ ішінде, жауап бейімділігін Обама қолдау байланыспаған екенін барған сайын ықтимал болар еді деп үміттенеді. біздің мысалымызда ұқсап Келесі емес, жеке-деңгейі салмағы салу қарағанда, Ван және әріптестер Обама үшін дауыс еді әр топта халықтың үлесін бағалауға кешенді моделі пайдаланылады. Соңында, олар қолдау шамамен жалпы деңгейін шығаруға әр топтың белгілі мөлшерімен қолдау топтық сметасын combined. Басқаша айтқанда, олар әр түрлі топтарға халықты дейін туралған әр топта Обаманың қолдау бағаланады, содан кейін жалпы бағалауды қамтамасыз топ сметасын Орташа сараланған алды.
Осылайша, олардың көзқарас үлкен міндет осы 176.256 топтардың әр Обаманың қолдау бағалау болып табылады. олардың панелі 345.858 бірегей қатысушыларды енгізілген болса да, сайлау сауалнамасы стандарттар бойынша үлкен саны, Ван мен әріптестер дерлік жоқ респонденттер болған, ол үшін көптеген топтар бар. Сондықтан, олар көптеген бастап зерттеушілер коллекциямды нақты топтың ішінде Обама қолдау бағалауға, негізінен мырза P. қоңырау кейінгі стратификациямен көпдеңгейлі регрессия деп аталатын техниканы, мырза П. бассейндер ақпаратты пайдаланылатын әр топта қолдау бағалау тығыз байланысты топтар. Мысалы, қалыпты ретінде өзін-өзі анықтау тіркелген демократтар колледж түлектері, кім, 18-29 арасындағы жаста, әйелдер, жауығу арасында Обаманың қолдау бағалау міндеті деп санайды, және кім 2008 Бұл Обаманың үшін дауыс өте, өте ерекше тобы болып табылады, және ол осы сипаттамалары үлгідегі ешкім жоқ, бұл мүмкін. Сондықтан, бірлесіп, осы топ туралы мырза П. пулдарын сметасын жасауға өте ұқсас топтарда адамдардың бағалайды.
Осы талдау стратегиясын пайдалана отырып, Ван және әріптестер өте тығыз Обама 2012 сайлау (сурет 3.5) алынған жалпы қолдау бағалауға XBox емес ықтималдығы үлгіні пайдалана алдық. Шын мәнінде, олардың сметаларды қоғамдық пікірге сұрау салу жиынтығы қарағанда дәлірек болды. Осылайша, бұл жағдайда, салмағы-арнайы мырза емес ықтималдығы деректерді бұрмалау түзету жақсы жұмыс істеу үшін П.-меніңше; Егер сіз қандай да бір түзетулерсіз Xbox деректерден бағалаулар қарап кезде көрінеді ауытқулар.
Wang және әріптестерінің зерттеу негізгі екі сабақ бар. Біріншіден, қандай да бір түзетулерсіз емес ықтималдығы үлгілері жаман бағалаулар әкелуі мүмкін; Бұл көптеген зерттеушілер бұрын естіген сабақ болып табылады. Алайда, екінші сабақ емес ықтималдығы үлгілері болып табылады, дұрыс өлшенген кезде, іс жүзінде өте жақсы бағалаулар шығара алады. Шын мәнінде, олардың сметаларды, дәстүрлі сайлау учаскелеріне біріктіру pollster.com ден бағалаулар қарағанда дәлірек болды.
Соңында, біз осы бір нақты зерттеу үйренуге болады, қандай маңызды шектеулер бар. кейінгі стратификация осы нақты жағдайда жақсы жұмыс істеді Тек, өйткені, ол басқа жағдайларда жақсы жұмыс болады деп кепілдік жоқ. Әлеуметтану шамамен 100 жыл бойы сайлауын оқитын, тұрақты кері байланыс бар (біз сайлауда жеңіске жетті кім көре аласыз), сондай-ақ партиялық сәйкестендіру және демографиялық сипаттамалары дауыс беру салыстырмалы болжалды болып табылады, өйткені шын мәнінде, сайлау бәлкім ең оңай параметрлерінің бірі болып табылады. Осы сәтте, біз емес ықтималдығы үлгілерін салмақ түзетулер жеткілікті дәл бағалаулар шығаратын болады кезде білу қатты теориясы мен эмпирикалық тәжірибесі жетіспейді. түсінікті Бір нәрсе, алайда, сіз емес ықтималдығы үлгілерімен жұмыс істеуге мәжбүр болса, онда түзетілген смета емес түзетілген бағалаулар қарағанда жақсы болады деп есептейміз күшті негіз бар болып табылады.