Эмес ыктымалдуулук үлгүлөрү, тараза өзүнө тандап алуу жараяны улам бурмалоолор жоё алат.
изилдөөчүлөр ыктымалдык үлгүлөрүн жооп салмактын Ошол сыяктуу эле, алар да эмес ыктымалдуулук үлгүлөрүн жооп салмагы болот. Мисалы, МКС ордуна, сен жумушсуздук курсун аныктоо үчүн сурамжылоо үчүн катышуучуларды тартуу сайттардын мын баннер жарнаманы жайгаштырган деп ойлошот. Албетте, сиз үлгүдөгү жөнөкөй орточо жумушсуздук катнашы жакшы баа болоруна ишене болот. Эгер кээ бир адамдар башкаларга караганда сиздин сурамжылоого аягына чейин чыгаруу үчүн дагы мүмкүн деп ойлойм, анткени шек окшойт. Мисалы, Интернетте көп убакыт эмес, сенин сурамжылоого аягына чейин аз болуп саналат.
Биз акыркы бөлүмдө айтылгандай, бирок, биз үлгү кантип билсек Тандалып алынган-деп биз ыктымалдык менен үлгүлөрдү-, анда тандап алуу жараяны улам бурмалоолор жоё алат. Тилекке каршы, ал эми азык-ыктымалдык үлгүлөрү менен иштеп жатканда, биз үлгү тандалып алынган кантип пайда болгонун так билбейбиз. Бирок, биз тандап алуу жараяны жөнүндө божомолдорун жасоо жана андан кийин ошол эле жол менен салмагы колдоно алышат. Бул божомолдор туура болсо, салмак тандап алуу жараяны улам бурмалоолор жок кылат.
Мисалы, сиздин баннер жарнамасын жооп катары, сиз 100000 респонденттерди жалдаган деп ойлошот. Бирок, сиз бул 100000 респонденттер америкалык кишилер жөнөкөй кокустук токтолдук буга ишене албайм. Чынында, сен АКШ калк үчүн респонденттер салыштырып жатканда, адамдар кээ бир мамлекеттер (мисалы, New York) айрым мамлекеттердин эл мүчөлөрүнүн жана (мисалы, Аляска) ылайык түзөт деп тапкан. Ошентип, сенин үлгүдөгү жумушсуздук катнашы максаттуу калктын жумушсуздук курсунун жаман баа болушу мүмкүн.
тандап алуу жараянына болгон бурмалоо жокко чыгаруу үчүн бир жолу ар бир адамга тараза дайындоо үчүн; үлгүдөгү төмөнкү түзөт мамлекеттердин эл тараза (мисалы, New York) жана үлгүсүн жогору астында-катышкан мамлекеттердин эл тараза (мисалы, Аляска). Тактап айтканда, ар бир респондентке салмагы АКШ калктын алардын жайылышы үчүн үлгү салыштырмалуу алардын жайылышы менен байланыштуу. Бул салмак тартиби пост-катмарлашуусу жана салмагы идеясы Род-Айленд респонденттер California респонденттер кем салмак берилген жерде 3.4.1-бөлүмүндө, мисалы эстешибиз керек деп аталат. Post-катмарлашуусу сиз топко сиздин респонденттер үчүн жана ар бир тобу максаттуу калктын үлүшү билүү жетиштүү билүү талап кылынат.
ыктымалдык үлгүдөгү жана азык-ыктымалдыгы үлгүдөгү салмагы бир эле математикалык (техникалык тиркемени карагыла) болсо да, алар ар кандай кырдаалдарда, ошондой эле иш. изилдөөчү кемчиликсиз бир ыктымалдык үлгүсүн бар (б.а., эч кандай камтуу ката, эч кандай азык-жооп) болсо, анда салмак бардык учурда бардык касиеттердин үчүн калыс баа берет. ыктымалдуулук үлгүлөрдүн жактоочулары эмне үчүн аларды ушунчалык сулуу, ушул күчтүү теориялык кепилдиги болуп саналат. Экинчи жагынан, салмак эмес ыктымалдуулук үлгүлөрүн жооп Ыйыктыктын ар бир топ боюнча баарына бирдей болсо, бардык касиеттердин үчүн калыс баа берет. Башка сөз менен айтканда, биздин Мисалы, кийинки катмарлуу катышкан New York ар бир ыктымалдыкка ээ болсо, калыс баа берет колдонуу жана Аляска менен ар бир адам үчүн ой жүгүртүү, ошондой эле катышкан жана ошол эле ыктымалдыкка ээ. Бул божомол тектүү-жооп-Ыйыктыктын ичинде топтор болжолдоого деп аталат, жана ал пост-катмарлашуусу эмес ыктымалдуулук үлгүлөрүн жакшы иштей турган болсо, билип негизги ролду ойнойт.
Тилекке каршы, биздин Мисалы, бир тектүү-жооп-Ыйыктыктын ичинде топтор божомол чын болушу күмөн. Тагыраак айтканда, ал Аляска ар бир сиздин сурамжылоодо болуу бир ыктымалдыкка ээ күмөн көрүнөт. Бирок, ал кыйла келечектүү көрүнгөн кийинки катмарларга жөнүндө эстен чыгарбашы үч маанилүү пункт бар, кылып турган.
Биринчиден, бир тектүү-жооп-Ыйыктыктын ичинде топтор божомол топтордун санынын өсүшү сыяктуу чындыкка жакын болуп калат. Менен изилдөөчүлөр ойлоп белгилүү бир өлчөм негизинде топтор менен эле чектелбейт. Мисалы, биз мамлекет, жаш курагы, жынысы, билим берүү жана даражасына негизинде топторду түзүү мүмкүн. Ал 18-29 топтун ичинде бир тектүү жооп Ыйыктыктын бар экенин туурадай сезилет, аялдар, Аляскадагы, бардык адамдардын тобу кечиктирбестен Аляска жашаган колледж бүтүрүүчүлөрү. Ошентип, кийинки катмарлашуусу жогорулатуу үчүн пайдаланылуучу топтордун саны, божомолдор бул акыл-эстүү болуу үчүн зарыл болгон. Муну эске алганда, бул окумуштуулар кийинки катмарларга үчүн топтордун көп сандаган түзүүнү каалабайт окшойт. Бирок, топтордун саны көбөйгөндө, изилдөөчүлөр бир башка маселе кирип: маалымат sparsity. Ар бир топко кирген адамдар бир аз гана саны бар болсо, анда баа дагы белгисиз болуп калат, ал эми өзгөчө учурларда эч кандай респонденттерди бар жерде бир топ жерде, андан кийин пост-катмарлашуусу толугу менен калат. homogeneous- жооп-зээндүү ичинде топтор ээлеген кооптуу жана ар бир топтун акыл-эстүү тандап алуунун өлчөмү болгон суроо-талаптын ортосунда бул мүнөздүү тирешүү чыгып, эки жол бар. Бир ыкма ар бир топ акыл-эстүү үлгү өлчөмдөрүн камсыз кылууга жардам берет, экономикалык ар кандай үлгүдөгү, чогултууга Салмакты эсептөө үчүн бир кыйла татаал статистикалык моделге жана башка түрткү болуп саналат. Жана кээде изилдөөчүлөр Мен төмөндө кененирээк баяндап болот эле, экөө тең жок.
ыктымалдык үлгүлөрүн анализдеп жатканда экинчи карап эмес ыктымалдуулук үлгүлөрүн кийинки катмарларга менен иштеген бир тектүү-жооп-зээндүү ичинде топтор божомол буга чейин көп эле болуп жатат. Бул гипотеза иш жүзүндө ыктымалдыгы үлгүлөрүн үчүн зарыл болгон себеби ыктымалдык үлгүлөрүн эмес жооп бар экенин, ал эми азык-жооп такташтыруунун ыкмасы жогоруда айтылгандай кийинки катмарлашуусу болуп саналат. Албетте, жөн эле, анткени көптөгөн изилдөөчүлөр бир божомол жасап, силер да, аны эмне кылуу керек дегенди билдирбейт. Бирок, ал иш жүзүндө ыктымалдыгы үлгүлөрүн эмес ыктымалдуулук үлгүлөрүн салыштырып жатканда, биз да баа өндүрүү үчүн божомолдоолорго жана кошумча маалыматтарды көз каранды эстен чыгарбашыбыз керек дегенди билдирбейт. абдан реалдуу орнотуулар менен, жөн эле периоддо эч кандай божомол-эркин мамиле бар.
Акыры, сиз биздин үлгү жумушсуздук боюнча, атап айтканда бир баа кам болсо, чен-сен тектүү-жооп-зээндүү ичинде топтор ээлеген алсызыраак шарт керек. Атап айтканда, сиз баары бирдей жооп маятник бар экенин, бир гана ар бир топко жооп жөндөмдөрүнө жана жумушсуздук ортосунда эч кандай байланыш жок деп эсептөө керек деп ойлойбуз кажети жок. Албетте, бул да алсызыраак абал кээ бир жагдайларда, жоопко тартпайм. Мисалы, коомдук иштерге катышып америкалыктардын үлүшүн эсептөө ойлошот. Коомдук иштерге катышып адам сурамжылоого болууга макул көбүрөөк болсо, анда изилдөөчүлөр системалуу ашуун-баалоо, алар кийинки катмарлашуусу өзгөрүүлөрдү тарабынан эмпирикалык көрсөтүп келаткан бир натыйжа да болсо, өз эрки суммасын берет Abraham, Helms, and Presser (2009) .
Мен мурдараак айткандай, эмес ыктымалдуулук үлгүлөрүн коомдук илимпоздор тарабынан көп ишенбөөчүлүк менен карашат, жарым-жартылай, анткени сурамжылоо изилдөөнүн алгачкы күндөрү кээ бир абдан уят үзгүлтүктөр, алардын ролу. канчалык биз эмес ыктымалдуулук үлгүлөрү менен келген айкын мисал туура америкалык Xbox колдонуучулардын эмес ыктымалдуулук үлгүсүн колдонуу менен 2012 АКШ шайлоонун жыйынтыктарын калыбына Wei Wang, David Rothschild, Канат Гоэл жана Эндрю Гелман жана изилдөө болуп саналат кездин чечкиндүү америкалыктардын эмес-кокустук үлгү (Wang et al. 2015) . изилдөөчүлөр Xbox оюн системасынын респонденттер жумушка, сен күткөн сыяктуу эле, Xbox үлгү эркек бурмаланды жана жаш бурмаланды: 18 - 29 жаштагы шайлоочулардын 19% түзөт, ал эми Xbox үлгүсүндөгү 65% ы жана эркектердин 47% түзөт Xbox үлгүсүндөгү (Figure 3.4) жана шайлоочулардын 93% ы. Себеби, бул күчтүү калкынын прогноздук, чийки Xbox маалыматтарды шайлоонун начар көрсөткүч. Ал Барак Обама Митт Ромни үчүн абдан салып алдын ала айткан. Дагы бир жолу, бул чийки, unadjusted эмес ыктымалдуулук үлгүлөрдү коркунуч дагы бир мисалы болуп саналат жана адабий Digest шерменделигин эске салат.
Бирок, Wang жана кесиптештери бул көйгөйлөр тууралуу жакшы жана тандап алуу жараянына туура респонденттерди салмактын аракет кылды. атап айтканда, алар мен жөнүндө айтып пост-катмарларга көбүрөөк татаал колдонгон. Ал кийинки катмарларга жөнүндө туюнуу курат, анткени алардын мамиле жөнүндө бир аз үйрөнүп кетүү керек, жана колдонулган конкреттүү версия Wang жана кесиптештери салмак эмес ыктымалдуулук үлгүлөрүн үчүн абдан кызыктуу ыкмалардын бири болуп саналат.
3.4.1-бөлүмүндө жумушсуздук эсептөө жөнүндө жөнөкөй Мисалы, биз жашаган боюнча мамлекеттик топко калкты бөлүнөт. айырмаланып, Wang жана кесиптештер менен аныкталат 176.256 топко кирип, калкты экиге бөлүп: гендердик (2 категориясы), расасы (4 категория), жаш курагы (4 категория), билим берүү (4 категория), мамлекеттик (51 категория), партия ID (3 категориялары), идеология (3 категориялары) жана 2008-жылдын добуш (3 категориялары). көп топтор менен, изилдөөчүлөр ар бир топ, жооп зээндүү Обама колдоо менен uncorrelated экенин барган сайын мүмкүн кылат деп үмүттөнүшкөн. Кийинки, тескерисинче, биз мисалы эле, жеке-деңгээл оордуктарды куруу караганда, Wang жана кесиптештер Барак Обама үчүн добуш берүүгө ар бир топтогу адамдардын үлүшүн аныктоо үчүн комплекстүү моделди колдонгон. Акыр-аягы, алар колдоо болгон баа жалпы деъгээлин өндүрүү үчүн ар бир топ белгилүү өлчөмдө колдоосу менен бул топ сметасын бириккен. Башка сөз менен айтканда, алар ар түрдүү топторго калкты уйларды ар бир топ боюнча да Обамага колдоо эсептелген, андан кийин жалпы баа өндүрүү үчүн бир топ баа салмактанып алынган орточо алды.
Ошентип, өз мамиле чоң көйгөй бул 176.256 топтордун ар Обамага колдоо баа болуп саналат. Алардын бир кашектин 345.858 уникалдуу катышуучуларды камтыган да, шайлоо добуш берүү стандарттары менен көп сандаган, Wang жана кесиптештери дээрлик жок респонденттерди болгон үчүн көп, көп топтор бар болчу. Ошондуктан, изилдөөчүлөр эркелеткендей мырза П. Жалпылап айтканда, белгилүү бир топтун ичинде да Обамага колдоо мырза P. көлмөлөрдү маалымат көп баалоого чакырган ар бир топ, алар кийинки катмарларга менен көп регрессия деп аталган ыкманы колдонгон колдоо баалоо бири-бири менен тыгыз байланышкан топтор. Мисалы, арасында Обамага колдоо эсептөө маселесин карап, аял болобу, Барак Обама, 18-29 лет, ким муътадилдердин эле өзүн-өзү аныктоо колледж бүтүрүүчүлөрү демократтар катталган, бар, ал эми 2008-жылы Барак Обама үчүн добуш берген, бул ким өтө, абдан белгилүү бир топ бар, ал эми бул өзгөчөлyктөрy менен бирге тандалып алынган эч ким жок деп божомолдоого болот. Ошондуктан, бул топ тууралуу баа берүү, мырза P. көлмөлөрдүн бирине абдан окшош топтордогу адамдардын түзөт.
Бул талдоо стратегияны пайдаланып, Wang жана кесиптештери абдан тыгыз Барак Обама 2012-шайлоо-жылы жалпысынан баалоо Xbox эмес ыктымалдуулук үлгүсүн колдоно алышкан (Figure 3.5). Чындыгында, алардын баасы боюнча коомдук пикирди сурап-билүүнүн жыйындысы да так эле. Демек, бул учурда, салмак-атайын мырза эмес ыктымалдуулук маалыматтарды арылганга төгүнгө жакшы аткарат P.-көрүнөт; Сиз unadjusted Xbox маалыматтардан баа карап жатканда проблемалар көрүнөт.
Wang жана кесиптештеримдин изилдөөнүн эки негизги сабактар бар. Биринчиден, unadjusted эмес ыктымалдуулук үлгүлөрүн жаман баа алып келиши мүмкүн; бул көптөгөн изилдөөчүлөр мурда угуп жатам деп көп нерсеге үйрөнө алабыз. Бирок, экинчи сабак туура бааланган кийин эмес ыктымалдуулук үлгүлөрүн, чынында, абдан жакшы баа өндүрө албайт. Чындыгында, алардын баа pollster.com, көбүрөөк салттуу шайлоо шайлоого бир жыйындысын бааларына караганда так болду.
Акыр-аягы, биз белгилүү бир изилдөөнүн кандай сабак алсак болот маанилүү чектөөлөр бар. кийинки катмарлашуусу бул учурда жакшы иштеген эле, себеби, ал башка учурларда, ошондой эле иш алып барат дегенге эч кандай кепилдик жок. Чынында, шайлоо Коомдук пикирди сурамжылоонун дээрлик 100 жылдан бери шайлоо окуп жатышат, себеби, балким, жөнөкөй командалардын бири болуп, дайыма кайтарым жок (биз шайлоого ким көрө алат) жана партиянын аныктоо жана кубулуштарды мүнөздөмөсү добуш салыштырмалуу жарыш болуп саналат. Бул жерде биз эмес ыктымалдуулук үлгүлөргө салмак өзгөрүүлөрдү так баа берет билүүгө катуу теориясын жана эмпирикалык тажрыйбасы жетишпейт. так эмес бир нерсе болсо, сен эмес ыктымалдуулук үлгүлөрү менен иштөөгө мажбур болсо, анда такталган сметасы эмес эске алуу баасы алда канча жакшы болот деп ишенүүгө негиз жок.