Санариптик жашы кыйын иш жүзүндө ыктымалдыгы пробаларды алуу жана дары-күтүүсүз тандоо үчүн жаңы мүмкүнчүлүк түзүп жатат.
Тандоонун тарыхында эки атаандаш ыкмаларды болуп: ыктымалдык үлгү алуу ыкмалары жана азык-ыктымалдыгы үлгү алуу ыкмалары. эки ыкмалар тандоо убагында колдонулат да, ыктымалдуулук үлгүлөрдү өкүмдарлык кылган, көптөгөн коомдук изилдөөчүлөр улуу ишенбөөчүлүк менен эмес ыктымалдуулук пробаларды көрүүгө үйрөтөт. Бирок, мен төмөндө айтып берет, санариптик курагы боюнча түзүлгөн өзгөрүшү изилдөөчүлөр эмес ыктымалдуулук пробаларды кайрадан убактысы болот деп айта албайбыз. Атап айтканда, ыктымалдуулук үлгүлөрдү алуу иш жүзүндө эмне үчүн кыйын, ал эми азык-ыктымалдыгы үлгүлөрдү алуу тез, арзан алып келген, ал эми жакшы. Тез жана арзан изилдөөлөр эле эмес, өзү менен аяктады: алар, мисалы, көп изилдөөлөрдүн жана ири тандап алуунун өлчөмү сыяктуу жаңы мүмкүнчүлүктөрдү берет. Мисалы, азык-ыктымалдык ыкмасын колдонуу менен Cooperative Конгресстин шайлоо изилдөөсү (CCES) ыктымалдык тандоону колдонуу менен мурдагы изилдөөлөрдүн жыйынтыктары болжол менен 10 эсе көп катышуучулардан алат. Бул көп үлгү топчолор жана коомдук жагдайларга боюнча көз караштар ар түрдүү жана жүрүм-турумун изилдеп саясий изилдөөчүлөр берет. Андан тышкары, бул кошо масштабдагы бардык баа сапатынын төмөндөшү келди (Ansolabehere and Rivers 2013) .
Азыркы учурда, коомдук изилдөө үчүн үлгүлөрдү берүүгө үстөмдүк мамиле ыктымалдык тандап алуу болуп саналат. күтүүсүз тандоо менен максаттуу калктын бардык мүчөлөрү белгилүү, сурамжылоого болуп nonzero ыктымалдыгы, жана сурамжылоого жооп сурамжылоого бардык адамдарды бар. Бул шарттар сакталган учурда, жарашыктуу математикалык жыйынтыгы максаттуу аудиториясы жөнүндө корутунду чыгара үлгүсүн колдонуу үчүн илимий жөндөмдүү жөнүндө илимдин кепилдик беришет.
Чыныгы дүйнөдө Бирок, бул математикалык жыйынтыгы негизги шарттары сейрек кездешет. Мисалы, көп камтуу каталар жана зулумдуктарына бар. Ушул көйгөйлөрдүн, изилдөөчүлөр көбүнчө алардын максаттуу калк үчүн алардын үлгүсүн далил үчүн статистикалык өзгөртүүлөрдү ар кандай колдонушу керек. Демек, эч кандай кепилдик бере жана статистикалык өзгөртүүлөрдү ар түрдүү көз каранды иш жүзүндө ыктымалдыгы күчтүү теориялык кепилдик бар пробаларды теориясына, жана күтүүсүз тандоо, айырмалоо маанилүү.
Убакыттын өтүшү менен, иш жүзүндө теориясы жана күтүүсүз тандоо күтүүсүз тандоо ортосундагы айырмачылык өсүүдө. Мисалы, зулумдуктарына арымы да, жогорку сапаттуу, кымбат изилдөөлөр (сүрөт 3.5) менен туруктуу, өсүп жатат (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) . Зулумдуктарына чендер соода телефон изилдөөлөр кээде да жогору эле 90% кыйла жогору (Kohut et al. 2012) . Бул зулумдуктарына менен көбөйөт, себеби баасы баа сапатын сайын коркунуч изилдөөчүлөр зулумдуктарына тууралуу үчүн колдонгон статистикалык моделдери көз каранды. Андан тышкары, сапаты бул кыскарышы жогорку жооп арымын сактап калууга сурамжылоо менен барган сайын кымбат аракеттерге карабастан болду. Кээ бир адамдар сапатын төмөндөтүү менен бааларды көтөрүү бул эгиз абалы сурамжылоо изилдөөнүн негизин коркунуч деп коркуп (National Research Council 2013) .
Ыктымалдык үлгүлөрдү алуу ыкмаларынын өсүп кыйынчылык болгон жок, ошол эле учурда, ошондой эле азык-ыктымалдык үлгүлөрдү алуу ыкмалары кызыктуу окуялар бар. Эмес ыктымалдуулук үлгүлөрдү алуу методдорун стилдеги сорту бар, бирок, алар орток бир нерсе алар күтүүсүз тандоо математикалык алкагында туура мүмкүн эмес экенин (Baker et al. 2013) . Башка сөз менен айтканда, азык-ыктымалдык үлгүлөрдү алуу ыкмалары ар киргизүү бир белгилүү жана nonzero ыктымалдыкка ээ эмес. Non-ыктымалдык үлгү алуу ыкмалары коомдук изилдөөчүлөр арасында коркунучтуу кадыр-баркка ээ жана алар мындай адабий Digest жое эле сурамжылоо көпчүлүк драмалык үзгүлтүктөр, айрымдары менен байланышкан (жогоруда) жана АКШ жөнүндө туура эмес болорун "Dewey Труман, чыгышты" 1948 (сүрөттө 3.6) жана президенттик шайлоо.
Санариптик курагына ылайыктуу айрыкча эмес күтүүсүз тандоо бир түрү онлайн такталар пайдалануу болуп саналат. онлайн курамдарды колдонуп Окумуштуулар кээ бир коллегиясынын камсыздоочу-адатта компания, өкмөттүн, изилдөөлөр боюнча респонденттердин катары кызмат кылууга макул адамдар көп, ар кандай топ же куруу окуу үчүн көз каранды. Бул бир кашектин катышуучулары, адатта, ушундай онлайн баннер жарнама катары атайын ар кандай ыкмаларды колдонуу менен кабыл алынат. Андан кийин, бир изилдөөчү Каалаган (мисалы, адамдардын улуттук өкүлү) менен респонденттердин бир үлгүдөгү жетүү үчүн бир кашектин тейлөөчүгө төлөй аласыз. Бул онлайн панелдер ар киргизүү менен белгилүү болгон, nonzero ыктымалдыкка ээ эмес, анткени азык-ыктымалдык ыкмалары болуп саналат. Эмес ыктымалдуулук онлайн панелдер буга чейин коомдук изилдөөчүлөр тарабынан колдонулуп жатат да (мисалы, CCES), дагы аларга келген баа сапаты жөнүндө талаш жок (Callegaro et al. 2014) .
Бул талаш-карабастан, мен убактысы туура эмес ыктымалдуулук пробаларды кайрадан коомдук илим изилдөөчүлөр үчүн эмне үчүн эки себеп бар деп ойлойм. Биринчиден, санариптик доордо, чогултуу жана азык-ыктымалдыгы үлгүлөрдү талдоо көптөгөн окуялар болду. Бул акыркы ыкмалары, мен өткөн кыйынчылыктарды пайда методдор жетиштүү экенин ар түрдүү, ал ошондой эле алардын ой мааниси бар деп ойлойм "эмес күтүүсүз тандоо 2.0." Экинчи себеби, эмне үчүн изилдөөчүлөр эмес ыктымалдуулук иргеп, анткени ыктымалдыгы берилди карап керек практикасы барган сайын кыйын болуп жатат. жогорку көрсөткүчтөрү бар болгондо эмес жооп катары респонденттердин жөнөтсүн реалдуу изилдөөлөрдүн азыр иш жүзүндө ыктымалдыгы да бар белгилүү эмес, аны менен бирге болуу ыктымалдыгы үлгүлөр жана азык-ыктымалдыгы үлгүлөрү көп изилдөөчүлөр ишенген сыяктуу эле ар түрдүү эмес.
Мен жана айтып өткөндөй, азык-ыктымалдык үлгүлөрү көптөгөн коомдук изилдөөчүлөр тарабынан көп ишенбөөчүлүк менен карашат, анткени сурамжылоо изилдөөнүн алгачкы күндөрү абдан уят бузулуулардын кээ бир өз ролун бөлүгүндө. Канчалык биз эмес ыктымалдуулук үлгүлөрүн менен келген айкын көрүнүп Wei Wang, Дөөтү Rothschild, Sharad Гоэл жана Эндрю Гелман изилдөө болуп саналат (2015) туура бир эмес ыктымалдуулук үлгүсүн колдонуу менен 2012 АКШ шайлоонун жыйынтыктарын кайра кайтарып алды Америка Xbox колдонуучулар бир америкалык чечкиндүү nonrandom үлгү. изилдөөчүлөр Xbox оюн системасынын респонденттерди ишке, сен күткөн мүмкүн эле, Xbox үлгү эркек бурмаланды жана жаш бурмаланды: 18- 29-жашка чейинки шайлоочулардын 19% түзөт, ал эми Xbox үлгүсүндөгү 65%, ал эми эркектер шайлоочулардын 47% түзөт, ал эми Xbox үлгүсүндөгү 93% (3.7-сүрөт). Мындай күчтүү калкынын кызыкчылыктардан, чийки Xbox маалыматтарды шайлоонун бир начар көрсөткүч. Ал Барак Обама Митт Ромни үчүн абдан салып алдын ала айткан. Дагы, бул чийки, unadjusted эмес ыктымалдуулук үлгүлөрдү коркунучтуу дагы бир мисалы болуп саналат жана адабий Digest жое эске салат.
Бирок, Кытай жана кесиптештери бул көйгөйлөр тууралуу жакшы эле баа берип жатканда, алардын кокусунан тандап алуу жараянына өзгөртүүгө аракет кылышкан. Атап айтканда, пост-катмарлуу, ошондой эле көп камтуу каталар жана азык-жооп ээ болуу ыктымалдыгы үлгүлөрүн жөнгө салуу үчүн колдонулат бир ыкманы колдонгон.
Пост-катмарларга негизги идеясы үлгүдөгү келген баа жакшыртууга жардам берүү үчүн максаттуу аудиториясы жөнүндө кошумча маалыматтарды колдонуу болуп саналат. алардын эмес ыктымалдуулук үлгүдөн баа берүү кийинки катмарлашууну колдонуп жатканда, Wang жана кесиптеш ар кандай топторго калкты жарып, ар бир топ боюнча да Обамага колдоо эсептелген, андан кийин жалпы баа өндүрүү үчүн бир топ баа салмактанып алынган орточо алды. Мисалы, алар калктын эки топко (эркектер жана аялдар) салып, эркектер жана аялдар арасында да Обамага колдоо эсептелген, андан кийин да эсепке алуу максатында салмактанып алынган орточо алуу менен Обама жалпы колдоо эсептелген аялдар экиге бөлүп алмак кылып шайлоочулардын жана эркектердин 47% 53% чейин. Болжол менен, кийинки катмарлашуусу топторунун өлчөмү жөнүндө кошумча маалымат алып келүү менен бир салмаксыз үлгүдөгү туура берет.
Пост-катмарларга ачкычы туура топторду түзүү болуп саналат. Эгер бир тектүү топторго калктын отунга жарып, анда жооп Ыйыктыктын ар бир топтун ар бир эле ушундай болсо, анда кийинки катмарлашуусу калыс баа берет. Башка сөз менен айтканда, жынысы боюнча кийинки катмарлуу структурага бардык адамдар жооп ык коюу жана аялдардын баары бирдей жооп ык бар болсо, калыс баа берет. Бул божомол тектүү-жооп-Ыйыктыктын ичинде-топтор болжолдоого деп аталат, мен аны бул бөлүмдүн аягында бир аз математикалык белгилер көбүрөөк сүрөттөгөн.
Албетте, бул жооп Ыйыктыктын бардык адамдар жана аялдар үчүн бирдей болот деп күмөн. Ошентсе да, бир тектүү-жооп-Ыйыктыктын ичинде топтордо божомол топтор көбөйүп саны көбүрөөк алектениши болот. Болжол менен, андан да көбүрөөк топторду түзүү, эгерде бир тектүү топко калкты жарып жардам берет. Мисалы, бардык аялдар бирдей жооп ык ээ болбойт сезилиши мүмкүн, бирок, ал качан колледжди бүтүргөн бардык 18-29 жаштагы аялдар үчүн бирдей жооп зээндүү бар экенин жана ынандырарлык жана California жашап жаткандарга сезилиши мүмкүн . Ошентип, кийинки катмарларга колдонулган топтордун саны көп түшөрү менен, ыкмасын колдоо үчүн зарыл болгон божомолдор дагы акыл-эстүү болуп калат. Муну эске алганда, изилдөөчүлөр көбүнчө кийинки катмарларга үчүн топтордун көп сандаган түзүп келет. маалымат sparsity: Бирок, топтор саны көбөйгөндө, изилдөөчүлөр башка көйгөй кезигишет. ар бир топ адамдар бир аз гана саны бар болсо, анда баа дагы белгисиз болуп калат, ал эми өтө учурда эч кандай респонденттерди бар жерде бир топ жерде, андан кийин пост-катмарлашуусу толугу менен калат.
бир тектүү-жооп-зээндүү ичинде топтордо берүүлөрдүн кооптуу жана ар бир топтун акыл-эстүү тандап алуунун өлчөмү суроо-талаптын ортосундагы мүнөздүү келишпестиктер чыгып, эки жолу бар. Биринчиден, изилдөөчүлөр ар бир топ акыл-эстүү үлгү өлчөмдө камсыз кылууга жардам берет ири, ар түрдүү үлгүдөгү, чогултуп алат. Экинчиден, алар жалгыз эмес, топ ичинде баа берүүлөрүн эске алуу үчүн бир кыйла татаал статистикалык үлгүнү колдонсо болот. Ал эми, чынында, кээде изилдөөчүлөр Wang жана кесиптештер Xbox келген респонденттерди колдонуп, шайлоо, аларды изилдөө менен бирге эле, экөө тең керек.
Алар 345.858 уникалдуу катышуучулардын маалымат чогулта берген кайсы бир компьютер башкаруучу маектешүү менен эмес ыктымалдуулук тандап алуу ыкмасы (I бөлүмүндө 3,5-жылы компьютер башкаруучу маектешүү кененирээк сөз кылабыз), Кытай жана кесиптештер, өтө арзан маалымат жыйнагын эле колдонуп келишкен, анткени шайлоо пикир сурап-билүү жүргүзүлгөн стандарттары боюнча бир топ. Бул массалык үлгү пост-катмарлашуусу топтордун өтө көп санда пайда болушу үчүн, Ыйса алардын акылын ачты. Пост-катмарлашуусу адатта топтордун жүздөгөн калкты жарып билдирет, ал эми, Кытай жана кесиптештери калк менен аныкталат 176.256 топко гендердик бөлүнгөн (2-категория), расалык (4 категория), жаш курагы (4 категория), билим берүү (4 категория), мамлекеттик (51 категория), партиялык ID (3 категория), идеология (3 категория), ал эми 2008-жылдын добуш (3 категориялары). Башка сөз менен айтканда, алардын зор үлгү арзан баадагы маалыматтарды чогултуу менен иштетилди көлөмү, алардын эсептик жүрүшүндө бир дагы туурадай алгандыгы үчүн, Ыйса алардын акылын ачты.
Ал тургай, 345.858 уникалдуу катышуучулар менен, бирок, дагы эле көп, Wang турган топтор көп жана кесиптештери дээрлик эч респонденттерди эле бар болчу. Ошондуктан, ар бир топ колдоо баалоого көп регрессия деп аталган ыкманы колдонгон. Жалпылап айтканда, белгилүү бир топтун ичинде да Обамага колдоо баалоо үчүн, көп регрессиялык көптөгөн менен тыгыз байланышта топторунан маалымат топтолгон. Мисалы, арасында аялдар испан тилдүүлөр, 18 жаштан 29 жашка чейинки, жогорку окуу жайларынын бүтүрүүчүлөрү, муътадилдердин эле өзүн-өзү аныктоо демократтар, катталган, ал эми Барак Обама үчүн добуш берген 2008-жылы да Обамага колдоо баалоого аракет Бул өтө дейли , белгилүү бир тобу, ошондой эле бул өзгөчөлyктөрy менен бирге үлгүсүндөгү эч ким жок деп божомолдоого болот. Ошондуктан, бул топ тууралуу баа берүү, көп регрессиялык абдан окшош топторго элдин чогуу баа топтоо статистикалык моделди колдонот.
Ошентип, Wang жана кесиптештер көп кетүү жана пост-катмарлашууну бирге ыкманы колдонгон, алар кийинки катмарларга менен стратегиясы көп регрессиялык же, кээде деп аталат ", деп билдирди P. "качан Wang жана кесиптештер мырза П. колдонулган Xbox эмес ыктымалдуулук үлгүдөн баа берүү, Обаманын 2012-шайлоо (3.8-сүрөт) алынган жалпы колдоосу абдан жакын баа өндүрүлөт. Чындыгында, алардын баасы боюнча салттуу коомдук пикирди сурап-билүүнүн жалпысынан караганда так болду. Демек, бул учурда, статистикалык өзгөрүүлөрдү-атайын мырза эмес ыктымалдуулук маалыматтарды арылганга жазаласа, жакшы иштерди кылууга P.-окшойт; Сиз unadjusted Xbox маалыматтардан баа караганыбызда апачык көрүнүп турган проблемалар.
Wang жана кесиптештеримдин изилдөөнүн эки негизги сабактар бар. Биринчиден, unadjusted эмес ыктымалдуулук үлгүлөрү жаман баа алып келиши мүмкүн; Бул көптөгөн изилдөөчүлөр мурда уккан бир сабак болуп саналат. Экинчиси болсо, туура талдап жатканда эмес ыктымалдуулук үлгүлөрүн, чындыгында, жакшы баа чыгара алат; эмес ыктымалдуулук үлгүлөрүн жазуусу Адабий Digest жое сыяктуу бир нерсе алып келбеши керек.
Силер үчүн оор тандоонун алдында бир ыктымалдык үлгүлөрдү мамиле менен эмес ыктымалдуулук тандап алуу ыкмасын колдонуу менен чечүүгө аракет кылып жатышат, анда алдыга. Кээде изилдөөчүлөр бул тез жана катуу башкаруусуна (мисалы, дайыма болуу ыктымалдыгы үлгү алуу ыкмаларын пайдалануу), бирок ал мындай эрежени сунуш барган сайын кыйын болуп баратат. Окумуштуулар оор иш жүзүндө барган сайын кымбат жана аларды пайдалануу менен эмес ыктымалдуулук үлгү алуу ыкмаларын-арзан актоого теориялык жыйынтыктары алыс жана ыктымалдыгы үлгүлөрдү алуу ыкмаларын тандоо жана тез дуушар болушат, бирок анча тааныш жана ар түрдүү. баа пост-катмарлуу жана пайдалануу деп апачык бир нерсе, бирок, силер эмес ыктымалдуулук үлгүлөрүн же nonrepresentative чоң маалымат булактары менен иштөөгө аргасыз болушат, эгер (кайра 2-бөлүмдүн ойлойт) болсо, анда күчтүү негиз жок тийиштүү ыкмалары unadjusted, чийки бааларга салыштырмалуу жакшы болот.