Թվային տարիքը հավանականության նմուշառումն ավելի գործնականում դարձնում է ավելի դժվար եւ նոր հնարավորություններ ստեղծում ոչ հավանականության նմուշառման համար:
Ընտրանքի պատմության մեջ եղել են երկու մրցակցային մոտեցում `հավանականության նմուշառման մեթոդներ եւ ոչ հավանականության ընտրանքի մեթոդներ: Չնայած նմուշառման վաղ օրերին կիրառվել են երկու մոտեցումները, հավանականության նմուշառումը եկել է գերիշխող եւ շատ սոցիալական հետազոտողներ սովորեցնում են ոչ հավանականության նմուշառման դիտարկել մեծ թերահավատությամբ: Այնուամենայնիվ, ինչպես ես նկարագրեմ ստորեւ, թվային տարիքի ստեղծած փոփոխությունները նշանակում են, որ ժամանակն է, որ հետազոտողները վերանայեն ոչ հավանականության նմուշառումը: Մասնավորապես, հավանականության նմուշառումը շատ դժվար է գործնականում իրականացնել, եւ ոչ հավանականության նմուշառումը դարձել է ավելի արագ, ավելի էժան եւ ավելի լավ: Ավելի արագ եւ ավելի էժան հարցումներն ինքնանպատակ չեն, դրանք հնարավորություն են տալիս նոր հնարավորություններ, ինչպիսիք են ավելի հաճախակի հետազոտությունները եւ ավելի մեծ նմուշի չափերը: Օրինակ, ոչ հավանականության մեթոդների կիրառմամբ Կոոպերատիվի Կոնգրեսի Ընտրական ուսումնասիրությունը (CCES) կարող է մոտավորապես 10 անգամ ավելի շատ մասնակիցներ ունենալ, քան նախորդ ուսումնասիրությունները, օգտագործելով հավանականության նմուշառումը: Այսքան մեծ նմուշը թույլ է տալիս քաղաքական հետազոտողներին ուսումնասիրել տարանջատումը ըստ ենթախմբերի եւ սոցիալական համատեքստերի մոտեցումների եւ վարքագծի: Բացի այդ, այս լրացուցիչ սանդղակը եկել է առանց նվազման գնահատման որակի (Ansolabehere and Rivers 2013) :
Ներկայումս սոցիալական հետազոտության համար ընտրանքի նկատմամբ գերիշխող մոտեցումը հավանականության նմուշառումն է : Հավանականության նմուշառման դեպքում, թիրախային բնակչության բոլոր անդամները ունեն ընտրված, ոչ սեզոնային նմուշառման հավանականություն, եւ ընտրված բոլոր մարդիկ արձագանքում են հարցմանը: Երբ այդ պայմանները համապատասխանում են, էլեգանտ մաթեմատիկական արդյունքները հնարավորություն են տալիս ապացուցել, որ հետազոտողը կարող է օգտվել նմուշի օգտագործման հնարավորությունից `նպատակային բնակչության մասին զետեղելու համար:
Իրական աշխարհում, սակայն, այս մաթեմատիկական արդյունքների հիմքում ընկած պայմանները հազվադեպ են հանդիպում: Օրինակ, հաճախ ծածկույթի սխալներ եւ պատասխաններ չկան: Այս խնդիրների պատճառով հետազոտողները հաճախ ստիպված են կիրառել մի շարք վիճակագրական ճշգրտումներ, որպեսզի իրենց նմուշից դուրս գան իրենց թիրախային բնակչությանը: Այսպիսով, կարեւոր է տարբերակել հավանականության նմուշառումը տեսական տեսանկյունից , որն ունի ուժեղ տեսական երաշխիքներ եւ գործնականում հավանականության նմուշառում , որն առաջարկում է նման երաշխիքներ եւ կախված է վիճակագրական տարբեր ճշգրտումներից:
Ժամանակի ընթացքում տեսականորեն հավանականության նմուշառման եւ պրակտիկայում հավանականության նմուշառման տարբերությունները աճում են: Օրինակ, անպատասխանատվության ցուցանիշները աստիճանաբար աճում են, նույնիսկ բարձրորակ, թանկ հետազոտություններում (Նկար 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) : Անպատասխան սակագները շատ ավելի բարձր են առեւտրային հեռախոսային հարցումների ժամանակ, երբեմն նույնիսկ այն դեպքում, որքան 90% (Kohut et al. 2012) : Պատասխանատվության այդ բարձրացումը վտանգում է գնահատման որակը, քանի որ գնահատումները ավելի ու ավելի են կախված վիճակագրական մոդելներից, որոնք հետազոտողներն օգտագործում են չկատարելու համար չկատարելու համար: Հետագայում որակյալ այս նվազումները տեղի են ունեցել, չնայած հարցման հետազոտողների կողմից գնաճի բարձր մակարդակի բարձրացմանը: Որոշ մարդիկ վախենում են, որ որակի նվազեցման եւ աճող արժեքի այս երկվորյակ միտումները սպառնում են հետազոտության հետազոտության հիմքի վրա (National Research Council 2013) :
Միեւնույն ժամանակ, հավանականության նմուշառման մեթոդների աճող դժվարություններ են եղել, նաեւ հետաքրքիր զարգացումներ են եղել ոչ հավանականության նմուշառման մեթոդներով : Կան հավանական հավանականության նմուշառման տարբեր մեթոդներ, սակայն մի բան, որ նրանք ունեն ընդհանուր, այն է, որ նրանք հեշտությամբ չեն կարող տեղավորվել հավանականության նմուշառման մաթեմատիկական դաշտում (Baker et al. 2013) : Այլ կերպ ասած, ոչ հավանականության նմուշառման մեթոդներով, ոչ բոլորն ունեն ընդգրկման հայտնի եւ ոչ սեռական հավանականություն: Ոչ հավանականության ընտրանքային մեթոդները սոցիալական հետազոտողների շրջանում սարսափելի հեղինակություն ունեն եւ դրանք կապված են հետազոտական հետազոտողների ամենատարածված ձախողումների հետ, ինչպիսիք են « Գրական Digest fiasco» (ավելի շուտ քննարկված) եւ «Dewey Defeats Truman», ԱՄՆ-ի վերաբերյալ սխալ կանխատեսումներ: 1948 թվականի նախագահական ընտրությունները (3.6-րդ կետ):
Ոչ մի հավանական հավանականության նմուշառման մեկ ձեւ, որը հատկապես համապատասխանում է թվային տարիքին, առցանց վահանակների օգտագործումը: Ինտերնետային վահանակներ օգտագործող հետազոտողները կախված են որոշ վահանակի մատակարարից, սովորաբար, ընկերությունից, կառավարությունից կամ համալսարանից `խոշոր, բազմազան խումբ կազմելու համար, ովքեր համաձայն են հարցումների համար պատասխանատու լինել: Այս վահանակի մասնակիցները հաճախ հավաքագրվում են տարբեր գովազդային մեթոդներով, ինչպիսիք են առցանց banner գովազդները: Այնուհետեւ, հետազոտողը կարող է վահանակի մատակարարին վճարել ցանկալի հատկանիշներով հարցվողների օրինակին (օրինակ, մեծահասակների ազգային ներկայացուցիչ): Այս առցանց վահանակները ոչ հավանականության մեթոդներ են, քանի որ ոչ բոլորն ունեն ընդգրկման հայտնի, ոչ սեռական հավանականություն: Չնայած ոչ հավանականության առցանց վահանակները արդեն օգտագործվում են սոցիալական հետազոտողների կողմից (օրինակ, CCES- ը), դեռեւս որոշ բանավեճեր են առաջանում դրանցից ստացված գնահատումների որակի վերաբերյալ (Callegaro et al. 2014) :
Չնայած այս բանավեճերին, ես կարծում եմ, որ կան երկու պատճառ, թե ինչու ժամանակն է ճիշտ սոցիալական հետազոտողների համար վերանայել ոչ հավանականության նմուշառումը: Նախ, թվային տարիքում շատ դեպքեր եղել են ոչ հավանականության նմուշների հավաքման եւ վերլուծության մեջ: Այս նոր մեթոդները բավականին տարբեր են այն մեթոդներից, որոնք առաջացրել են խնդիրներ, որոնք իմ կարծիքով իմաստավորելու են դրանք որպես «ոչ հավանականության նմուշառման 2.0»: Երկրորդ պատճառն այն է, որ հետազոտողները պետք է վերանայեն ոչ հավանականության նմուշառումը, քանի որ հավանականության նմուշառում պրակտիկան ավելի բարդ է դառնում: Երբ չկան արձագանքման բարձր տեմպեր, քանի որ ներկայումս իրական հետազոտություններ են կատարվում, հարցվողների համար ներգրավվածության փաստացի հավանականությունը հայտնի չէ, ուստի, հավանականության նմուշները եւ հավանականության նմուշները տարբեր չեն, քանի որ շատ հետազոտողներ հավատում են:
Նախկինում ասացի, որ ոչ հավանականության նմուշները դիտվում են մեծ թերահավատությամբ մեծ թվով սոցիալական հետազոտողների կողմից, մասնակիորեն իրենց հետազոտության հետազոտության վաղ շրջանում որոշակի անհարմար անհաջողությունների պատճառով: Հավանականության նմուշների հետ մեր հեռավորության մասին հստակ օրինակ է Վեյ Վանգը, Դեյվիդ Ռոթսչիլդը, Շարադ Գոլը եւ Էնդրյու Գելմանը (2015) որոնք ճիշտ վերականգնում էին 2012 թ. ԱՄՆ ընտրությունների արդյունքը, օգտագործելով ոչ հավանականության նմուշը Ամերիկացի Xbox- ի օգտվողները, ամերիկացիների անվերապահ ոչ նմուշի ընտրությունը: Հետազոտողները XBox- ի խաղային համակարգից հարցվածներին հավաքագրել են, եւ ինչպես կարող եք ակնկալել, Xbox- ի ընտրանքը արցունքաբեր տղամարդ է եւ ձախողված երիտասարդ: 18- 29 տարեկանները կազմում են ընտրողների 19% -ը, սակայն Xbox- ի 65% -ը եւ տղամարդիկ կազմում են ընտրողների 47% -ը, սակայն Xbox- ի 93% -ը (նկար 3.7): Այդ ուժեղ դեմոգրաֆիկ կողմնակալությունների պատճառով, հում Xbox- ի տվյալները ընտրությունների արդյունքների վատ ցուցանիշն էին: Այն կանխատեսում էր Բարաք Օբամայի դեմ Միթ Ռոմնիի համար ուժեղ հաղթանակը: Կրկին, սա եւս մեկ օրինակ է հումքի, չհիմնավորված ոչ հավանականության նմուշների վտանգների մասին եւ հիշեցնում է « Գրական Digest» ֆիասկոյի հիշողությունը:
Այնուամենայնիվ, Վանն ու գործընկերները տեղյակ էին այդ խնդիրների մասին եւ փորձեցին հարմարեցնել իրենց ոչ պատահական ընտրանքային պրոցեսին գնահատման ժամանակ: Մասնավորապես, նրանք օգտագործեցին post-stratification , տեխնիկան, որը նույնպես լայնորեն օգտագործվում է հավանական հավանականության նմուշները ճշգրտելու համար, որոնք ունեն ծածկույթի սխալներ եւ ոչ պատասխանի:
Post-stratification- ի հիմնական գաղափարը թիրախային բնակչության մասին օժանդակ տեղեկատվություն է, որն օգնում է բարելավել նմուշից ստացված գնահատումը: Հետընտրական շերտավորում օգտագործելով, իրենց ոչ հավանականության նմուշից գնահատելու համար, Վանգը եւ գործընկերը բնակչությանը կտրեցին տարբեր խմբերի, գնահատեցին Օբամայի աջակցությունը յուրաքանչյուր խմբի մեջ, եւ այնուհետեւ գնահատական տվեց խմբի գնահատականների կշռված միջին գնահատման համար: Օրինակ, նրանք կարող էին բաժանել բնակչությանը երկու խմբերի (տղամարդկանց եւ կանանց), գնահատել Օբամայի աջակցությունը տղամարդկանց եւ կանանց շրջանում, այնուհետեւ գնահատել Օբամայի ընդհանուր աջակցությունը `կշռված միջին հաշվով հաշվի առնելով այն փաստը, որ կանայք ընտրողների 53% -ը եւ տղամարդիկ `47%: Խստորեն, post-stratification- ը օգնում է ճիշտ ուղղել անհավասարակշռված նմուշին, խթանելով խմբերի չափերի մասին օժանդակ տեղեկատվություն:
Post-stratification- ի բանալին ճիշտ խմբերի ձեւավորումն է: Եթե դուք կարող եք կտրել բնակչությունը միատարր խմբերում, այնպես, որ յուրաքանչյուր խմբի համար արձագանքների հակասությունները նույնն են, ապա հետտրտատիզմը կհանգեցնի օբյեկտիվ գնահատականների: Այլ կերպ ասած, գենդերի հետ շերտավորումն անխուսափելի գնահատականներ կստեղծի, եթե բոլոր տղամարդիկ ունենան արձագանքման հակում, եւ բոլոր կանայք ունեն նույն արձագանքը: Այս ենթադրությունը կոչվում է միատարր-արձագանք-հակվածություն, ներսում խմբերի ենթադրություն, եւ ես նկարագրում եմ դա մի քանի անգամ մաթեմատիկական նշումներում այս գլխի վերջում:
Իհարկե, կարծես թե հավանական է, որ արձագանքի պակասը նույնն է լինելու բոլոր տղամարդկանց եւ բոլոր կանանց համար: Այնուամենայնիվ, միատարր-արձագանք-պրոպենսանսները, ներառյալ խմբերի ենթադրությունը, ավելի հավանական է դառնում, քանի որ խմբերն ավելանում են: Կոպիտ, դառնում է ավելի հեշտ, եթե դուք ստեղծեք ավելի շատ խմբեր, եթե բնակչությունը միատարր խմբերին կտրվի: Օրինակ, կարող է թվալ, որ բոլոր կանայք նույն արձագանքման հակում ունեն, բայց ավելի հավանական է թվում, որ նույն արձագանքման հակում կա 18-29 տարիքի բոլոր կանանց համար, ովքեր ավարտել են քոլեջը եւ ովքեր ապրում են Կալիֆոռնիայում . Այսպիսով, երբ հետխորհրդային երկրներում օգտագործվող խմբերն ավելի են մեծանում, մեթոդի պահպանման համար անհրաժեշտ ենթադրությունները ավելի խելամիտ են դառնում: Հաշվի առնելով այս փաստը, հետազոտողները հաճախ ցանկանում են ստեղծել մեծ թվով խմբեր post-stratification. Այնուամենայնիվ, քանի որ խմբերն ավելանում են, հետազոտողները տարբեր խնդիր են դնում. Տվյալների անբավարարություն: Եթե յուրաքանչյուր խմբում կան միայն փոքր թվով մարդիկ, ապա գնահատումները ավելի անորոշ կլինեն, եւ ծայրահեղ դեպքերում, երբ կա մի խումբ, որը չունի հարցվողներ, ապա պաստառապատումը լիովին խախտում է:
Այս հստակ լարվածության երկու տարբերակ կա `միատարր-արձագանքման-հակում-խմբերում ենթադրությունների հավանականության եւ յուրաքանչյուր խմբի խելամիտ ընտրանքի չափերի պահանջարկի միջեւ: Նախ, հետազոտողները կարող են հավաքել ավելի մեծ, ավելի բազմազան նմուշներ, որոնք օգնում են ապահովել խելամիտ ընտրանքի չափերը յուրաքանչյուր խմբի մեջ: Երկրորդը, նրանք կարող են օգտագործել ավելի բարդ վիճակագրական մոդել, խմբերի շրջանակներում գնահատումներ կատարելու համար: Եվ, ըստ էության, երբեմն էլ հետազոտողները երկուսն էլ անում են, ինչպես Վանգը եւ գործընկերները, Xbox- ի հարցման մասնակիցների ընտրության հարցում:
Քանի որ նրանք օգտագործում էին ոչ հավանականության նմուշառման մեթոդը, համակարգչային կառավարվող հարցազրույցների միջոցով (ես կխոսեմ համակարգչային կառավարվող հարցազրույցների մասին, բաժնի 3.5-ում), Wang- ը եւ գործընկերները ունեցել են շատ էժան տվյալների հավաքում, ինչը հնարավորություն է տալիս նրանց հավաքել տեղեկատվություն 345,858 եզակի մասնակիցներից , մեծ թվով ընտրությունների չափանիշներով: Այս զանգվածային նմուշի չափը հնարավորություն տվեց նրանց ստեղծել մեծ քանակությամբ հետտրիճանման խմբեր: Այնուհետեւ, փոքրաթիվացումը սովորաբար ներառում է բնակչության թիվը հարյուրավոր խմբերի մեջ, Վանգը եւ գործընկերները բնակչությանը բաժանեցին 176.256 խմբի (2 կարգի), ռասայական (4 կարգի), տարիքի (4 կատեգորիաներ), կրթության (4 կատեգորիաների), պետական (51 կատեգորիա), կուսակցական ID (3 բաժին), գաղափարախոսություն (3 բաժին) եւ 2008 թ. Քվեարկությունը (3 կատեգորիաներ): Այլ կերպ ասած, նրանց հսկայական նմուշի չափը, որը թույլատրված էր տվյալների հավաքման ցածր արժեքով, հնարավորություն տվեց նրանց գնահատման գործընթացում առավել հավանական ենթադրություն դարձնել:
Նույնիսկ 345,858 եզակի մասնակիցների հետ, սակայն, դեռ շատ էին, շատ խմբեր, որոնց համար Wang- ը եւ գործընկերները գրեթե ոչ ոք չունեին: Հետեւաբար, նրանք օգտագործեցին տեխնիկան, որը կոչվում է բազմակողմանի ռեգրեսիա `գնահատելու յուրաքանչյուր խմբում աջակցությունը: Իրականում, գնահատելու Օբամայի աջակցությունը կոնկրետ խմբի մեջ, բազմակողմ ռեգրեսիան միտված է բազմաթիվ սերտ կապված խմբերի տեղեկատվության: Օրինակ, պատկերացրեք, որ Օբաման աջակցություն է ցուցաբերում Օբամայի կողմից 18-29 տարեկան կանանց շրջանում, ովքեր քոլեջի շրջանավարտներ են, ովքեր գրանցված են դեմոկրատներին, ովքեր ինքնուրույն են ճանաչում որպես չափավոր եւ 2008-ին Օբամայի օգտին քվեարկեցին: Սա շատ , շատ կոնկրետ խումբ, եւ հնարավոր է, որ այդ հատկանիշներով ընտրանքի մեջ ոչ ոք չկա: Հետեւաբար, այս խմբի մասին գնահատականներ տալու համար բազմակողմ ռեգրեսիան օգտագործում է վիճակագրական մոդել, որը շատ նման խմբերի մարդկանց հավաքագրում է հաշվարկներ:
Այսպիսով, Վանգը եւ գործընկերները օգտագործեցին մի մոտեցում, որը միավորում էր բազմակողմանի ռեգրեսիան եւ հետծննդաբերականությունը, ուստի կոչեցին իրենց ռազմավարությունը բազմակողմանի ռեգրեսիան հետտրկատիզացիայով կամ ավելի սիրալիր կերպով. P. «Երբ Վանն ու գործընկերները պարոն Պ.-ին օգտագործեցին XBox- ի ոչ հավանականության նմուշից գնահատելու համար, նրանք շատ մոտ էին գնահատականներին, որոնք Օբաման ստացել է 2012 թ. Ընտրություններում (նկար 3.8): Իրականում նրանց գնահատականները ավելի ճշգրիտ էին, քան ավանդական հասարակական կարծիքի հարցումների համախումբը: Այսպիսով, այս պարագայում վիճակագրական ճշգրտումներ, մասնավորապես պարոն Պ.- կարծես թե լավ աշխատանք է կատարում ոչ հավանականության տվյալների շեղման համար, կանխատեսումները, որոնք ակնհայտորեն տեսանելի են, երբ հաշվի չեն առնվում ճշգրտված Xbox- ի տվյալները:
Wang- ի եւ գործընկերների ուսումնասիրությունից կան երկու հիմնական դաս: Նախ, չկատարված ոչ հավանականության նմուշները կարող են հանգեցնել վատ գնահատականների. սա դաս է, որ շատ հետազոտողները նախկինում լսել են: Երկրորդ դասը, այնուամենայնիվ, այն է, որ ոչ հավանականության նմուշները, ճիշտ վերլուծության ժամանակ, կարող են իրականում լավ գնահատականներ տալ. ոչ հավանականության նմուշները պետք չէ ավտոմատ կերպով հանգեցնել Literary Digest fiasco- ի նմանությանը:
Առաջադրվելու դեպքում, եթե դուք փորձում եք որոշել հավանականության նմուշառման մոտեցման եւ ոչ հավանականության նմուշառման մոտեցման օգտագործման միջեւ, դուք բախվում եք բարդ ընտրության: Երբեմն հետազոտողները ցանկանում են արագ եւ կոշտ կանոն (օրինակ, միշտ օգտագործում են հավանականության նմուշառման մեթոդներ), բայց դա ավելի ու ավելի դժվար է առաջարկել նման կանոն: Հետազոտողները դժվարին ընտրություն են ունենում պրակտիկայում հավանական ընտրանքի մեթոդների միջեւ, որոնք ավելի ու ավելի թանկ են եւ հեռու են տեսական արդյունքներից, որոնք հիմնավորում են դրանց օգտագործման եւ ոչ հավանականության նմուշառման մեթոդները, որոնք ավելի էժան եւ արագ են, բայց ավելի քիչ ծանոթ եւ ավելի բազմազան: Այնուամենայնիվ, պարզ է մի բան, որ եթե ստիպված եք աշխատել ոչ հավանականության նմուշների կամ ոչ ներկայացրած մեծ տվյալների աղբյուրների հետ (կարծում եմ, վերադառնանք Գլուխ 2), ապա կա հուսալի հիմք `հավաստիացնելով, կապված տեխնիկան ավելի լավն է, քան ոչ ճշգրիտ, հումքի գնահատականները: