Ամրացվածը խնդրելով օգտագործել կանխատեսող մոդել, հետազոտության տվյալները մի քանի մարդկանցից համադրելու համար, որը մեծ թվով մարդկանցից մեծ տվյալների աղբյուր է:
Հետազոտության եւ մեծ տվյալների աղբյուրների համատեղման այլ եղանակ է, որը ես կոչ եմ անում բարձրացնել հարցումը: Հետազոտողը հարցնում է, որ հետազոտողը օգտագործում է կանխատեսող մոդել, փոքր տվյալների հետազոտության տվյալների մի մեծ տվյալների աղբյուրի հետ համադրելու համար, որպեսզի գնահատականները կատարվեն մասշտաբով կամ հատվածային մասում, որը հնարավոր չէ անհատական տվյալների աղբյուրի հետ: Ամփոփված խնդրի կարեւոր օրինակներից են Ջոշուա Բլումենստոկի աշխատանքը, որը ցանկանում է հավաքել տվյալներ, որոնք կարող են օգնել աղքատ երկրներում զարգացմանը: Նախկինում նման տվյալներ հավաքող հետազոտողները ընդհանուր առմամբ ստիպված էին լինում երկու մոտեցումներից մեկը. Ընտրանքային հետազոտություններ կամ մարդահամարներ: Ընտրանքային հետազոտություններ, որտեղ հետազոտողների հարցազրույցը փոքր թվով մարդիկ կարող են լինել ճկուն, ժամանակին եւ համեմատաբար էժան: Այնուամենայնիվ, այս հետազոտությունները, քանի որ դրանք հիմնված են նմուշի վրա, հաճախ սահմանափակվում են դրանց լուծման մեջ: Ընտրանքային հետազոտության արդյունքում դժվար է գնահատել որոշակի աշխարհագրական շրջաններ կամ կոնկրետ ժողովրդագրական խմբեր: Մարդահամարությունները, մյուս կողմից, փորձում են բոլորի հետ հարցազրույց անցկացնել, եւ դրանք կարող են օգտագործվել փոքրիկ աշխարհագրական շրջաններ կամ ժողովրդագրական խմբերի գնահատականներ արտադրելու համար: Սակայն մարդահամարներն ընդհանուր առմամբ թանկ են, նեղ են ուշադրության կենտրոնում (նրանք ընդամենը մի քանի հարցեր են պարունակում) եւ ոչ թե ժամանակին (դրանք տեղի են ունենում ֆիքսված ժամանակացույցում, օրինակ `ամեն 10 տարին) (Kish 1979) : Պատկերահանդեսների կամ մարդահամարների հետ կապված չլինելու փոխարեն, պատկերացրեք, թե արդյոք հետազոտողները կարող են համատեղել երկուսի լավագույն հատկանիշները: Պատկերացրեք, արդյոք հետազոտողները կարող են ամեն օր հարց տալ յուրաքանչյուր մարդու ամեն օր: Ակնհայտ է, որ այս ամենը ամենուրեք, ամեն մի հետազոտություն, մի տեսակ սոցիալական գիտության ֆանտազիա է: Բայց երեւում է, որ մենք կարող ենք սկսել մոտավորապես այն `միավորել մարդկանց հարցումներից մի քանիսը թվային հետքերով բազմաթիվ մարդկանցից:
Blumenstock- ի հետազոտությունը սկսվեց այն ժամանակ, երբ նա համագործակցում էր Ռուանդայի խոշորագույն բջջային հեռախոսահամարով, իսկ ընկերությունը 2005 եւ 2009 թվականներին մոտ 1.5 միլիոն բաժանորդից անոնսիզացված գործարքներ է մատուցել: Այս գրառումները պարունակում են տեղեկություններ յուրաքանչյուր զանգի եւ տեքստային հաղորդագրության մասին, ինչպես օրինակ սկիզբը, տեւողությունը , ինչպես նաեւ զանգահարողի եւ ստացողի մոտավոր աշխարհագրական դիրքը: Մինչեւ ես խոսում եմ վիճակագրական խնդիրների մասին, հարկ է նշել, որ այս առաջին քայլը կարող է լինել շատ դժվարին հետազոտողների համար: Ինչպես ես նկարագրեցի 2-րդ գլխում, մեծ թվով տվյալների աղբյուրները անհասանելի են հետազոտողների համար: Հեռախոսային meta-data- ը հատկապես անհասանելի է, քանի որ հիմնականում անհնար է անանունացնել եւ գրեթե անկասկած պարունակում է այն տեղեկատվությունը, որը մասնակիցները կքննարկեն զգայուն (Mayer, Mutchler, and Mitchell 2016; Landau 2016) : Այս առնչությամբ հետազոտողները զգույշ էին պահում տվյալների պաշտպանությունը եւ նրանց աշխատանքը վերահսկվում էր երրորդ կողմի կողմից (այսինքն, իրենց IRB- ն): Ես կվերադառնամ այս բարոյական հարցերը մանրամասն 6-րդ գլխում:
Blumenstock- ը շահագրգռված էր հարստության եւ բարեկեցության չափման մեջ: Բայց այդ հատկությունները ուղղակիորեն չեն կատարվում զանգի գրառումներում: Այսինքն, այս զանգի գրառումները թերի են այս հետազոտության համար `մեծ տվյալների աղբյուրների ընդհանուր առանձնահատկությունը, որը մանրամասնորեն քննարկվել է գլուխ 2-ում: Սակայն, հավանական է, որ զանգի գրառումները հավանաբար ունենան որոշ տեղեկություններ, որոնք կարող են անուղղակիորեն տրամադրել հարստության եւ բարեկեցություն: Հաշվի առնելով այդ հնարավորությունը, Blumenstock- ը հարցրեց, թե արդյոք հնարավոր է ուսուցանել մեքենա ուսուցման մոդել `կանխատեսելու համար, թե ինչպես պետք է արձագանքեն հարցման վրա կատարված հարցմանը: Եթե դա հնարավոր է, ապա Blumenstock- ը կարող է օգտագործել այս մոդելը կանխատեսելու 1.5 միլիոն հաճախորդների հետազոտության պատասխանները:
Նման մոդելի կառուցելու եւ վերապատրաստման համար, Blumenstock- ը եւ Քիգալիի Գիտությունների եւ Տեխնոլոգիաների Ինստիտուտի հետազոտական օգնականները հազարավոր հաճախորդների պատահական նմուշ են անվանել: Հետազոտողները բացատրեցին ծրագրի նպատակները մասնակիցներին, խնդրեցին իրենց համաձայնությունը կապ հաստատել հարցումների պատասխանների հետ զանգի գրառումներին, ապա խնդրեց նրանց մի շարք հարցեր `չափելու իրենց հարստությունը եւ բարեկեցությունը, ինչպես օրինակ« Դուք ունեք ռադիոյով »եւ« Հեծանիվ եք տիրում »(տես մաս 3.14-ը, մասնակի ցուցակի համար): Հետազոտության բոլոր մասնակիցները փոխհատուցվել են ֆինանսապես:
Հաջորդը, Blumenstock- ը օգտագործեց մեքենայական ուսուցման սովորական երկու քայլ ընթացակարգ. Նախ, խաղարկային ինդուստրիալ փուլում, հարցազրույցի մասնակից բոլորի համար, Blumenstock- ը դարձրել է զանգի գրառումները յուրաքանչյուր անձի վերաբերյալ մի շարք բնութագրերի մեջ, Տվյալների գիտնականները կարող են անվանել այս հատկանիշները «առանձնահատկություններ» եւ սոցիալական գիտնականները նրանց անվանում են «փոփոխականներ»: Օրինակ, յուրաքանչյուր անձի համար, Blumenstock հաշվարկեց օրերի ընդհանուր քանակը, գործունեության հետ, այն անձի, եթերաժամում ծախսված գումարները եւ այլն: Քննադատաբար, լավ խաղարկային տեխնիկա պահանջում է գիտելիքների գիտելիքների մակարդակը: Օրինակ, եթե կարեւոր է տարբերակել ներքին եւ միջազգային զանգերը (մենք կարող ենք ակնկալել այն մարդկանց, ովքեր միջազգայնորեն կոչում են հարուստ), ապա դա պետք է արվի, որ խաղարկային ինժեներական քայլը կատարվի: Ռուանդայի աննշան պատկերացմամբ հետազոտողը չի կարող այդ առանձնահատկությունն ընդգրկել, ապա մոդելի կանխատեսելի կատարումը կտուժի:
Հաջորդը, վերահսկվող ուսման փուլում, Blumenstock- ը կառուցել է մոդել, կանխատեսելու յուրաքանչյուր մարդու համար հետազոտության պատասխանը, ըստ իրենց հատկանիշների: Այս պարագայում Blumenstock- ն օգտագործեց տրամաբանական ռեգրեսիան, սակայն կարող էր օգտագործել մի շարք այլ վիճակագրական կամ մեքենայական ուսուցման մոտեցումներ:
Այսպիսով, ինչքան լավ է աշխատել: Blumenstock- ը կարողացավ կանխատեսել հարցման հարցերի պատասխանները, ինչպիսիք են `« Դուք ունեք ռադիոյով »եւ« Հեծանիվ ունեք », օգտագործելով զանգի գրառումներից ստացված հատկությունները: Իր կանխատեսելի մոդելի գնահատման համար, Blumenstock- ը օգտագործեց խաչաձեւ վավերացում , որը սովորաբար կիրառվում է տվյալների գիտության մեջ, բայց հազվադեպ է հասարակական գիտության մեջ: Խաչաձեւ վավերացման նպատակն է ապահովել մոդելի կանխատեսելի կատարողականի արդարացի գնահատումը `այն վերապատրաստելով եւ փորձարկում այն տվյալների տարբեր ենթախմբերի վրա: Մասնավորապես, Blumenstock- ը իր տվյալները բաժանեց 100 հոգու յուրաքանչյուր 10 կտոր: Այնուհետեւ նա իր 9 մոդելները սովորեցնելու համար օգտագործել էր իր մոդելը, եւ վերապատրաստված մոդելի կանխատեսելի կատարումը գնահատվել է մնացած մասերի վրա: Նա կրկնեց այս ընթացակարգը 10 անգամ, յուրաքանչյուր տվյալների հավաքածուի միջոցով, մեկ անգամ որպես վավերացման տվյալներ, եւ արդյունքները միջին էին:
Կանխատեսումների ճշգրտությունը որոշակի հատկանիշների համար բարձր էր (նկար 3.14); օրինակ, Blumenstock- ը կարող էր կանխատեսել 97.6% ճշգրտությամբ, եթե որեւէ մեկը ռադիոյին պատկաներ: Սա կարող է տպավորիչ լինել, բայց միշտ կարեւոր է համեմատել բարդ կանխատեսման մեթոդը պարզ այլընտրանքի հետ: Այս դեպքում պարզ այլընտրանք է կանխատեսել, որ բոլորը ամենատարածված պատասխանը կտան: Օրինակ, հարցվողների 97.3% -ը հաղորդել է ռադիոյին, որպեսզի եթե Բլյումենստոկը կանխատեսեր, որ բոլորը կհայտարարեն ռադիո ունենալը, նա 97.3% ճշգրտություն կլիներ, ինչը զարմանալիորեն նման է իր ավելի բարդ ընթացակարգի կատարմանը (97.6% ճշտություն) . Այլ կերպ ասած, բոլոր ֆանտաստիկ տվյալների եւ մոդելավորման արդյունքում կանխատեսման ճշտությունը բարձրացրեց 97.3% -ից մինչեւ 97.6%: Սակայն, այլ հարցերի համար, ինչպիսիք են `« Դուք ունեք հեծանիվ », կանխատեսումները բարելավվել են 54.4% -ից մինչեւ 67.6%: Ընդհանուր առմամբ, 3.15-րդ աղյուսակը ցույց է տալիս, որ Blumenstock- ը որոշակի հատկանիշների համար չի բարելավում շատ ավելի պարզ բանալին նախնական կանխատեսումը դարձնելու համար, սակայն մյուս հատկանիշների համար որոշակի բարելավում կա: Պարզապես այդ արդյունքների վրա, սակայն, գուցե չեք կարծում, որ այս մոտեցումը հատկապես խոստումնալից է:
Սակայն, ընդամենը մեկ տարի անց, Blumenstock- ը եւ երկու գործընկերներ, Գաբրիել Կադամուրոն եւ Ռոբերտ Օն-ը, տպագրեցին գիտության մեջ զգալիորեն ավելի լավ արդյունքներով (Blumenstock, Cadamuro, and On 2015) : Այս բարելավման համար գոյություն ունեցան երկու հիմնական տեխնիկական պատճառ: 1) նրանք օգտագործեցին ավելի բարդ մեթոդներ (այսինքն, նոր մոտեցում հատկապես ինովացիոն ինստիտուտին եւ ավելի բարդ մոդելին, կանխատեսելու հատկությունների պատասխանները) եւ (2), այլ ոչ թե անհատական պատասխանների հետազոտության հարցերը (օրինակ, «Դուք ունեք ռադիոյով»), նրանք փորձել են ներդնել կոմպոզիտային հարստության ինդեքս: Այս տեխնիկական բարելավումները նշանակում էին, որ նրանք կարող են կատարել իրենց խելամիտ աշխատանքը, օգտագործելով զանգի գրառումները, որպեսզի իրենց նախընտրած մարդկանց համար հարստություն կանխատեսեն:
Սակայն, օրինակ, ժողովրդի հարստությունը կանխատեսելը հետազոտության վերջնական նպատակը չէ: Հիշեք, որ վերջնական նպատակն էր միավորել ընտրանքային հետազոտությունների եւ մարդահամարների մի քանի լավագույն հատկանիշները `զարգացող երկրներում աղքատության ճշգրիտ եւ բարձրորակ գնահատականները առաջ բերելու համար: Այս նպատակին հասնելու իրենց ունակությունը գնահատելու համար, Blumenstock- ը եւ գործընկերները օգտագործել են իրենց մոդելը եւ իրենց տվյալները `զանգի գրառումներում կանխատեսելու 1.5 միլիոն մարդկանց հարստությունը: Եվ նրանք օգտագործում էին զանգվածային գրառումներում տեղադրված աշխարհագրական տեղեկություններ (հիշեցնենք, որ տվյալները յուրաքանչյուր զանգի համար սահմանել են մոտակա բջջային աշտարակի տեղադրությունը) յուրաքանչյուր անձի մոտավոր բնակության վայրը գնահատելու համար (Նկար 3.17): Այս երկու գնահատականները միասին դնելով, Blumenstock- ը եւ գործընկերները բաժանեցին բաժանորդների հարստության աշխարհագրական բաշխմանը, չափազանց բարակ տարածական հատվածավորության վրա: Օրինակ, Ռուանդայի 2,148 բջիջներից յուրաքանչյուրը (երկրում ամենափոքր վարչական միավորը) կարող էր գնահատել միջին հարստությունը:
Որքանով են այդ գնահատումները համապատասխանում այս տարածաշրջաններում աղքատության փաստացի մակարդակին: Նախքան պատասխանեմ այս հարցին, ուզում եմ շեշտել այն փաստը, որ թերահավատության համար շատ պատճառներ կան: Օրինակ, անհատական մակարդակում կանխատեսումներ կատարելու ունակությունը բավականին աղմկոտ էր (նկար 3.17): Եվ, թերեւս, ավելի կարեւոր է, բջջային հեռախոսներով մարդիկ կարող են համակարգված կերպով տարբերվել բջջային հեռախոսներից առանց մարդկանց: Այսպիսով, Blumenstock եւ գործընկերները կարող են տառապում տեսակների անդրադարձներում սխալներ, որոնք կողմնակալ է 1936 Գրական Digest հարցում, որը ես նկարագրված ավելի վաղ:
Հաշվի առնելով իրենց գնահատականների որակը, Blumenstock- ը եւ գործընկերները պետք է համեմատեն դրանք այլ բանով: Բարեբախտաբար, միեւնույն ժամանակ, ինչպես իրենց ուսումնասիրության, հետազոտողներից մեկի խումբը Ռուանդայում ավելի ավանդական սոցիալական հետազոտություն էր անցկացնում: Այս այլ հետազոտությունը, որը մասսայական հարգված ժողովրդագրական եւ առողջապահական հետազոտությունների ծրագրի մաս էր կազմում, մեծ բյուջե էր եւ օգտագործվում է բարձրորակ, ավանդական մեթոդներով: Հետեւաբար, Ժողովրդագրական եւ Առողջապահական Հետազոտության գնահատականները կարող են ողջամտորեն համարվել ոսկու ստանդարտ գնահատումներ: Երբ համեմատվում էին երկու գնահատականները, դրանք շատ նման էին (Նկար 3.17): Այլ կերպ ասած, զուգահեռ տվյալների հետ մի փոքր զուգահեռ անցկացնելով, Blumenstock- ը եւ գործընկերները կարողացան համեմատել այնպիսի գնահատականներ, որոնք ոսկու ստանդարտ մոտեցումներից են:
Հավանաբար, թերահավատությունը կարող է տեսնել այդ արդյունքները: Ի վերջո, նրանց դիտելու մեկ տարբերակն այն է, որ օգտագործելով մեծ տվյալների եւ մեքենայական ուսուցման միջոցով, Blumenstock- ը եւ գործընկերները կարողացան արտադրել գնահատումներ, որոնք արդեն իսկ առկա մեթոդներով կարող են ավելի վստահելի լինել: Բայց ես չեմ կարծում, որ այս ուսումնասիրության մասին մտածելու ճիշտ ձեւը երկու պատճառներով: Նախ, Blumenstock- ի եւ գործընկերների գնահատումները մոտ 10 անգամ ավելի արագ էին եւ 50 անգամ ավելի էժան (երբ ծախսերը չափվում են փոփոխական ծախսերի տեսքով): Ինչպես ես առաջարկել եմ այս գլխում, հետազոտողները անտեսում են իրենց վտանգը: Այս պարագայում, օրինակ, ծախսերի կտրուկ նվազումը նշանակում է, որ ոչ թե ամեն մի քանի տարիների ընթացքում, որքան Ժողովրդագրական եւ Առողջապահական հետազոտությունների համար ստանդարտը, այսպիսի հետազոտություն կարող է իրականացվել ամեն ամիս, որը կարող է ապահովել բազմաթիվ առավելություններ հետազոտողների եւ քաղաքականության համար արտադրողներ: Երկրորդ պատճառը թերահավատության տեսակետից չպետք է դիտարկվի, որ այս ուսումնասիրությունը ապահովում է հիմնական բաղադրատոմս, որը կարող է հարմարվել տարբեր հետազոտական իրավիճակների: Այս բաղադրատոմսը բաղկացած է ընդամենը երկու բաղադրիչներից եւ երկու քայլերից: Բաղադրիչները (1) մեծ տվյալների աղբյուրն է, որը լայն է, բայց բարակ է (այսինքն, այն ունի շատ մարդիկ, բայց ոչ այն տեղեկատվությունը, որը դուք պետք է յուրաքանչյուր մարդու համար) եւ (2) նեղ, բայց հաստ (այսինքն, մի քանի մարդ, բայց այն ունի տեղեկատվություն այն մասին, որ դուք պետք է այդ մարդկանց մասին): Այս բաղադրիչները համակցվում են երկու քայլերով: Նախ, երկու տվյալների աղբյուրների մարդկանց համար ստեղծել մեքենա ուսուցման մոդել, որն օգտագործում է տվյալների աղբյուրը, կանխատեսելու հետազոտության պատասխանները: Հաջորդը, օգտագործեք այդ մոդելը `խոշոր տվյալների աղբյուրի բոլորի հարցման պատասխանները խթանելու համար: Այսպիսով, եթե կա մի հարց, որը դուք ցանկանում եք հարցնել շատ մարդկանց, փնտրեք մեծ տվյալների աղբյուր, այն մարդկանցից, որոնք կարող են օգտագործվել կանխատեսելու իրենց պատասխանը, նույնիսկ եթե դուք հետաքրքրված չեք մեծ տվյալների աղբյուրից : Այսինքն, Blumenstock- ը եւ գործընկերները բնորոշ չեն վերաբերվում զանգի գրառումներին. նրանք միայն հոգ էին տանում զանգի մասին գրառումների մասին, քանի որ դրանք կարող էին օգտագործվել կանխատեսելու իրենց հետաքրքրող հարցման պատասխանները: Այս բնորոշ ուղղակի անուղղակի շահագրգռվածությունը մեծ տվյալների աղբյուրի վրա ստիպում է ուժեղացնել խնդրելով տարբերվող ներկառուցված հարցադրումը, որը ես ավելի վաղ նկարագրեցի:
Ի վերջո, Blumenstock- ը բարձրացրեց հարցման մոտեցումը զուգահեռ հետազոտության տվյալները մի մեծ տվյալների աղբյուրի հետ `ոսկու ստանդարտ հետազոտության համար համեմատելի գնահատականներ արտադրելու համար: Այս կոնկրետ օրինակը նաեւ հստակեցնում է որոշ զուգահեռներ ամբուլացված հարցման եւ ավանդական հետազոտության մեթոդների միջեւ: Խրախուսված հարցումների գնահատումը ավելի ժամանակին, էապես ավելի էժան եւ ավելի հատիկ: Սակայն, մյուս կողմից, չկա ուժեղ տեսական հիմք `այս հարցի բարձրացման համար: Այս մեկ օրինակը չի ցուցաբերում, երբ այդ մոտեցումը կգործի, եւ երբ դա չի լինի, եւ այս մոտեցումը օգտագործող հետազոտողները պետք է հատկապես մտահոգվեն, թե ով է ներգրավված, եւ ով ընդգրկված չէ, իրենց մեծ տվյալների աղբյուրում: Այնուհետեւ, ուժեղացված խնդրող մոտեցումը դեռեւս չունի լավ եղանակներ, որպեսզի գնահատի անորոշությունը իր գնահատականների շուրջ: Բարեբախտաբար, ուժեղացված հարցումները խորը կապեր են ունենում վիճակագրության երեք խոշոր տարածքների `փոքր տարածքների գնահատման (Rao and Molina 2015) , imputation (Rubin 2004) եւ մոդելային վրա հիմնված post-stratification (որը ինքնին սերտորեն կապված է պարոն Պ.- այն մեթոդը, որը նկարագրեցի ավելի վաղ գլուխը) (Little 1993) : Այդ խորը կապերի շնորհիվ, ես ակնկալում եմ, որ շուտով բարելավված հարցման բազում մեթոդաբանական հիմունքները կզարգանան:
Ի վերջո, Blumenstock- ի առաջին եւ երկրորդ փորձերը համեմատելով նաեւ կարեւոր դաս է թվային տարիքի սոցիալական հետազոտության մասին. Սկիզբը վերջը չէ: Այսինքն, բազմիցս առաջին մոտեցումը լավագույնը չի լինի, բայց եթե հետազոտողները շարունակում են աշխատել, ամեն ինչ կարող է ավելի լավ լինել: Ավելի ընդհանրապես, թվային տարիքում սոցիալական հետազոտությունների նոր մոտեցումների գնահատման ժամանակ կարեւոր է երկու տարբեր գնահատականներ տալ. 1) Ինչպես է դա լավ: եւ (2) Որքան լավ կլինի այս ապագայում, քանի որ տվյալների լանդշաֆտը փոխվում է, եւ հետազոտողները մեծ ուշադրություն են դարձնում խնդրին: Թեեւ հետազոտողները վերապատրաստվում են, որպեսզի գնահատման առաջին տեսակը լինի, երկրորդը հաճախ ավելի կարեւոր է: