Ki lye ak sondaj ou a tras dijital kapab tankou mande tout moun kesyon ou nan tout fwa.
Poze jeneralman vini nan de kategori prensipal: echantiyon sondaj ak resansman. sondaj Egzanp, kote ou gen aksè a yon ti kantite moun ki, yo ka fleksib, alè, ak relativman bon mache. Sepandan, sondaj echantiyon, yo paske yo te baze sou yon echantiyon, yo souvan limite nan rezolisyon yo; ak yon sondaj echantiyon, li se souvan di fè estimasyon sou rejyon jeyografik espesifik oswa pou gwoup demografik espesifik. Resansman, sou lòt la, eseye fè entèvyou avèk tout moun nan popilasyon an. Yo gen gwo rezolisyon an, men yo yo jeneralman chè, etwat nan konsantre (yo sèlman gen ladan yon ti kantite kesyon), epi yo pa alè (yo rive sou yon orè fiks, tankou chak 10 zan) (Kish 1979) . Koulye a, imajine si chèchè te kapab konbine Karakteristik yo pi byen nan sondaj echantiyon ak resansman; imajine si chèchè ka mande tout kesyon nan tout moun chak jou.
Li evidan, kontinyèl sa a, omniprésente, toujou-sou sondaj se yon kalite fantasy syans sosyal. Men, li parèt ke nou kapab kòmanse apwoksimatif sa a pa mete ansanm kesyon sondaj ki sòti nan yon ti kantite moun ki gen tras dijital soti nan anpil moun. Mwen rele sa a ki kalite konbinezon anplifye mande la a. Si fè byen, li te kapab ede nou bay estimasyon ki gen plis lokal yo (pou pi piti zòn jeyografik), plis granulaire (pou gwoup demografik espesifik yo), ak plis ankò alè.
Yon egzanp nan anplifye mande soti nan travay la nan Jozye Blumenstock, ki te vle kolekte done ki ta ka ede devlopman gid nan peyi pòv yo. Plis espesyalman, Blumenstock te vle kreye yon sistèm ki mezire richès ak byennèt ki konbine konplè a nan yon resansman ak fleksibilite a ak frekans nan yon sondaj (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . An reyalite, Mwen te deja dekri travay Blumenstock nan yon ti tan sa nan chapit 1.
Pou yo kòmanse, Blumenstock tèt-ansanm ak pi gwo founisè a telefòn mobil nan Rwanda. Konpayi a bay l 'anonim dosye tranzaksyon soti nan sou 1.5 milyon dola kliyan ki kouvri konpòtman soti nan 2005 ak 2009. Mòso bwa yo gen enfòmasyon sou chak apèl ak tèks mesaj tankou lè sa a, dire, ak apwoksimatif kote jeyografik nan moun kap rele a ak reseptè. Anvan nou kòmanse pale sou pwoblèm yo ki estatistik, sa li vo montre yo ke premye etap sa a pouvwa ap youn nan pi di a. Jan sa dekri nan Chapit 2, ki pi dijital done tras se aksesib nan chèchè. Epi, anpil konpayi yo ki titre ezite pataje done yo paske li se prive; ki se kliyan yo pwobableman pa t 'atann ke yo pral pataje-an dosye yo esansyèl-ak chèchè. Nan ka sa a, chèchè yo te te pran mezi atansyon anonymize done yo e li te travay yo sipèvize pa yon twazyèm-pati (sètadi, IRB yo). Men, malgre efò sa yo, done sa yo yo se pwobableman toujou idantifye epi yo gen anpil chans gen enfòmasyon sansib (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Mwen pral retounen nan sa yo kesyon etik nan chapit 6.
Sonje byen, Blumenstock te enterese nan mezire richès ak byennèt. Men, sa yo karakteristik yo pa dirèkteman nan dosye yo apèl. Nan lòt mo, dosye apèl sa yo, se enkonplè pou rechèch sa a, yon karakteristik komen nan tras dijital ki te diskite an detay nan Chapit 2. Men, li pi sanble ke dosye yo rele pwobableman gen kèk enfòmasyon sou richès ak byennèt. Se konsa, yon fason pou mande kesyon Blumenstock a ta ka: se li posib nou ka prevwa ki jan yon moun pral reponn a yon sondaj ki baze sou done dijital tras yo? Si se konsa, Lè sa a, pa mande yon kèk moun nou ka devine repons yo nan tout lòt moun.
Pou evalye sa a pwouve, Blumenstock ak rechèch asistan soti nan Kigali Enstiti pou Syans ak Teknoloji rele yon echantiyon nan sou yon mil kliyan telefòn mobil. Chèchè yo te eksplike objektif yo nan pwojè a bay patisipan yo, te mande pou konsantman yo fè rapò ant repons yo sondaj nan dosye yo rele, ak Lè sa mande yo yon seri de kesyon ki mezire richès yo ak byennèt, tankou "ou posede yon radyo? "ak" Èske ou posede yon bisiklèt? "(al gade Figi 3.11 pou yon lis pasyèl). Tout patisipan nan sondaj la te rekonpanse finansyèman.
Apre sa, Blumenstock itilize yon pwosedi de etap komen nan syans done: jeni karakteristik ki te swiv pa aprann sipèvize. Premyèman, nan etap la jeni karakteristik, pou tout moun ki te fè antrevi, Blumenstock konvèti dosye yo rele nan yon seri nan karakteristik sou chak moun; syantis done ta ka rele karakteristik sa yo "karakteristik" ak syantis sosyal tapral ba yo "varyab." Pou egzanp, pou chak moun, Blumenstock kalkile kantite total nan jou ak aktivite, ki kantite moun ki distenk yon moun te an kontak ak, kantite lajan an nan lajan te pase sou D ', ak sou sa. Kritik, bon jeni karakteristik mande pou konesans nan anviwònman an rechèch. Pou egzanp, si li enpòtan nan distenge apèl domestik ak entènasyonal (nou ta ka atann moun ki rele entènasyonalman yo dwe rich), Lè sa a, sa a yo dwe fè nan etap la jeni karakteristik. Yon chèchè ak ti konpreyansyon yo genyen sou Rwanda pa ka gen ladan yo karakteristik sa a, ak Lè sa a pèfòmans nan prediksyon nan modèl la yo ap soufri.
Apre sa, nan etap aprantisaj la sipèvize, Blumenstock bati yon modèl estatistik nou ka prevwa repons lan sondaj pou chak moun ki baze sou karakteristik yo. Nan ka sa a, Blumenstock itilize lojistik retou annaryè ak 10-pliye kwa-validation, men li te kapab te itilize yon varyete de lòt apwòch estatistik oswa machin aprann.
Se konsa, kouman byen li t 'travay? Blumenstock te kapab predi repons a sondaj kesyon tankou "ou posede yon radyo?" Ak "ou posede yon bisiklèt?" Lè l sèvi avèk karakteristik sòti nan dosye apèl? Triye nan. Presizyon nan prediksyon yo yo te wo pou kèk karakteristik (Figi 3.11). Men, li se toujou enpòtan yo konpare yon metòd prediksyon konplèks kont yon altènatif senp. Nan ka sa a, yon altènatif senp se nou ka prevwa ke tout moun ap bay repons ki pi komen. Pou egzanp, 97.3% te rapòte jan mèt yon radyo Se konsa, si Blumenstock te prevwa ke tout moun ta rapòte jan mèt yon radyo li ta ka gen yon presizyon nan 97.3%, ki se etonan menm jan ak pèfòmans nan nan pwosedi pi konplèks li (97.6% presizyon). Nan lòt mo, tout done yo anpenpan ak modèl ogmante presizyon nan prediksyon a soti nan 97.3% nan 97.6%. Sepandan, pou lòt kesyon, tankou "Èske ou posede yon bisiklèt?", Prediksyon yo amelyore soti nan 54.4% nan 67.6%. Plis jeneralman, Figi 3.12 montre pou kèk karakteristik Blumenstock pa t 'amelyore anpil pi lwen pase jis fè senp prediksyon a debaz, men sa pou lòt karakteristik te gen kèk amelyorasyon.
Nan pwen sa a ou ka panse ke rezilta sa yo se yon ti jan enèvan, men jis yon ane pita, Blumenstock ak de kòlèg-Gabriel Cadamuro ak Robert On-pibliye yon papye nan Syans ak anpil pi bon rezilta (Blumenstock, Cadamuro, and On 2015) . Vwala te gen de prensipal rezon teknik pou amelyorasyon an: 1) yo te konn itilize metòd pi plis sofistike (sètadi, yon apwòch nouvo nan prezante jeni ak yon modèl pi plis sofistike aprantisaj machin) ak 2) olye ke eseye dégager repons a kesyon sondaj endividyèl (egzanp, "ou posede yon radyo?"), yo te vle dégager yon endèks richès konpoze.
Blumenstock ak kòlèg demontre pèfòmans nan apwòch yo nan de fason. Premye yo, yo te jwenn ke pou pèp la nan echantiyon yo, yo ta ka fè yon trè bon travay nan predi ke richès yo nan dosye rele (Figi 3.14). Dezyèmman, tout tan pi enpòtan, Blumenstock ak kòlèg te montre ke pwosedi yo ta kapab pwodwi-wo kalite estimasyon de distribisyon an jeyografik nan richès nan Rwanda. Plis espesyalman, yo te konn itilize modèl aprantisaj machin yo, ki te resevwa fòmasyon sou echantiyon yo nan sou 1,000 moun, nou ka prevwa richès a nan tout 1.5 milyon moun nan dosye yo apèl. Pli lwen, ak done yo jeospasyo entegre nan done yo rele (sonje ke done yo rele an gen ladan kote adrès la nan gwo kay won an selil pi pre pou chak apèl), chèchè yo te yo te kapab estime plas ki genyen nan rezidans nan chak moun. Mete estimasyon sa yo de ansanm, rechèch yo ki te pwodwi yon estimasyon de distribisyon an jeyografik nan richès abònen a trè amann granularite espasyal. Pou egzanp, yo te kapab estime richès an mwayèn nan chak nan 2148 selil Rwanda a (pi piti inite a administratif nan peyi a). Valè sa yo richès prevwa te tèlman granulaire yo te difisil yo tcheke. Se konsa, chèchè yo agrégées rezilta yo yo pwodwi estimasyon de richès an mwayèn nan 30 distri Rwanda a. Sa yo estime onivo distri a te fòtman ki gen rapò ak estimasyon yo ki sòti nan yon lò estanda sondaj tradisyonèl yo, Ouwanda demografik ak Sante Sondaj sou (Figi 3.14). Malgre ke estimasyon yo nan de sous yo te ki similè yo, estimasyon yo soti nan Blumenstock ak kòlèg te apeprè 50 fwa pi bon mache ak 10 fwa pi vit (lè pri nan mezire an tèm de depans varyab). Sa a diminye dramatik nan pri vle di ke olye pou yo kouri chak kèk ane-kòm se estanda pou demografik ak Sante Sondaj-te kapab ibrid nan ti sondaj konbine avèk gwo done tras dijital dwe kouri chak mwa.
An konklizyon, Blumenstock a anplifye mande apwòch konbine done sondaj ak done tras dijital yo pwodwi estimasyon konparab ak estimasyon sondaj lò-estanda. Sa a egzanp patikilye tou klarifye kèk nan komès konpwomi yo-ant anplifye mande ak metòd sondaj tradisyonèl yo. Premyèman, anplifye estimasyon yo mande yo te plis alè, anpil pi bon mache, ak plis ankò granulaire. Men, sou lòt men an, nan moman sa a, pa gen yon baz fò teyorik pou sa a kalite anplifye mande. Sa se, sa a egzanp yon sèl pa montre lè li pral travay ak lè li pa pral. Pli lwen, apwòch la mande anplifye poko gen bon fason yo quantifier ensèten alantou estimasyon li yo. Sepandan, anplifye mande gen koneksyon gwo twou san fon nan twa gwo zòn nan estatistik-modèl ki baze sou pòs-stratifikasyon (Little 1993) , akizasyon (Rubin 2004) , ak estimasyon ti-zòn (Rao and Molina 2015) -yo ak Se konsa, mwen espere ke pwogrè pral gen rapid.
Anplifye mande swiv yon resèt debaz ki ka pwepare a sitiyasyon an patikilye ou yo. Gen de engredyan ak de etap. de engredyan yo se 1) yon dataze tras dijital ki se gran men mens (Sa vle di, li gen anpil moun men se pa enfòmasyon ki ke ou bezwen sou chak moun) epi 2) yon sondaj ki se etwat men epè (Sa vle di, li gen se sèlman kèk moun, men li gen enfòmasyon nan ke ou bezwen sou moun sa yo). Lè sa a, ki te gen de etap. Premyèman, pou pèp la nan tou de sous done, bati yon modèl aprantisaj machin ki itilize done tras dijital nou ka prevwa repons sondaj la. Apre sa, sèvi ak sa modèl aprantisaj machin yo bezwen akize repons yo sondaj sou tout moun nan done yo tras dijital. Konsa, si gen kèk kesyon ke ou vle ap mande pou yo anpil moun, gade pou done tras dijital soti nan moun sa yo ki ta ka dwe itilize nou ka prevwa repons yo.
Konparezon premye ak dezyèm tantativ Blumenstock a nan pwoblèm nan tou montre yon leson enpòtan sou tranzisyon an soti nan dezyèm epòk bay twazyèm apwòch epòk fè yon sondaj sou rechèch: nan konmansman an se pa fen an. Sa se, anpil fwa, apwòch la premye pa yo pral pi bon an, men si chèchè kontinye k ap travay, bagay sa yo ka jwenn pi bon. Plis jeneralman, lè evalye nouvo apwòch nan rechèch sosyal nan laj dijital la, li enpòtan fè de evalyasyon distenk: 1) ki jan byen fè travay sa a kounye a epi 2) ki jan byen ou panse ke sa a ta ka travay nan tan kap vini an kòm jaden flè nan done chanjman ak kòm chèchè konsakre pi plis atansyon sou pwoblèm nan. Malgre ke, chèchè yo resevwa fòmasyon fè kalite an premye nan evalyasyon (ki jan bon se sa a moso patikilye nan rechèch), dezyèm lan se souvan pi enpòtan.