Anplifye mande lè l sèvi avèk yon modèl prediksyon pou konbine done sondaj ki sòti nan kèk moun ki gen yon gwo done ki soti nan anpil moun.
Yon fason diferan nan konbine sondaj ak sous done gwo se yon pwosesis ke mwen pral rele anplifye mande . Nan anplifye mande, yon chèchè itilize yon modèl prediksyon pou konbine yon ti kantite done sondaj ak yon gwo sous done pou yo pwodwi estimasyon nan yon echèl oswa granularite ki pa ta posib ak swa done sous endividyèlman. Yon egzanp enpòtan nan anplifye mande soti nan travay la nan Jozèf Blumenstock, ki moun ki te vle kolekte done ki ta ka ede gide devlopman nan peyi pòv yo. Nan tan lontan an, chèchè yo kolekte sa a kalite done jeneralman te pran youn nan de apwòch: sondaj echantiyon oswa resansman. Egzanp sondaj, kote chèchè entèvyou yon ti kantite moun, ka fleksib, alè, ak relativman bon mache. Sepandan, sa yo sondaj, paske yo baze sou yon echantiyon, yo souvan limite nan rezolisyon yo. Avèk yon sondaj echantiyon, li souvan difisil pou fè estimasyon sou rejyon jeyografik espesifik oswa pou gwoup demografik espesifik. Censuses, nan lòt men an, eseye entèvyou ak tout moun, e konsa yo ka itilize yo pwodwi estime pou ti rejyon jeyografik oswa gwoup demografik. Men sinis yo jeneralman chè, etwat nan konsantrasyon (yo sèlman gen ladan yon ti kantite kesyon), epi yo pa alè (yo rive sou yon orè fiks, tankou chak 10 ane) (Kish 1979) . Olye ke yo te kole ak sondaj echantiyon oswa resansman, imajine si chèchè ka konbine karakteristik yo pi byen nan tou de. Imajine si chèchè yo ka mande chak kesyon bay chak moun chak jou. Li evidan, sa a omniprésente, toujou-sou sondaj se yon kalite syans sosyal fantasy. Men, li parèt ke nou ka kòmanse apwoksimatif sa a pa konbine kesyon sondaj soti nan yon ti kantite moun ki gen tras dijital soti nan anpil moun.
Rechèch Blumenstock a te kòmanse lè li te asosye ak pi gwo founisè telefòn mobil nan Rwanda, epi konpayi an te bay dosye anonim tranzaksyon ki soti nan anviwon 1.5 milyon kliyan ant 2005 ak 2009. Dosye sa yo genyen enfòmasyon sou chak apèl ak mesaj tèks, tankou kòmansman tan, dire , ak apwoksimatif jeyografik kote moun kap rele a ak reseptè. Anvan mwen pale sou pwoblèm yo estatistik, sa li vo montre ke premye etap sa a ka youn nan pi di a pou chèchè anpil. Kòm mwen dekri nan chapit 2, pi gwo sous done yo inaccessible pou chèchè yo. Telefòn Meta-done, an patikilye, se espesyalman aksesib paske li se fondamantalman enposib anonimize epi li sètènman gen enfòmasyon ke patisipan yo ta konsidere sansib (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Nan ka sa a an patikilye, chèchè yo te pran prekosyon pou pwoteje done yo ak travay yo te sipèvize pa yon twazyèm pati (sa vle di IRB yo). Mwen pral retounen nan pwoblèm sa yo etik nan plis detay nan chapit 6.
Blumenstock te enterese nan mezire richès ak byennèt. Men, karakteristik sa yo pa dirèkteman nan dosye yo rele. Nan lòt mo yo, dosye sa yo rele yo enkonplè pou rechèch sa a - yon karakteristik komen nan sous gwo done ki te diskite an detay nan chapit 2. Sepandan, li sanble gen anpil chans ke dosye yo rele pwobableman gen kèk enfòmasyon ki ta ka endirèkteman bay enfòmasyon sou richès ak byennèt. Etandone sa a posibilite, Blumenstock mande li si li te posib nan tren yon modèl aprantisaj machin yo predi kijan yon moun pral reponn a yon sondaj ki baze sou dosye rele yo. Si sa te posib, Lè sa a, Blumenstock te kapab itilize modèl sa a pou predi repons sondaj tout kliyan 1.5 milyon dola.
Yo nan lòd yo bati ak tren tankou yon modèl, Blumenstock ak asistan rechèch soti nan Kigali Enstiti pou Syans ak Teknoloji yo rele yon echantiyon o aza nan sou yon mil kliyan yo. Chèchè yo eksplike objektif pwojè a pou patisipan yo, mande konsantman yo pou yo konekte repons sondaj yo nan dosye yo rele yo, epi yo mande yo yon seri kesyon pou mezire richès yo ak byennèt, tankou "ou posede yon radyo? "ak" Èske ou posede yon bisiklèt? "(gade figi 3.14 pou yon lis pasyèl). Tout patisipan nan sondaj la te rekonpanse finansyèman.
Next, Blumenstock itilize yon pwosedi de etap komen nan aprantisaj machin: jeni karakteristik ki te swiv pa sipèvize aprantisaj. Premyèman, nan etap nan Jeni karakteristik , pou tout moun ki te fè antrevi, Blumenstock konvèti dosye yo rele nan yon seri karakteristik sou chak moun; Syans done ta ka rele karakteristik sa yo "karakteristik" ak syantis sosyal ta rele yo "varyab". Pou egzanp, pou chak moun, Blumenstock kalkile kantite total jou ak aktivite, ki kantite moun diferan yon moun te an kontak ak, kantite lajan ki pase sou D ', ak sou sa. Kritikman, jeni karakteristik bon mande pou konesans nan anviwònman rechèch la. Pa egzanp, si li enpòtan pou fè distenksyon ant domestik ak entènasyonal apèl (nou ta ka atann moun ki rele entènasyonalman pou yo rich), lè sa a, sa dwe fèt nan etap Jeni prezante a. Yon chèchè ak konpreyansyon ti kras nan Rwanda pa ta ka gen ladan karakteristik sa a, ak Lè sa a, pèfòmans nan prediksyon nan modèl la ta soufri.
Apre sa, nan etap aprantisaj sipèvize a, Blumenstock te konstwi yon modèl pou predi repons sondaj la pou chak moun ki baze sou karakteristik yo. Nan ka sa a, Blumenstock te itilize lojistik retou annaryè, men li te kapab itilize yon varyete de lòt apwòch estatistik oswa machin aprantisaj.
Se konsa, kouman li te travay? Èske Blumenstock te kapab prevwa repons pou kesyon sondaj tankou "Èske ou posede yon radyo?" Ak "Èske ou posede yon bisiklèt?" Lè ou itilize karakteristik ki sòti nan dosye rele? Pou evalye pèfòmans modèl prediksyon li a, Blumenstock itilize kwa validasyon , yon teknik ki souvan itilize nan syans done men raman nan syans sosyal. Objektif la nan kwa-validation se bay yon evalyasyon ki jis nan pèfòmans prediksyon yon modèl la pa fòmasyon li ak tès li sou diferan subsets nan done. An patikilye, Blumenstock fann done l 'nan 10 fragman nan 100 moun chak. Lè sa a, li itilize nèf nan fragman yo nan tren modèl l 'yo, epi li te pèfòmans nan prediksyon nan modèl la ki resevwa fòmasyon evalye sou moso ki rete a. Li repete pwosedi sa a 10 fwa-avèk chak moso nan done k ap resevwa yon sèl vire tankou validasyon an done-yo ak mwayenn rezilta yo.
Presizyon nan prediksyon yo te wo pou kèk karakteristik (figi 3.14); pou egzanp, Blumenstock te ka predi ak 97,6% presizyon si yon moun posede yon radyo. Sa a ta ka son enpresyonan, men li toujou enpòtan yo konpare yon metòd prediksyon konplèks kont yon altènatif senp. Nan ka sa a, yon altènatif senp se predi ke tout moun ap bay repons ki pi komen. Pou egzanp, 97,3% nan repond rapòte posede yon radyo Se konsa, si Blumenstock te prevwa ke tout moun ta rapò jan mèt yon radyo li ta te gen yon presizyon nan 97.3%, ki se etonan menm jan ak pèfòmans nan pwosedi plis konplèks li (97.6% presizyon) . Nan lòt mo, tout done anpenpan ak modèl ogmante presizyon nan prediksyon ki soti nan 97.3% a 97.6%. Sepandan, pou lòt kesyon, tankou "Èske ou posede yon bisiklèt?", Prediksyon yo amelyore soti nan 54.4% a 67.6%. Plis jeneralman, figi 3.15 montre ke pou kèk karakteristik Blumenstock pa t 'amelyore pi lwen pase jis fè prediksyon a debaz senp, men sa pou lòt karakteristik te gen kèk amelyorasyon. Gade jis nan rezilta sa yo, sepandan, ou pa ka panse ke apwòch sa a se patikilyèman pwomèt.
Sepandan, jis yon ane pita, Blumenstock ak de kòlèg-Gabriel Cadamuro ak Robert On-pibliye yon papye nan Syans ak anpil rezilta pi bon (Blumenstock, Cadamuro, and On 2015) . Te gen de prensipal rezon teknik pou amelyorasyon sa a: (1) yo te itilize metòd plis sofistike (sètadi, yon nouvo apwòch pou jeni karakteristik ak yon modèl ki pi sofistike pou prevwa repons nan karakteristik yo) ak (2) olye ke eseye degaje repons a moun Kesyon sondaj (paegzanp, "ou posede yon radyo?"), yo te eseye enferre yon endèks richès konpoze. Amelyorasyon teknik sa yo te vle di ke yo ta ka fè yon travay rezonab pou yo itilize dosye rele pou predi richès pou moun ki nan echantiyon yo.
Predi ke richès moun nan echantiyon an, sepandan, pa t 'objektif la ultim nan rechèch la. Sonje ke objektif la ultim te konbine kèk nan karakteristik yo pi byen nan sondaj echantiyon ak resansman yo pwodwi egzat, wo-rezolisyon estimasyon de povrete nan peyi devlope yo. Pou evalye kapasite yo nan reyalize objektif sa a, Blumenstock ak kòlèg yo te itilize modèl yo ak done yo pou predi richès tout 1.5 milyon moun nan dosye yo rele. Apre sa, yo itilize enfòmasyon ki jeospasyo anrejistre nan dosye yo rele (sonje ke done yo enkli kote ki pi pre selil gwo kay won an pou chak apèl) pou estime kote apwoksimatif rezidans chak moun (figi 3.17). Mete de estimasyon sa yo ansanm, Blumenstock ak kòlèg li yo pwodui yon estimasyon de jeyografik distribisyon richès abònen nan granularite ekstrèmman amann espasyal. Pou egzanp, yo te ka estime richès an mwayèn nan chak selil 2,148 Rwanda a (pi piti inite administratif nan peyi a).
Kouman byen te fè sa yo estime matche ak jiska nivo aktyèl la nan povrete nan rejyon sa yo? Anvan mwen reponn kesyon sa a, mwen vle mete aksan sou lefèt ke gen yon anpil nan rezon yo dwe ensèten. Pou egzanp, kapasite nan fè prediksyon nan nivo endividyèl la te trè fè bwi (figi 3.17). Epi, petèt pi enpòtan, moun ki gen telefòn mobil yo ka sistematik diferan de moun ki san telefòn mobil yo. Se konsa, Blumenstock ak kòlèg li ta ka soufri de kalite erè kouvèti asirans yo ki te deziye 1936 literè dijere sondaj la ke mwen dekri pi bonè.
Pou jwenn yon sans de bon jan kalite a nan estimasyon yo, Blumenstock ak kòlèg bezwen konpare yo ak yon lòt bagay. Erezman, alantou menm tan an kòm etid yo, yon lòt gwoup chèchè te kouri yon sondaj plis tradisyonèl sosyal nan Rwanda. Sa a lòt sondaj-ki te yon pati nan pwogram lan Sondaj sou demografik ak swen sante lajman respekte-te gen yon gwo bidjè ak itilize-wo kalite, tradisyonèl metòd. Se poutèt sa, estimasyon yo soti nan sondaj la demografik ak Sante kapab rezonab konsidere kòm estime lò-estanda. Lè de estimasyon yo te konpare, yo te byen menm jan an (figi 3.17). Nan lòt mo, pa konbine yon ti kantite done sondaj ak dosye yo rele, Blumenstock ak kòlèg li yo te kapab pwodwi estimasyon konparab ak sa yo soti nan apwòch lò-estanda.
Yon septik ka wè rezilta sa yo kòm yon desepsyon. Apre yo tout, yon fason pou gade yo se yo di ke lè l sèvi avèk done gwo ak aprantisaj machin, Blumenstock ak kòlèg li yo te kapab pwodwi estimasyon ki ta ka fè plis fiable pa metòd ki egziste deja. Men, mwen pa panse ke se yon bon fason yo reflechi sou etid sa a pou de rezon. Premyèman, estimasyon yo soti nan Blumenstock ak kòlèg li yo te apeprè 10 fwa pi vit ak 50 fwa pi bon mache (lè pri yo mezire an tèm de depans varyab). Kòm mwen te diskite pi bonè nan chapit sa a, chèchè inyore pri nan danje yo. Nan ka sa a, pou egzanp, diminisyon nan dramatik nan pri vle di ke olye ke yo te kouri chak kèk ane-kòm se estanda pou Sondaj demografik ak Sante - sa a kalite sondaj ka kouri chak mwa, ki ta bay anpil avantaj pou chèchè yo ak politik mizisyen yo. Rezon ki fè dezyèm pa pran opinyon skeptik la se ke etid sa a bay yon resèt debaz ki ka pwepare nan anpil sitiyasyon rechèch diferan. Sa a resèt gen sèlman de engredyan ak de etap. Engredyan yo se (1) yon gwo done ki laj, men mens (sa vle di, li gen anpil moun, men se pa enfòmasyon ou bezwen sou chak moun) epi (2) yon sondaj ki etwat men epè (sa vle di li sèlman kèk moun, men li gen enfòmasyon ou bezwen sou moun sa yo). Sa yo engredyan yo Lè sa a, konbine nan de etap. Premyèman, pou moun ki nan tou de sous done, bati yon modèl aprantisaj machin ki sèvi ak sous la done gwo predi sondaj repons yo. Apre sa, sèvi ak modèl sa a pou reponn repons sondaj tout moun nan sous gwo done yo. Se konsa, si gen kèk kesyon ke ou vle mande anpil moun, gade pou yon sous done gwo soti nan moun sa yo ki ka itilize yo prevwa repons yo, menm si ou pa pran swen sou gwo done a sous . Sa se, Blumenstock ak kòlèg li pa t 'okipe swen sou dosye rele; yo te sèlman pran swen sou dosye rele paske yo te ka itilize yo predi sondaj repons yo ke yo pran swen sou. Sa a enterè karakteristik-sèlman endirèk nan done yo gwo done-fè anplifye mande diferan de mande mande, ki mwen dekri pi bonè.
An konklizyon, anplifikant demann fraz an Florentstock konbine done sondaj ak yon gwo sous done pou pwodwi estimasyon konparab ak sa ki soti nan yon sondaj lò-estanda. Egzanp patikilye sa a tou klarifye kèk nan komès-konpwomi ant anplifye demann ak metòd sondaj tradisyonèl yo. Estimasyon yo mande anplifye yo te pi alè, anpil pi bon mache, ak plis granulaire. Men, nan lòt men an, pa gen ankò yon baz fò teyorik pou sa a kalite anplifye mande. Egzanp sa a pa montre lè apwòch sa a ap travay ak lè li pa pral, ak chèchè ki itilize apwòch sa a bezwen espesyalman konsène sou posib prejije ki te koze pa ki moun ki enkli-yo ak ki pa enkli-nan sous gwo done yo. Pli lwen, apwòch la mande anplifye pa poko gen bon fason yo quantifier ensèten alantou estime li yo. Erezman, anplifye mande gen koneksyon gwo twou san fon nan twa gwo zòn nan estatistik-ti-zòn estimasyon (Rao and Molina 2015) , enputasyon (Rubin 2004) , ak modèl ki baze sou post-stratifikasyon (ki tèt li se pre relasyon ak Mesye P., metòd mwen te dekri pi bonè nan chapit la) (Little 1993) . Paske nan koneksyon sa yo gwo twou san fon, mwen espere ke anpil nan fondasyon yo metodolojik nan anplifye mande byento pral amelyore.
Finalman, konpare premye ak dezyèm tantativ Blumenstock a montre tou yon leson enpòtan sou dijital ki gen laj rechèch sosyal: kòmansman an se pa fen an. Sa se, anpil fwa, apwòch nan premye pa pral pi bon an, men si chèchè kontinye ap travay, bagay yo ka jwenn pi bon. Plis jeneralman, lè evalye nouvo apwòch rechèch sosyal nan laj dijital la, li enpòtan pou fè de evalyasyon distenk: (1) kòman travay sa a kounye a? ak (2) Konnen byen travay sa a nan lavni an kòm chanjman nan jaden flè done epi kòm chèchè konsakre plis atansyon a pwoblèm nan? Malgre ke chèchè yo resevwa fòmasyon pou fè premye kalite evalyasyon, dezyèm lan souvan pi enpòtan.