Amplifita petante uzi modelon predictivo por kombini datumojn de enketo de malmultaj personoj kun granda fonto de datumoj de multaj personoj.
Alia maniero por kombini enketon kaj grandajn datumojn estas procezo, kiun mi vokos plifortigis demandante . En ampleksa peto, esploristo uzas antaŭdiskvan modelon por kombini malgrandan kvanton da enketa datumo kun granda fonto de datumoj por produkti taksojn je skalo aŭ granduleco, kiu ne eblus kun la datuma fonto individue. Grava ekzemplo de plifortigado petas de la laboro de Joshua Blumenstock, kiu volis kolekti datumojn, kiuj povus helpi gvidi evoluon en malriĉaj landoj. En la pasinteco, esploristoj kolektantaj ĉi tiun tipon de datumoj ĝenerale devis preni unu el du aliroj: specimeno enketoj aŭ censoj. Specimaj enketoj, kie esploristoj intervjuis malgrandan nombron da homoj, povas esti flekseblaj, ĝustatempe kaj relative malkaraj. Tamen, ĉi tiuj enketoj, ĉar ili estas bazitaj sur specimeno, ofte estas limigitaj en sia rezolucio. Kun specimena enketo, ofte estas malfacile fari taksojn pri specifaj geografiaj regionoj aŭ por specifaj demografiaj grupoj. Censoj, aliflanke, provas intervjui ĉion, do ili povas esti uzataj por produkti taksojn por malgrandaj geografiaj regionoj aŭ demografiaj grupoj. Sed la censoj ĝenerale estas multekostaj, mallarĝaj en fokuso (ili nur inkludas malgrandajn demandojn), kaj ne ĝustatempe (ili okazas en fiksa horaro, kiel ĉiu 10 jaroj) (Kish 1979) . Prefere ol esti ligita kun specimaj enketoj aŭ censoj, imagu, ĉu esploristoj povus kombini la plej bonajn karakterizaĵojn de ambaŭ. Imagu, ĉu esploristoj povus demandi ĉiun demandon ĉiun tagon al ĉiu persono. Evidente, ĉi tiu ĉiutaga, ĉiam-enketo estas speco de socia scienca fantazio. Sed ŝajnas, ke ni povas komenci proksimigi ĉi tion per kombinado de enketaj demandoj de malgranda nombro da homoj kun ciferecaj spuroj de multaj homoj.
La esploro de Blumenstock komencis kiam li kunlaboris kun la plej granda poŝtelefono en Rwanda, kaj la kompanio provizis anonimajn transaktajn rekordojn de proksimume 1,5 milionoj da klientoj inter 2005 kaj 2009. Ĉi tiuj registroj enhavis informojn pri ĉiu alvoko kaj tekstmesaĝo, kiel la komenco de tempo, daŭro , kaj proksimuma geografia loko de la alvokanto kaj ricevilo. Antaŭ ol mi parolas pri la statistikaj aferoj, ĝi valoras indiki, ke ĉi tiu unua paŝo eble estos unu el la plej malfacilaj por multaj esploristoj. Kiel mi priskribis en ĉapitro 2, plej grandaj datumoj estas nealireblaj por esploristoj. Telefona datumado, precipe, estas precipe nealirebla ĉar ĝi estas esence neebla anonimigi kaj ĝi preskaŭ certe enhavas informojn, kiujn partoprenantoj konsiderus sentemaj (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . En ĉi tiu aparta kazo, la esploristoj zorge protektis la datumojn kaj ilia laboro estis supervisata fare de tria (tio estas, ilia IRB). Mi revenos al ĉi tiuj etikaj aferoj pli detale en la ĉapitro 6.
Blumenstock interesis mezuri riĉecon kaj bonstaton. Sed ĉi tiuj trajtoj ne estas rekte en la alvokoj. Alivorte, ĉi tiuj alvokoj estas nekompletaj por ĉi tiu esplorado - komuna trajto de grandaj datumaj fontoj, kiuj estis diskutitaj en detalo en ĉapitro 2. Tamen, ŝajnas verŝajna, ke la alvokoj registras verŝajne havi informojn, kiuj povus nerekte informi pri riĉeco kaj bonstato. Konsiderante ĉi tiun eblecon, Blumenstock demandis ĉu eblas trejni maŝin-lernadon por antaŭdiri kiel iu respondos al enketo bazita sur iliaj alvokoj. Se tio estus ebla, tiam Blumenstock povus uzi ĉi tiun modelon por antaŭdiri la enketajn respondojn de ĉiuj 1.5 milionoj da klientoj.
Por konstrui kaj trejni tian modelon, Blumenstock kaj esploraj helpantoj de Kigali Institute of Science and Technology (nomita Kigali Institute of Science and Technology) nomis hazarda specimeno de ĉirkaŭ mil klientoj. La esploristoj klarigis la celojn de la projekto al la partoprenantoj, petis sian konsenton ligi la enketajn respondojn al la alvokoj, kaj tiam demandis al ili serion da demandoj por mezuri sian riĉecon kaj bonstaton, kiel "Ĉu vi posedas radio? "kaj" Ĉu vi posedas biciklon? "(vidu figuron 3.14 por parta listo). Ĉiuj partoprenantoj en la enketo estis kompensitaj finance.
Tuj poste, Blumenstock uzis du-paŝan proceduron komuna en maŝina lernado: trajna inĝenierado sekvata de supervisita lernado. Unue, en la trajna inĝenierado , por ĉiuj, intervjuitaj, Blumenstock transformis la alvokajn rekordojn en aro de karakterizaĵoj pri ĉiu persono; sciencistoj de datumoj povus nomi ĉi tiujn "karakterizajn" karakterizaĵojn kaj sociajn sciencojn nomus ilin "variabloj". Ekzemple, por ĉiu persono, Blumenstock kalkulis la tutan numeron de tagoj kun aktiveco, la nombro de malsamaj personoj, kiujn persono kontaktis, la kvanto da mono elspezita dum veturo, kaj tiel plu. Kritike, bona trajta inĝenierado postulas scion pri la esplorado. Ekzemple, se gravas distingi inter internaj kaj internaciaj alvokoj (ni povus atendi homojn, kiuj nomas internacie pli riĉe), tiam tio devas esti farita ĉe la trajna inĝenierado. Esploristo kun malmulte da kompreno pri Ruando eble ne inkluzivus ĉi tiun funkcion, kaj tiam la prognoza elfaro de la modelo suferus.
Tuj poste, en la kontrolita paŝo de lernado , Blumenstock konstruis modelon por antaŭdiri la enketan respondon por ĉiu persono bazita sur iliaj trajtoj. En ĉi tiu kazo, Blumenstock uzis loĝistikan regreson, sed li povus uzi diversajn aliajn statistikajn aŭ maŝinajn alirojn.
Do kiel bone funkciis? Ĉu Blumenstock povis antaŭdiri respondojn al enketaj demandoj kiel "Ĉu vi posedas radion?" Kaj "Ĉu vi posedas biciklon?" Uzante trajtojn derivitaj de alvokoj. Por taksi la agadon de lia prognozema modelo, Blumenstock uzis krucvalidigon , teknikon ofte uzatan en datuma scienco, sed malofte en socia scienco. La celo de krucvalidigo estas provizi justan takson de la prognoza prognoza modelo per trejnado kaj provado de diversaj subaroj de datumoj. En aparta, Blumenstock dividis sian datumon en 10 punktojn de 100 homoj ĉiu. Poste, li uzis naŭ el la punktoj por trejni sian modelon, kaj la prognoza elfaro de la trejnita modelo estis taksita pri la cetera pikilo. Li ripetis ĉi tiun proceduron 10 fojojn -kun ĉiu fazo da datumoj akiri unu turnon kiel la validiga datumo-kaj averaĝis la rezultojn.
La precizeco de la antaŭdiroj estis alta por iuj trajtoj (figuro 3.14); ekzemple, Blumenstock povus antaŭdiri kun 97.6% precizeco se iu posedis radion. Ĉi tio eble ŝajnas impresa, sed ĉiam gravas kompari kompleksan antaŭdirmanieron kontraŭ simpla alternativo. En ĉi tiu kazo, simpla alternativo estas antaŭdiri ke ĉiuj donos la plej oftan respondon. Ekzemple, 97.3% de la enketintoj raportis posedantan radioon, do se Blumenstock antaŭdiris, ke ĉiuj informos, ke ili posedas radioon, li havis precizecon de 97.3%, kio estas surprize simila al la agado de lia pli kompleksa proceduro (97.6% precizeco) . Alivorte, ĉiuj fantalaj datumoj kaj modelado pliigis la precizecon de la antaŭdiro de 97.3% ĝis 97.6%. Tamen, por aliaj demandoj, kiel "Ĉu vi posedas biciklon?", La antaŭdiroj pliboniĝis de 54.4% ĝis 67.6%. Pli ĝenerale, figuro 3.15 montras, ke por iuj trajtoj, Blumenstock ne pliboniĝis multe pli ol simple farante la simplan bazan antaŭdiron, sed ke por aliaj trajtoj ekzistis iom da plibonigo. Rigardante nur tiujn rezultojn, tamen vi eble ne pensas, ke ĉi tiu aliro estas precipe promesplena.
Tamen, nur unu jaron poste, Blumenstock kaj du kolegoj - Gabriel Cadamuro kaj Roberto - eldonis paperon en Scienco kun multe pli bonaj rezultoj (Blumenstock, Cadamuro, and On 2015) . Ekzistis du ĉefaj teknikaj kialoj por ĉi tiu pliboniĝo: (1) ili uzis pli kompleksajn metodojn (tio estas, nova aliro al karakterizaĵo de inĝenierado kaj pli kompleksa modelo por antaŭdiri respondojn de trajtoj) kaj (2) anstataŭ provi malsukcesi respondojn al individuo Enketaj demandoj (Ekz., "Ĉu vi posedas radioon?"), Ili provis inferi kompensan riĉan indekson. Ĉi tiuj teknikaj plibonigoj signifis, ke ili povus fari bonan laboron uzi reklamajn reklamojn por antaŭdiri riĉecon por la homoj en sia specimeno.
Antaŭdiri la riĉecon de homoj en la specimeno, tamen, ne estis la finfina celo de la esplorado. Memoru, ke la fina celo estis kombini iujn el la plej bonaj trajtoj de specimaj enketoj kaj censoj por produkti precizajn, altajn distingajn korinklinojn pri malriĉeco en evolulandoj. Por taksi sian kapablon atingi ĉi tiun celon, Blumenstock kaj kolegoj uzis sian modelon kaj iliajn datumojn por antaŭdiri la riĉecon de ĉiuj 1.5 milionoj da homoj en la alvokoj. Kaj ili uzis la geospatian informon enkorpigita en la alvokoj (memoru, ke la datumoj inkluzivis la lokon de la plej proksima ĉela turo por ĉiu alvoko) por taksi la proksimuman loĝejon de ĉiu persono (figuro 3.17). Metante ĉi tiujn du taksojn kune, Blumenstock kaj kolegoj produktis takson de la geografia distribuo de abonanto-riĉeco ĉe ekstreme bona spaca granduleco. Ekzemple, ili povus taksi la averaĝan riĉecon en ĉiu el la 2,148 ĉeloj de Ruando (la plej malgranda administra unuo en la lando).
Kiel bone ĉi tiuj taksoj kongruas al la reala nivelo de malriĉeco en ĉi tiuj regionoj? Antaŭ ol mi respondas tiun demandon, mi volas elstari la fakton, ke ekzistas multaj kialoj por esti skeptikaj. Ekzemple, la kapablo fari antaŭdirojn ĉe individua nivelo estis sufiĉe ruza (figuro 3.17). Kaj, eble pli grave, homoj kun poŝtelefonoj povus esti sisteme malsamaj al homoj sen poŝtelefonoj. Tiel, Blumenstock kaj kolegoj povus suferi el la tipoj de kovraraj eraroj, kiuj preterpasis la 1936 Literaturajn Digest- enketon, kiun mi priskribis antaŭe.
Por akiri senton pri la kvalito de iliaj taksoj, Blumenstock kaj kolegoj bezonis kompari ilin per io alia. Feliĉe, samtempe ol ilia studado, alia grupo de esploristoj kuris pli tradician socian enketon en Ruando. Ĉi tiu alia enketo, kiu estis parto de la vaste respektita Demografia kaj Sana Enketo-programo havis grandan buĝeton kaj uzis altkvalitajn tradiciajn metodojn. Sekve, la taksoj de la Demografia kaj Sana Enketo povus konsiderinde konsideri orajn normajn taksojn. Kiam la du taksoj estis komparitaj, ili estis sufiĉe similaj (figuro 3.17). Alivorte, kombinante malgrandan kvanton da enketo-datumoj kun la alvokoj, Blumenstock kaj kolegoj povis produkti korinklinojn kompareblaj al tiuj de orkestraj aliroj.
Skeptika povus vidi ĉi tiujn rezultojn kiel seniluziiĝon. Post ĉiu, unu maniero de vidi ilin estas diri, ke per uzado de grandaj datumoj kaj maŝinlernado, Blumenstock kaj kolegoj povis produkti taksojn, kiuj povus esti pli fidinde faritaj per jam ekzistantaj metodoj. Sed mi ne pensas, ke tio estas la ĝusta maniero por pensi pri ĉi tiu studo pro du kialoj. Unue, la taksoj de Blumenstock kaj kolegoj estis proksimume 10 fojojn pli rapide kaj 50 fojojn pli malmultekostaj (kiam kosto estas mezurita laŭ variabloj). Kiel mi argumentis pli frue en ĉi tiu ĉapitro, esploristoj ignoras koston ĉe ilia danĝero. En ĉi tiu kazo, ekzemple, la drama malkresko signifas, ke anstataŭ kelkaj jaroj, kiel normo por Demografiaj kaj Sanaj Survejoj, ĉi tiu speco de enketo povus esti kurita ĉiun monaton, kiu havus multajn avantaĝojn por esploristoj kaj politikoj fabrikantoj. La dua kialo por ne preni la opinion de la skeptika estas ke ĉi tiu studo provizas bazan recepton kiu povas esti adaptita al multaj malsamaj esploraj situacioj. Ĉi tiu recepto havas nur du ingrediencojn kaj du paŝojn. La ingrediencoj estas (1) granda datuma fonto, kiu estas larĝa sed maldika (tio estas, ĝi havas multajn homojn, sed ne la informojn, kiujn vi bezonas pri ĉiu persono) kaj (2) enketo, kiu estas mallarĝa sed dika (tio estas, ĝi havas nur kelkaj homoj, sed ĝi havas la informojn, kiujn vi bezonas pri tiuj homoj). Ĉi tiuj ingrediencoj tiam kombinas en du paŝoj. Unue, por la homoj en ambaŭ datumaj fontoj, konstruu maŝinan lernadon, kiu uzas la grandan datumon por antaŭdiri enketajn respondojn. Tuj poste, uzu tiun modelon por kulpi la enketajn respondojn de ĉiuj en la granda fonto de datumoj. Tiel, se estas iu demando, kiun vi volas peti multajn homojn, serĉu grandan datumon de tiuj homoj, kiuj povus esti uzataj por antaŭdiri sian respondon, eĉ se vi ne zorgas pri la granda fonto de datumoj . Tio estas, Blumenstock kaj kolegoj tute ne zorgis pri alvokoj; ili nur zorgis pri alvokoj, ĉar ili povus esti uzataj por antaŭdiri la enketajn respondojn, kiujn ili zorgis pri. Ĉi tiu trajto-nura nerekta intereso en la granda datuma fonto-plifortigas peti malsaman de enigita demandado, kiun mi priskribis antaŭe.
En konkludo, la amplifiĝanta peto de Blumenstock alproksimigis kombinajn enketajn datumojn kun granda datuma fonto por produkti korinklinojn kompare kun tiuj de oraj norma enketo. Ĉi tiu aparta ekzemplo ankaŭ klarigas iujn el la komercaj interŝanĝoj inter ampleksaj demandoj kaj tradiciaj enketoj. La ampleksaj demandaj taksoj estis pli ĝustatempe, substance pli malkaraj, kaj pli grandulaj. Sed, aliflanke, ankoraŭ ne ekzistas forta teoria bazo por ĉi tiu speco de amplifita peto. Ĉi tiu ununura ekzemplo ne montras, kiam ĉi tiu alproksimiĝo funkcios kaj kiam ĝi ne faros, kaj esploristoj uzantaj ĉi tiun aliron devas speciale koncerni pri eblaj antaŭjuĝoj kaŭzitaj de kiuj estas inkluzivita -kiuj ne estas inkluditaj-en sia granda fonto de datumoj. Plie, la amplifita demanda aliro ankoraŭ ne havas bonajn manierojn por kalkuli necertecon ĉirkaŭ ĝiaj taksoj. Feliĉe, plifoje demandante havas profundajn rilatojn al tri grandaj areoj en statistiko-malgranda areo-estimado (Rao and Molina 2015) , imputation (Rubin 2004) , kaj modelo-bazita poststratifikado (kiu mem rilatas al sinjoro P., La metodo mi priskribis pli frue en la ĉapitro) (Little 1993) . Pro ĉi tiuj profundaj ligoj, mi esperas, ke multaj el la metodologiaj fundamentoj de plifortigado estos baldaŭ plibonigitaj.
Fine, komparante la unuaj kaj duaj provoj de Blumenstock ankaŭ ilustras gravan lecionon pri ciferecaj socia esplorado: la komenco ne estas la fino. Tio estas, multajn fojojn, la unua aliro ne estos la plej bona, sed se esploristoj daŭre funkcias, aferoj povas pliboniĝi. Pli ĝenerale, kiam oni taksas novajn alirojn al socia esplorado en la cifereca aĝo, gravas fari du apartajn taksojn: (1) Kiel bone funkcias ĉi tio nun? kaj (2) Kiel bone ĉi tio funkcios en la estonteco kiel la datumpejno ŝanĝiĝas kaj ĉar esploristoj pli atentas la problemon? Kvankam esploristoj estas trejnitaj por fari la unuan specon de takso, la dua ofte estas pli grava.