D'iarr sé go n-úsáidfí múnla réamh-mheasta chun sonraí suirbhé a chomhcheangal ó roinnt daoine le foinse mór sonraí ó go leor daoine.
Is próiseas é bealach difriúil chun suirbhé agus foinsí sonraí móra a chur le chéile agus cuirfimid glaoch orm ar iarraidh . Nuair a iarrtar air a mhéadú, úsáideann taighdeoir samhail réamhaisnéiseach chun méid beag sonraí suirbhé a chomhcheangal le foinse mór sonraí d'fhonn meastacháin a tháirgeadh ar scála nó gráinneacht nach bhféadfaí foinse sonraí amháin a bheith ina n-aonar. Tagann sampla thábhachtach d'iarrtaí amplified ó obair Joshua Blumenstock, a bhí ag iarraidh sonraí a bhailiú a d'fhéadfadh cabhrú le forbairt a threorú i dtíortha bochta. San am atá caite, ba cheart do thaighdeoirí a bhailigh an cineál sonraí seo go ginearálta ceann de dhá chur chuige a ghlacadh: suirbhéanna samplacha nó daonáirimh. Is féidir le suirbhéanna samplacha, áit a mbíonn taighdeoirí agallamh ar líon beag daoine, solúbtha, tráthúil, agus réasúnta saor. Mar sin féin, is minic a bhíonn na suirbhéanna seo, toisc go bhfuil siad bunaithe ar shampla, teoranta ina rún. Le suirbhé samplach, is minic a bhíonn sé deacair meastacháin a dhéanamh faoi réigiúin gheografacha sonracha nó do ghrúpaí déimeagrafacha sonracha. Ar an láimh eile, déanann Daonáirimh iarracht gach duine a agallamh, agus mar sin is féidir iad a úsáid chun meastacháin a dhéanamh do réigiúin gheografacha beaga nó do ghrúpaí déimeagrafacha. Ach is iondúil go mbíonn daonáirimh costasach, caolfhócas (níl ach líon beag ceisteanna acu), agus ní tráthúil (tarlaíonn siad ar sceideal seasta, mar shampla gach 10 mbliana) (Kish 1979) . Seachas a bheith i bhfostú le suirbhéanna samplacha nó daonáirimh, shamhlú dá bhféadfadh taighdeoirí na saintréithe is fearr dá chéile a chur le chéile. Samhlaigh má d'fhéadfadh taighdeoirí gach ceist a chur ar gach duine gach lá. Ar ndóigh, is é seo an t-suirbhé uile-uileláithreach, i gcónaí, ar chineál fantais eolaíochta sóisialta. Ach feictear gur féidir linn tús a chur leis seo trí cheisteanna suirbhé a chomhcheangal ó líon beag daoine le rianta digiteacha ó go leor daoine.
Thosaigh taighde Blumenstock nuair a thug sé comhpháirtíocht leis an soláthraí fón póca is mó i Rwanda, agus thug an chuideachta taifid idirbhearta gan ainm ó thart ar 1.5 milliún custaiméir idir 2005 agus 2009. Bhí faisnéis faoi na glaonna agus na teachtaireachtaí téacs seo sna taifid sin, amhail am tosaithe, ré , agus suíomh geografach an ghlaonna agus an ghlacadóra. Sula dtabharfaidh mé labhairt faoi na saincheisteanna staitistiúla, is fiú a rá go bhféadfadh an chéad chéim seo a bheith ar cheann de na deacrachtaí do go leor taighdeoirí. Mar a thuairiscigh mé i gCaibidil 2, níl na foinsí sonraí is mó inacmhainne do thaighdeoirí. Go háirithe, ní féidir teacht ar mheiteashonraí teileafón, go háirithe, toisc go bhfuil sé dodhéanta go bunúsach a bheith gan ainmniú agus go bhfuil eolas beagnach cinnte a mheasfadh rannpháirtithe íogair (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Sa chás áirithe seo, bhí na taighdeoirí cúramach na sonraí a chosaint agus rinne an tríú páirtí maoirseacht ar a gcuid oibre (.i. IRB). Tabharfaidh mé ar ais go dtí na saincheisteanna eitice seo níos mionsonraithe i gcaibidil 6.
Bhí suim ag Blumenstock saibhreas agus dea-bhail a thomhas. Ach ní bhíonn na tréithe seo go díreach sna taifid glaonna. I bhfocail eile, níl na taifid glaonna seo neamhiomlán don taighde seo - gné choitianta de na foinsí sonraí móra a pléadh go mion i gcaibidil 2. Mar sin féin, is dóichí gur dócha go bhfuil faisnéis áirithe ag na taifid glaonna a d'fhéadfadh faisnéis a thabhairt go hindíreach maidir le saibhreas agus dea-bhail. Mar gheall ar an bhféidearthacht seo, d'iarr Blumenstock an bhféadfaí samhail foghlama meaisín a oiliúint chun tuar conas a dhéanfaidh duine suirbhé a fhreagairt bunaithe ar a gcuid taifead glao. Má bhí sé indéanta, d'fhéadfadh Blumenstock an múnla seo a úsáid chun freagraí an suirbhé a mheas ar gach 1.5 milliún custaiméir.
D'fhonn múnla den sórt sin a thógáil agus a thraenáil, thug Blumenstock agus cúntóirí taighde ó Institiúid Eolaíochta agus Teicneolaíochta Kigali sampla randamach de thart ar mhíle custaiméir. Mhínigh na taighdeoirí spriocanna an tionscadail do na rannpháirtithe, d'iarr siad a gcuid toiliú chun freagraí an tsuirbhé a nascadh leis na taifid glaonna, agus ansin d'iarr siad sraith ceisteanna orthu chun a saibhreas agus a leas a thomhas, mar shampla "An bhfuil tú féin raidió? "agus" An bhfuil rothar agat féin? "(féach figiúr 3.14 le haghaidh liosta páirteach). Cuireadh cúiteamh airgeadais ar gach rannpháirtí sa suirbhé.
Ar Aghaidh, d'úsáid Blumenstock nós imeachta dhá chéim a bhí coitianta i bhfoghlaim meaisín: innealtóireacht ghné ina dhiaidh sin ag foghlaim faoi mhaoirseacht. Ar dtús, sa chéim innealtóireachta gné , do gach duine a cuireadh faoi agallamh, d'athraigh Blumenstock na taifid glaonna isteach i sraith de shaintréithe faoi gach duine; d'fhéadfadh eolaithe sonraí na "gnéithe" seo a chur in iúl agus d'eisigh eolaithe sóisialta "athróg" dóibh. Mar shampla, do gach duine, ríomh Blumenstock an líon iomlán laethanta le gníomhaíocht, an líon daoine ar leith a bhí i dteagmháil le duine, an méid airgid a chaitear ar an am ama, agus mar sin de. Go criticiúil, éilíonn innealtóireacht ghné maith eolas ar an suíomh taighde. Mar shampla, má tá sé tábhachtach idirdhealú a dhéanamh idir glaonna intíre agus idirnáisiúnta (féadfaimis go mbeifí ag súil le daoine a ghlaonn go hidirnáisiúnta a bheith níos saibhre), ní mór é sin a dhéanamh ag an gcéim innealtóireachta gné. Ní fhéadfadh taighdeoir a bhfuil an tuiscint bheag aige ar Ruanda an ghné seo a chur san áireamh, agus ansin bheadh feidhmíocht thuarfachach an tsamhail ag fulaingt.
Ina dhiaidh sin, sa chéim foghlama maoirseachta , thóg Blumenstock samhail chun freagairt an suirbhé a thuar do gach duine atá bunaithe ar a gcuid gnéithe. Sa chás seo, d'úsáid Blumenstock aischéimniú loighisticiúil, ach d'fhéadfadh sé úsáid a bhaint as éagsúlacht cur chuige foghlama staidrimh nó meaisín éagsúla.
Mar sin, cé chomh maith a bhí sé ag obair? An raibh Blumenstock in ann freagraí a thabhairt ar cheisteanna suirbhé mar "An bhfuil raidió ort féin" agus "An bhfuil rothar agat féin" ag baint úsáide as gnéithe a dhíorthaítear ó thaifid glaonna? D'fhonn measúnú a dhéanamh ar fheidhmíocht a mhúnla réamh-mheasta, d'úsáid Blumenstock tras-bhailíochtú , teicníc a úsáidtear go coitianta in eolaíocht na sonraí ach is annamh a bhíonn san eolaíocht shóisialta. Is é an sprioc atá ag tras-bhailíochtú measúnú cothrom a thabhairt ar fheidhmíocht réamh-mheastacháin mhúnla trína oiliúint agus é a thástáil ar shíntílí éagsúla sonraí. Go háirithe, scoiltigh Blumenstock a chuid sonraí i 10 gcrann de 100 duine an ceann. Ansin, d'úsáid sé naoi gcodán chun a mhúnla a oiliúint, agus rinneadh meastóireacht ar fheidhmíocht thuarthach an tsamhail oilte ar an gcruach eile. Rinne sé an nós imeachta seo arís agus arís eile 10 huaire - le gach ceann de na sonraí ag dul cas amháin mar na sonraí bailíochtaithe - agus mheán na torthaí ar an meán.
Bhí cruinneas na tuartha ard do roinnt tréithe (figiúr 3.14); mar shampla, d'fhéadfadh Blumenstock a thuar le cruinneas 97.6% dá mbeadh raidió ag duine éigin. D'fhéadfadh sé seo go hiontach, ach tá sé tábhachtach i gcónaí modh tuartha casta a chur i gcomparáid le rogha eile simplí. Sa chás seo, is é rogha eile simplí a thuar go dtabharfaidh gach duine an freagra is coitianta. Mar shampla, thuairiscigh 97.3% de na freagróirí gur rachadh raidió uirthi féin, dá mba rud é go raibh tuar ag Blumenstock go mbeadh tuairisc ag gach duine ar raidió a bheadh aige go mbeadh cruinneas de 97.3% aige, rud atá iontas cosúil le feidhmíocht a nós imeachta níos casta (cruinneas 97.6%) . I bhfocail eile, mhéadaigh na sonraí agus an samhaltú mhaisiúil go léir cruinneas an tuar ó 97.3% go 97.6%. Mar sin féin, le haghaidh ceisteanna eile, amhail "An bhfuil rothar agat?", Feabhsaigh na tuar ó 54.4% go 67.6%. Níos ginearálta, léiríonn figiúr 3.15 nach raibh feabhas mór déanta ar roinnt tréithe Blumenstock ach an réamhtheachtadh simplí bunlíne a dhéanamh, ach go raibh feabhsúchán ann le haghaidh tréithe eile. Ag féachaint go díreach ar na torthaí seo, áfach, ní dóigh leat go bhfuil an cur chuige seo go háirithe geallta.
Ach bliain amháin ina dhiaidh sin, thug Blumenstock agus beirt chomhghleacaithe Gabriel Cadamuro agus Robert Foilsíodh páipéar in Eolaíocht le torthaí níos fearr fós (Blumenstock, Cadamuro, and On 2015) . Bhí dhá phríomhchúis theicniúla ann don fheabhsú seo: (1) d'úsáid siad modhanna níos sofaisticiúla (ie, cur chuige nua maidir le hinnealtóireacht ghné agus múnla níos sofaisticiúla chun freagairtí a thuar ó ghnéithe) agus (2) seachas iarracht a dhéanamh freagraí a nochtadh ceisteanna suirbhé (m.sh., "An bhfuil raidió ort féin?"), rinne siad innéacs rachmais ilchodach a chur in iúl. Chiallaigh na feabhsuithe teicniúla seo go bhféadfadh siad post réasúnach a dhéanamh le taifid glaonna a úsáid chun saibhreas a thuar do na daoine ina sampla.
Mar sin féin, ní raibh sé mar sprioc deiridh an taighde ag tuar an saibhreas daoine sa sampla. Cuimhnigh gurb é an cuspóir deiridh ná cuid de na gnéithe is fearr de shuirbhéanna agus de dhaonáirimh samplacha a chur le chéile chun meastacháin chruinne, ardréitigh bochtaineachta a tháirgeadh i dtíortha i mbéal forbartha. Chun measúnú a dhéanamh ar a gcumas an sprioc seo a bhaint amach, d'úsáid Blumenstock agus comhghleacaithe a múnla agus a gcuid sonraí chun saibhreas gach 1.5 milliún duine a thuar sna taifid glaonna. Agus d'úsáid siad an fhaisnéis geospásúlachta atá leabaithe sna taifid glaonna (ag cuimhneamh go raibh na sonraí san áireamh an túir ceall is gaire do gach glao) chun áit chónaithe gar gach duine a mheas (figiúr 3.17). Agus an dá mheastachán seo á chur le chéile, thug Blumenstock agus comhghleacaithe meastachán ar dháileadh geografach saibhreas na suibscríobhaí ag gránláithreacht spásúil thar a bheith breá. Mar shampla, d'fhéadfadh siad meastachán a dhéanamh ar an meán-saibhreas i ngach ceann de 2,148 ceall Ruanda (an t-aonad riaracháin is lú sa tír).
Cé chomh maith is a mheastar na meastacháin seo go dtí leibhéal iarbhír na bochtaineachta sna réigiúin seo? Sula freagraim an cheist sin, ba mhaith liom béim a chur ar an bhfíric go bhfuil go leor cúiseanna ann a bheith skeptical. Mar shampla, bhí an cumas tuartha a dhéanamh ag leibhéal an duine aonair go leor (figiúr 3.17). Agus, b'fhéidir níos tábhachtaí fós, d'fhéadfadh daoine le fóin phóca a bheith éagsúil go córasach ó dhaoine gan fón póca. Dá bhrí sin, d'fhéadfadh Blumenstock agus comhghleacaithe fulaingt as na cineálacha earráidí clúdaigh a chlaontaigh suirbhé ar Tháirgí Liteartha 1936 a thuairiscigh mé roimhe seo.
Chun tuiscint a fháil ar chaighdeán a gcuid meastacháin, ba ghá Blumenstock agus comhghleacaithe iad a chur i gcomparáid le rud éigin eile. Ar an drochuair, bhí an t-suirbhé sóisialta níos traidisiúnta á reáchtáil ag Ríoga ag an am céanna lena staidéar. Bhí buiséad mór ag an suirbhé eile seo - a bhí mar chuid den chlár Suirbhé Déimeagrafach agus Sláinte a bhí meas go forleathan, agus d'úsáid modhanna traidisiúnta ardchaighdeáin. Dá bhrí sin, d'fhéadfaí measúnú réasún a dhéanamh ar mheastacháin ó chaighdeán ór ó na meastacháin ón Suirbhé Déimeagrafach agus Sláinte. Nuair a rinneadh comparáid idir an dá mheastachán, bhí siad an-chosúil (figiúr 3.17). I bhfocail eile, trí líon beag sonraí suirbhé a chomhcheangal leis na taifid glaonna, bhí Blumenstock agus comhghleacaithe in ann meastacháin a tháirgeadh a bhí inchomparáide leo siúd ó chur chuige caighdeán ór.
D'fhéadfadh sé go mbeadh na torthaí seo mar díomá. Tar éis an tsaoil, is é bealach amháin chun breathnú orthu ná a rá gur féidir le blumenstock agus le comhghleacaithe meastacháin a dhéanamh a d'fhéadfaí a dhéanamh níos iontaofa trí mhodhanna atá ann cheana féin a úsáid trí úsáid a bhaint as sonraí móra agus foghlaim meaisín. Ach ní dóigh liom gurb é sin an bealach ceart chun smaoineamh ar an staidéar seo ar dhá chúis. Ar dtús, bhí na meastacháin ó Blumenstock agus comhghleacaithe thart ar 10 n-uaire níos tapúla agus 50 uair níos saoire (nuair a dhéantar an costas a thomhas i dtéarmaí na gcostas athraitheach). Mar a d'áitigh mé níos luaithe sa chaibidil seo, ní dhéanann taighdeoirí neamhaird ar chostas ar a gcontúirt. Sa chás seo, mar shampla, ciallaíonn an laghdú drámatúil ar chostas, seachas a bheith á reáchtáil gach cúpla bliain - mar is caighdeán le haghaidh Suirbhéanna Déimeagrafacha agus Sláinte-d'fhéadfaí an cineál suirbhé seo a reáchtáil gach mí, rud a chuirfeadh buntáistí iomadúla do thaighdeoirí agus do pholasaí lucht déanta. Is é an dara fáth nach nglacann sé leis an tuairim go gcuirtear an t-oideas bunúsach ar fáil a fhéadfar a chur in oiriúint do go leor cásanna taighde éagsúla. Níl ach dhá chomhábhar agus dhá chéim ag an oideas seo. Is iad na comhábhair (1) foinse sonraí mór atá leathan ach tanaí (.i. Tá go leor daoine ann ach níl an fhaisnéis a theastaíonn uait faoi gach duine) agus (2) suirbhé atá cúngach ach tiubh (is é sin, tá sé ach cúpla duine, ach tá an fhaisnéis a theastaíonn uait faoi na daoine sin). Déantar na comhábhair sin a chur le chéile i dhá chéim. Ar dtús, do dhaoine sa dá fhoinse sonraí, múnla foghlama meaisín a thógáil a úsáideann an fhoinse sonraí mór chun freagraí suirbhé a thuar. Ansin, bain úsáid as an múnla sin chun freagraí an tsuirbhé a cháiliú ar gach duine sa bhfoinse sonraí mór. Dá bhrí sin, má tá roinnt cheist ann gur mhaith leat go leor daoine a iarraidh, foinse mór sonraí a lorg ó na daoine sin a d'fhéadfaí a úsáid chun a bhfreagra a thuar, fiú amháin más rud é nach bhfuil cúram ort faoin bhfoinse sonraí mór . Is é sin, ní raibh cúram go bunúsach ag Blumenstock agus ar chomhghleacaithe faoi thaifid glaonna; ní raibh siad ach cúram faoi thaifid ghlaoite toisc go bhféadfaí iad a úsáid chun freagraí suirbhé a ndearbhú leo a thuar. Déanann an t-ús neamhdhíreach saintréith seo sa bhfoinse sonraí mór-fhada a iarraidh go bhfuil sé ag iarraidh a bheith difriúil ó iarraidh leabaithe, a thuairiscigh mé roimhe seo.
Mar fhocal scoir, chuir cur chuige leantach blumenstock ag iarraidh sonraí suirbhé a chomhcheangal le foinse sonraí mór chun meastacháin a tháirgeadh a bheadh inchomparáide leis na cinn sin ó shuirbhé caighdeánach ór. Déanann an sampla áirithe seo soiléiriú freisin ar roinnt de na dícheadanna idir modhanna cuimsitheacha agus suirbhé traidisiúnta. Bhí na meastacháin iarraidh amplified níos tráthúla, go mór níos saoire, agus níos mó gráinneach. Ach, ar an láimh eile, níl bunús teoiriciúil láidir fós ann maidir leis an gcineál seo a iarraidh amplified. Ní léiríonn an sampla seo amháin nuair a bheidh an cur chuige seo ag obair agus nuair nach mbeidh sé, agus go gcaithfidh taighdeoirí ag baint úsáide as an gcur chuige seo a bheith buartha go háirithe maidir le tuiscintí féideartha de bharr cé a chuimsítear-agus nach bhfuil san áireamh - ina bhfoinse sonraí mór. Ina theannta sin, níl bealaí maithe ag an gcur chuige ag iarraidh níos mó ná neamhchinnteacht a mheas maidir lena meastacháin. Go fortunately, tá sé ag iarraidh go bhfuil nasc domhain aige le trí réimse mór i staitisticí - meastachán ceantar beag (Rao and Molina 2015) , cur i bhfeidhm (Rubin 2004) , agus iar-stratification atá bunaithe ar mhúnla (a bhaineann go dlúth leis an Uasal P., an modh a chuir mé síos roimhe seo sa chaibidil) (Little 1993) . Mar gheall ar na naisc dhomhain seo, táim ag súil go bhfeabhsófar go leor de na bunúsacha modheolaíocha a bhaineann le hiarnú níos fearr.
Mar fhocal scoir, léiríonn comparáid idir iarrachtaí chéad agus dara Blumenstock ceacht tábhachtach faoi thaighde sóisialta digiteach: ní hé an deireadh an deireadh. Is é sin, go minic, ní bheidh an chéad chur chuige is fearr, ach má leanann taighdeoirí ag obair, is féidir rudaí a fháil níos fearr. Go ginearálta, nuair a dhéantar measúnú ar chur chuige nua maidir le taighde sóisialta san aois dhigiteach, tá sé tábhachtach dhá mheasúnú ar leith a dhéanamh: (1) Cé chomh maith is atá an obair seo anois? agus (2) Cé chomh maith agus a dhéanfaidh an obair seo amach anseo mar a athraíonn tírdhreacha na sonraí agus mar a thugann taighdeoirí aird níos mó ar an bhfadhb? Cé go bhfuil taighdeoirí oilte chun an chéad chineál meastóireachta a dhéanamh, is minic a bhíonn an dara ceann níos tábhachtaí.