Is é an cineál eitneagrafaíochta amháin atá san áireamh sa chaibidil seo. Chun tuilleadh eolais a fháil ar eitneagrafaíocht i spásanna digiteacha, féach Boellstorff et al. (2012) , agus le haghaidh níos mó ar eitneagrafaíocht i spásanna measctha agus fisiceacha measctha, féach Lane (2016) .
Níl aon sainmhíniú comhsheasmhachta ar bith ar "sonraí móra", ach is cosúil go bhfuil go leor sainmhínithe ag díriú ar na "3 Vs": toirt, éagsúlacht agus treoluas (eg, Japec et al. (2015) ). Féach De Mauro et al. (2015) le haghaidh athbhreithniú ar na sainmhínithe.
Is beagán neamhghnách é mo chuid sonraí riaracháin rialtais sa chatagóir sonraí mór, cé go ndearna daoine eile an cás seo, lena n-áirítear Legewie (2015) , Connelly et al. (2016) , agus Einav and Levin (2014) . Le haghaidh tuilleadh eolais faoi luach sonraí riaracháin rialtais le haghaidh taighde, féach Card et al. (2010) , Adminstrative Data Taskforce (2012) , agus Grusky, Smeeding, and Snipp (2015) .
Ar mhaithe le taighde riaracháin ó chóras staidrimh an rialtais, go háirithe Biúró Daonáirimh na Stát Aontaithe, féach Jarmin and O'Hara (2016) . Le haghaidh cóireála Wallgren and Wallgren (2007) ar thaighde na dtaifead riaracháin ag Staitisticí na Sualainne, féach Wallgren and Wallgren (2007) .
Sa chaibidil, rinne mé suirbhé gairid ar shuirbhé traidisiúnta ar nós an tSuirbhé Ginearálta Sóisialta (GSS) le foinse sonraí meáin shóisialta mar Twitter. Chun comparáid chuimsitheach agus cúramach a dhéanamh idir suirbhéanna traidisiúnta agus sonraí meáin shóisialta, féach Schober et al. (2016) .
Cur síos ar na 10 saintréithe sonraí mór seo ar éagsúlacht bealaí éagsúla ag údair éagsúla. I measc na scríbhneoireachta a thug tionchar ar mo smaointeoireacht ar na saincheisteanna seo tá Lazer et al. (2009) , Groves (2011) , Howison, Wiggins, and Crowston (2011) , boyd and Crawford (2012) , SJ Taylor (2013) , Mayer-Schönberger and Cukier (2013) , Golder and Macy (2014) , Ruths and Pfeffer (2014) , Tufekci (2014) , Sampson and Small (2015) , K. Lewis (2015b) , Lazer (2015) , Horton and Tambe (2015) , Japec et al. (2015) , agus Goldstone and Lupyan (2016) .
Le linn na caibidle seo, úsáid mé an téarma rianta digiteacha , a chreidim go bhfuil sé réasúnta neodrach. Is é an téarma tóir eile do rianta digiteacha ná costais dhigiteacha (Golder and Macy 2014) , ach mar a léiríonn Hal Abelson, Ken Ledeen, agus Harry Lewis (2008) , is dócha go mbeidh téarma níos oiriúnaí ar mhéarloirg dhigiteacha . Nuair a chruthaíonn tú costais, tá a fhios agat ar an méid atá ag tarlú agus ní féidir do chosáin a rianú go pearsanta duit féin. Níl an rud céanna fíor do do rianta digiteacha. Go deimhin, tá tú ag fágáil rianta an t-am ar fad a bhfuil eolas an-bheag agat. Agus, cé nach bhfuil d'ainm ag na rianta seo orthu, is minic is féidir iad a nascadh ar ais chugat. I bhfocail eile, tá siad níos mó cosúil le méarloirg: dofheicthe agus a aithint go pearsanta.
Chun tuilleadh eolais a fháil ar an bhfáth go M. Lin, Lucas, and Shmueli (2013) sonraí mór fadhbanna tástála, féach M. Lin, Lucas, and Shmueli (2013) agus McFarland and McFarland (2015) . Ba cheart go dtiocfadh na taighdeoirí seo chun díriú ar thábhacht praiticiúil seachas tábhacht staitistiúil.
Chun tuilleadh eolais a fháil faoi conas a fuair Raj Chetty agus comhghleacaithe rochtain ar na taifid chánach, féach Mervis (2014) .
Is féidir le tacar sonraí móra fadhbanna ríomhairí a chruthú a bhíonn níos mó ná cumais ríomhaire amháin. Dá bhrí sin, is minic a scaipeadh taighdeoirí ar ríomhchláir sonraí móra an obair thar go leor ríomhairí, próiseas ar a dtugtar cláir comhthreomhar uaireanta. Chun tabhairt isteach ar chláir comhthreomhar, go háirithe teanga ar a dtugtar Hadoop, féach Vo and Silvia (2016) .
Agus tú ag smaoineamh ar shonraí i gcónaí, tá sé tábhachtach a bhreithniú an bhfuil tú ag comparáid idir na daoine céanna agus an t-am céanna nó an bhfuil tú ag comparáid idir grúpa daoine atá ag athrú; féach mar shampla, Diaz et al. (2016) .
Is é an leabhar clasaiceach ar bhearta neamhghníomhacha Webb et al. (1966) . Tá na samplaí sa leabhar sin roimh ré ar an aois dhigiteach, ach tá siad fós ag soilsiú. Le haghaidh samplaí de dhaoine atá ag athrú a n-iompar mar gheall ar mhainneachtain faireachais a fheiceáil, féach Penney (2016) agus Brayne (2014) .
Tá dlúthbhaint ag athghníomhaíocht leis na héifeachtaí atá ag taighdeoirí ar éilimh éilimh (Orne 1962; Zizzo 2010) agus an éifeacht Hawthorne (Adair 1984; Levitt and List 2011) .
Chun tuilleadh eolais a fháil ar an nasc taifead, féach Dunn (1946) agus Fellegi and Sunter (1969) (stairiúil) agus Larsen and Winkler (2014) (nua-aimseartha). Forbraíodh cur chuige comhchosúla freisin in eolaíocht ríomhaireachta faoi ainmneacha cosúil le sonraí a bhailiú, aithint cásanna, meaitseáil ainm, braite dúblach, agus (Elmagarmid, Ipeirotis, and Verykios 2007) taifead dúblach (Elmagarmid, Ipeirotis, and Verykios 2007) . Tá cur chuige caomhnaithe príobháideachta ann freisin chun nasc a thaifeadadh nach dteastaíonn faisnéis a aithint go pearsanta (Schnell 2013) . D'fhorbair Facebook próiseas chun a gcuid taifead a nascadh chun iompar vótála; rinneadh é seo chun meastóireacht a dhéanamh ar thurgnamh a chuirfidh tú in iúl duit i gcaibidil 4 (Bond et al. 2012; Jones et al. 2013) .
Le tuilleadh eolais maidir le bailíocht a thógáil, féach caibidil 3 Shadish, Cook, and Campbell (2001) .
Chun tuilleadh eolais a fháil maidir leis an mbabhtáil logála AOL, féach Ohm (2010) . Cuirim comhairle ar fáil maidir le comhpháirtíocht le cuideachtaí agus le rialtais i gcaibidil 4 nuair a chuireann mé síos ar thurgnaimh. Léirigh roinnt údair imní faoi thaighde a bhíonn ag brath ar shonraí nach bhfuil inrochtana, féach Huberman (2012) agus boyd and Crawford (2012) .
Is é ceann bhealach maith do thaighdeoirí ollscoile chun rochtain ar shonraí a fháil a bheith ag obair ag cuideachta mar intéirneach nó taighdeoir ar cuairt. Chomh maith le a chumasú rochtain ar shonraí, beidh an próiseas seo cabhrú freisin leis an taighdeoir níos mó faoi conas a cruthaíodh na sonraí, rud atá tábhachtach le haghaidh anailíse fhoghlaim.
Maidir le rochtain a fháil ar shonraí rialtais, Mervis (2014) conas a fuair Raj Chetty agus comhghleacaithe rochtain ar na taifid chánach a úsáideadh ina gcuid taighde ar shoghluaisteacht shóisialta.
Chun tuilleadh eolais a fháil ar stair "ionadaíochta" mar choincheap, féach Kruskal and Mosteller (1979a) , Kruskal and Mosteller (1979b) , Kruskal and Mosteller (1979c) , agus Kruskal and Mosteller (1980) .
Bhí achoimre ar mo chuid oibre Sneachta agus obair Dholl agus Cnoc. Chun tuilleadh eolais a fháil ar obair Snow ar an gcórara, féach Freedman (1991) . Chun tuilleadh eolais a fháil ar Staidéar Dochtúirí na Breataine féach Doll et al. (2004) agus Keating (2014) .
Beidh iontas ar go leor taighdeoirí a fhoghlaim, cé gur bhailigh Doll agus Cnoc sonraí ó dhochtúirí ban agus ó dhochtúirí faoi bhun 35, níor úsáid siad na sonraí seo go hintinneach sa chéad anailís. Mar a d'áitigh siad: "Ós rud é go bhfuil ailse scamhóg sách annamh i mná agus fir faoi bhun 35, ní dócha go bhfaighfear figiúirí úsáideacha sna grúpaí seo le blianta beaga le teacht. Sa réamhthuairisc seo ní mór dúinn ár n-aird a theorannú do dhaoine atá 35 bliana d'aois agus níos sine. " Rothman, Gallacher, and Hatch (2013) , a bhfuil an teideal spreagúil" Cén fáth gur chóir ionadaíocht a sheachaint, "argóint níos ginearálta a dhéanamh maidir le luach sonraí neamhthábhachtacha a chruthú go hintinneach.
Is fadhb mhór é neamh-léiriú le haghaidh taighdeoirí agus rialtais ar mian leo ráitis a dhéanamh faoi dhaonra iomlán. Is cúis imní é seo do chuideachtaí, atá de ghnáth dírithe ar a n-úsáideoirí. Chun tuilleadh eolais a fháil ar an gcaoi a measann Staitisticí na hÍsiltíre an t-ábhar a bhaineann le neamh-léiriú sonraí móra gnó, féach Buelens et al. (2014) .
Le haghaidh samplaí de thaighdeoirí a léiríonn imní faoi nádúr neamh-ionadaíoch na bhfoinsí sonraí mór, féach boyd and Crawford (2012) , K. Lewis (2015b) , agus Hargittai (2015) .
Chun comparáid níos mionsonraithe a dhéanamh ar spriocanna na suirbhéanna sóisialta agus an taighde eipidéimeolaíoch, féach Keiding and Louis (2016) .
Chun tuilleadh eolais a dhéanamh ar iarrachtaí Twitter a úsáid chun ginearálta-samplaí a dhéanamh maidir le vótálaithe, go háirithe an cás ó thoghchán na Gearmáine 2009, féach Jungherr (2013) agus Jungherr (2015) . Ina dhiaidh sin d'obair Tumasjan et al. (2010) taighdeoirí ar fud an domhain modhanna fancier a úsáid - amhail anailís sentimentach a úsáid chun idirdhealú a dhéanamh idir luachanna dearfacha agus diúltacha na bpáirtithe - d'fhonn feabhas a chur ar chumas na sonraí Twitter chun éagsúlacht cineálacha éagsúla toghcháin a thuar (Gayo-Avello 2013; Jungherr 2015, chap. 7.) . Seo mar a Huberty (2015) achoimre ar thorthaí na n-iarrachtaí seo chun toghcháin a thuar:
"Theip ar na modhanna réamhaisnéise go léir atá bunaithe ar na meáin shóisialta nuair a dhéantar éilimh ar réamhaisnéisí toghcháin fíorfhéachaint ar aghaidh. Is cosúil go bhfuil na teipeanna seo mar gheall ar airíonna bunúsacha na meáin shóisialta, seachas deacrachtaí modheolaíochta nó algartamacha. Go gairid, ní dhéanann na meáin shóisialta, agus is dócha go dtiocfaidh siad, pictiúr cobhsaí, neamhchlaonta, ionadaíoch ar fáil don toghthóirí; agus níl dóthain sonraí le samplaí áise de na meáin shóisialta chun na fadhbanna seo a réiteach tar éis é seo. "
I gcaibidil 3, cuirfidh mé síos ar an sampláil agus ar an meastachán i bhfad níos mó. Fiú má tá na sonraí neamh-ionadaíocha, faoi choinníollacha áirithe, is féidir iad a ualú chun meastacháin mhaith a thabhairt.
Tá sruth an chórais an-deacair a fheiceáil ón taobh amuigh. Rinne grúpa taighde acadúil an tionscadal MovieLens (pléadh níos mó i gCaibidil 4) áfach, ar feadh níos mó ná 15 bliain. Dá bhrí sin, bhí siad in ann faisnéis a dhoiciméadú agus a roinnt faoin mbealach a tháinig an córas chun cinn le himeacht ama agus conas a d'fhéadfadh sé seo tionchar a dhéanamh ar anailís (Harper and Konstan 2015) .
Tá roinnt scoláirí dírithe ar sruth ar Twitter: Liu, Kliman-Silver, and Mislove (2014) agus Tufekci (2014) .
Is é bealach amháin chun déileáil le sruth an daonra ná painéal úsáideoirí a chruthú, rud a ligeann do thaighdeoirí na daoine céanna a staidéar le himeacht ama, féach Diaz et al. (2016) .
Chuala mé an téarma "confounded algorithmically" a úsáideann Jon Kleinberg i gcaint, ach ar an drochuair ní cuimhin liom nuair a tugadh an caint nó cén áit a tugadh an labhairt. An chéad uair a chonaic mé an téarma i gcló ná Anderson et al. (2015) , is plé suimiúil é seo ar conas a d'fhéadfadh na halgartaim a úsáideann láithreáin dhátú casta a dhéanamh ar chumas taighdeoirí sonraí a úsáid as na láithreáin ghréasáin seo chun roghanna sóisialta a mheas. Thóg K. Lewis (2015a) an t-imní seo mar fhreagra ar Anderson et al. (2014) .
Chomh maith le Facebook, Molann Twitter freisin do dhaoine d'úsáideoirí a leanúint bunaithe ar an smaoineamh ar dhúnadh triadach; féach Su, Sharma, and Goel (2016) . Mar sin, is é an leibhéal dúnadh triadach i Twitter ná roinnt claonadh daonna i dtreo dhúnadh triadach agus roinnt claonadh algartamach chun dúnadh triadach a chur chun cinn.
Chun tuilleadh eolais a fháil maidir le feidhmiúlacht-go háirithe an smaoineamh gurb iad "teicneolaíocht innill ná ceamaraí" ná roinnt teoiricí eolaíochta sóisialta (is é sin, déanann siad cruth ar an domhan seachas a thuairisciú) - fear Mackenzie (2008) .
Glaonn gníomhaireachtaí staidrimh an Rialtais eagarthóireacht sonraí staidrimh a ghlanadh. De Waal, Puts, and Daas (2014) cur síos ar theicnící eagarthóireachta sonraí staidrimh a forbraíodh le haghaidh sonraí suirbhé agus scrúdaíonn siad a mhéid is infheidhme maidir le foinsí sonraí móra, agus cuireann Puts, Daas, and Waal (2015) cuid de na smaointe céanna le haghaidh lucht féachana níos ginearálta.
Le haghaidh forbhreathnú ar bhotáin shóisialta, féach Ferrara et al. (2016) . I gcás roinnt samplaí de staidéir a dhírigh ar spam a aimsiú i Twitter, féach Clark et al. (2016) agus Chu et al. (2012) . Ar deireadh, Subrahmanian et al. (2016) cur síos ar thorthaí Dhúshlán DARPA Twitter Bot, maischomhar atá deartha chun cur chuige a chur i gcomparáid le haghaidh bataí a bhrath ar Twitter.
Athbhreithníonn Ohm (2015) taighde níos luaithe ar an smaoineamh ar fhaisnéis íogair agus cuireann sé tástáil ilfhachtóra ar fáil. Is iad na ceithre fachtóir a mholtar an méid díobhála, an dóchúlacht a bhaineann le díobháil, caidreamh rúnda a bheith ann, agus cibé an léiríonn an riosca ábhair imní ollmhór.
Bhí staidéar Farber ar thacsaithe i Nua-Eabhrac bunaithe ar staidéar níos luaithe ag Camerer et al. (1997) a d'úsáid trí shampla éagsúla áisiúlachta ar bhileoga turas páipéir. Chinn an staidéar níos luaithe seo gur cosúil go raibh tiománaithe mar sprioc-saothraithe: d'oibrigh siad níos lú ar laethanta ina raibh a gcuid pá níos airde.
In obair ina dhiaidh sin, rinne Rí agus comhghleacaithe iniúchadh breise ar chinsireacht ar líne sa tSín (King, Pan, and Roberts 2014, [@king_how_2016] ) . Maidir le cur chuige gaolmhar maidir le cinsireacht ar líne a thomhas sa tSín, féach Bamman, O'Connor, and Smith (2012) . Le haghaidh níos mó ar mhodhanna staidrimh cosúil leis an duine a úsáideadh sa King, Pan, and Roberts (2013) chun meastachán a dhéanamh ar thuairim na 11 milliún post, féach Hopkins and King (2010) . Chun tuilleadh eolais a fháil ar fhoghlaim faoi mhaoirseacht, féach James et al. (2013) (níos teicniúla) agus Hastie, Tibshirani, and Friedman (2009) (níos teicniúla).
Is cuid mhór d'eolaíocht sonraí tionsclaíocha an réamhaisnéis (Mayer-Schönberger and Cukier 2013; Provost and Fawcett 2013) . Is é an cineál réamhaisnéise amháin a dhéanann taighdeoirí sóisialta go coitianta ná réamhaisnéis déimeagrafach; féach, mar shampla, Raftery et al. (2012) .
Níor ghlac Google Flu Trends an chéad tionscadal chun sonraí cuardaigh a úsáid go dtí an leitheadúlacht fliú anois. Go deimhin, (Polgreen et al. 2008; Ginsberg et al. 2009) taighdeoirí sna Stáit Aontaithe (Polgreen et al. 2008; Ginsberg et al. 2009) agus an tSualainn (Hulth, Rydevik, and Linde 2009) go raibh téarmaí cuardaigh áirithe (m.sh., "fliú") ag súil le faireachas sláinte poiblí náisiúnta sonraí sular scaoileadh é. Ina dhiaidh sin, rinne go leor tionscadal eile iarracht sonraí rian digiteach a úsáid le haghaidh faireacháin galar a bhrath; féach Althouse et al. (2015) le haghaidh athbhreithnithe.
Chomh maith le sonraí rianúla digiteacha a úsáid chun torthaí sláinte a thuar, rinneadh méid mór oibre freisin ag baint úsáide as sonraí Twitter chun torthaí toghcháin a thuar; le haghaidh athbhreithnithe féach Gayo-Avello (2011) , Gayo-Avello (2013) , Jungherr (2015) (caibidil 7), agus Huberty (2015) . Tá na táscairí eacnamaíocha a sceidealú, mar shampla olltáirgeacht intíre (OTI), coitianta i mbainc cheannais, féach Bańbura et al. (2013) . Cuimsíonn tábla 2.8 roinnt samplaí de staidéir a úsáideann roinnt cineálacha rian digiteach chun cineál áirithe imeacht ar domhan a thuar.
Rian digiteach | Toradh | Luaite |
---|---|---|
Ioncam oifig bhosca scannáin sna Stáit Aontaithe | Asur and Huberman (2010) | |
Logs cuardaigh | Díolacháin scannáin, ceol, leabhair, agus cluichí físeáin sna Stáit Aontaithe | Goel et al. (2010) |
Meán Tionsclaíoch Dow Jones (margadh stoc na SA) | Bollen, Mao, and Zeng (2011) | |
Na meáin shóisialta agus logaí cuardaigh | Suirbhéanna ar mheon na n-infheisteoirí agus na margaí stoc sna Stáit Aontaithe, sa Ríocht Aontaithe, i gCeanada agus sa tSín | Mao et al. (2015) |
Logs cuardaigh | Leitheadúlacht Fiabhras Dengue i Singeapór agus i Bancác | Althouse, Ng, and Cummings (2011) |
Mar fhocal scoir, léirigh Jon Kleinberg agus comhghleacaithe (2015) go dtéann fadhbanna réamhaisnéise isteach i gcatagóirí dhá fho-dhifriúla agus gur tharla go raibh eolaithe sóisialta ag díriú ar cheann amháin agus neamhaird a dhéanamh ar an gceann eile. Samhlaigh déantóir polasaí amháin, glaoidh mé a Anna, atá os comhair triomach agus caithfidh sé cinneadh a dhéanamh an bhfuil sé ag iarraidh crannchur a fhostú chun damhsa báisteach a dhéanamh chun an bháisteach a mhéadú. Caithfidh déantóir polasaí eile, glaoigh sí a Betty, cinneadh a dhéanamh an ndéanfaidh scáth a bheith ag obair chun a bheith ag fulaingt ar an mbealach abhaile. Is féidir le Anna agus Betty cinneadh níos fearr a dhéanamh má thuigeann siad an aimsir, ach ní mór dóibh rudaí éagsúla a fhiosrú. Caithfidh Anna tuiscint a fháil ar an mbáisteach a mbíonn cúrsaí báisteach ann. Ní gá do Betty, ar an láimh eile, aon ní a thuiscint faoi chúisiúlacht; ní mór di ach réamhaisnéis chruinn a bheith aige. Is minic a chuireann taighdeoirí sóisialta ag díriú ar na fadhbanna a bhaineann le duine a bhfuil aghaidh ag Anna-a dtugann Kleinberg agus comhghleacaithe fadhbanna polasaí 'báistí ar nós damhsa' orthu-toisc go mbíonn ceisteanna cúisíochta acu. Is féidir le ceisteanna cosúil leis an duine atá i ngleic le Betty-a Kleinberg agus le comhghleacaithe fadhbanna polasaí "scáthghlasacha" - a bheith an-tábhachtach freisin, ach tá aird níos lú faighte acu ó thaighdeoirí sóisialta.
Bhí siompóisiam ag an iris PS Political Science ar shonraí móra, toradh cúisimh, agus teoiric fhoirmiúil, agus déanann Clark and Golder (2015) achoimre ar gach ranníocaíocht. Bhí siompóisiam ar Imeacht Acadamh Náisiúnta Eolaíochtaí na Stát Aontaithe Mheiriceá maidir le toradh cúisimh agus sonraí móra, agus Shiffrin (2016) achoimre ar gach ranníocaíocht. Maidir le cur chuige foghlama meaisín a chuireann iarracht ar thurgnaimh nádúrtha a fháil go huathoibríoch taobh istigh de fhoinsí sonraí móra, féach Jensen et al. (2008) , Sharma, Hofman, and Watts (2015) , agus Sharma, Hofman, and Watts (2016) .
Maidir le turgnaimh nádúrtha, soláthraíonn Dunning (2012) cóireáil tosaigh, leabhar-fada le go leor samplaí. I gcás dearcadh skeptical ar thurgnaimh nádúrtha, féach Rosenzweig and Wolpin (2000) (eacnamaíocht) nó Sekhon and Titiunik (2012) (eolaíocht pholaitiúil). Deaton (2010) agus Heckman and Urzúa (2010) gur féidir díriú ar thurgnaimh nádúrtha taighdeoirí a threorú chun díriú ar mheastachán a dhéanamh ar éifeachtaí cúiseacha nach bhfuil tábhachtach; Imbens (2010) na hargóintí seo le dearcadh níos dóchasach ar luach na dturgnaimh nádúrtha.
Agus tú ag cur síos ar conas a d'fhéadfadh taighdeoir dul ó mheastóireacht a dhéanamh ar an éifeacht atá á dréachtú d'éifeacht na seirbhíse, bhí mé ag cur síos ar theicníc ar a dtugtar athróg ionstraimí . Imbens and Rubin (2015) , ina gcaibidlí 23 agus 24, réamhrá isteach agus úsáid a bhaint as an dréachtchrannchur mar shampla. Uaireanta, is é éifeacht na seirbhíse míleata ar chomhlíontóirí an t-éifeacht cúiseach meánchláir (CAcE) agus uaireanta an éifeacht cóireála meán áitiúil (LATE). Sovey and Green (2011) , Angrist and Krueger (2001) , agus Bollen (2012) athbhreithnithe ar úsáid athróg ionstraimí san eolaíocht eacnamaíoch, eacnamaíocht agus socheolaíocht, agus Sovey and Green (2011) "seicliosta léitheora" measúnú a dhéanamh ar staidéir ag baint úsáide as athróga ionstraimí.
Tarlaíonn sé nach raibh an dréacht-chrannchur 1970, i ndáiríre randamach i gceart; bhí difríochtaí beaga ó randamach íon (Fienberg 1971) . Berinsky and Chatfield (2015) nach bhfuil an t-idirdhealú seo tábhachtach go substaintiúil agus an tábhacht a bhaineann le randamachú a rinneadh i gceart a phlé.
Maidir le meaitseáil, féach Stuart (2010) le haghaidh athbhreithniú dóchasach, agus Sekhon (2009) le haghaidh athbhreithnithe doirbh. Le haghaidh níos mó ar meaitseáil mar chineál iascaireachta, féach Ho et al. (2007) . Is minic go bhfuil sé deacair comhoiriún foirfe amháin a aimsiú do gach duine, agus tugann sé seo roinnt casta isteach. Ar dtús, nuair nach bhfuil cluichí cruinn ar fáil, ní mór do thaighdeoirí cinneadh a dhéanamh ar conas an t-achar idir dhá aonad a thomhas agus má tá achar áirithe gar go leor. Éiríonn an dara casta má tá taighdeoirí ag iarraidh go leor cluichí a úsáid i gcás gach cás sa ghrúpa cóireála, ós rud é gur féidir meastacháin níos cruinne a bheith ann. Déantar cur síos mionsonraithe ar an dá cheist seo, chomh maith le daoine eile, i gcaibidil 18 de Imbens and Rubin (2015) . Féach Cuid II de ( ??? ) .
Féach Dehejia and Wahba (1999) le haghaidh sampla ina raibh modhanna comhoiriúnacha in ann meastacháin a dhéanamh cosúil leo siúd ó thurgnamh rialaithe randamach. Ach féach Arceneaux, Gerber, and Green (2006) agus Arceneaux, Gerber, and Green (2010) le haghaidh samplaí nuair a theip ar mhodhanna meaitseála tagarmharc turgnamhach a atáirgeadh.
Rosenbaum (2015) agus Hernán and Robins (2016) comhairle eile chun comparáidí úsáideach a fhionnadh laistigh de fhoinsí sonraí móra.