Tip wieħed ta 'osservazzjoni li mhix inkluża f'dan il-kapitolu huwa l-etnografija. Għal aktar tagħrif dwar l-etnografija fl-ispazji diġitali, ara Boellstorff et al. (2012) , u għal aktar dwar l-etnografija fi spazji mħallta diġitali u fiżiċi, ara Lane (2016) .
M'hemmx definizzjoni konsensiva waħda ta '"dejta kbira", iżda ħafna definizzjonijiet jidhru li jiffukaw fuq "3 Vs": volum, varjetà, u veloċità (eż., Japec et al. (2015) ). Ara De Mauro et al. (2015) għal reviżjoni tad-definizzjonijiet.
L-inklużjoni tiegħi ta 'dejta amministrattiva tal-gvern fil-kategorija ta' dejta kbira hija kemmxejn mhux tas-soltu, għalkemm oħrajn ukoll għamlu dan il-każ, inkluż Legewie (2015) , Connelly et al. (2016) , u Einav and Levin (2014) . Għal aktar tagħrif dwar il-valur tad-data amministrattiva tal-gvern għar-riċerka, ara Card et al. (2010) , Adminstrative Data Taskforce (2012) , u Grusky, Smeeding, and Snipp (2015) .
Għal opinjoni ta 'riċerka amministrattiva minn ġewwa s-sistema statistika tal-gvern, partikolarment l-Uffiċċju taċ-Ċensiment tal-Istati Uniti, ara Jarmin and O'Hara (2016) . Għal trattament tul il-kotba tar-riċerka tar-rekords amministrattivi fl-Istatistika ta 'l-Iżvezja, ara Wallgren and Wallgren (2007) .
Fil-kapitolu, qrajt fil-qosor stħarriġ tradizzjonali bħall-Istħarriġ Soċjali Ġenerali (GSS) ma 'sors tad-dejta tal-midja soċjali bħal Twitter. Għal tqabbil bir-reqqa u bir-reqqa bejn l-istħarriġ tradizzjonali u d-dejta tal-midja soċjali, ara Schober et al. (2016) .
Dawn l-10 karatteristiċi ta 'dejta kbira ġew deskritti f'varjetà ta' modi differenti minn varjetà ta 'awturi differenti. Il-kitba li influwenzat il-ħsieb tiegħi dwar dawn il-kwistjonijiet tinkludi Lazer et al. (2009) , Groves (2011) , Howison, Wiggins, and Crowston (2011) , boyd and Crawford (2012) , SJ Taylor (2013) , Mayer-Schönberger and Cukier (2013) , Golder and Macy (2014) , Ruths and Pfeffer (2014) , Tufekci (2014) , Sampson and Small (2015) , K. Lewis (2015b) , Lazer (2015) , Horton and Tambe (2015) , Japec et al. (2015) , u Goldstone and Lupyan (2016) .
Matul dan il-kapitolu, użajt it-terminu traċċi diġitali , li naħseb li huwa relattivament newtrali. Terminu ieħor popolari għat-traċċi diġitali huwa footprints diġitali (Golder and Macy 2014) , iżda kif jindikaw Hal Abelson, Ken Ledeen u Harry Lewis (2008) , terminu aktar xieraq huwa probabbilment marki tas-swaba 'diġitali . Meta toħloq footprints, taf x'inhu jiġri u l-footprints tiegħek ġeneralment ma jistgħux jiġu ntraċċati lilek personalment. L-istess ma jgħoddx għat-traċċi diġitali tiegħek. Fil-fatt, qed tħalli traċċi l-ħin kollu li għandek għarfien żgħir ħafna. U, għalkemm dawn it-traċċi ma jkollhomx l-isem tiegħek fuqhom, ħafna drabi jistgħu jiġu marbuta lura lilek. Fi kliem ieħor, huma aktar bħal marki tas-swaba ': inviżibbli u personalment identifikabbli.
Għal aktar tagħrif dwar għaliex settijiet ta 'dejta kbar jagħmlu problemi problematiċi statistiċi, ara M. Lin, Lucas, and Shmueli (2013) u McFarland and McFarland (2015) . Dawn il-kwistjonijiet għandhom iwasslu lir-riċerkaturi biex jiffukaw fuq sinifikat prattiku minflok sinifikat statistiku.
Għal aktar tagħrif dwar kif Raj Chetty u l-kollegi kisbu aċċess għar-rekords tat-taxxa, ara Mervis (2014) .
Datoti kbar jistgħu wkoll joħolqu problemi ta 'komputazzjoni li ġeneralment ikunu lil hinn mill-kapaċitajiet ta' kompjuter wieħed. Għalhekk, ir-riċerkaturi li jagħmlu komputazzjonijiet fuq datasets kbar ta 'spiss ixerrdu l-ħidma fuq bosta kompjuters, proċess li kultant jissejjaħ programmazzjoni parallela . Għal introduzzjoni għall-ipprogrammar parallel, b'mod partikolari lingwa msejħa Hadoop, ara Vo and Silvia (2016) .
Meta tikkunsidra data dejjem fuq, huwa importanti li tikkunsidra jekk intix tqabbel l-istess nies eżatti maż-żmien jew jekk intix tqabbel xi grupp li qed jinbidel ta 'nies; ara pereżempju, Diaz et al. (2016) .
Ktieb klassiku dwar miżuri mhux reattivi huwa Webb et al. (1966) . L-eżempji f'dak il-ktieb kienu qabel l-era diġitali, iżda għadhom qed iddawwal. Għal eżempji ta 'nies li jibdlu l-imġiba tagħhom minħabba l-preżenza ta' sorveljanza tal-massa, ara Penney (2016) u Brayne (2014) .
Ir-reattività hija marbuta mill-qrib ma 'dak li r-riċerkaturi jsejħu effetti tad-domanda (Orne 1962; Zizzo 2010) u l-effett Hawthorne (Adair 1984; Levitt and List 2011) .
Għal aktar tagħrif dwar ir-rabta rekord, ara Dunn (1946) u Fellegi and Sunter (1969) (storiċi) u Larsen and Winkler (2014) (moderna). Approċċi simili ġew żviluppati wkoll fix-xjenza tal-kompjuter taħt ismijiet bħal deduplikazzjoni tad-dejta, identifikazzjoni tal-istanza, tqabbil tal-ismijiet, sejbien doppju u sejbien doppju ta 'rekords (Elmagarmid, Ipeirotis, and Verykios 2007) . Hemm ukoll approċċi li jippreservaw il-privatezza biex jirreġistraw rabta li ma teħtieġx it-trażmissjoni ta 'informazzjoni ta' identifikazzjoni personali (Schnell 2013) . Facebook żviluppa wkoll proċess biex jgħaqqad ir-rekords tagħhom mal-imġiba tal-votazzjoni; dan sar biex tevalwa esperiment li ser ngħidilkom dwarhom fil-kapitolu 4 (Bond et al. 2012; Jones et al. 2013) .
Għal aktar dwar il-validità tal-kostruzzjoni, ara l-kapitolu 3 ta ' Shadish, Cook, and Campbell (2001) .
Għal aktar tagħrif dwar id-debacle tar-reġistru tat-tiftix ta 'AOL, ara Ohm (2010) . Jiena nagħti pariri dwar is-sħubijiet mal-kumpaniji u l-gvernijiet fil-kapitolu 4 meta niddeskrivi l-esperimenti. Numru ta 'awturi esprimew tħassib dwar riċerka li tiddependi fuq dejta inaċċessibbli, ara Huberman (2012) u boyd and Crawford (2012) .
Mod wieħed tajjeb għar-riċerkaturi universitarji biex jiksbu aċċess għad-data huwa li taħdem fuq kumpannija bħala intern jew li jżuru riċerkatur. Minbarra d jippermettu aċċess għad-data, dan il-proċess se jgħin ukoll lir-riċerkatur jitgħallmu aktar dwar kif id-data tkun inħolqot, li hija importanti għall-analiżi.
F'termini ta 'aċċess għal data tal-gvern, Mervis (2014) jiddiskuti kif Raj Chetty u l-kollegi kisbu aċċess għar-rekords tat-taxxa użati fir-riċerka tagħhom dwar il-mobbiltà soċjali.
Għal aktar tagħrif dwar l-istorja ta '"rappreżentattività" bħala kunċett, ara Kruskal and Mosteller (1979a) , Kruskal and Mosteller (1979b) , Kruskal and Mosteller (1979c) , u Kruskal and Mosteller (1980) .
Is-sommarji tiegħi tal-ħidma ta 'Snow u x-xogħol ta' Doll u Hill kienu fil-qosor. Għal aktar dwar ix-xogħol ta 'Snow fuq il-kolera, ara Freedman (1991) . Għal aktar tagħrif dwar l-Istudju tat-Tobba Brittaniċi ara Doll et al. (2004) u Keating (2014) .
Ħafna riċerkaturi jkunu sorpriżi li jitgħallmu li għalkemm Doll u Hill ġabru data minn tobba nisa u minn tobba taħt il-35 sena, huma intenzjonalment ma użawx din id-dejta fl-ewwel analiżi tagħhom. Kif sostnew: "Minħabba li l-kanċer tal-pulmun huwa relattivament rari fin-nisa u l-irġiel taħt il-35 sena, x'aktarx ma jinkisbux ċifri utli f'dawn il-gruppi għal xi snin li ġejjin. F'dan ir-rapport preliminari għalaqna l-attenzjoni tagħna għall-irġiel li għandhom 35 sena jew aktar. " Rothman, Gallacher, and Hatch (2013) , li għandu t-titlu provokattiv" Għaliex għandha tiġi evitata rappreżentanza " Rothman, Gallacher, and Hatch (2013) argument aktar ġenerali għall-valur ta ' li joħolqu intenzjonalment data mhux rappreżentattiva.
Ir-rappreżentanza mhux attiva hija problema kbira għar-riċerkaturi u l-gvernijiet li jixtiequ jagħmlu stqarrijiet dwar popolazzjoni sħiħa. Dan huwa inqas ta 'tħassib għall-kumpaniji, li huma tipikament iffukati fuq l-utenti tagħhom. Għal aktar tagħrif dwar kif l-Istatistika L-Olanda tikkunsidra l-kwistjoni ta 'nonrepresentativeness ta' dejta kummerċjali kbira, ara Buelens et al. (2014) .
Għal eżempji ta 'riċerkaturi li jesprimu tħassib dwar in-natura mhux rappreżentattiva ta' sorsi ta 'dejta kbar, ara boyd and Crawford (2012) , K. Lewis (2015b) , u Hargittai (2015) .
Għal paragun aktar dettaljat tal-għanijiet ta 'stħarriġ soċjali u riċerka epidemjoloġika, ara Keiding and Louis (2016) .
Għal aktar tagħrif dwar it-tentattivi biex tuża Twitter biex tagħmel ġeneralizzazzjonijiet barra mill-kampjun dwar il-votanti, speċjalment il-każ mill-elezzjoni Ġermaniża tal-2009, ara Jungherr (2013) u Jungherr (2015) . Sussegwentement għax-xogħol ta ' Tumasjan et al. (2010) riċerkaturi madwar id-dinja użaw metodi fancier - bħalma huma l-użu ta 'analiżi sentimentali biex jiddistingwu bejn sejbiet pożittivi u negattivi tal-partijiet - sabiex itejbu l-abilità tad-dejta Twitter li tbassar varjetà ta' tipi differenti ta 'elezzjonijiet (Gayo-Avello 2013; Jungherr 2015, chap. 7.) . Hekk kif Huberty (2015) ġabar fil-qosor ir-riżultati ta 'dawn it-tentattivi biex ibassar l-elezzjonijiet:
"Il-metodi kollha magħrufa ta 'tbassir ibbażati fuq il-midja soċjali naqsu meta ġew suġġetti għat-talbiet ta' tbassir elettorali veru li tħares 'il quddiem. Dawn in-nuqqasijiet jidhru li huma dovuti għal proprjetajiet fundamentali tal-midja soċjali, aktar milli għal diffikultajiet metodoloġiċi jew algoritmiċi. Fil-qosor, il-midja soċjali ma ', u probabbilment qatt mhu ser, toffri stampa stabbli, imparzjali u rappreżentattiva tal-elettorat; u l-kampjuni ta 'konvenjenza tal-midja soċjali m'għandhomx biżżejjed dejta biex jiffissaw dawn il-problemi post hoc. "
Fil-kapitolu 3, ser niddeskrivi t-teħid ta 'kampjuni u l-istima f'dettall ferm akbar. Anki jekk id-dejta mhix rappreżentattiva, taħt ċerti kundizzjonijiet, jistgħu jiġu peżati biex jipproduċu stimi tajbin.
It-tifrix tas-sistema huwa diffiċli ħafna biex tara minn barra. Madankollu, il-proġett MovieLens (diskuss aktar fil-kapitolu 4) ilu għaddej għal aktar minn 15-il sena minn grupp ta 'riċerka akkademika. Għalhekk, huma setgħu jiddokumentaw u jaqsmu informazzjoni dwar il-mod kif is-sistema evolviet maż-żmien u kif dan jista 'jkollu impatt fuq l-analiżi (Harper and Konstan 2015) .
Għadd ta 'studjużi ffokaw fuq it- Liu, Kliman-Silver, and Mislove (2014) : Liu, Kliman-Silver, and Mislove (2014) u Tufekci (2014) .
Approċċ wieħed biex tiġi ttrattata d-devjazzjoni tal-popolazzjoni huwa li jinħoloq panel ta 'utenti, li jippermetti li r-riċerkaturi jistudjaw l-istess nies maż-żmien, ara Diaz et al. (2016) .
L-ewwel smajt it-terminu "algorithmically confounded" użat minn Jon Kleinberg waqt diskussjoni, imma sfortunatament ma niftakarx meta jew fejn ingħatat it-taħdit. L-ewwel darba li rajt it-terminu stampat kienet Anderson et al. (2015) , li hija diskussjoni interessanti dwar kif l-algoritmi użati mis-siti tad-dating jistgħu jikkomplikaw il-ħila tar-riċerkaturi li jużaw id-dejta minn dawn il-websajts biex jistudjaw il-preferenzi soċjali. Dan it-tħassib tqajjem minn K. Lewis (2015a) bi tweġiba għal Anderson et al. (2014) .
Minbarra l-Facebook, Twitter jirrakkomanda wkoll lin-nies għall-utenti li jsegwu bbażati fuq l-idea ta 'għeluq triadiku; ara Su, Sharma, and Goel (2016) . Allura l-livell ta 'għeluq triadiku f'Tok Twitter huwa taħlita ta' xi tendenza tal-bniedem lejn għeluq triadiku u xi tendenza algoritmika biex tippromwovi l-għeluq triadiku.
Għal aktar dwar il-prestazzjoni - b'mod partikolari l-idea li xi teoriji dwar ix-xjenzi soċjali huma "magni mhux cameras" (jiġifieri, huma jsawru d-dinja aktar milli sempliċement jiddeskrivuha) - ara Mackenzie (2008) .
L-aġenziji tal-istatistika governattivi jsejħu editjar tad-dejta statistika għat - tindif tad-data De Waal, Puts, and Daas (2014) jiddeskrivu tekniki statistiċi ta 'editjar tad-dejta żviluppati għal data ta' stħarriġ u jeżaminaw safejn huma applikabbli għal sorsi kbar ta 'data, u Puts, Daas, and Waal (2015) jippreżentaw uħud mill-istess ideat għal udjenza aktar ġenerali.
Għal ħarsa ġenerali tal-bots soċjali, ara Ferrara et al. (2016) . Għal xi eżempji ta 'studji ffukati fuq is-sejba ta' spam fuq Twitter, ara Clark et al. (2016) u Chu et al. (2012) . Finalment, Subrahmanian et al. (2016) iddeskrivi r-riżultati tad-DARPA Twitter Bot Challenge, kollaborazzjoni massiva mfassla biex tqabbel approċċi għall-iskoperta ta 'robots fuq Twitter.
Ohm (2015) jirrevedi riċerka preċedenti dwar l-idea ta 'informazzjoni sensittiva u joffri test ta' ħafna fatturi. L-erba 'fatturi li jipproponi huma l-kobor tal-ħsara, il-probabbiltà ta' ħsara, il-preżenza ta 'relazzjoni kunfidenzjali, u jekk ir-riskju jirriflettix tħassib maġġuri.
L-istudju tax-taxis ta 'Farber fi New York kien ibbażat fuq studju preċedenti minn Camerer et al. (1997) li użaw tliet kampjuni ta 'konvenjenza differenti ta' folji tal-vjaġġ tal-karta. Dan l-istudju ta 'qabel sab li s-sewwieqa kienu jidhru li huma dawk li jaqilgħu l-mira: ħadmu inqas fil-ġranet fejn il-pagi tagħhom kienu ogħla.
Fix-xogħol sussegwenti, King u kollegi esplorati aktar iċ-ċensura onlajn fiċ-Ċina (King, Pan, and Roberts 2014, [@king_how_2016] ) . Għal approċċ relatat biex titkejjel iċ-ċensura onlajn fiċ-Ċina, ara Bamman, O'Connor, and Smith (2012) . Għal aktar tagħrif dwar metodi ta 'statistika bħal dak użat King, Pan, and Roberts (2013) biex jistma l-sentiment tal-11-il miljun kariga, ara Hopkins and King (2010) . Għal aktar dwar tagħlim sorveljat, ara James et al. (2013) (inqas tekniku) u Hastie, Tibshirani, and Friedman (2009) (aktar tekniku).
It-tbassir huwa parti kbira tax-xjenza tad-dejta industrijali (Mayer-Schönberger and Cukier 2013; Provost and Fawcett 2013) . Tip wieħed ta 'tbassir li normalment isir mir-riċerkaturi soċjali huwa t-tbassir demografiku; ara, pereżempju, Raftery et al. (2012) .
Google Flu Trends ma kienx l-ewwel proġett li juża data ta 'tfittxija għal prevalenza ta' influwenza ta 'nowcast. Fil-fatt, riċerkaturi fl-Istati Uniti (Polgreen et al. 2008; Ginsberg et al. 2009) u l-Iżvezja (Hulth, Rydevik, and Linde 2009) sabu li ċerti termini ta 'tfittxija (eż. data qabel ma ġiet rilaxxata. Sussegwentement ħafna, bosta proġetti oħra ppruvaw jużaw dejta ta 'traċċa diġitali għas-sejbien tas-sorveljanza tal-mard; ara Althouse et al. (2015) għal reviżjoni.
Minbarra l-użu ta 'data traċċa diġitali biex jitbassru r-riżultati tas-saħħa, kien hemm ukoll ammont kbir ta' xogħol bl-użu ta 'data Twitter biex jitbassru r-riżultati tal-elezzjoni; għal reviżjonijiet ara Gayo-Avello (2011) , Gayo-Avello (2013) , Jungherr (2015) (kapitolu 7), u Huberty (2015) . It-tixrid ta 'indikaturi ekonomiċi, bħall-prodott gross domestiku (PGD), huwa wkoll komuni fil-banek ċentrali, ara Bańbura et al. (2013) . tabella 2.8 tinkludi ftit eżempji ta 'studji li jużaw xi tip ta' traċċa diġitali biex jipprevedu xi tip ta 'avveniment fid-dinja.
Traċċa diġitali | Eżitu | Ċitazzjoni |
---|---|---|
Id-dħul mill-uffiċċju tal-kaxxa tal-films fl-Istati Uniti | Asur and Huberman (2010) | |
Fittex zkuk | Bejgħ ta 'films, mużika, kotba u video games fl-Istati Uniti | Goel et al. (2010) |
Dow Jones Industrial Average (ishma tas-suq Amerikan) | Bollen, Mao, and Zeng (2011) | |
Midja soċjali u reġistri ta 'tfittxija | Stħarriġ ta 'sentiment tal-investituri u swieq tal-ishma fl-Istati Uniti, ir-Renju Unit, il-Kanada u ċ-Ċina | Mao et al. (2015) |
Fittex zkuk | Prevalenza tad-Deni Dengue f'Singapor u f'Bangkok | Althouse, Ng, and Cummings (2011) |
Fl-aħħarnett, Jon Kleinberg u l-kollegi (2015) enfasizzaw li l-problemi ta 'previżjoni jaqgħu f'żewġ kategoriji sottili u differenti u li x-xjenzati soċjali kellhom it-tendenza li jiffukaw fuq waħda u jinjoraw lill-oħra. Immaġina produttur wieħed ta 'politika, nagħmel sejħa lil Anna tagħha, li qed tiffaċċja nixfa u trid tiddeċiedi jekk tikrix shaman biex tagħmel żfin tax-xita biex iżżid iċ-ċans ta' xita. Maker ta 'politika ieħor, nagħmel sejħa lil Betty tagħha, trid tiddeċiedi jekk għandhiex tieħu umbrella biex taħdem biex tevita li tibqa' mxarrba fuq il-mod tad-dar. Kemm Anna kif ukoll Betty jistgħu jieħdu deċiżjoni aħjar jekk jifhmu t-temp, iżda għandhom ikunu jafu affarijiet differenti. Anna għandha bżonn tifhem jekk ix-xita tagħmel ix-xita. Betty, min-naħa l-oħra, m'għandux għalfejn jifhem xi ħaġa dwar il-kawżalità; hi biss teħtieġ previżjoni preċiża. Ir-riċerkaturi soċjali ħafna drabi jiffukaw fuq il-problemi bħal dik li jiffaċċjaw Anna-li Kleinberg u l-kollegi jsejħu problemi ta 'politika "simili għan-xita" minħabba li jinvolvu kwistjonijiet ta' kawżalità. Mistoqsijiet bħal dawk iffaċċjati minn Betty - li Kleinberg u l-kollegi jsejħu "problemi ta 'politika" bħala "umbrella" - jistgħu jkunu pjuttost importanti wkoll, iżda rċevew ħafna inqas attenzjoni mir-riċerkaturi soċjali.
Il-ġurnal Political Science PS kellu simpożju dwar dejta kbira, inferenza kawżali, u teorija formali, u Clark and Golder (2015) jiġbor fil-qosor kull kontribuzzjoni. Il-Ġurnal Proċedimenti tal-Akkademja Nazzjonali tax-Xjenzi tal-Istati Uniti tal-Amerika kellhom simpożju dwar inferenza kawżali u dejta kbira, u Shiffrin (2016) jiġbor fil-qosor kull kontribuzzjoni. Għal approċċi ta 'tagħlim tal-magni li jippruvaw jiskopru awtomatikament esperimenti naturali ġewwa sorsi ta' dejta kbar, ara Jensen et al. (2008) , Sharma, Hofman, and Watts (2015) , u Sharma, Hofman, and Watts (2016) .
F'termini ta 'esperimenti naturali, Dunning (2012) jipprovdi trattament introduttorju ta' tul ta 'ktieb b'ħafna eżempji. Għal perspettiva xettika ta 'esperimenti naturali, ara Rosenzweig and Wolpin (2000) (ekonomija) jew Sekhon and Titiunik (2012) (xjenza politika). Deaton (2010) u Heckman and Urzúa (2010) jargumentaw li l-iffukar fuq esperimenti naturali jista 'jwassal li r-riċerkaturi jiffukaw fuq stima ta' effetti kawżali mhux importanti; Imbens (2010) jidentifika dawn l-argumenti b'viżjoni aktar ottimista tal-valur ta 'esperimenti naturali.
Meta tiddeskrivi kif riċerkatur jista 'jmur mill-istima ta' l-effett li jkun imfassal għall-effett tas-servizz, kont qed tiddeskrivi teknika msejħa varjabbli strumentali . Imbens and Rubin (2015) , fil-kapitoli 23 u 24 tagħhom, jipprovdu introduzzjoni u jużaw l-abbozz tal-lotterija bħala eżempju. L-effett tas-servizz militari fuq dawk li jissodisfaw xi drabi jissejjaħ l-effett kawżali medju (CAcE) u kultant l-effett medju lokali tat-trattament (LATE). Sovey and Green (2011) , Angrist and Krueger (2001) , u Bollen (2012) joffru reviżjonijiet dwar l-użu ta 'varjabbli strumentali fix-xjenza politika, ekonomija u soċjoloġija, u Sovey and Green (2011) jipprovdi "lista ta' kontroll tal-qarrej" għal l-evalwazzjoni ta 'studji li jużaw varjabbli strumentali.
Jirriżulta li l-lotterija tal-abbozz tal-1970 ma kinitx, fil-fatt, randomised kif suppost; kien hemm devjazzjonijiet żgħar minn każwali aleatorju (Fienberg 1971) . Berinsky and Chatfield (2015) jargumentaw li din id-devjazzjoni żgħira mhijiex sostanzjalment importanti u tiddiskuti l-importanza ta 'randomisation imwettqa sewwa.
F'termini ta 'tqabbil, ara Stuart (2010) għal reviżjoni ottimista, u Sekhon (2009) għal reviżjoni pessimista. Għal aktar dwar tqabbil bħala tip ta 'żbir, ara Ho et al. (2007) . Is-sejba ta 'logħba waħda perfetta għal kull persuna spiss tkun diffiċli, u dan jintroduċi għadd ta' kumplessitajiet. L-ewwel, meta l-logħbiet eżatti mhumiex disponibbli, ir-riċerkaturi jridu jiddeċiedu kif ikejlu d-distanza bejn iż-żewġ unitajiet u jekk distanza partikolari hi viċina biżżejjed. Jirriżulta t-tieni kumplessità jekk ir-riċerkaturi jixtiequ jużaw logħbiet multipli għal kull każ fil-grupp ta 'trattament, peress li dan jista' jwassal għal estimi aktar preċiżi. Dawn iż-żewġ kwistjonijiet, kif ukoll oħrajn, huma deskritti fid-dettall fil-kapitolu 18 ta ' Imbens and Rubin (2015) . Ara wkoll il-Parti II ta ' ( ??? ) .
Ara Dehejia and Wahba (1999) għal eżempju fejn il-metodi ta 'tqabbil kienu kapaċi jipproduċu estimi simili għal dawk minn esperiment ikkontrollat randomizzat. Imma ara Arceneaux, Gerber, and Green (2006) u Arceneaux, Gerber, and Green (2010) għal eżempji fejn il-metodi ta 'tqabbil naqsu milli jirriproduċu benchmark sperimentali.
Rosenbaum (2015) u Hernán and Robins (2016) joffru parir ieħor biex jiskopru paraguni utli fi sorsi ta 'dejta kbar.