Usa ka matang sa pag-obserbar nga wala mahilakip niini nga kapitulo mao ang ethnography. Alang sa dugang bahin sa ethnography sa digital nga mga luna, tan-awa ang Boellstorff et al. (2012) , ug alang sa dugang sa etnograpiya sa nagkalainlain nga digital ug pisikal nga mga luna, tan-awa ang Lane (2016) .
Walay bisan usa ka kasabutan sa pagsabot sa "dagkong datos," apan daghang mga kahulogan ang nagtumong sa "3 Vs": gidaghanon, gidaghanon, ug gilay-on (pananglitan, Japec et al. (2015) ). Tan-awa ang De Mauro et al. (2015) alang sa pagrepaso sa mga kahulugan.
Ang akong paglakip sa datos sa pagdumala sa gobyerno sa kategoriya sa dagkong datos usa ka talagsaon nga talagsaon, bisan ang uban usab naghimo niini nga kaso, lakip ang Legewie (2015) , Connelly et al. (2016) , ug Einav and Levin (2014) . Alang sa dugang mahitungod sa bili sa data sa pagdumala sa gobyerno alang sa panukiduki, tan-awa ang Card et al. (2010) , Adminstrative Data Taskforce (2012) , ug Grusky, Smeeding, and Snipp (2015) .
Alang sa panglantaw sa administratibong panukiduki gikan sa sulod sa statistical system sa kagamhanan, ilabi na sa US Census Bureau, tan-awa ang Jarmin and O'Hara (2016) . Alang sa usa ka libro nga gitas-on nga pagtambal sa panukiduki sa rekord sa administratibo sa Statistics Sweden, tan-awa ang Wallgren and Wallgren (2007) .
Sa kapitulo, gitandi nako ang usa ka tradisyonal nga survey sama sa General Social Survey (GSS) nga adunay social media data source sama sa Twitter. Alang sa bug-os ug maampingong pagtandi tali sa mga tradisyonal nga surbi ug data sa social media, tan-awa ang Schober et al. (2016) .
Kining 10 nga mga kinaiya sa dagkong mga datos gihulagway sa nagkalainlain nga mga pamaagi sa nagkalainlain nga mga tigsulat. Ang sinulat nga nakaimpluwensya sa akong panghunahuna sa mga isyu naglakip sa Lazer et al. (2009) , Groves (2011) , Howison, Wiggins, and Crowston (2011) , boyd and Crawford (2012) , SJ Taylor (2013) , Mayer-Schönberger and Cukier (2013) , Golder and Macy (2014) , Ruths and Pfeffer (2014) , Tufekci (2014) , Sampson and Small (2015) , K. Lewis (2015b) , Lazer (2015) , Horton and Tambe (2015) , Japec et al. (2015) , ug Goldstone and Lupyan (2016) .
Sa tibuok niini nga kapitulo, gigamit nako ang termino nga digital nga mga timaan , nga sa akong hunahuna medyo neyutral. Ang laing popular nga termino alang sa mga digital nga timaan mao ang digital footprints (Golder and Macy 2014) , apan ingon sa gipunting nga Hal Abelson, Ken Ledeen, ug Harry Lewis (2008) , ang usa ka mas haom nga pulong tingali mga digital fingerprints . Kon maghimo ka sa mga tunob sa tiil, nahibal-an nimo kung unsay nanghitabo ug ang imong mga footprints dili masabtan sa imong kaugalingon. Dili usab kini tinuod alang sa imong digital nga agianan. Sa pagkatinuod, nagbilin ka og mga timailhan nga halos wala ka'y kahibalo. Ug, bisan tuod kining mga timaan walay imong ngalan niini, sila sagad nga nalambigit kanimo. Sa laing pagkasulti, sila susama sa mga fingerprint: dili makita ug personal nga pag-ila.
Alang sa dugang kon ngano nga ang dako nga mga dataset naghatag og problema sa istatistika, tan-awa ang M. Lin, Lucas, and Shmueli (2013) ug McFarland and McFarland (2015) . Ang kini nga mga isyu kinahanglan nga magdala sa mga tigdukiduki sa pag-focus sa praktikal nga kahulogan kay sa statistical significance.
Alang sa dugang kabahin kung giunsa ni Raj Chetty ug mga kaubanan nga nakakuha sa access sa tax records, tan-awa ang Mervis (2014) .
Ang dagko nga mga dataset mahimo usab nga makahimo og mga problema sa komputasyon nga sa kasagaran dili mahimo sa usa ka computer. Busa, ang mga tigdukiduki nga naghimo sa mga pag-compute sa dagkong mga dataset kasagarang nagpakatap sa buhat sa daghang kompyuter, usa ka proseso usahay gitawag nga parallel programming . Alang sa usa ka pasiuna sa susamang programming, sa partikular usa ka pinulongan nga gitawag ug Hadoop, tan-awa ang Vo and Silvia (2016) .
Sa pagkonsiderar kanunay sa mga datos, importante nga hunahunaon kung imo ba nga gitandi ang tukma nga mga tawo sa paglabay sa panahon o kon imong gitandi ang pipila nga nag-usab nga grupo sa mga tawo; tan-awa alang sa panig-ingnan, Diaz et al. (2016) .
Ang usa ka klasiko nga basahon sa dili aktibo nga mga lakang mao ang Webb et al. (1966) . Ang mga pananglitan sa maong libro nag-una sa digital nga edad, apan kini nagpakita pa gihapon. Alang sa mga pananglitan sa mga tawo nga nag-usab sa ilang kinaiya tungod sa presensya sa mass surveillance, tan-awa ang Penney (2016) ug Brayne (2014) .
Ang reaktibo dunay kalambigitan sa gitawag sa mga tigdukiduki nga mga panginahanglan sa panginahanglan (Orne 1962; Zizzo 2010) ug ang epekto sa Hawthorne (Adair 1984; Levitt and List 2011) .
Alang sa dugang nga mga linkage, tan-awa ang Dunn (1946) ug Fellegi and Sunter (1969) (makasaysayan) ug Larsen and Winkler (2014) (moderno). Ang susamang mga pamaagi usab gipalambo sa computer science ubos sa mga ngalan sama sa data deduplication, pananglitan nga pag-ila, pagkapili sa ngalan, duplicate detection, ug duplicate detection detection (Elmagarmid, Ipeirotis, and Verykios 2007) . Anaa usab ang mga pamaagi sa pagpreserba sa pribasiya sa pagrekord sa pag-link nga wala magkinahanglan sa pagpadala sa personal nga pag-ila nga impormasyon (Schnell 2013) . Ang Facebook usab nagpalambo og usa ka proseso sa pag-link sa ilang mga rekord sa pagboto nga kinaiya; gihimo kini aron mahibal-an ang usa ka eksperimento nga akong isulti kanimo mahitungod sa kapitulo 4 (Bond et al. 2012; Jones et al. 2013) .
Alang sa dugang sa pagtukod sa balido, tan-awa ang kapitulo 3 sa Shadish, Cook, and Campbell (2001) .
Alang sa dugang bahin sa debate sa pagpangita sa AOL, tan-awa ang Ohm (2010) . Naghatag ko og tambag mahitungod sa pagpakig-uban sa mga kompanya ug sa mga gobyerno sa kapitulo 4 sa dihang ako naghulagway sa mga eksperimento. Ang ubay-ubay nga mga tagsulat nagpahayag kabalaka bahin sa panukiduki nga nagasalig sa dili ma-akses nga data, tan-awa ang Huberman (2012) ug boyd and Crawford (2012) .
Usa ka maayo nga paagi alang sa unibersidad mga tigdukiduki sa pag-angkon sa data access mao ang sa pagtrabaho sa usa ka kompanya sa ingon nga usa ka intern o visiting tigdukiduki. Dugang pa sa makaabag nga data sa access, kini nga proseso usab sa pagtabang sa mga tigdukiduki nga makakat-on og dugang mahitungod sa kon sa unsang paagi nga ang data sa gibuhat, nga mao ang importante alang sa pagtuki.
Sa natad sa pag-angkon sa access sa data sa gobyerno, ang Mervis (2014) naghisgot kon giunsa ni Raj Chetty ug mga kaubanan nga nakuha ang access sa mga rekord sa buhis nga gigamit sa ilang panukiduki sa social mobility.
Alang sa dugang bahin sa kasaysayan sa "representatibo" isip konsepto, tan-awa ang Kruskal and Mosteller (1979a) , Kruskal and Mosteller (1979b) , Kruskal and Mosteller (1979c) , ug Kruskal and Mosteller (1980) .
Ang akong mga katingbanan sa buhat ni Snow ug sa buhat sa Doll ug Hill mga mubo. Alang sa dugang bahin sa trabaho ni Snow sa kolera, tan-awa ang Freedman (1991) . Alang sa dugang pa sa pagtuon sa British Doctors tan-awa ang Doll et al. (2004) ug Keating (2014) .
Daghang mga tigdukiduki ang makurat nga nahibal-an nga bisan ang Doll ug Hill nakolekta ang mga datos gikan sa mga babaye nga doktor ug gikan sa mga doktor nga ubos sa 35, sila sa tinuyo wala maggamit niini nga datos sa una nilang pagsusi. Sama sa ilang gipangatarongan: "Tungod kay ang kanser sa baga medyo talagsaon diha sa mga babaye ug mga lalaki nga ubos sa 35, ang mapuslanong mga numero dili tingali makuha sa niini nga mga grupo sulod sa pipila ka tuig nga moabut. Niini nga preliminary report nga among gihawanan ang among pagtagad sa mga lalaki nga nag-edad og 35 ug labaw sa tanan. " Rothman, Gallacher, and Hatch (2013) , nga adunay hagit nga titulo nga" Nganong ang representatibo kinahanglan likayan, "paghimo sa usa ka labaw nga kinatibuk-ang argumento alang sa bili sa sa tinuyo nga pagmugna sa dili representasyon nga datos.
Ang dili paghulagway usa ka dakong problema alang sa mga tigdukiduki ug sa mga gobyerno nga buot mohimo og mga pamahayag mahitungod sa tibuok populasyon. Dili kini usa ka kahingawa alang sa mga kompaniya, nga kasagaran naka-focus sa ilang mga tiggamit. Alang sa dugang kon giunsa sa Estadistika sa Netherlands nga giisip ang isyu sa dili paghulagway sa dagkong datos sa negosyo, tan-awa ang Buelens et al. (2014) .
Alang sa mga pananglitan sa mga tigdukiduki nga nagpahayag kabalaka mahitungod sa dili kinatibuk-ang kinaiyahan sa dagkong mga tinubdan sa datos, tan-awa ang boyd and Crawford (2012) , K. Lewis (2015b) , ug Hargittai (2015) .
Alang sa mas detalyado nga pagtandi sa mga tumong sa mga social survey ug epidemiological research, tan-awa ang Keiding and Louis (2016) .
Alang sa dugang kasayuran nga gamiton ang Twitter sa paghimo sa out-of-sample generalizations mahitungod sa mga botante, labi na ang kaso gikan sa 2009 nga Aleman nga piniliay, tan-awa ang Jungherr (2013) ug Jungherr (2015) . Human sa trabaho ni Tumasjan et al. (2010) tigdukiduki sa tibuok kalibutan naggamit sa mga pamaagi nga mas magamit-sama sa paggamit sa pag-usisa sa sentimento sa pag-ila sa positibo ug negatibo nga paghisgut sa mga partido-aron mapalambo ang abilidad sa Twitter data aron pagtag-an sa lainlaing matang sa eleksyon (Gayo-Avello 2013; Jungherr 2015, chap. 7.) . Ania kon giunsa ni Huberty (2015) ang mga resulta sa mga pagsulay sa pagtagna sa mga eleksiyon:
"Ang tanan nga nahibal-an nga mga pamaagi sa pagpanagna nga nakabase sa social media napakyas sa dihang gipailalom sa mga gipangayo sa tinuod nga pasiuna nga pagtan-aw sa eleksyon. Kining mga kapakyasan mora'g tungod sa sukaranan nga mga kabtangan sa social media, kay sa mga suliran sa metodolohikal o algorithm. Sa laktud, ang sosyal nga media dili, ug tingali dili gayud, naghatag sa usa ka lig-on, dili mapihigon, hulagway nga hulagway sa mga botante; ug kasayon nga mga sampol sa social media kulang ang kasayuran aron ayuhon ang mga problema post hoc. "
Sa kapitulo 3, akong ihulagway ang sampling ug pagbana-bana sa mas dako nga detalye. Bisan kon ang datos dili representante, ubos sa piho nga mga kondisyon, sila mahimong timbang aron makahatag og maayo nga pagbanabana.
Ang drift sa sistema lisud kaayo nga makita gikan sa gawas. Bisan pa, ang proyekto sa MovieLens (gihisgutan sa dugang sa kapitulo 4) nahitabo sulod sa kapin sa 15 ka tuig pinaagi sa usa ka grupo sa paniksik sa akademiko. Sa ingon, sila nakahimo sa pag dokumento ug pagpaambit sa kasayuran mahitungod sa paagi nga ang sistema nag-uswag sa paglabay sa panahon ug kung unsa kini mahimo nga maka-epekto sa pagtuki (Harper and Konstan 2015) .
Daghang mga eskolar ang nagtutok sa pagtadlas sa Twitter: Liu, Kliman-Silver, and Mislove (2014) ug Tufekci (2014) .
Ang usa ka pamaagi sa pagsagubang sa pag-uswag sa populasyon mao ang paghimo og usa ka grupo sa mga tiggamit, nga nagtugot sa mga tigdukiduki nga magtuon sa sama nga mga tawo sa paglabay sa panahon, tan-awa ang Diaz et al. (2016) .
Una nakong nadungog ang termino nga "gilibug sa algorithm" nga gigamit ni Jon Kleinberg sa usa ka pakigpulong, apan sa kasubo wala ko mahinumdum kung kanus-a o diin ang pakigpulong gihatag. Sa unang higayon nga akong nakita ang termino nga giimprinta anaa sa Anderson et al. (2015) , nga usa ka makapaikag nga paghisgot kung giunsa nga ang mga algorithm nga gigamit sa mga site sa pagpakigdeyt makapakomplikado sa abilidad sa mga tigdukiduki sa paggamit sa datos gikan niini nga mga website aron pagtuon sa mga gusto sa katilingban. Kini nga kabalaka gipatungha ni K. Lewis (2015a) isip tubag sa Anderson et al. (2014) .
Dugang pa sa Facebook, Twitter usab nagsugyot ang mga tawo alang sa mga tiggamit nga mosunod base sa ideya sa pagsira sa triad; tan-awa ang Su, Sharma, and Goel (2016) . Busa ang lebel sa triad nga pagsirado sa Twitter usa ka kombinasyon sa pipila ka tawhanong kalagmitan ngadto sa pagsira sa triad ug ang uban nga algorithmic nga kalagmitan sa pagpalambo sa triad nga pagsira.
Alang sa dugang sa pagpakita-sa partikular nga ideya nga ang pipila ka mga teoriya sa social science mao ang "mga makina nga dili mga kamera" (ie, gihulma nila ang kalibutan kay sa paghulagway niini) -see Mackenzie (2008) .
Ang mga ahensya sa statistical nga mga ahensya nagtawag sa data paglimpyo sa statistical data nga pag-usab . Gihubit sa De Waal, Puts, and Daas (2014) ang mga pamaagi sa pag-edit sa statistical data nga gihimo alang sa mga datos sa pagsurbi ug pagsusi sa gidak-on kung asa kini magamit sa dagkong tinubdan sa datos, ug ang Puts, Daas, and Waal (2015) usa ka mas heneral nga mamiminaw.
Alang sa kinatibuk-ang panglantaw sa mga social bots, tan-awa ang Ferrara et al. (2016) . Alang sa pipila ka mga pananglitan sa pagtuon nga naka-focus sa pagpangita sa spam sa Twitter, tan-awa ang Clark et al. (2016) ug Chu et al. (2012) . Sa katapusan, ang Subrahmanian et al. (2016) paghulagway sa mga resulta sa DARPA Twitter Bot Challenge, usa ka mass collaboration nga gidisenyo aron itandi ang mga pamaagi sa pag-ila sa mga bot sa Twitter.
Ohm (2015) magribyu sa sayo nga panukiduki mahitungod sa ideya sa sensitibo nga impormasyon ug nagtanyag og usa ka multi-factor test. Ang upat ka mga butang nga iyang gisugyot mao ang kadako sa kadaot, ang kalagmitan nga makadaot, ang presensya sa usa ka confidential nga relasyon, ug kung ang risgo nagpakita sa mayor nga mga kabalaka.
Ang pagtuon sa mga taxi sa Farber sa New York gibase sa usa ka pagtuon sa una pa sa Camerer et al. (1997) nga naggamit sa tulo ka nagkalainlaing kasarang nga mga sampol sa papel nga mga panid sa papel. Nakita niining sayo nga pagtuon nga ang mga drayber daw nahimong mga nakaangkon sa target: sila wala kaayo magtrabaho sa mga adlaw nga mas taas ang suholan.
Sa sunod nga buhat, ang Hari ug mga kaubanan dugang nga nagsuhid sa online nga censorship sa China (King, Pan, and Roberts 2014, [@king_how_2016] ) . Alang sa usa ka susama nga pamaagi sa pagsukod sa online censorship sa China, tan-awa ang Bamman, O'Connor, and Smith (2012) . Alang sa dugang sa statistical methods sama sa usa nga gigamit sa King, Pan, and Roberts (2013) sa pagbanabana sa sentimento sa 11 ka milyon nga mga poste, tan-awa ang Hopkins and King (2010) . Alang sa dugang sa supervised learning, tan-awa ang James et al. (2013) (dili teknikal) ug Hastie, Tibshirani, and Friedman (2009) (mas teknikal).
Ang pagpanagna usa ka dakong bahin sa siyensiya sa industriya sa impormasyon (Mayer-Schönberger and Cukier 2013; Provost and Fawcett 2013) . Ang usa ka matang sa pagpanagna nga sagad gihimo sa mga social nga tigdukiduki mao ang pagtagna sa demograpiya; tan-awa, pananglitan, Raftery et al. (2012) .
Ang Google Flu Trends dili mao ang una nga proyekto nga maggamit sa datos sa pagpangita sa karon nga pagsabwag sa influenza. Sa pagkatinuod, ang mga tigdukiduki sa Estados Unidos (Polgreen et al. 2008; Ginsberg et al. 2009) ug Sweden (Hulth, Rydevik, and Linde 2009) nakakaplag nga ang pipila ka mga termino alang sa pagpangita (pananglitan, "flu" data sa wala pa kini gibuhian. Human sa daghan, daghang uban pang mga proyekto ang naningkamot sa paggamit sa mga datos sa digital nga pagsubay alang sa detection sa sakit nga pagsusi; tan-awa ang Althouse et al. (2015) alang sa usa ka pagrepaso.
Gawas pa sa paggamit sa digital nga datos aron mahibal-an ang mga resulta sa panglawas, aduna usab usa ka dakong kantidad sa trabaho nga gigamit ang data sa Twitter aron pagtag-an sa mga resulta sa piniliay; alang sa mga review makita ang Gayo-Avello (2011) , Gayo-Avello (2013) , Jungherr (2015) (kapitulo 7), ug Huberty (2015) . Ang pagtan-aw sa mga indikasyon sa ekonomiya, sama sa gross domestic product (GDP), komon usab sa mga sentral nga bangko, tan-awa ang Bańbura et al. (2013) . Ang lamesa 2.8 naglakip sa pipila ka mga pananglitan sa mga pagtuon nga naggamit sa usa ka matang sa digital nga pagsubay aron sa pagtagna sa usa ka matang sa panghitabo sa kalibutan.
Digital pagsubay | Resulta | Citation |
---|---|---|
Ang kita sa Box office sa mga sine sa US | Asur and Huberman (2010) | |
Pangita mga logs | Pagbaligya sa mga salida, musika, libro, ug mga dula sa video sa US | Goel et al. (2010) |
Dow Jones Industrial Average (US stock market) | Bollen, Mao, and Zeng (2011) | |
Social media ug mga search logs | Mga pagsusi sa sentimyento sa mga mamumuhunan ug mga merkado sa stock sa Estados Unidos, United Kingdom, Canada, ug China | Mao et al. (2015) |
Pangita mga logs | Pagkalapnag sa Dengue Fever sa Singapore ug Bangkok | Althouse, Ng, and Cummings (2011) |
Sa katapusan, si Jon Kleinberg ug mga kaubanan (2015) nagpunting nga ang mga suliran sa pag-usisa nahulog ngadto sa duha ka, tinuud nga nagkalainlain nga mga kategoriya ug ang mga sosyal nga mga siyentipiko kanunay nga nag-focus sa usa ug wala magtagad sa lain. Hunahunaa ang usa ka magbubuhat sa palisiya, tawgon ko siya nga si Anna, nga nag-atubang sa usa ka hulaw ug kinahanglang modesisyon kon mosuhol ba og usa ka salamangkero aron sa pagbuhat og usa ka sayaw sa ulan aron sa pagdugang sa kahigayunan sa pag-ulan. Laing magbubuhat sa palisiya, tawgon ko siya nga si Betty, kinahanglang modesisyon nga magdala og payong aron magtrabaho aron malikayan ang basa sa dalan pauli. Si Anna ug si Betty makahimo sa usa ka mas maayo nga desisyon kon sila makasabut sa panahon, apan sila kinahanglan mahibalo sa lainlaing mga butang. Kinahanglan nga sabton ni Anna kung ang ulan nga sayaw maoy hinungdan sa ulan. Sa laing bahin, si Betty dili kinahanglan nga masabtan ang bisan unsang butang mahitungod sa hinungdan; siya nagkinahanglan lamang og tukmang forecast. Ang mga tigdukiduki sa sosyudad kasagaran nagpunting sa mga suliran sama sa usa nga giatubang ni Anna-nga ang gitawag ni Kleinberg ug mga kaubanan gitawag nga mga problema sa polisiya nga "sama sa ulan nga sayaw"-tungod kay kini naglakip sa mga pangutana sa hinungdan. Ang mga pangutana sama sa usa nga giatubang ni Betty-nga ang gitawag ni Kleinberg ug mga kaubanan nga gitawag og "payong-sama" nga mga suliran sa palisiya-mahimong importante usab, apan nakadawat og dili kaayo pagtagad gikan sa mga tigdukiduki sa katilingban.
Ang journal PS Political Science adunay usa ka simposyum sa dagkong datos, hinungdan nga panghunahuna, ug pormal nga teorya, ug ang Clark and Golder (2015) nagsumaryo sa matag kontribusyon. Ang magasin nga Proceedings sa National Academy of Sciences sa United States of America adunay usa ka simposyum sa kasaypanan nga hinungdan ug dako nga data, ug ang Shiffrin (2016) nagsumaryo sa matag kontribusyon. Alang sa mga pamaagi sa pagkat-on sa makina nga nagsulay sa awtomatik nga pagkaplag sa natural nga mga eksperimento sulod sa dagkong mga tinubdan sa datos, tan-awa ang Jensen et al. (2008) , Sharma, Hofman, and Watts (2015) , ug Sharma, Hofman, and Watts (2016) .
Sa natad sa mga natural nga mga eksperimento, ang Dunning (2012) naghatag og pasiuna, libro-length nga pagtambal nga adunay daghang mga ehemplo. Alang sa maduhaduhaon nga panglantaw sa natural nga mga eksperimento, tan-awa ang Rosenzweig and Wolpin (2000) (ekonomiya) o Sekhon and Titiunik (2012) (siyensiya sa politika). Deaton (2010) ug Heckman and Urzúa (2010) nangatarongan nga ang pag-focus sa mga natural nga mga eksperimento mahimong magdala sa mga tigdukiduki sa pag-focus sa pagbana-bana sa mga dili mahinungdanon nga mga epekto sa mga epekto; Imbens (2010) niini nga mga argumento nga adunay mas malaumon nga panglantaw sa bili sa natural nga mga eksperimento.
Sa dihang gihulagway kung unsa ang mahimo sa usa ka tigdukiduki gikan sa pagbana-bana sa epekto nga gi-draft ngadto sa epekto sa pag-alagad, naghulagway ako sa usa ka pamaagi nga gitawag nga mga instrumento sa instrumento . Imbens and Rubin (2015) , sa ilang mga kapitulo 23 ug 24, naghatag og pasiuna ug naggamit sa draft loterya isip usa ka ehemplo. Ang epekto sa serbisyo sa militar sa mga complitor usahay gitawag nga average complier causation (CAcE) ug usahay ang lokal nga average treatment effect (LATE). Sovey and Green (2011) , Angrist and Krueger (2001) , ug Bollen (2012) nagtanyag sa mga pagsusi sa paggamit sa mga variable nga instrumental sa politikanhong siyensiya, ekonomiya, ug sosyolohiya, ug Sovey and Green (2011) naghatag og "checklist sa magbabasa" alang sa pag-evaluate sa mga pagtuon gamit ang mga variable sa instrumental.
Gipanghimakak nga ang 1970 draft loterya dili, sa pagkatinuod tukmang pagkapili; dihay gagmay nga mga pagtipas gikan sa purpura nga pagkadali (Fienberg 1971) . Berinsky and Chatfield (2015) nangatarungan nga kining gamay nga pagtipas dili mahinungdanon kaayo ug hisgutan ang kaimportante sa tukmang gihimo nga randomization.
Sa natad sa pagkapares, tan-awa ang Stuart (2010) alang sa positibo nga pagrepaso, ug Sekhon (2009) alang sa usa ka pessimistic review. Alang sa dugang sa pagparis isip usa ka matang sa pagpul-ong, tan-awa ang Ho et al. (2007) . Ang pagpangita sa usa ka hingpit nga tugma alang sa matag tawo kasagaran lisud, ug kini nagpaila sa daghang mga pagkakalibutanon. Una, kon wala ang eksaktong mga tugma, ang mga tigdukiduki kinahanglang modesisyon unsaon pagsukod ang distansya tali sa duha ka mga yunit ug kon ang gilay-on nga gilay-on duol na. Ang usa ka ikaduha nga komplikado motumaw kung ang mga tigdukiduki gusto nga mogamit og daghang mga posporo alang sa matag kaso sa grupo sa pagtambal, tungod kay kini mahimong mosangpot sa mas tukma nga mga pagbanabana. Ang duha niini nga mga isyu, maingon man ang uban, gihulagway sa detalye sa kapitulo 18 sa Imbens and Rubin (2015) . Tan-awa usab ang Bahin II sa ( ??? ) .
Tan-awa ang Dehejia and Wahba (1999) alang sa usa ka panig-ingnan diin ang mga pamaagi sa pagtutugma nakahimo og mga pagbanabana susama sa gikan sa usa ka randomized controlled experiment. Apan, tan-awa ang Arceneaux, Gerber, and Green (2006) ug Arceneaux, Gerber, and Green (2010) alang sa mga pananglitan diin ang mga paagi sa pagparehas napakyas sa paghimo sa usa ka benchmark sa eksperimento.
Rosenbaum (2015) ug Hernán and Robins (2016) nagtanyag og laing tambag alang sa pagdiskobre sa mapuslanong pagtandi sa sulod sa dagkong tinubdan sa datos.