Энэ бүлэгт ороогүй нэг төрлийн ажиглалт бол угсаатны зүй. Дижитал зайнд угсаатны зүйн талаар дэлгэрэнгүй Boellstorff et al. (2012) , холимог тоон болон физик орон зайд угсаатны зүйн талаар илүү ихийг олж авахын тулд Lane (2016) үзнэ үү.
"Том өгөгдөл" гэсэн ганцхан зөвшилцлийн тодорхойлолт байдаггүй боловч олон тодорхойлолт нь "3 V" -д анхаарлаа төвлөрч байгаа мэт санагддаг: хэмжээ, төрөл, хурд (жишээ нь Japec et al. (2015) ). De Mauro et al. (2015) тодорхойлолтын тоймыг харна уу.
Томоохон өгөгдлийн төрлөөр засгийн газрын захиргааны мэдээллийг оруулах нь жаахан ер бусын, гэхдээ Legewie (2015) , Connelly et al. (2016) , Einav and Levin (2014) . Судалгааны ажилд зориулсан засгийн газрын захиргааны өгөгдлүүдийн талаар илүү ихийг олж авахын тулд Card et al. (2010) , Grusky, Smeeding, and Snipp (2015) Adminstrative Data Taskforce (2012) Grusky, Smeeding, and Snipp (2015) .
Засгийн газрын статистик тогтолцооны доторх захиргааны судалгаа, ялангуяа АНУ-ын Тооллогын Товчооноос Jarmin and O'Hara (2016) -ыг үзнэ үү. Швед улсын Статистикийн статистикийн мэдээллийн менежментийн номны урт хугацааны эмчилгээний зорилгоор Wallgren and Wallgren (2007) үзнэ үү.
Энэхїї бїлэгт би нийгмийн ерєнхий судалгаа (GSS) гэх мэт уламжлалт судалгааг Твиттер гэх мэт нийгмийн мэдээллийн эх сурвалжтай харьцуулж товчийг харьцуулсан. Уламжлалт судалгаа, нийгмийн мэдээллийн хэрэгслийн хоорондын харьцуулалтыг сайтар, харьцуулахын тулд Schober et al. (2016) .
Том өгөгдлийн 10 шинж чанарыг янз бүрийн зохиогчоор янз бүрийн аргаар тайлбарласан байдаг. Эдгээр асуудлаар миний бодолд нөлөөлсөн бичвэрийг бичих нь Lazer et al. (2009) , Groves (2011) , Howison, Wiggins, and Crowston (2011) , boyd and Crawford (2012) , SJ Taylor (2013) , Mayer-Schönberger and Cukier (2013) , Golder and Macy (2014) , Ruths and Pfeffer (2014) , Tufekci (2014) , Sampson and Small (2015) , K. Lewis (2015b) , Lazer (2015) , Horton and Tambe (2015) , Japec et al. (2015) , Goldstone and Lupyan (2016) .
Энэ бүлгийн туршид би тоон суурийн нэр томъёог ашигласан бөгөөд энэ нь харьцангуй төвийг сахисан гэж үздэг. Тоон мөрийн хувьд өөр нэг нэр томъёо бол дижитал мөрийн хөтөлбөр (Golder and Macy 2014) боловч Hal Abelson, Ken Ledeen болон Харри Левис (2008) илүү тохиромжтой гэдэг нь тоон хурууны хээ юм. Хөлийн мөрийг үүсгэх үед та юу болж байгааг мэдэж байгаа бөгөөд хөлийн мөр тань ерөнхийдөө таних боломжгүй байдаг. Таны дижитал ул мөр дээр бас адилгүй. Үнэндээ та маш бага мэдлэгтэй байдаг бүх үеийг ул мөр үлдээдэг. Эдгээр ул мөрүүд таны нэрийг агуулдаггүй ч ихэнхдээ тантай холбоотой байдаг. Өөрөөр хэлбэл эдгээр нь хурууны хээ шиг илэрдэг бөгөөд биечлэн таних.
Статистик тестийг яагаад их хэмжээний дата гаргаж өгдөг талаар илүү их мэдээлэл авахын тулд M. Lin, Lucas, and Shmueli (2013) , McFarland and McFarland (2015) . Эдгээр асуудлууд нь судлаачдыг статистикийн ач холбогдлоос илүү ач холбогдолтой практик ач холбогдолтой гэж үзэж болох юм.
Раж Чехти болон бусад хамт олон татварын баримтыг хэрхэн олж авах талаар илүү дэлгэрэнгүй мэдээллийг Mervis (2014) үзнэ үү.
Том хэмжээний өгөгдөл нь ерөнхийдөө нэг компьютерийн чадамжаас давсан тооцооллын асуудлуудыг үүсгэж болно. Тиймээс томоохон өгөгдлийн олон тооны тооцоолуур хийдэг судлаачид ихэвчлэн олон компьютер дээр ажилладаг бөгөөд заримдаа зэрэгцээ програмчлал гэж нэрлэдэг. Зэрэгцээ програмчлалын танилцуулга, ялангуяа Hadoop нэртэй хэл, Vo and Silvia (2016) үзнэ үү.
Өгөгдлийг байнга авч үзэхийн тулд тухайн хүмүүстэй ижил хүмүүстэй харьцуулж байгаа эсэх, эсвэл өөрчлөгдсөн бүлгийн хүмүүсийг харьцуулж байгаа эсэх талаар авч үзэх нь чухал юм. Жишээ нь, Diaz et al. (2016) .
Идэвхгүй арга хэмжээнүүдийн сонгодог ном бол Webb et al. (1966) . Энэ номон дээрх жишээнүүд нь тоон эринийг урьдчилан хэлж байгаа боловч тэдгээр нь одоо ч гэрэлтүүлж байна. Массын тандалт ажиглагдаж буй хүмүүсийн зан төлөвийг өөрчилсөн хүмүүсийн жишээнээс үзэхэд Penney (2016) , Brayne (2014) зэргийг үзнэ үү.
Реактив нь судлаачдын эрэлт хэрэгцээний нөлөөг (Orne 1962; Zizzo 2010) , Hawthorne нөлөө (Adair 1984; Levitt and List 2011) .
Dunn (1946) , Fellegi and Sunter (1969) (түүхэн), Larsen and Winkler (2014) (орчин үеийн) -ийг үзнэ үү. Үүнтэй төстэй аргууд нь компьютерийн шинжлэх ухаанд өгөгдлийн деприклаци, жишээ нь таних, нэр тааруулах, давхардсан илрүүлэлт, хоѐр рекордыг илрүүлэх гэх мэт нэрээр нэрлэгддэг (Elmagarmid, Ipeirotis, and Verykios 2007) . Хувийн мэдээллийг таних мэдээллийг дамжуулах шаардлагагүй холбоосыг бүртгэх хувийн нууцлалыг хадгалах арга барилууд байдаг (Schnell 2013) . Фэйсбүүк нь өөрсдийн бүртгэлийг санал өгөх зан үйлд холбох үйл явцыг боловсруулсан байна. Үүнийг 4-р бүлэгт (Bond et al. 2012; Jones et al. 2013) хэлэх болно.
Shadish, Cook, and Campbell (2001) байдлыг тогтоох талаар дэлгэрэнгүйг Shadish, Cook, and Campbell (2001) 3-р бүлэг Shadish, Cook, and Campbell (2001) үзнэ үү.
AOL хайлтын бүртгэлийн алдаануудын талаар дэлгэрэнгүйг Ohm (2010) -г үзнэ үү. Би туршилтуудыг тайлбарлахдаа 4-р бүлэгт компаниуд болон засгийн газруудтай хамтран ажиллах талаар зөвлөгөө өгдөг. Зарим судлаачид мэдээлэл олж авах боломжийн талаар санаа зовж байгаагаа илэрхийлсэн бөгөөд Huberman (2012) , boyd and Crawford (2012) зэргийг үзнэ үү.
их сургуулийн судлаачид мэдээ хандах олж авах нэг сайн арга бол дадлага, эсвэл очиж судлаач зэрэг компанид ажиллах явдал юм. мэдээ хандалтыг идэвхжүүлэх гадна энэ үйл явц нь судлаач хэрхэн мэдээлэлд дүн шинжилгээ хийх нь чухал юм, бий болсон талаар илүү ихийг мэдэхийг туслах болно.
Засгийн газрын мэдээллийг олж авахын тулд Mervis (2014) Раж Четти болон хамт олон нь нийгмийн хөдөлгөөнт байдлын судалгаанд ашигласан татварын баримтыг хэрхэн олж авах талаар ярилцав.
" Kruskal and Mosteller (1979a) " -ын түүхийг илүү ойлгомжтой болгохын тулд Kruskal and Mosteller (1979a) , Kruskal and Mosteller (1979b) , Kruskal and Mosteller (1979c) Kruskal and Mosteller (1979b) , Kruskal and Mosteller (1979c) Kruskal and Mosteller (1980) .
Сноугын ажлын талаар товчхон дурдъя. Doll and Hill нарын хийсэн товч танилцуулга. Freedman (1991) ажилд Freedman (1991) талаар илүү ихийг мэдэхийн тулд Freedman (1991) үзнэ үү. Британий эмч нарыг судлахдаа Doll et al. (2004) болон Keating (2014) .
Судлаачид Doll and Hill 35-аас доош насны эмэгтэй эмч нар, эмч нараас мэдээлэл цуглуулсан ч тэдний анхны дүн шинжилгээнд санаатайгаар ашиглаагүй байна. Тэдний хэлснээр: "Уушгины хорт хавдар нь 35-аас доош насны эмэгтэйчүүд, эрэгтэйчүүдэд харьцангуй ховор байдаг тул эдгээр бүлгүүдэд хэдэн жилийн туршид хэрэгцээтэй тоо баримт гардаггүй. Энэхүү урьдчилсан мэдээнд бид 35 ба түүнээс дээш насны хүмүүст анхаарлаа хандуулсан "гэжээ. Rothman, Gallacher, and Hatch (2013) нар" Яагаад төлөөлөх чадварыг яагаад хэрэглэхээс зайлсхийх хэрэгтэй " үл танилцуулсан өгөгдлийг санаатайгаар үүсгэх.
Тодорхой бус байдал нь бүх хүн амын талаархи мэдэгдэл хийхийг хүсч буй судлаачид болон засгийн газруудад гол асуудал болдог. Энэ нь тэдний хэрэглэгчдэд голчлон анхаардаг компаниудад санаа зовох асуудал биш юм. Нидерландын бизнесийн статистик мэдээллээс үл хамаарах асуудлыг хэрхэн авч үздэг талаар Buelens et al. (2014) .
Том мэдээллийн эх сурвалжийг төлөөлөхгүй байх талаар санаа зовниж буй судлаачдын жишээ бол boyd and Crawford (2012) , K. Lewis (2015b) , Hargittai (2015) .
Нийгмийн судалгаа, эпидемиологийн судалгааны зорилгыг илүү дэлгэрэнгүй харьцуулахын тулд Keiding and Louis (2016) үзнэ үү.
Твиттерийг Jungherr (2013) тулд сонгогчдын талаар ерєнхий ойлголт Jungherr (2013) тулд, ялангуяа 2009 оны сонгуулийн санал Jungherr (2013) , Jungherr (2015) зэргийг харна уу. Дараа нь Tumasjan et al. (2010) дэлхийн өнцөг булан бүрт судлаачид янз бүрийн янз бүрийн сонгуулийн янз бүрийн төрлүүдийг урьдчилан таамаглахын тулд Twitter-ийн өгөгдлийг чадваржуулах зорилгоор талуудын эерэг ба сөрөг талыг ялгахын тулд симуляцийн дүн шинжилгээ хийх зэрэг аргыг хэрэглэдэг (Gayo-Avello 2013; Jungherr 2015, chap. 7.) . Huberty (2015) урьдчилан таамаглахын тулд эдгээр оролдлогуудын үр дүнг Huberty (2015) хэрхэн харуулсан бэ:
"Олон нийтийн мэдээллийн хэрэгсэлд суурилсан мэдэгдэж буй бүх мэдэгдэл нь жинхэнэ урагшлах сонгуулийн урьдчилсан мэдүүлгийн шаардлагыг биелүүлэхэд саад болж байна. Эдгээр алдаа нь арга зүйн эсвэл алгоритмын хүндрэлээс илүүтэйгээр олон нийтийн мэдээллийн хэрэгслийн гол шинж чанаруудаас шалтгаалдаг юм. Товчоор хэлэхэд, нийгмийн хэвлэл мэдээллийн хэрэгсэл сонгогчдын тогтвортой, шударга бус, төлөөлөл бүхий зургийг санал болгохгүй байх магадлалтай. Нийгмийн мэдээллийн хэрэгслийн дээжийн дээж хангалттай мэдээлэл дутуу байдаг. "
3-р бүлэгт би дээжлэлт, тооцоог илүү нарийвчлан тайлбарлах болно. Хэдийгээр өгөгдөл нь тодорхойгүй нөхцөлд ч гэсэн тодорхой нөхцөлд түүнийг сайн тооцоолохын тулд жигнэж тооцдог.
Системийн шилжилт нь гадна талаас харахад маш хэцүү байдаг. Гэсэн хэдий ч, MovieLens төсөл (4-р бүлэгт дэлгэрэнгүй авч үзсэн) нь эрдэм шинжилгээний судалгааны бүлгээс 15-аас дээш жил ажилласан байна. Тиймээс, систем нь цаг хугацааны туршид хэрхэн өөрчлөгдөж байгаа, энэ нь хэрхэн дүн шинжилгээ хийхэд нөлөөлж болох талаар баримтжуулах, хуваалцах боломжтой болсон (Harper and Konstan 2015) .
Liu, Kliman-Silver, and Mislove (2014) , Tufekci (2014) нарын олон тооны эрдэмтэд Твиттерт төвлөрч байна.
Хүн амын шилжилт хөдөлгөөнийг зохицуулах нэг арга бол хэрэглэгчдийн бүрэлдэхүүнийг бий болгох явдал юм. Энэ нь судлаачид ижил хүмүүсийг судлах боломжийг олгодог Diaz et al. (2016) нарыг үзнэ үү Diaz et al. (2016) .
Жон Клеерберг хэрэглэсэн яриа хэлээр "алгасвал илэрхийлэгддэг" гэдэг үгийг хамгийн түрүүнд сонссон боловч харамсалтай нь би хэзээ, хаана ярихаа мэдэхгүй байна. Би анх удаа хэвлэгдсэн нэр томъёо Anderson et al. (2015) , энэ нь болзооны сайтуудын ашигладаг алгоритмууд нь эдгээр вебсайтуудаас мэдээллийг ашиглах боломжийг нийгмийн судлаачдын сонирхлыг судлах сонирхолтой байдаг. Энэ асуудлыг Anderson et al. (2014) компаний хариуд K. Lewis (2015a) гаргасан Anderson et al. (2014) .
Фэйсбүүкээс гадна, Твиттер мөн хэрэглэгчдийг хүмүүсийг хаахыг зөвлөж байна. Su, Sharma, and Goel (2016) үзнэ үү. Тиймээс Твиттер дэхь гурвалсан хаалтын ханш нь триадий хаахыг дэмжих зарим алгоритмийн хандлагын зарим нэг хандлага юм.
Тоглолт, тухайлбал, нийгмийн шинжлэх ухааны онолын зарим нь "камер биш аппарат" (өөрөөр хэлбэл тэд ертөнцийг дүрслэн тайлбарлахаас илүүтэйгээр бүтээн байгуулдаг) гэсэн санааг илэрхийлдэг- Mackenzie (2008) .
Засгийн газрын статистикийн байгууллагууд статистик мэдээлэл засаж цэвэрлэх өгөгдөл гэж нэрлэдэг. De Waal, Puts, and Daas (2014) судалгааны өгөгдөлд зориулан боловсруулсан статистик өгөгдлийг засварлах аргачлалуудыг тодорхойлж, том хэмжээний өгөгдлийн эх сурвалжуудад хэрэглэх боломжтой цар хэмжээ, Puts, Daas, and Waal (2015) илүү ерөнхий үзэгчид.
Нийгмийн вакуумуудын тоймыг харахын тулд Ferrara et al. (2016) . Твиттер дээр спам хайхад чиглэсэн судалгаануудын зарим жишээг үзэхэд Clark et al. (2016) , Chu et al. (2012) . Эцэст нь Subrahmanian et al. (2016) DARPA Twitter Bot Challenge-ийн үр дүнг тайлбарлав.
Ohm (2015) нь эмзэг мэдээллийн санааг судлах, олон хүчин зүйлийн сорилыг санал болгодог. Түүний санал болгож буй дөрвөн хүчин зүйл нь хор хохирлын хэмжээ, хор уршиг, магадгүй нууц харилцааг бий болгосон, эрсдэл нь ерөнхийлөгчийн санаа зовоосон асуудлуудыг илэрхийлдэг эсэх зэрэг болно.
Нью-Йоркийн татвар төлөх Фарберын судалгаагаар Camerer et al. (1997) цаасны аялалын гурван өөр тохиромжтой дээжийг ашигласан. Өмнө нь хийсэн судалгаанаас үзэхэд жолооч нар зорилтот ажилчдыг сонгох хандлагатай байв.
Дараагийн ажилд Хаан болон хамтран ажиллагсад Хятадын онлайн цензурыг судлах (King, Pan, and Roberts 2014, [@king_how_2016] ) . БНХАУ-д онлайн цензур хэмжихтэй холбоотой арга барилын хувьд Bamman, O'Connor, and Smith (2012) зэргийг үзнэ үү. King, Pan, and Roberts (2013) ашигласан статистикийн аргуудын талаар 11 сая бичлэгийн байр суурийг тооцоолохын тулд Hopkins and King (2010) үзнэ үү. Хяналттай сургалтын талаар илүү ихийг олж авахын тулд James et al. (2013) (техник дутуу), Hastie, Tibshirani, and Friedman (2009) (илүү техникийн).
Урьдчилан таамаглах нь аж үйлдвэрийн мэдээллийн шинжлэх ухааны томоохон хэсэг (Mayer-Schönberger and Cukier 2013; Provost and Fawcett 2013) . Нийгмийн судлаачдын хийдэг нэг төрлийн таамаглал нь хүн ам зүйн таамаглал юм; Жишээлбэл, Raftery et al. (2012) .
Google Flu Trends нь томуугийн тархалтыг хянах зорилгоор хайлтын датаг ашиглах анхны төсөл биш юм. Үнэндээ АНУ-ын судлаачид (Polgreen et al. 2008; Ginsberg et al. 2009) , (Polgreen et al. 2008; Ginsberg et al. 2009) , Швед (Hulth, Rydevik, and Linde 2009) тодорхой хайлтын нэр томъёо ("томуу" гэх мэт) Өгөгдөл гарахаас өмнө өгөгдөл. Үүний дараа олон тооны төслүүд өвчний тандалтын илрүүлэлтийн тоон тоон өгөгдлийг ашиглахыг оролдсон; Althouse et al. (2015) .
Эрүүл мэндийн үр дүнг таамаглахын тулд дижитал тоон өгөгдлийг ашиглахаас гадна Тв Twitter-ийн мэдээллийг ашиглан сонгуулийн үр дүнг урьдчилан таамаглахад асар их ажил хийгдэж байсан; сэтгэгдэл үзнэ үү Gayo-Avello (2011) , Gayo-Avello (2013) , Jungherr (2015) (7-р бүлэг), болон Huberty (2015) . Дотоодын нийт бүтээгдэхүүн (ДНБ) зэрэг эдийн засгийн үзүүлэлтүүдийг тооцоолох нь төв банкуудад бас түгээмэл байдаг бөгөөд Bańbura et al. (2013) нарыг үзнэ үү Bańbura et al. (2013) . Хүснэгт 2.8-д дэлхийн зарим төрлийн үйл явдлыг урьдчилан таамаглахын тулд зарим төрлийн дижитал ул мөрийг ашигладаг судалгааны зарим жишээг дурдав.
Дижитал мөр | Үр дүн | Citation |
---|---|---|
Твиттер | АНУ-ын киноны албан тасалгааны орлого | Asur and Huberman (2010) |
Лог хайх | АНУ-д кино, хөгжим, ном, видео тоглоом борлуулах | Goel et al. (2010) |
Твиттер | Dow Jones Industrial Average (АНУ-ын хөрөнгийн зах зээл) | Bollen, Mao, and Zeng (2011) |
Олон нийтийн сүлжээ, хайлтын бүртгэл | АНУ, Их Британи, Канад, БНХАУ дахь хөрөнгө оруулагчдын сонирхол, хөрөнгийн зах зээлийн судалгаа | Mao et al. (2015) |
Лог хайх | Сингапур, Бангкок дахь ДЭМБ-ын халдварын тархалт | Althouse, Ng, and Cummings (2011) |
Эцэст нь Jon Kleinberg болон түүний хамтрагчид (2015) таамаглаж буй асуудлууд нь хоёр өөр ангилалд хуваагдаж, нийгмийн эрдэмтэд нэг нь анхаарлаа төвлөрүүлж, нөгөө талыг нь үл тоомсорлодог. Бодлого боловсруулагчийг төсөөлөөд үзээрэй, ган гачигдаж байгаа Аннаыг дуудаж, борооны боломжоо нэмэгдүүлэхийн тулд борооны бүжиг хийх бөөцөө авах эсэхийг шийдэх ёстой. Өөр нэг бодлого гаргагч, би түүнийг Бетти гэж дуудна. Гэртээ харих замдаа нойтон байхаас зайлсхийхийн тулд дээвэр авах уу гэдгийг шийдэх ёстой. Анна, Бетт хоёр цаг агаарыг ойлгодог бол илүү сайн шийдвэр гаргаж чадна, гэхдээ тэд өөр өөр зүйлийг мэддэг байх хэрэгтэй. Борооны бүжиг бороо оруулдаг эсэхийг Анна ойлгох хэрэгтэй. Бетти нөгөө талаас шалтгааныг ойлгох шаардлагагүй юм. Тэр зүгээр л урьдчилсан таамаглал хэрэгтэй. Нийгмийн судлаачид Аннетэй тулгардаг бэрхшээлүүд дээр төвлөрдөг бөгөөд Клейгберг болон түүний хамтрагчид "борооны бүжиг" бодлогын асуудлууд гэж нэрлэдэг тул учир шалтгааны асуудалтай холбоотой байдаг. Беттигийн тулгардаг асуултууд нь Клайбергбер болон түүний хамтран ажиллагчид "дээвэр шиг" бодлогын асуудлууд гэж нэрлэдэг бөгөөд энэ нь маш чухал, гэхдээ нийгмийн судлаачидаас илүү анхаарал татдаг.
ЖХ-ийн улс төрийн шинжлэх ухааны сэтгүүл том хэмжээний өгөгдөл, учир шалтгааны дүгнэлт, албан ёсны онолын талаархи симпозиумтай байсан бөгөөд Clark and Golder (2015) хувь нэмэр тус бүрийг нэгтгэн дүгнэв. АНУ-ын Шинжлэх ухааны академийн Шинжлэх ухааны академи нь учир шалтгааныг дүгнэлт, том хэмжээний өгөгдлүүдийн симпозиумтай байсан бөгөөд Shiffrin (2016) хувь нэмэр болгон дүгнэдэг. Том хэмжээний өгөгдлийн эх сурвалжид байгалийн туршилтуудыг автоматаар илрүүлэх оролдлогыг хийдэг машиныг судлах аргуудын хувьд Jensen et al. (2008) , Sharma, Hofman, and Watts (2015) , Sharma, Hofman, and Watts (2016) .
Байгалийн туршилтаар Dunning (2012) олон жишээнээс эхлэн ном, эмчилгээний танилцуулга бэлтгэдэг. Байгалийн туршилтыг үл итгэсэн үзэл баримтлалын хувьд Rosenzweig and Wolpin (2000) (эдийн засаг) эсвэл Sekhon and Titiunik (2012) (улс төрийн шинжлэх ухаан) -ийг үзнэ үү. Deaton (2010) , Heckman and Urzúa (2010) байгалийн туршилтууд дээр анхаарлаа төвлөрүүлэхэд судлаачид чухал бус шалтгаант үр нөлөөг үнэлэхэд чиглүүлэх боломжтой гэж үздэг; Imbens (2010) эдгээр туршилтуудыг байгалийн туршилтуудын үнэ цэнийн талаар илүү өөдрөг Imbens (2010) .
Үйлчлэлийн үр нөлөөнд бэлтгэх үйл ажиллагааны үр нөлөөг тооцоолохын тулд судлаач хэрхэн явагдаж болохыг тайлбарлахдаа instrumental хувьсагч гэж нэрлэгддэг техникийг тайлбарласан. Imbens and Rubin (2015) , 23, 24-р бүлгүүдэд танилцуулж, сугалааны төслийг жишээ болгон Imbens and Rubin (2015) . Цэргийн алба хаагчдад цэргийн алба хаагчдын дундаж үр дагаврыг (CAcE), зарим тохиолдолд орон нутгийн дундаж эмчилгээний үр нөлөө (LATE) гэж нэрлэдэг. Sovey and Green (2011) , Angrist and Krueger (2001) , Bollen (2012) нь улс төрийн шинжлэх ухаан, эдийн засаг, социологийн хэрэглээний хувьсагчдын хэрэглээг судлах, Sovey and Green (2011) нь "уншигчдын шалгах хуудас" багажийн хувьсагчийг ашиглан судалгааг үнэлэх.
1970 оны сугалааны төсөл нь үнэндээ зөв санамсаргүй биш байсан. цэвэр санамсаргүй байдлаас бага зэргийн хазайлт (Fienberg 1971) . Berinsky and Chatfield (2015) энэ жижиг хазайлт нь чухал ач холбогдолтой биш бөгөөд зөв санамсаргүй Berinsky and Chatfield (2015) ач холбогдлыг хэлэлцдэг гэж үздэг.
Тохирох талаасаа, Stuart (2010) өөдрөг үзлийн тоймыг, мөн Sekhon (2009) нь гутрангуй үзэл бодлыг судалж үзээрэй. Илүү их тайралт хийхээр тохируулахын тулд Ho et al. (2007) үзнэ үү Ho et al. (2007) . Хүн бүрт нэг төгс тохирохыг олох нь ихэвчлэн хэцүү байдаг бөгөөд энэ нь хэд хэдэн төвөгтэй байдлыг бий болгодог. Нэгдүгээрт, таарах зүйл байхгүй тохиолдолд судлаачид хоёр нэгжийн хоорондох зайг хэрхэн хэмжих болон өгөгдсөн зай хангалттай зайтай эсэхийг шийдэх хэрэгтэй. Судлаачид бүлэг бүрт олон тааралдалтыг ашиглахыг хүсвэл хоёрдогч нарийн төвөгтэй байдал үүсдэг. Энэ нь илүү нарийвчлалтай тооцооллууд үүсгэдэг. Эдгээр асуудлууд болон бусад зүйлсийг Imbens and Rubin (2015) 18-р бүлэгт дэлгэрэнгүй тайлбарласан байгаа. Мөн II-р хэсэг үзнэ үү ( ??? ) .
Жишээ нь Dehejia and Wahba (1999) тохирсон хяналттай туршилттай төстэй аргаар тооцоолох боломжтой тохирох аргыг жишээ болгон үзүүлэв. Гэхдээ Arceneaux, Gerber, and Green (2006) , Arceneaux, Gerber, and Green (2010) туршилтын жишиг харьцуулалтыг үр дүнгүй болгож байсан жишээнүүдээс харна уу.
Rosenbaum (2015) , Hernán and Robins (2016) мэдээллийн том эх үүсвэрүүд дээр ашигласан харьцуулалтыг олохын тулд бусад зөвлөгөөг санал болгодог.