Санарип издерин үчүн сурамжылоо байлоо ар ар дайым сиздин суроо берип окшош болушу мүмкүн.
иргеп текшерүү жана каттоо: сурап, негизинен, эки негизги категорияга кирет. Иргеп текшерүү адамдар бир аз сандагы кирүү, ийкемдүү, өз учурунда болушу мүмкүн, ал эми салыштырмалуу арзан. Бирок, алар үлгү боюнча, анткени үлгү изилдөөлөр, көп учурда аларды чечүүнүн менен чектелген; үлгүсүн изилдөө менен, аны белгилүү бир Geographic аймактарында же конкреттүү кубулуштарды топтору үчүн баа берүү кыйын. Каттоо, башка, калктын ар бир маек алууга аракет кылышат. Алар улуу токтом бар, бирок алар негизги көбүнчө кымбат, тар экен (алар гана суроолордун бир аз санын камтыйт), (мисалы, ар бир 10 жыл болуп, белгилүү бир күн тартиби боюнча эмне алар) менен эмес, өз убагында (Kish 1979) . Азыр изилдөөчүлөр үлгү изилдөөлөр жана эл каттоонун жыйынтыгы боюнча мыкты өзгөчөлүктөрүн аралаштыра алса, элестетип; изилдөөчүлөр ар бир күнү ар бир адам ар бир суроо болсо дейли.
Албетте, бул дайыма, бардык жерде, ар дайым-сурамжылоо коомдук илимдер элестин бир түрү болуп саналат. Бирок, ал биз көптөгөн адамдар санариптик издерин менен элдин аз сандагы Сурамжылоонун суроолорду бириктирип, бул болжол менен башташы мүмкүн окшойт. Мен айкалыштырып бул түрү сурап күчөтүлгөн деп аташат. жакшы иш болсо, анда ал бизге (кичирээк аймактар үчүн) көп жергиликтүү баа берип, көбүрөөк гранулданган жардам бере (конкреттүү кубулуштарды топтору үчүн), жана өз убагында.
жакыр өлкөлөрдө жол өнүгүшүнө жардам бере турган маалыматтарды чогултуу үчүн күчөтүлгөн деп сураганда бир мисал Жашыя Blumenstock, ишин келип чыккан. Тактап айтканда, Blumenstock байлык өлчөө системасын түзүү жана жыргалчылыгын сурамжылоонун ийилчээк жана тездиги менен каттоонун толуктугун айкалыштырылган каалаган (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . 1 Чындыгында, мен бөлүмдө эле кыскача Blumenstock ишин сүрөттөлгөн койдук.
баштоо үчүн, Blumenstock Руандада ири уюлдук оператору менен өнөктөштүк мамиле түзгөн. компания мындай башталыш убактысы, мөөнөтү, жана дубасын жана кабыл болжолдуу айкашы катары 2005-жылы жана 2009-журналдар ар бир чалуу жана текст кабары жөнүндө маалыматтарды камтууга келген жүрүм-турумду камтыган болжол менен 1,5 млн кардарлары ага атынан бүтүм эсебин берген. Биз статистикалык маселелер жөнүндө сөз баштоо алдында, бул биринчи кадам кыйын бири болушу мүмкүн экенин баса белгилеп кетүү зарыл. 2-бөлүмдө айтылгандай, көпчүлүк санарип изи маалымат изилдөөчүлөр үчүн жеткиликтүү эмес. Жана көптөгөн компаниялар бул жеке, анткени алардын маалыматтарын бөлүшүү үчүн негиздүү болгон чечкиндүүлүгүбүз жетпей жатканда; Бул алардын кардарлары, балким, алардын жазмаларын, жалпы-изилдөөчүлөр тобу-менен болот деп күткөн эмес болуп саналат. бул учурда, изилдөөчүлөр маалыматтарды жөнсүз кылдат кадамдарды таштады жана алардын иши үчүнчү тарап тарабынан көзөмөлдөөгө (б.а., алардын IRB). Бирок, бул аракеттерге карабастан, бул маалыматтар, сыягы, дагы эле аныкталат, алар, кыязы, сезимтал маалыматтарды камтыйт (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Мен 6-бөлүмдө бул этикалык суроого кайтып келет.
Blumenstock байлык менен жыргалчылыгын өлчөө кызыкдар болгон. Бирок, бул өзгөчөлүктөрдүн чакыруу кагаздарын түздөн-түз эмес. Башка сөз менен айтканда, бул чакыруу кагаздарын Бул изилдөө, 2. бөлүмүндө майда-чүйдөсүнө чейин талкууланды санариптик издерин жалпы өзгөчөлүгү үчүн толук эмес, бирок, ал чакыруу кагаздарын, балким, мал-мүлк жана бакубат жашоо-турмушу тууралуу маалымат бар болушу мүмкүн. Ошондуктан, Blumenstock суроосун талап болушу мүмкүн бир жолу: Эгер кимдир бирөө бир сурамжылоого жооп кандай болот, алардын санариптик изи маалыматтарынын негизинде алдын ала айтууга болот? Эгер ошондой болсо, анда бир нече адам сурап, биз дагы ар бир жообун божомолдой алабыз.
эмпирикалык бул баа берүү үчүн, Kigali Илим жана технология институтунун Blumenstock жана кенже илимий кызматкер жөнүндө саны мобилдик байланыш кардарларынын үлгүсүн чакырды. мисалы «катары изилдөөчүлөр катышуучуларга долбоордун максаты, чакыруу документтерине Сурамжылоонун жоопторун байланыштыруу үчүн алардын макулдугу менен сурап, андан кийин өз байлыгын жана жыргалчылыгын өлчөө үчүн аларга бир нече суроо менен кайрылган, түшүндүрүп сиз ээлик кыла радио? «жана» Эгер Салоны таандыкпы? «(кара жарым-жартылай тизмеси үчүн 3.11-сүрөт). Изилдөөнүн бардык катышуучуларынын каржылык сый акы алган.
Кийинки, Blumenstock маалыматтар илимде жалпы эки кадам тартиби колдонулат: көзөмөлдөнгөн окутуу менен өзгөчөлүк инженердик. Биринчиден, өзгөчөлүк инженердик кадам, маек, адам, Blumenstock ар бир адам жөнүндө мүнөздөмөлөрдүн топтому эске чакыруу жазууларды айланттык; маалымат илимпоздор бул мүнөздөмөлөр «өзгөчөлүктөрү» деп атаган жана коомдук окумуштуулар аларды чакырып алып келиши мүмкүн «, өзгөрмө.» Мисалы, ар бир адам үчүн, Blumenstock иши менен күн жалпы санын эсептеп, элдин саны бир адам менен байланышта болгон суммасы акча кыттын жумшалат, ж.б.у.с.. Сын, жакшы өзгөчөлүк инженердик изилдөө аныктоо билүү талап кылынат. Мисалы, ал ата-мекендик жана эл аралык чалуулар ортосунда (биз эл аралык деп эл бай деп ойлоо мүмкүн) айырмалоо үчүн маанилүү болсо, анда бул мүмкүнчүлүк инженердик кадамда жасалууга тийиш. Руанда аз түшүнүү менен бир изилдөөчү бул өзгөчөлүктү жок, мүмкүн, андан кийин модели жарыш аткаруу азап берет.
Кийинки, көзөмөлдөнгөн окуу кадам, Blumenstock алардын өзгөчөлүктөрү боюнча, ар бир адам үчүн сурамжылоо жооп алдын ала статистикалык үлгү курду. бул учурда, Blumenstock 10 эсе кайчылаш текшерүү менен логистикалык регрессия колдонгон, бирок ал башка статистикалык же машина окутуу ыкмалардын ар кандай пайдаланылышы мүмкүн.
бул кандай жакшы болгон иш? Blumenstock сыяктуу суроолорду сурамжылоо жооп алдын ала: «Эгер бир радио ээ болот?» Жана «Эгер Салоны таандык?» Деген чакыруу эсепке алынган өзгөчөлүктөрдү пайдалануу болгон? Сыяктуу. алдын ала так кээ бир өзгөчөлүктөрү (Figure 3.11) жогору болгон. Бирок, бул жөнөкөй атаандаш каршы комплекстүү алдын ыкмасын дайыма маанилүү. Мындай учурда, жөнөкөй альтернатива ар бир кыйла жалпы жооп бере албайт деп айтууга болот. Мисалы, ар бир адам, анын бир кыйла татаал тартиби (97,6% тууралыгы) үчүн өтө окшош бир радио, ал 97,3% га так эле болмок, ээ отчет деп 97,3% Blumenstock алдын ала айткан болсо, бир радио ээ билдирди. Башка сөз менен айтканда, бардык кооз маалымат жана моделдөө алдын ала так 97,3% дан 97,6% га чейин өстү. Бирок, ушул сыяктуу башка маселелер боюнча «Сен Салоны таандыкпы?», Алдын ала 54,4% 67,6% га чейин жакшырткан. Жалпысынан, Figure 3.12 кээ бир өзгөчөлүктөрү үчүн шоу Blumenstock эле жөнөкөй баштапкы алдын алуу тышкары көп жакшыртуу эмес, бирок башка өзгөчөлүктөрү боюнча айрым жылыштар болду.
Бул учурда сиз бул жыйынтыктар бир аз капа болуп саналат деп ойлоп калышы мүмкүн, бирок ал бир жылдан кийин, Blumenstock жана эки кесиптеш-Gabriel Cadamuro жана Роберт On-жарыяланган бир кыйла жакшы жыйынтык менен илим бир кагаз (Blumenstock, Cadamuro, and On 2015) . жакшыртуу жерде эки негизги техникалык себептер болгон: 1) алар (башкача айтканда, инженердик жана бир кыйла татаал машина окуу моделин сунуштоо жаңы ыкма) кыйла татаал ыкмаларын пайдалануу жана 2), тескерисинче, жекече изилдөө суроолорго (мисалы, жооп тыянак аракет эмес, «Эгер сен бир радио ээ болот?»), алар курама байлык индекси тыянак аракет кылышкан.
Blumenstock жана кесиптештер эки жол менен алардын мамиленин натыйжалуулугун көрсөттү. Биринчиден, алар тандалып алынган адамдар үчүн, алардын чакыруу кагаздарын (Figure 3.14), алардын байлыгын алдын ала абдан жакшы иш деп табылган. Экинчи, ал эми мурдагыдан да маанилүүсү, Blumenstock жана кесиптештердин тартиби Руандада байлыкты геомаалыматтык бөлүштүрүү жогорку сапаттуу сметасын өндүрүү мүмкүн экенин көрсөттү. Тактап айтканда, алар чакыруу кагаздарын бүт 1,5 миллион элдин байлыгын алдын ала айтуу, 1000ге жакын адам, алардын үлгү боюнча окуудан эле алардын машина окуу моделин колдонушуптур. Андан ары, чалуу маалыматтар киргизилген Геомейкиндиктик маалыматтар менен (чалуу маалыматтары ар бир чалуу үчүн жакынкы клетка мунаранын ордун камтыйт экенин эске), изилдөөчүлөр ар бир адам жашаган болжолдуу ордун аныктоо мүмкүнчүлүгүнө ээ болушту. бул эки баа коюп, изилдөө абдан жакшы мейкиндик деталдаштыруу боюнча абонент байлыкты Geographic бөлүштүрүү баа өндүрүлгөн. Мисалы, алар Руанданын 2148 клетканын ар бири (өлкөдөгү майда-башкаруу бирдиги) орточо байлык баалоо мүмкүн. Бул алдын ала байлык баалуулуктар текшерүү үчүн кыйын эле ушунчалык майда болгон. Демек, илимий изилдөөчү Руандадагы 30 райондор боюнча орточо байлык сметасын өндүрүү үчүн алардын жыйынтыктарын жалпыланган. Бул райондук баа күчтүү алтын стандарты салттуу сурамжылоонун эсептөөлөргө байланыштуу болгон, Руанданын DEMOGRAPHIC жана ден соолук боюнча изилдөө (Figure 3.14). эки булактардан баасы боюнча окшош болгон, бирок Blumenstock, кесиптештердин баасы 50 эсеге арзан жана 10 жолу болгон тезирээк (өзгөрүлмө чыгымдар өлчөмдөр боюнча наркы). наркы ушул кескин төмөндөшү, тескерисинче, бир нече жылда бир-сыяктуу кубулуштарды жана саламаттык сактоо боюнча жүргүзүлгөн сурамжылоонун-гибриди стандарттык ири санариптик изи маалыматтар менен бирге чакан сурамжылоо иштетип караганда, ар бир ай чуркап мүмкүн дегенди билдирет.
Жыйынтыктап айтканда, Blumenstock алтын-стандартты, сурамжылоо баасы менен салыштырмалуу баа өндүрүү үчүн санариптик изи маалыматтар менен мамиле курама изилдөө боюнча маалыматтарды сурап күчөтүлгөн. Бул мисал да күчөтүлгөн сураганда жана салттуу иликтөө ыкмалары ортосунда соода-маалымат төгүндөлдү кээ бир такталууда. Биринчиден, күч сурап, баа дагы убагында, кыйла эле арзан болгон жана гранулданган. Бирок, башка жагынан алганда, бул учурда күчөтүлгөн деп сураганда алар бул үчүн бекем теориялык негиз жок. Ал, жок иштеп, кийин боло турган, Бул мисалдан да көрүнүп калат. Андан ары, бойго суроо мамиле, анын баасы болжол менен белгисиз сандык жакшы жолдорун ээ эмес. Бирок, бойго суроо статистикасы-моделдин негизинде кийинки катмарларга үч чоң жерлерге терең байланышы бар (Little 1993) , мойнуна күнөө (Rubin 2004) , чакан аймак баалоо (Rao and Molina 2015) учун мен прогресс деп күтөт тез болот.
Бойго суроо кырдаалга жараша боло турган негизги салышы төмөнкүдөй. эки, курамы жана эки кадам бар. эки кадамды кең, ал эми арык (деп саналат) санариптик изи танышуусуна 1 болуп саналат, ал көптөгөн адамдарга, бирок ар бир адам жөнүндө зарыл болгон маалыматтарды) жок жана 2) (бул тар, бирок коюу сурамжылоо бар, бул бар бир аз эле адам, бирок ошол адамдар тууралуу зарыл маалымат) бар. Андан кийин, эки кадам бар. Биринчиден, эки маалымат булактарында адамдар үчүн, сурамжылоо жооп алдын ала санариптик изи маалыматтарды колдонгон машина окуу моделин куруу. Кийинки санариптик изи маалыматтарды ар бир иликтөө жооп берүүгө ошол машина окуу моделин колдонуу. Ошентип, силер, элге токчулук берип, жооп алдын ала айтуу үчүн колдонулушу мүмкүн адамдардын санариптик изи маалыматтарды издеп келет кээ бир суроо бар болсо.
көйгөйдү Blumenstock биринчи жана экинчи аракет салыштыруу, ошондой эле илимий изилдөөлөрдү жүргүзүү үчүн үчүнчү доору ыкмаларды экинчи мезгилинен өтүү жөнүндө маанилүү сабак көрсөтүлгөн: башталышы аягы эмес. Деп, канча жолу, биринчи мамиле жакшы эмес, бирок, изилдөөчүлөр иш улантылган болсо, баары жакшы болот. Жалпысынан, санариптик кылымдын коомдук изилдөөлөр боюнча жаңы ыкмаларды баа берүү, ал эки башка баа үчүн маанилүү болуп саналат: 1) Бул келечекте маалыматтар пейзаж катары иштөөгө мүмкүн деп ойлойм, канчалык жакшы азыр бул ишти канчалык жакшы жана 2) өзгөртүүлөр жана изилдөөчүлөр сыяктуу маселеге көбүрөөк көнүл бурулду. Изилдөөчүлөр баалоонун биринчи түрүн (изилдөөлөр бул өзгөчө бөлүгү кандай жакшы) үчүн даярдалган, бирок, экинчи учурда дагы да маанилүү болуп эсептелет.