Сандық іздері Сіздің сауалнама байланыстыру барлық уақытта әркім өз сұрақтар қойып сияқты болуы мүмкін.
іріктеп зерттеу және санақ: әдетте, Сұрай негізгі екі санатқа жеткізіледі. Егер сіз адамдардың саны аз қатынасу үлгісі зерттеулер, икемді уақтылы, және салыстырмалы арзан болуы мүмкін. олар үлгідегі негізделген, өйткені Дегенмен, іріктемелі зерттеу, көбінесе оларды шешуге шектеледі; іріктеп зерттеу отырып, ол нақты географиялық аймақтарда туралы немесе нақты демографиялық топтары үшін сметасын жасауға жиі қиын. Санағының, екінші жағынан, халықтың барлығына сұхбат әрекет. (Олар мұндай әрбір 10 жыл ретінде белгіленген кестеге, бойынша орын) Олар үлкен қарар бар, бірақ олар, әдетте, қымбат, назарында тар (олар тек сұрақтар аз санын қамтиды), және уақтылы емес (Kish 1979) . зерттеушілер іріктемелі зерттеу және санақ үздік сипаттамалары біріктіру мүмкін болса Енді елестетіп; зерттеушілер күн сайын әркімге әр сұрақ мүмкін болса елестету.
Әлбетте, бұл үздіксіз, жаппай, сауалнама әрқашан-әлеуметтік ғылым қиял бір түрі болып табылады. Бірақ, бұл біз көптеген адамдардың сандық іздері бар адамдардың шағын санының сауалнама сұрақтарына үйлестіре отырып, осы жақындаған бастау алады екен. Мен аралас күшейтілген сұрағаннан осы түрін атайды. жарайсыңдар болса, ол бізге (аз географиялық аудандарда үшін) көп жергілікті бағалауды, (нақты демографиялық топтары үшін) көбірек түйіршіктелген, және одан уақтылы қамтамасыз көмектесе алар еді.
күшейтілген сұрағаннан Бір мысал кедей елдерде дамуын көмектесу еді деректерді жинау үшін келді Ешуа Blumenstock, жұмысына шыққан. Нақтырақ айтқанда, Blumenstock байлығы мен зерттеу икемділік пен жиілігі санақ толықтығын біріктірілген әл-ауқатын өлшеуге жүйесін құру келді (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . Шын мәнінде, мен қазірдің өзінде 1-тарау қысқаша Blumenstock жұмысын сипатталған болатынмын.
бастау үшін, Blumenstock Руанда ірі ұялы телефон провайдерімен серіктес болды. company журналдар әр қоңыраулар мен мәтіндік осындай басталу уақытына делінген хабарламада, ұзақтығы, сондай-ақ қоңырау шалушының және қабылдағыш шамамен алғандағы географиялық орналасқан жері туралы ақпаратты қамтитын оған 2005 мінез қамтитын шамамен 1,5 млн тұтынушылардан түсетін анонимді мәміле жазбалар және 2009 көзделген. біз статистикалық мәселелер туралы әңгіме бастамас бұрын, ол осы алғашқы қадам ауыр бірі болуы мүмкін деп атап көрсетті жөн. 2-тарауда сипатталғандай, ең сандық ізі деректер зерттеушілер қол жетімді. бұл жеке болғандықтан, көптеген компаниялар өздерінің деректерін бөлісуге әділ сенімсіздігі; бұл олардың клиенттері, бәлкім, олардың жазбалар бөлісті-жылы болады деп үймелі-бар зерттеушілердің күткен жоқ болып табылады. Бұл жағдайда, зерттеушілер деректерді анонимді ұқыпты қадамдар жасады және олардың жұмыс үшінші тараптың (яғни, олардың IRB) қадағалап отырды. Бірақ, осы күш қарамастан, бұл деректер бәлкім, әлі де анықталатын болып табылады және олар, ең алдымен, құпия ақпаратты қамтитын (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Мен 6-тарауында осы этикалық мәселеге қайтып болады.
Blumenstock байлығы мен әл-ауқатын өлшеу мүдделі екенін еске сала кетейік. Бірақ, бұл қасиеттер қоңырау жазбалар тікелей емес. Басқаша айтқанда, бұл қоңырау жазбалар, 2-тарау егжей-тегжейлі талқыланды сандық іздері ортақ ерекшелігі осы зерттеу үшін толық Бірақ, бұл қоңырау жазбалар бәлкім байлық пен әл-ауқаты туралы кейбір мәліметтерді бар екенін, ең алдымен, меніңше. Сондықтан, Blumenstock компаниясының сұрақ бірі жолы болуы мүмкін: ол біреу олардың сандық ізі деректерге негізделген сауалнама жауап қалай болжауға болады? Егер солай болса, онда бірнеше адам сұрап, біз барлық қалған жауаптар сұраса болады.
эмпирикалық Осы бағалау үшін, ғылым және технологиялар институтының Kigali Blumenstock және зерттеу көмекшілері мыңға жуық ұялы телефон клиенттер үлгісін шақырды. зерттеушілер мұндай «Сіз иесі бе ретінде, қатысушыларға жобаның мақсаттары түсіндірді қоңырау жазбаларға сауалнама жауап байланыстыру олардың келiсiмiмен сұрады, содан кейін олардың байлығы мен әл-ауқатын өлшеу үшін сұрақтар сериясын оларды сұрады радио? «және» Егер сіз велосипед меңгерген? «(ішінара тізіміне арналған суретті 3.11 қараңыз). сауалнамаға Барлық қатысушылар қаржы өтелді.
Жетекшілік ететін оқыту кейін ерекшелігі инженерлік: Келесі, Blumenstock деректер ғылым ортақ екі қадамдық рәсімін пайдаланған. Біріншіден, ерекшелігі инженерлік қадамда, сұхбат берді әрбір адам үшін, Blumenstock әрбір адам туралы сипаттамаларын жиынына қоңырау жазбаларын айырбасталады; ғалымдар осы сипаттамалары «ерекшеліктері» және әлеуметтік ғалымдар оларды қоңырау еді қоңырау мүмкін «айнымалылар.» Мысалы, деректер, әрбір адамның, қызметімен күн Blumenstock есептелген жалпы санының үшін, айқын адамдар саны адам, байланыста сомасы болды ақша т.б. эфирлік жұмсалған, және. Сыни, жақсы мүмкіндігі инженерлік зерттеу параметрге білуді талап етеді. ол (біз халықаралық қоңырау адам бай болады деп күтеді мүмкін) отандық және халықаралық қоңыраулар ажырата маңызды Мысалы, егер, онда бұл функция инженерлік қадамда жасалуы тиіс. Руанда аз түсіністік бар зерттеуші бұл мүмкіндікті қамтиды болмауы мүмкін, содан кейін моделін болжалды өнімділігі зардап шегеді.
Келесі, жетекшілік ететін оқыту қадамда, Blumenstock олардың ерекшеліктері негізінде әрбір адам үшін сауалнама жауап болжауға статистикалық моделін салынды. Бұл жағдайда, Blumenstock 10 есе кросс-валидация бар логистикалық регрессиялық пайдаланылатын, бірақ ол басқа да статистикалық немесе машина оқыту тәсілдерін түрлі пайдалана алар еді.
Сондықтан оны қаншалықты жақсы жұмыс істедіңіз? Blumenstock «? Егер сіз радио иесі бе» сияқты сұрақтарға сауалнама жауап болжауға қабілетті болды және «сіз велосипед иесі ме?» Қоңырау жазбаларынан алынған мүмкіндіктерді пайдалану? сұрыптау. болжау дәлдігі кейбір белгілерінің (сурет 3.11) жоғары болды. Бірақ, бұл қарапайым балама қарсы кешенді болжау әдісін салыстыруға әрқашан маңызды. Бұл жағдайда, қарапайым балама әркім ең көп таралған жауап береді деген болжау болып табылады. Мысалы, 97,3% Blumenstock әркім ол өзінің аса күрделі тәртіппен (97,6% дәлдігі) орындауға таңқаларлық ұқсас 97,3%, оның дәлдігін еді радио иеленетін баяндауға болады деп болжаған болатын, сондықтан, егер радио иеленетін хабарлады. Басқаша айтқанда, барлық қаларлық деректер мен модельдеу 97,6% -ға дейін 97,3% -дан болжау дәлдігін өсті. Алайда, мұндай «сіз велосипед иесі ме?» Сияқты басқа да мәселелер бойынша, болжау 67,6% -ға дейін 54,4% -дан жақсарды. кейбір ерекшеліктерді үшін Неғұрлым жалпы сурет 3.12 шоу Blumenstock қарапайым базалық болжау жасау шегінен тыс көп жақсарту жоқ, бірақ бұл басқа да белгілері бойынша кейбір жетілдіру болды.
Осы кезде сіз On-жарияланған айтарлықтай жақсы нәтижелерімен ғылым қағаз Бұл нәтижелер сәл разочаровывает деп ойлап, бірақ тек бір жылдан кейін, Blumenstock және екі әріптестер-Габриэль Cadamuro және Роберт мүмкін (Blumenstock, Cadamuro, and On 2015) . жақсарту үшін екі негізгі техникалық себептері болды: 1) олар көбірек күрделі әдістерін (яғни, инженерлік және неғұрлым күрделі машина оқыту моделін мүмкіндігі жаңа көзқарас) пайдаланылатын және 2) орнына жеке сауалнама сұрақтарына жауап тұжырым тырысып қарағанда (мысалы, «Егер сіз радио меңгерген?»), олар композиттік байлық индексі тұжырым жасауға тырысты.
Blumenstock мен әріптестер екі жолмен олардың тәсілді көрсеткіштерін көрсетті. Біріншіден, олар өз үлгідегі адамдар үшін, олар қоңырау жазбалар (3.14-сурет) олардың байлығын болжау өте жақсы жұмыс істей алар еді деп тапты. Екіншіден, мен бұрынғыдан бастысы, Blumenstock мен әріптестер олардың тәртібі Руанда байлық географиялық бөлу сапалы бағалауын мүмкін екендігін көрсетті. Нақтырақ айтқанда, олар қоңырау жазбаларына барлық 1,5 млн халқының байлығын болжау, шамамен 1000 адам, олардың үлгідегі оқыды, олардың машина оқыту моделі, пайдаланылған. Әрі қарай, қоңырау деректер енгізілген геоақпараттық деректерді (қоңырау деректер әр қоңырау үшін ең жақын орналасқан ұялы мұнара орналасқан жерін қамтиды еске) бар, зерттеушілер әр адамның тұрғылықты шамамен орын бағалауға мүмкіндік алды. бірге осы екі сметасын қою, ғылыми-зерттеу өте майда кеңістіктік нақтылау дәрежесі абоненттік байлықтың географиялық бөлу бағалау өндірілген. Мысалы, олар Руанда ның 2148 жасушаларының (елдегі ең кішкентай әкімшілік бірлік) әрбір орташа байлығын бағалай алды. Бұл байлығы құндылықтар олар тексеру қиын болды, сондықтан түйіршікті болды болжаған. Сондықтан, зерттеушілер Руанда 30 аудандарының орташа байлық сметасын өндіруге өз нәтижелерін біріктіріледі. Бұл аудандық деңгейдегі бағалау алтын стандарт дәстүрлі сауалнама Руанда демографиялық және денсаулық шолу (3.14-сурет) бастап бағалаулар қатты байланысты болды. екі көздерден сметаларды ұқсас болмағанымен, Blumenstock және әріптестерінен сметаларды шамамен 50 есе арзан және 10 есе жылдам (өзіндік құн айнымалы шығындар бойынша бағаланған кезде) болды. құнының Бұл драмалық төмендеуі, керісінше, бірнеше жыл сайын-ақ іске асырылуда қарағанда демографиялық және денсаулық үшін стандартты болып табылады, бұл зерттеулер-үлкен сандық ізі деректермен ұштастыра шағын зерттеу гибридті ай сайын іске болуы мүмкін дегенді білдіреді.
Қорытындылай келе, Blumenstock алтын стандартты зерттеу бағалау салыстырмалы бағалауын сандық ізі деректермен тәсіл аралас зерттеу деректерін сұрап күшейді. Бұл, атап айтқанда, мысал, сондай-ақ күшейді сұрап, дәстүрлі зерттеу әдістері арасындағы сауда-офф кезеңінде кейбір түсіндіреді. Біріншіден, күшейтілген сұрап сметаларды, айтарлықтай арзан, және одан түйіршікті көп уақтылы болды. Бірақ, екінші жағынан, осы уақытта, күшейтілген сұрағаннан осындай күшті теориялық негізі жоқ. Яғни ол кезде емес болады, ол жұмыс істейді және қашан осы бір мысал көрсетеді емес болып табылады. Әрі қарай, күшейтілген Сұрау тәсіл әлі оның бағалаулар айналасында белгісіздік сандық жақсы жолдарын жоқ. Алайда, күшейтілген Сұрау статистика моделіне негізделген пост-стратификациясы үш ірі аудандардың терең байланысы (Little 1993) , есептеу (Rubin 2004) , сондай-ақ шағын-аймақ бағалау (Rao and Molina 2015) -and сондықтан мен бұл прогресс болады күтуге жылдам болуы.
Күшейтілген Сұрау сіздің нақты жағдайға бейімделуі мүмкін негізгі рецептіні мынадай. Екі ингредиенттер мен екі қадамдар бар. Екі ингредиенттер) кең, бірақ жұқа сандық ізі деректер (бұл сіз әр тұлғалар туралы қажетті ақпаратты көптеген адамдар бар, бірақ,) және тар, бірақ қалың болып 2) сауалнама (яғни, ол бар 1 бірнеше адам ғана, бірақ ол), сіз сол адамдар туралы қажетті ақпаратты бар. Содан кейін, екі қадамдар бар. Біріншіден, сауалнама жауап болжау сандық ізі деректерді пайдаланатын машиналық оқыту моделін құру, екі деректер көздеріне адамдардың. Келесі, сандық ізі деректер барлық тексеру жауабын жүктеу деп машина оқыту моделін пайдаланады. Сіз адамдардың көптеген сұрағым келеді, кейбір мәселе бар болса, олардың жауап болжауға үшін пайдаланылуы мүмкін адамдардың сандық ізі деректер іздеңіз.
басы соңы емес: Сондай-ақ, үшінші дәуірдің екінші дәуірі көшу туралы маңызды сабақ көркемдейді мәселесіне Blumenstock алғашқы және екінші талпыныс салыстыра зерттеулер танысады тәсілдер. Яғни, бірнеше рет болып, бірінші тәсіл ең үздік болуы мүмкін емес болады, бірақ зерттеушілер жұмыс жалғасуда, егер нәрселер жақсы алуға болады. Тұтастай алғанда, сандық жасына әлеуметтік зерттеулерге жаңа тәсілдерді бағалау кезінде, ол екі түрлі бағалау жасауға маңызды: 1) қаншалықты жақсы қазір бұл жұмыс жасайды және 2) қаншалықты жақсы Сіз бұл деректер ландшафт ретінде болашақта жұмыс істеуі мүмкін деп ойлайсыз өзгерістер мен зерттеушілер мәселесіне көп көңіл бөлеміз ретінде. зерттеушілер (зерттеудің осы нақты бөлігі қаншалықты жақсы) бағалау бірінші түрін жасауға оқытылды, Дегенмен, екінші жиі маңыздырақ.