Kuunganisha utafiti wako kwa athari digital inaweza kuwa kama kuuliza kila mtu maswali yako wakati wote.
Kuuliza ujumla huja katika aina mbili kuu: sampuli tafiti na sensa. Mfano wa tafiti, ambapo kupata idadi ndogo ya watu, inaweza kuwa rahisi, kwa wakati, na kiasi nafuu. Hata hivyo, tafiti sampuli, kwa sababu wao ni kulingana na sampuli, ni mara nyingi mdogo katika azimio yao; na sampuli za utafiti, mara nyingi ni vigumu kufanya makadirio kuhusu mikoa maalum ya kijiografia au kwa vikundi maalum idadi ya watu. Sensa, kwa upande mwingine, kujaribu kuwahoji kila mmoja katika idadi ya watu. Wana azimio kubwa, lakini wao ni ujumla ghali, mwembamba katika lengo (wao tu ni pamoja na idadi ndogo ya maswali), na si wakati (wao kutokea kwenye ratiba fasta, kama vile kila baada ya miaka 10) (Kish 1979) . Sasa kufikiria kama watafiti inaweza kuchanganya sifa bora ya tafiti sampuli na sensa; kufikiria kama watafiti anaweza kuuliza kila swali kwa kila mtu kila siku.
Ni wazi, daima hii, ubiquitous, daima-juu ya utafiti ni aina ya sayansi ya jamii fantasy. Lakini, inaonekana kwamba tunaweza kuanza kwa takriban hii kwa kuchanganya maswali ya utafiti kutoka idadi ndogo ya watu na athari digital kutoka kwa watu wengi. Natoa wito aina hii ya mchanganyiko alijiinua kuuliza. Kama kufanyika vizuri, inaweza kutusaidia hutoa makadirio kwamba ni mitaa zaidi (kwa maeneo madogo ya kijiografia), punjepunje zaidi (kwa ajili ya makundi maalum idadi ya watu), na zaidi kwa wakati muafaka.
Mfano mmoja wa kuuliza alijiinua linatokana na kazi ya Joshua Blumenstock, ambaye alitaka kukusanya takwimu kwamba ingesaidia maendeleo mwongozo katika nchi maskini. Zaidi hasa, Blumenstock alitaka kujenga mfumo wa kupima utajiri na ustawi kwamba pamoja ukamilifu wa sensa na kubadilika na mzunguko wa utafiti (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . Kwa kweli, nimekuwa tayari ilivyoelezwa kazi Blumenstock kwa kifupi katika Sura ya 1.
Kuanza, Blumenstock ilishirikiana na kubwa kutoa huduma ya simu nchini Rwanda. kampuni zinazotolewa yake rekodi anonymized shughuli kutoka kwa wateja wapatao milioni 1.5 kufunika tabia kuanzia mwaka 2005 na 2009. magogo yana habari kuhusu kila ujumbe wito na maandishi kama vile kuanza wakati, muda, na takriban eneo la kijiografia ya mpigaji na mpokeaji. Kabla ya kuanza kuzungumza juu ya masuala ya takwimu, ni thamani ya kusema kuwa hatua hii ya kwanza inaweza kuwa moja ya gumu. Kama ilivyoelezwa katika Sura ya 2, wengi digital kuwaeleza data ni inaccessible kwa watafiti. Na, makampuni mengi ni justifiably tvekar kushiriki data zao kwa sababu ni binafsi; kwamba ni wateja wao pengine hawakuwa wanatarajia kwamba rekodi zao itakuwa pamoja-kwa wingi-na watafiti. Katika kesi hiyo, watafiti walichukua hatua makini na anonymize data na kazi zao yalikuwa yakisimamiwa na wa tatu (yaani, IRB yao). Lakini, licha ya juhudi hizi, data hizi ni pengine bado zinazotambulika na wao uwezekano vyenye habari nyeti (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . Mimi itabidi kurudi swali haya ya kimaadili katika Sura ya 6.
Kumbuka kwamba Blumenstock ilikuwa nia ya kupima utajiri na ustawi. Lakini, sifa hizi si moja kwa moja katika kumbukumbu wito. Kwa maneno mengine, kumbukumbu hizi wito ni pungufu kwa ajili ya utafiti huu, hulka ya kawaida ya athari digital kwamba lilijadiliwa kwa kina katika Sura ya 2. Lakini, inaonekana kuwa rekodi wito pengine kuwa na baadhi ya taarifa kuhusu mali na ustawi. Hivyo, njia moja ya kuuliza swali Blumenstock ya inaweza kuwa: ni, inawezekana kutabiri jinsi mtu anaweza kukabiliana na utafiti kwa kuzingatia takwimu zao digital kuwaeleza? Ikiwa hivyo, basi kwa kuuliza watu wachache tunaweza nadhani majibu ya kila mtu mwingine.
Kutathmini hii empirically, Blumenstock na utafiti wasaidizi kutoka Kigali Taasisi ya Sayansi na Teknolojia aitwaye sampuli ya elfu wateja simu za mkononi. watafiti alielezea malengo ya mradi kwa washiriki, aliomba ridhaa yao kuunganisha majibu ya utafiti wa kumbukumbu za wito, na kisha kuwataka mfululizo wa maswali ili kupima mali zao na ustawi, kama vile "Je, wewe mwenyewe radio? "na" Je, wewe mwenyewe baiskeli? "(ona Kielelezo 3.11 kwa orodha ubaguzi). Washiriki wote katika utafiti walipewa fidia kifedha.
Next, Blumenstock kutumika hatua mbili utaratibu wa kawaida katika data sayansi: Kipengele uhandisi na kufuatiwa na kujifunza kusimamiwa. Kwanza, katika hatua kipengele uhandisi, kwa kila mtu kwamba alihojiwa, Blumenstock kubadilishwa rekodi wito katika seti ya sifa juu ya kila mtu; wanasayansi data kuyaita sifa hizo "makala" na wanasayansi wa kijamii bila kuwaita "vigezo." Kwa mfano, kwa kila mtu, Blumenstock mahesabu jumla ya idadi ya siku na shughuli, idadi ya watu tofauti mtu imekuwa katika kuwasiliana na, kiasi cha fedha zilizotumika muda wa maongezi, na kadhalika. Kwa kina, nzuri kipengele uhandisi inahitaji elimu ya mazingira utafiti. Kwa mfano, kama ni muhimu kutofautisha kati ya wito wa ndani na kimataifa (sisi kutarajia watu wanaoomba kimataifa kuwa tajiri), basi hii ni lazima kufanyika katika hatua kipengele uhandisi. mtafiti na uelewa mdogo wa Rwanda wanaweza ni pamoja na kipengele hiki, na kisha utendaji uingizaji wa mtindo kuteseka.
Next, katika inasimamiwa kujifunza hatua, Blumenstock kujengwa mfano wa takwimu kutabiri majibu ya utafiti kwa kila mtu kulingana na sifa zao. Katika kesi hiyo, Blumenstock kutumika vifaa regression na mara 10 msalaba-uthibitisho, lakini hakuweza kuwa kutumika aina ya mbinu nyingine takwimu au kujifunza mashine.
Hivyo ni jinsi vizuri gani kazi? Blumenstock alikuwa na uwezo wa kutabiri majibu ya utafiti maswali kama "Je, wewe mwenyewe radio?" Na "Je, wewe mwenyewe baiskeli?" Kutumia makala inayotokana na rekodi wito? Aina ya. usahihi wa utabiri walikuwa juu ya baadhi ya sifa (Kielelezo 3.11). Lakini, daima ni muhimu kulinganisha utabiri mbinu tata dhidi rahisi mbadala. Katika kesi hiyo, rahisi mbadala ni kutabiri kwamba kila mtu kutoa jibu ya kawaida. Kwa mfano, 97.3% taarifa kumiliki radio hivyo kama Blumenstock wametabiri kuwa kila mtu bila kutoa taarifa kumiliki radio asingekuwa usahihi wa 97.3%, ambayo ni ya kushangaza sawa na utendaji wa utaratibu wake ngumu zaidi (97.6% usahihi). Kwa maneno mengine, data zote dhana na modeling kuongezeka kwa usahihi wa utabiri kutoka 97.3% hadi 97.6%. Hata hivyo, kwa maswali mengine, kama vile "Je, wewe mwenyewe baiskeli?", Utabiri kuboresha kutoka 54.4% hadi 67.6%. Zaidi kwa ujumla, Kielelezo 3.12 inaonyesha kwa baadhi ya sifa Blumenstock hakuwa na kuboresha mengi zaidi tu kufanya msingi utabiri rahisi, lakini kwamba kwa sifa nyingine kulikuwa na baadhi ya maboresho.
Katika hatua hii unaweza kuwa na mawazo kwamba matokeo haya ni kidogo kuwakatisha tamaa, lakini tu mwaka mmoja baadaye, Blumenstock na wenzake wawili-Gabriel Cadamuro na Robert On-kuchapishwa karatasi katika Sayansi na matokeo unafuu zaidi (Blumenstock, Cadamuro, and On 2015) . Kulikuwa na mbili sababu kuu ya kiufundi kwa ajili ya kuboresha: 1) walitumia mbinu ya kisasa zaidi (yaani, mbinu mpya ya kipengele uhandisi na kisasa zaidi kujifunza mashine mfano) na 2) badala ya kujaribu kudai majibu ya maswali ya utafiti binafsi (kwa mfano, "Je, wewe mwenyewe radio?"), walijaribu kudai Composite utajiri index.
Blumenstock na wenzake alionyesha utendaji wa mbinu zao kwa njia mbili. Kwanza, waligundua kuwa kwa watu katika sampuli yao, hawakuweza kufanya kazi nzuri ya utabiri wa mali zao kutoka rekodi wito (Kielelezo 3.14). Pili, na milele muhimu zaidi, Blumenstock na wenzake ilionyesha kuwa utaratibu yao inaweza kuzalisha makadirio ya ubora wa usambazaji wa kijiografia wa mali nchini Rwanda. Zaidi hasa, walitumia mashine zao kujifunza mfano, ambayo akapata mafunzo ya sampuli yao ya watu wapatao 1,000, kutabiri utajiri wa watu wote milioni 1.5 katika rekodi wito. Zaidi ya hayo, pamoja na data geospatial iliyoingia katika data wito (kukumbuka kuwa data wito ni pamoja na eneo la karibu mnara kiini kwa kila simu), watafiti waliweza kukadiria takriban nafasi ya makazi ya kila mtu. Kuweka makadirio hayo mawili kwa pamoja, utafiti zinazozalishwa makadirio ya usambazaji wa kijiografia wa mteja utajiri granularity sana faini ya anga. Kwa mfano, hawakuweza kukadiria utajiri wastani katika kila moja ya 2148 seli Rwanda (kidogo sana cha kiutawala katika nchi). Hizi alikadiria utajiri maadili walikuwa hivyo punjepunje walikuwa vigumu kuangalia. Hivyo, watafiti totala matokeo yao kuzalisha makadirio ya utajiri wa wastani wa wilaya 30 nchini Rwanda. makadirio ngazi ya wilaya hizi walikuwa sana kuhusiana na makadirio kutoka kiwango cha utafiti dhahabu wa jadi, Rwanda Idadi ya Watu na Utafiti wa Afya (Kielelezo 3.14). Ingawa makadirio kutoka vyanzo viwili walikuwa sawa, makadirio kutoka Blumenstock na wenzake walikuwa juu ya 50 mara nafuu na mara 10 kwa kasi (wakati gharama katika kipimo katika suala la gharama variable). Hii kupungua kwa kiasi kikubwa kwa gharama ina maana kwamba badala ya kuwa kukimbia kila baada ya miaka-kama wachache ni kiwango kwa Tafiti za DHS-mseto wa utafiti ndogo pamoja na data kubwa digital kuwaeleza inaweza kuwa na kukimbia kila mwezi.
Kwa kumalizia, Blumenstock ya Amplified kuuliza mfumo wa pamoja takwimu za utafiti na data digital kuwaeleza kuzalisha makadirio kulinganishwa na makadirio ya utafiti dhahabu-standard. mfano huu hasa pia anafafanua baadhi ya biashara awamu ya pili kati ya kuuliza alijiinua na mbinu za jadi utafiti. Kwanza, alijiinua kuuliza makadirio walikuwa zaidi kwa wakati, kikubwa bei nafuu, na zaidi punjepunje. Lakini, kwa upande mwingine, wakati huu, kuna si imara kinadharia msingi kwa ajili ya aina hii ya kuuliza alijiinua. Yaani, mfano huu mmoja hana wakati itakuwa kazi na wakati itakuwa si. Zaidi ya hayo, alijiinua kuuliza mbinu bado haina kuwa njia nzuri ya kupima wasiwasi kote makadirio yake. Hata hivyo, alijiinua kuuliza ana uhusiano wa kina kwa maeneo matatu kubwa katika takwimu-mfano makao baada ya stratification (Little 1993) , imputation (Rubin 2004) , na wadogo eneo la kukadiria (Rao and Molina 2015) -na hivyo natarajia kwamba maendeleo mapenzi itakuwa haraka.
Alijiinua kuuliza ifuatavyo mapishi ya msingi ambayo yanaweza kulengwa kwa hali yako maalum. Kuna viungo mbili na hatua mbili. viungo wawili ni 1) digital kuwaeleza CCD kwamba ni pana lakini nyembamba (yaani, ina watu wengi lakini si habari kwamba unahitaji kuhusu watu kila) na 2) utafiti kwamba ni nyembamba lakini nene (yaani, ina ni watu wachache tu, lakini ina taarifa kwamba unahitaji kuhusu watu hao). Basi, kuna hatua mbili. Kwanza, kwa ajili ya watu katika wawili vyanzo data, kujenga mashine kujifunza mfano kwamba anatumia data digital kuwaeleza kutabiri majibu utafiti. Next, kutumia mfano wa kuigwa mashine kujifunza kwa kumsingizia majibu ya kila mtu utafiti katika data digital kuwaeleza. Hivyo, kama kuna baadhi ya swali kwamba unataka kuuliza kwa kura ya watu, kuangalia kwa data digital kuwaeleza kutoka kwa wale watu ambayo inaweza kutumika kutabiri jibu yao.
Kulinganisha jaribio la kwanza na la pili Blumenstock ya saa tatizo pia unaeleza somo muhimu kuhusu mpito kutoka zama ya pili ya mbinu era tatu kufanya utafiti wa utafiti: mwanzo sio mwisho. Hiyo ni, mara nyingi, mbinu ya kwanza haitakuwa bora, lakini kama watafiti kuendelea kufanya kazi, mambo yanaweza kupata bora. Zaidi kwa ujumla, wakati kutathmini mbinu mpya ya utafiti wa kijamii katika umri digital, ni muhimu kufanya tathmini mbili tofauti: 1) jinsi vizuri gani kazi hii sasa na 2) jinsi vizuri unafikiri hii inaweza kufanya kazi katika siku zijazo kama mazingira data mabadiliko na kama watafiti kujishughulisha kipaumbele zaidi ya tatizo. Pamoja na kwamba, watafiti ni mafunzo kwa kufanya aina ya kwanza ya tathmini (jinsi nzuri ni hii kipande fulani ya utafiti), ya pili ni mara nyingi muhimu zaidi.