2.4.1.2 формирање Пријатељство међу студентима

Истраживачи су користили е-дневника и административне податке да разумеју формирање пријатељство. Ово истраживање захтева суочавање са непотпуности великих података.

У многим ситуацијама, истраживачи нису довољно среће да имамо све што они желе аутоматски прикупљене на једном месту. Два заједнички проблеми су непотпуне информације о људима и неслагања између теоријских конструкција и података. Оба ова проблема су се обратили Коссинетс и Ваттс (2009) , као део њихових напора да разумеју како друштвене мреже еволуирају.

Грубо говорећи, истраживачи сматрају да се друштвена мрежа еволуција је вођен три могућности: 1) структури постојећих односа 2) заједничких активности (нпр, домова, класе) и 3) демографији. Разумевање међусобне између ова три фактора захтева лонгитудиналне податке мреже у комбинацији са информацијама о демографији и активности појединаца. Раније студије су имали неке од ових функција, али нико није имао сва три.

Коссинетс и В започели су истраживање куповином евиденцију емаил од великог универзитета. Међутим, ове евиденције емаил сами били непотпуни, они не укључују све што је потребно да разуме разне факторе вожњу мреже еволуцију. Стога, Коссинетс и В спојио ове е-дневника, са друга два извора информација: демографске информације прикупљене од стране универзитета и информације о заједничким активностима (нпр, Студент Ресиденце информација и комплетна листа уписа у курсевима). Када ова три извора информација, од којих је сваки био непотпун, су спојени Коссинетс и В је снажно структуру података за разумевање мреже еволуције.

Али, био је један коначни изазов да су морали да превазиђу. Коссинетс и В желео да студира како друштвена мрежа у овом универзитету еволуирали тако да је потребно начин да користе дневнике е у процени који је повезан са ким у које време. Као што је речено у претходно (члан 2.3.2.1), ова врста операционализације теоријских конструкција је велики изазов када се користи дигиталне трагове за друштвена истраживања. На крају, Коссинетс и В одлучио да двоје људи сматра повезана на време \ (Т \) ако и само ако су међусобно размењивали електронску пошту (\ (и \) поштом \ (ј \) и \ (ј \) е-поштом \ ( и \)) у претходних 60 дана. Ови избори нису били произвољно; они су на основу пажљивог разматрања овог емпиријског подешавања, и Коссинетс и В проверити да су њихови резултати били отпорни на овим изборима. У принципу, ако је операционализација укључује избор неке специфичне одсечци-саи 60 дана уместо 30 дана или 90 дана-то је добра идеја да се уверите да ваши резултати нису осетљиви на овом избору.

Када Коссинетс и В бавила проблемом изазване непотпуности (на пример, недостаје демографских података, недостају информације о заједничком активношћу, а недостаје теоријске конструкције), имали су податке које су им омогућиле да разумеју три главне силе које може возити мреже еволуцију: 1) struktura постојећих односа 2) заједничких активности (на пример, домовима, класе) и 3) демографију. У складу са ранијим истраживањима, открили су да су људи са сличним демографским карактеристикама више шансе да формирају везе. Међутим, за разлику од ранијих истраживања, открили су да овај образац је јако ублажен постојеће мреже структуром и заједничким активностима. Другим речима, образац који је видео раније истраживачи су делимично објашњава податак да се ранији истраживачи нема. Тако, успешно се бави непотпуности њихових података, Коссинетс и В су могли разјаснити интеракције разних различитих фактора који покрећу еволуцију друштвене мреже.