2.4.1.2 Tworzenie Przyjaźń wśród studentów

Naukowcy wykorzystali dzienniki e-mail i rejestrów administracyjnych zrozumieć powstawanie przyjaźń. Badanie to wymaga czynienia z niekompletności dużych danych.

W wielu sytuacjach, naukowcy nie są na tyle szczęście, że wszystko to, co chcą, automatycznie zbierane w jednym miejscu. Dwa wspólne problemy są niekompletne informacje na temat ludzi i niedopasowania pomiędzy konstruktami teoretycznymi i danych. Oba te problemy zostały poruszone przez Kossinets i Watts (2009) jako część ich wysiłków, aby zrozumieć, jak sieci społecznościowe ewoluować.

Z grubsza rzecz biorąc, naukowcy uważają, że ewolucja społecznościowy jest napędzany przez trzy funkcje: 1) strukturę istniejących relacji 2) wspólnych działań (np akademiki, zajęcia) i 3) demograficzne. Zrozumienie zależności między tymi trzema czynnikami wymaga podłużne danych sieciowych w połączeniu z informacjami na temat demografii i działań poszczególnych osób. Wcześniejsze badania miały niektóre z tych funkcji, ale żaden nie miał wszystkie trzy.

Kossinets i Watts rozpoczął swoje badania poprzez nabywanie dzienniki e-mail z dużego uniwersytetu. Jednak te same dzienniki e-mail były niekompletne, nie obejmują one wszystko, co potrzebne, aby zrozumieć różne czynniki wpływające na ewolucję sieci. Dlatego Kossinets i Watts połączyła te dzienniki e-mail, z dwóch innych źródeł informacji: dane demograficzne zebrane przez uczelnię oraz informacje o działaniach wspólnych (np informacyjnych dom studencki oraz pełna lista zapisów na kursy). Po tych trzech źródeł informacji, z których każda była niekompletna, zostały połączone ze sobą Kossinets i Watts miał potężną strukturę danych dla zrozumienia ewolucji sieci.

Ale był jeden końcowy wyzwanie, które mieli do pokonania. Kossinets i Watts chciał zbadać, jak społecznościowy w tej uczelni ewoluowały więc potrzebowała sposobu korzystania z dzienników e-mail na oszacowanie, który został połączony który w tym czasie. Jak omówiono poprzednio (pkt 2.3.2.1), ten rodzaj operacjonalizacji konstruktów teoretycznych jest dużym wyzwaniem przy użyciu śladów cyfrowych dla badań społecznych. W końcu Kossinets i Watts zdecydował, że dwie osoby zostały uznane za związane w czasie \ (t \) wtedy i tylko wtedy, gdyby wymienili maile (\ (i \) wysłane \ (j \) i \ (j \) wysłane \ ( i \)) w ciągu ostatnich 60 dni. Te wybory nie były arbitralne; były one oparte na starannym rozważeniu tej empirycznej ustawienia i Kossinets i Watts zaznaczone, że ich wyniki były odporne na tych wyborów. W ogóle, jeśli operacjonalizacji polega na wybraniu pewnych szczególnych spodenki powiedzmy 60 dni zamiast 30 dni lub 90 dni, to jest dobry pomysł, aby upewnić się, że wyniki nie są wrażliwe na tego wyboru.

Po Kossinets i Watts skierowana problemu spowodowanego przez niekompletność (np brakujące dane demograficzne, brakujące informacje o wspólnej działalności, a brakującą konstruktów teoretycznych), mieli dane, które pozwoliły im zrozumieć trzy główne siły, które mogą napędzają rozwój sieci: 1) struktura istniejących relacji 2) wspólnych działań (np akademiki, ćwiczenia) oraz 3) dane demograficzne. Zgodnie z wcześniejszych badań, naukowcy odkryli, że osoby o podobnych danych demograficznych są bardziej skłonne do tworzenia relacji. Jednakże, w przeciwieństwie do wcześniejszych badań okazało się, że ten wzór był silnie zmniejszone w istniejącej strukturze sieciowej i działania współdzielonych. Innymi słowami wzór, który wcześniej badacze widać częściowo wytłumaczyć danych wcześniej badacze nie mieć. W ten sposób, z powodzeniem do czynienia z niekompletności swoich danych, Kossinets i Watts byli w stanie wyjaśnić wzajemne oddziaływanie różnych czynników, które napędzają ewolucji sieci społecznych.