Cercetatorii au folosit busteni de e - mail și înregistrări administrative pentru a înțelege formarea prieteniei. Această cercetare necesită a face cu incompletitudinea datelor mari.
În multe situații, cercetătorii nu sunt suficient de norocos pentru a avea tot ceea ce ei doresc colectate în mod automat într-un singur loc. Două probleme comune sunt informații incomplete despre oameni și o nepotrivire între constructe teoretice și date. Ambele aceste probleme au fost abordate de către Kossinets și Watts (2009) , ca parte a eforturilor lor de a înțelege modul în care sociale evoluează rețele.
Aproximativ vorbind, cercetătorii cred că evoluția rețelei sociale este determinată de trei caracteristici: 1) structura relațiilor existente 2) activități comune (de exemplu, cămine, clase) și 3) demografice. Înțelegerea interrelațiile dintre acești trei factori necesită rețea de date longitudinale, combinate cu informații cu privire la datele demografice și activitățile persoanelor. Studiile anterioare au avut unele dintre aceste caracteristici, dar nici unul nu a avut toate cele trei.
Kossinets și Watts au început cercetările lor prin achiziționarea jurnalele de e-mail de la o universitate mare. Cu toate acestea, aceste jurnale de e-mail în monoterapie au fost incomplete, ele nu includ tot ce este necesar pentru a înțelege diferiții factori de conducere evoluția rețelei. Prin urmare, Kossinets și Watts a fuzionat aceste jurnale de e-mail, cu alte două surse de informații: informații demografice colectate de către universitate și informații cu privire la activitățile comune (de exemplu, informații de rezidență student și o listă completă de înscriere la cursuri). Odată ce aceste trei surse de informații, fiecare dintre acestea a fost incompletă, s-au fuzionat împreună Kossinets și Watts a avut o structură de date puternică pentru înțelegerea evoluției rețelei.
Dar, a fost o provocare finală, care au trebuit să le depășească. Kossinets și Watts a vrut să studieze modul în care rețeaua socială în această universitate a evoluat astfel încât au nevoie de o modalitate de a utiliza jurnalele de e-mail într-o estimare a, care a fost conectat la care, la timp, care. Așa cum sa discutat în prealabil (secțiunea 2.3.2.1), acest tip de operaționalizare a constructelor teoretice este o mare provocare atunci când se utilizează urme digitale pentru cercetarea socială. În cele din urmă, Kossinets și Watts a decis că două persoane au fost considerate conectate la momentul \ (t \) , dacă și numai dacă au făcut schimb de e - mailuri (\ (i \) prin e - mail \ (j \) și \ (j \) prin e - mail \ ( i \)) în cursul celor 60 de zile anterioare. Aceste alegeri nu au fost arbitrare; acestea s-au bazat pe o analiză atentă a acestei setări empirice și Kossinets și Watts verificat că rezultatele lor au fost robuste la aceste alegeri. În general, în cazul în care operaționalizarea dvs. implică alegerea unor anumite Cutoffs-spun 60 de zile în loc de 30 de zile sau 90 de zile, este o idee bună să vă asigurați că rezultatele nu sunt sensibile la această alegere.
Odată ce Kossinets și Watts a abordat problema cauzată de incompletitudine (de exemplu, lipsa de informații demografice, informații despre activitatea partajate care lipsesc, și lipsesc constructe teoretice), au avut date pe care le-au permis să înțeleagă cele trei forțe principale care pot conduce evoluția rețelei: 1) structura relațiilor existente 2) activități comune (de exemplu, cămine, clase) și 3) criterii demografice. In concordanta cu cercetarile anterioare, au descoperit ca persoanele cu datele demografice similare sunt mai susceptibile de a forma relații. Cu toate acestea, spre deosebire de studiile anterioare, au descoperit că acest model a fost puternic atenuat de structura rețelei existente, precum și activități comune. Cu alte cuvinte, modelul care a vazut cercetatorii anterioare a fost explicată parțial de date care cercetătorii anterioare nu au avut. Astfel, prin abordarea cu succes a incompletitudinea datelor lor, Kossinets și Watts au putut clarifica interacțiunea dintre o varietate de diferiți factori care conduc evoluțiile rețelei sociale.