Raziskovalci uporabljajo e-dnevnike in druge evidence razumeti nastanek prijateljstva. Ta raziskava je zahteva, ki se ukvarjajo s popolnostjo velikih podatkov.
V mnogih primerih, raziskovalci niso dovolj srečni, da imajo vse, kar želijo, se samodejno zbrane na enem mestu. Dve skupni problemi so nepopolni podatki o ljudeh in neusklajenosti med teoretičnih konstruktov in podatkov. Oba od teh težav je nagovoril Kossinets in Watts (2009) kot del svojih prizadevanj za boljše razumevanje, kako socialna omrežja razvijajo.
Grobo rečeno, raziskovalci menijo, da je razvoj socialne mreže poganja tri funkcije: 1) strukturi obstoječih razmerij 2) skupne dejavnosti (npr dorms, razredi) in 3) demografske. Razumevanje medsebojne povezave med temi tremi dejavniki zahteva longitudinalne podatke omrežja v kombinaciji s podatki o demografiji in aktivnosti posameznikov. Prejšnje študije so bile nekatere od teh funkcij, vendar nobena ni imela vse tri.
Kossinets in Watts začeli svoje raziskave z nakupom e-dnevnike iz velike univerze. Vendar pa so bili samo ti e-poštni dnevniki nepopolna, ne vključujejo vse potrebno za razumevanje različnih dejavnikov, ki vplivajo razvoj omrežja. Zato Kossinets in Watts združili te e-dnevniki, z dvema drugimi viri informacij: demografske podatke, ki jih univerze in informacije o skupnih dejavnostih (npr informacijskih študentskih domov in popoln seznam o vpisu v tečaje) zbrani. Po teh treh virov informacij, od katerih je bila nepopolna, so bili združeni Kossinets in Watts je močno podatkovno strukturo za razvoj razumevanja omrežja.
Vendar pa je bil en zadnji izziv, ki so morali premagati. Kossinets in Watts želel študirati, kako socialna mreža na tej univerzi je razvil, tako da je potrebno način za uporabo e-dnevnike v oceno, ki je bil povezan, kdo v tem času. Kot je navedeno v prej (oddelek 2.3.2.1), ta vrsta operacionalizacijo teoretičnih konstruktov je velik izziv pri uporabi digitalnih sledi za socialne raziskave. Na koncu, Kossinets in Watts je odločil, da so bile dve osebi šteje povezani v času \ (t \), če in samo če sta izmenjala e-pošte (\ (i \) po e-pošti \ (j \) in \ (j \) po e-pošti \ ( i \)) v zadnjih 60 dneh. Te odločitve ne bi bilo pristransko; ti so temeljili na temeljitem premisleku o tem empiričnih nastavitve in Kossinets in Watts preverila, ali so njihovi rezultati robustna, da te izbire. Na splošno, če je vaša operacionalizacija vključuje izbiro nekatere posebne Cutoffs-pravijo 60 dni namesto 30 dni ali 90 dni, to je dobra ideja, da se prepričajte, da so vaši rezultati niso občutljivi na to izbiro.
Ko Kossinets in Watts o problemu, ki ga nepopolnosti povzročile (npr manjka demografske podatke, manjkajoče podatke o skupni aktivnosti in manjkajoče teoretične konstrukte), so imeli podatke, ki so jim omogočila razumeti tri glavne sile, ki lahko poganjajo razvoj omrežja: 1) struktura obstoječih razmerij 2) skupne dejavnosti (npr dorms, razredi) in 3) demografije. V skladu s prejšnjimi raziskavami so ugotovili, da so ljudje s podobnimi demografijo bolj verjetno, da tvorijo odnose. Vendar pa za razliko od prejšnjih študijah so ugotovili, da je bil ta vzorec močno zmanjšati z obstoječo strukturo omrežja in skupnih aktivnosti. Z drugimi besedami, je vzorec, ki je prejšnji raziskovalci opazili delno pojasniti s podatki, ki jih ni bilo prejšnje raziskovalci. Tako je z uspešno ukvarjajo s popolnostjo svojih podatkov, je bilo Kossinets in Watts mogli pojasniti interakcijo različnih dejavnikov, ki poganjajo evolucijo socialnih omrežij.