Teadlased e palke ja haldusandmetest mõista sõprus teket. See uurimistöö on tegemist puudulikkus suur andmed.
Paljudes olukordades, teadlased ei ole õnn, et kõik, mis nad tahavad automaatselt kogutud ühes kohas. Kaks levinud probleemid on puudulik teave inimesi ja ebakõla teoreetilised ja andmed. Mõlemad probleemile juhtis Kossinets ja Watts (2009) osana oma jõupingutusi, et mõista, kuidas sotsiaalsed võrgustikud areneda.
Üldjoontes teadlased arvavad, et sotsiaalne võrgustik areng on ajendatud kolm funktsioone: 1) struktuur olemasolevaid suhteid 2) ühiste tegevuste (nt hostelis, klassid) ja 3) demograafia. Arusaamine nende omavahelist kolm tegurit on vaja piki- võrgu andmed koos informatsiooni üksikisikute demograafia ja tegevusi. Varasemad uuringud olid mõned neist omadustest, kuid ükski neist oli kõik kolm.
Kossinets ja Watts alustas oma uurimistööd, omandades e-posti palgid suures ülikoolis. Kuid need e-posti palke üksi olid puudulikud, ei sisalda nad kõik vajalik, et mõista erinevaid tegureid, mis mõjutavad võrgu areng. Seetõttu Kossinets ja Watts ühines need e-posti palke, kaks muud teabeallikad: demograafilisi andmeid kogutakse ülikooli ja informatsiooni jagada tegevusi (nt üliõpilaselamu informatsiooni ja täieliku nimekirja kuulumine kursused). Kui need kolm teabeallikad, millest igaüks oli puudulik, liideti kokku Kossinets ja Watts oli võimas andmete struktuuri mõistmiseks võrgu areng.
Aga seal oli üks lõplik väljakutse, et neil ületada. Kossinets ja Watts tahtis õppida, kuidas sotsiaalne võrgustik selle ülikooli arenenud, et nad vajasid võimalus kasutada e-posti logib hinnangu kes oli ühendatud kes sel ajal. Nagu mainitud eespool (punkt 2.3.2.1), selline edenes teoreetilised on suur väljakutse, kui kasutate digitaalset jäljed sotsiaalsed uuringud. In the end, Kossinets ja Watts otsustas, et kaks inimest peeti ühendatud ajahetkel \ (t \) siis ja ainult siis, kui nad olid vahetanud e-kirju (\ (i \) saadetakse \ (j \) ja \ (j \) saadetakse \ ( i \)) viimase 60 päeva jooksul. Need valikud ei olnud meelevaldne; need põhinevad hoolikalt kaaluda selle empiiriline seade ja Kossinets ja Watts kontrollida, et nende tulemused olid tugevad, et neid valikuid. Üldiselt, kui teie edenes hõlmab valides mõne konkreetse cutoffs-öelda 60 päeva asemel 30 päeva või 90 päeva, see on hea mõte, et veenduda, et teie tulemused ei ole tundlik seda valikut.
Kui Kossinets ja Watts probleemiga tegelenud põhjustatud puudulikkus (nt kadunud demograafilisi andmeid, puuduv teave jagatud aktiivsus ja puudu teoreetilisi konstruktsioone), neil oli andmeid, mis võimaldas neil mõista kolm peamist jõud, mis võib sõita võrgu areng: 1) struktuuri olemasolevaid suhteid 2) ühiste tegevuste (nt hostelis, klassid) ja 3) demograafia. Kooskõlas varasemate uuringutega, leidsid nad, et inimesed sarnaste demograafia on tõenäolisem, et moodustada suhteid. Kuid erinevalt varasematest uuringutest, leidsid nad, et see muster oli tugevalt leevendada olemasoleva võrgu struktuur ja ühiste tegevuste. Teisisõnu struktuuris et varem teadlaste näinud oli osaliselt seletada andmed sellele varasemale teadlaste ei olnud. Seega edukalt tegelevad puudulikkus oma andmed, Kossinets ja Watts suutsid selgitada koostoime erinevaid tegureid, mis autot sotsiaalne võrgustik arenguid.