Navorsers gebruik e-pos logs en administratiewe rekords vorming vriendskap verstaan. Hierdie navorsing vereis wat handel oor die onvolledigheid van die groot data.
In baie gevalle, navorsers is nie gelukkig genoeg is om alles wat hulle outomaties in 'n plek wil ingesamel het. Twee algemene probleme is onvolledige inligting oor die mense en 'n wanverhouding tussen teoretiese konstrukte en data. Beide van hierdie probleme is aangespreek deur Kossinets en Watts (2009) as deel van hul pogings om te verstaan hoe sosiale netwerke ontwikkel.
Rofweg gesproke, navorsers dink dat sosiale netwerk evolusie gedryf word deur drie funksies: 1) die struktuur van bestaande verhoudings 2) gedeel aktiwiteite (bv, slaapsale, klasse) en 3) demografie. Verstaan die onderlinge verband tussen hierdie drie faktore vereis longitudinale netwerk data gekombineer met inligting oor demografie en aktiwiteite individue. Vroeër studies het 'n paar van hierdie eienskappe, maar niemand het al drie.
Kossinets en Watts begin hul navorsing deur die verkryging van die e-pos logs van 'n groot universiteit. Maar hierdie e-pos logs alleen was onvolledig, hulle sluit nie alles wat nodig is om die verskillende faktore wat die netwerk evolusie te verstaan. Daarom, Kossinets en Watts saamgesmelt hierdie e-pos logs, met twee ander bronne van inligting: demografiese inligting deur die Universiteit en inligting oor gedeelde aktiwiteite (bv studentekoshuis inligting en 'n volledige lys van inskrywings in kursusse) ingesamel. Sodra hierdie drie bronne van inligting, elk van wat onvolledig was, het saam saamgesmelt Kossinets en Watts het 'n kragtige datastruktuur vir begrip netwerk evolusie.
Maar, was daar 'n laaste uitdaging wat hulle moes oorkom. Kossinets en Watts wou bestudeer hoe die sosiale netwerk in hierdie universiteit ontwikkel sodat hulle nodig om 'n manier om die e-pos logs gebruik in 'n skatting van wat gekoppel is aan wie op watter tyd. Soos bespreek in voorheen (Afdeling 2.3.2.1), hierdie soort van operasionalisering van teoretiese konstrukte is 'n groot uitdaging wanneer die gebruik van digitale spore vir sosiale navorsing. Op die ou end, Kossinets en Watts besluit dat twee mense in ag geneem in verband ten tye \ (t \) as en slegs as hulle e-pos (\ (i \) per e-pos \ (j \) en \ (j \) per e-pos \ (het uitgeruil I \)) in die vorige 60 dae. Hierdie keuses was nie arbitrêre; hulle op grond van deeglike oorweging van hierdie empiriese omgewing, en Kossinets en Watts seker gemaak dat hul uitslae was sterk om hierdie keuses. In die algemeen, as jou operasionalisering behels die keuse van 'n spesifieke cutoffs-sê 60 dae in plaas van 30 dae of 90 dae-dit is 'n goeie idee om seker te maak dat jou resultate is nie sensitief vir hierdie keuse.
Sodra Kossinets en Watts die probleem wat veroorsaak word deur onvolledigheid aangespreek (bv ontbreek demografiese inligting, ontbreek inligting oor gedeelde aktiwiteit, en ontbreek teoretiese konstrukte), het hulle inligting wat hulle in staat gestel om die drie belangrikste kragte wat netwerk evolusie kan ry verstaan: 1) die struktuur van bestaande verhoudings 2) gedeel aktiwiteite (bv, slaapsale, klasse) en 3) demografie. In ooreenstemming met vorige navorsing, het hulle gevind dat mense met 'n soortgelyke demografie is meer geneig om verhoudings te vorm. Maar, in teenstelling met vorige studies, het hulle gevind dat hierdie patroon sterk is versag deur die bestaande netwerk struktuur en gedeelde aktiwiteite. Met ander woorde, is die patroon wat vroeër navorsers het gesien gedeeltelik verklaar deur data wat vroeër navorsers het nie. Dus, deur suksesvol hantering van die onvolledigheid van hul data, Kossinets en Watts kon verduidelik die interaksie van 'n verskeidenheid van verskillende faktore wat sosiale netwerk ontwikkelinge ry.