2.4.1.2 Vänskap bildning bland studenter

Forskarna använde e-post loggar och andra register för att förstå vänskap bildning. Denna forskning kräver att göra med ofullständig big data.

I många situationer, forskare inte har turen att ha allt de önskar automatiskt samlas på ett ställe. Två vanliga problem är ofullständig information om människor och en obalans mellan teoretiska konstruktioner och data. Båda dessa problem behandlades av Kossinets och Watts (2009) som en del av sina ansträngningar att förstå hur sociala nätverk utvecklas.

Grovt sett forskare tror att sociala nätverk evolution drivs av tre funktioner: 1) struktur av befintliga relationer 2) gemensamma aktiviteter (t.ex. sovsalar, klasser) och 3) demografi. Att förstå sambanden mellan dessa tre faktorer kräver longitudinella data nätverk i kombination med information om individers demografi och aktiviteter. Tidigare studier hade några av dessa funktioner, men ingen hade alla tre.

Kossinets och Watts startade sin forskning genom att förvärva e-postloggar från ett stort universitet. Men enbart dessa e-loggar var ofullständiga, att de inte inkluderar allt som behövs för att förstå de olika faktorer som påverkar nätverksutveckling. Därför Kossinets och Watts samman dessa e-loggar, med två andra informationskällor: demografisk information som samlats in av universitetet och information om gemensamma aktiviteter (t.ex. informations studenthem och en komplett lista över inskrivning i kurser). När dessa tre informationskällor, vilka var och en var ofullständig, slogs ihop tillsammans Kossinets och Watts hade en kraftfull datastruktur för förståelse nätverks evolution.

Men det var en sista utmaningen att de måste övervinna. Kossinets och Watts ville studera hur det sociala nätverket i detta universitet utvecklats så de behövde ett sätt att använda e-postloggar till en uppskattning av som anslöts till som vid vilken tidpunkt. Som diskuterats i tidigare (avsnitt 2.3.2.1), är denna typ av operationalisering av teoretiska konstruktioner en stor utmaning när man använder digitala spår för social forskning. I slutändan, Kossinets och Watts beslutat att två personer ansågs ansluten vid tiden \ (t \) om och endast om de hade bytt e-post (\ (i \) mailade \ (j \) och \ (j \) skickas \ ( i \)) under de senaste 60 dagarna. Dessa val var inte godtyckligt; De baserades på en noggrann genomgång av denna empiriska inställning och Kossinets och Watts kontrolleras att deras resultat var stabil i förhållande till dessa val. Generellt gäller att om din operation innebär att man väljer vissa specifika cutoffs-säga 60 dagar i stället för 30 dagar eller 90 dagar, det är en bra idé att se till att dina resultat är inte känsliga för detta val.

När Kossinets och Watts adresserade de problem som orsakas av ofullständig (t.ex. saknas demografisk information saknar uppgift om gemensam aktivitet, och saknade teoretiska konstruktioner), hade de uppgifter som gjorde det möjligt för dem att förstå de tre viktigaste krafterna som kan driva nätverk evolution: 1) struktur av befintliga relationer 2) gemensamma aktiviteter (t.ex. sovsalar, klasser) och 3) demografi. I överensstämmelse med tidigare forskning, fann de att människor med liknande demografi är mer benägna att skapa relationer. Men till skillnad från tidigare studier, fann de att detta mönster starkt mildras genom den befintliga strukturen nätverk och gemensamma aktiviteter. Med andra ord var det mönster som tidigare forskare hade sett delvis förklaras av data som tidigare forskare inte har. Genom framgångsrikt hantera ofullständighet sina uppgifter, Kossinets och Watts kunde klargöra samverkan mellan en mängd olika faktorer som driver sociala förändringarna nätverk.