Mananaliksik na ginamit logs email at administratibo mga talaan upang maunawaan friendship formation. Pananaliksik na ito ay nangangailangan ng pakikipag-usap sa incompleteness ng malaking data.
Sa maraming mga sitwasyon, ang mga mananaliksik ay hindi mapalad sapat upang magkaroon ng lahat ng bagay na kanilang nais awtomatikong nakolekta sa isang lugar. Dalawang karaniwang problema ay hindi kumpletong impormasyon tungkol sa mga tao at isang mismatch sa pagitan theoretical constructs at data. Pareho ng mga problemang ito ay hinarap sa pamamagitan Kossinets at Watts (2009) bilang bahagi ng kanilang mga pagsisikap upang maunawaan kung paano social network evolve.
Halos nagsasalita, ang mga mananaliksik sa tingin na ang social network evolution ay hinihimok sa pamamagitan ng tatlong mga tampok: 1) ang istraktura ng mga umiiral na mga relasyon 2) shared gawain (eg, dorms, mga klase) at 3) demographics. Pag-unawa sa interrelationships sa pagitan ng mga tatlong mga kadahilanan ay nangangailangan pahabang datos network pinagsama na may impormasyon tungkol sa mga indibidwal 'demograpiko at mga gawain. Mas maaga pag-aaral ay nagkaroon ng ilan sa mga tampok na ito, ngunit wala ay ang lahat ng tatlong.
Kossinets at Watts nagsimula ang kanilang pananaliksik sa pamamagitan ng pagkuha ng email logs mula sa isang malaking unibersidad. Subalit, ang mga email logs nag-iisa ay hindi kumpleto, hindi sila isama ang lahat ng kailangan upang maunawaan ang iba't ibang mga kadahilanan sa pagmamaneho network evolution. Samakatuwid, Kossinets at Watts ipinagsama ang mga email logs, na may dalawang iba pang mga pinagkukunan ng impormasyon: demograpikong impormasyon na nakolekta sa pamamagitan ng unibersidad at impormasyon tungkol sa ibinahaging mga aktibidad (eg, student residence impormasyon at isang kumpletong listahan ng pagpapatala sa kurso). Sa sandaling ang mga tatlong mga mapagkukunan ng impormasyon, ang bawat isa ay hindi kumpleto, ay pinagsama-sama Kossinets at Watts ay nagkaroon ng isang malakas na istraktura ng data para sa pag-unawa network evolution.
Ngunit, nagkaroon ng isang huling hamon na sila ay nagkaroon sa pagtagumpayan. Kossinets at Watts gustong mag-aral kung paano ang social network sa unibersidad na ito nagbago kaya sila kailangan ng isang paraan upang gamitin ang email logs sa isang pagtatantya ng kung sino ay konektado sa kung sino at kung saan ang panahon. Gaya ng tinalakay sa naunang (Seksyon 2.3.2.1), ang ganitong uri ng operationalization ng panteorya constructs ay isang malaking hamon kapag gumagamit digital traces para sa mga social research. Sa katapusan, Kossinets at Watts nagpasya na ang dalawang tao ay isinasaalang-alang kay sa oras na \ (t \) at kung lamang kung sila ay ipinagpapalit mga email (\ (i \) i-email \ (j \) at \ (j \) i-email \ ( i \)) sa nakaraang 60 araw. Ang mga pagpipilian ay hindi arbitrary; sila ay batay sa masusing pagsasaalang-alang ng mga ito mula sa obserbasyon setting, at Kossinets at Watts checked na ang kanilang mga resulta ay matatag sa mga pagpipiliang ito. Sa pangkalahatan, kung ang iyong operationalization nagsasangkot ng pagpili sa ilang tiyak na cutoffs-sabihin 60 araw sa halip ng 30 araw o 90 araw-ito ay isang magandang ideya na siguraduhin na ang iyong mga resulta ay hindi sensitibo sa mga pagpipilian na ito.
'Pag Kossinets at Watts direksiyon ang problema na sanhi ng incompleteness (eg, nawawala demograpikong impormasyon, kulang na impormasyon tungkol sa ibinahaging mga aktibidad, at nawawala theoretical constructs), kinailangan nilang data na naka-enable ang mga ito upang maunawaan ang tatlong pangunahing pwersa na maaaring drive network evolution: 1) ang istraktura ng mga umiiral na mga relasyon 2) shared gawain (eg, dorms, mga klase) at 3) demographics. Pare-pareho sa mas maaga pananaliksik, sila ay natagpuan na ang mga tao na may katulad na mga demograpiko ay mas malamang na bumuo ng mga relasyon. Gayunpaman, hindi katulad ng mas maaga pag-aaral, sila natagpuan na ang pattern na ito ay Matindi ang mitigated sa pamamagitan ng mga umiiral na istraktura ng network at ibinahagi gawain. Sa ibang salita, ang pattern na mas maaga mananaliksik nakita ay bahagyang ipinaliwanag sa pamamagitan ng data na mas maaga mananaliksik ay hindi magkaroon. Kaya, sa pamamagitan ng matagumpay pagharap sa incompleteness ng kanilang data, Kossinets at Watts nagawang linawin ang pakikipag-ugnayan ng isang iba't ibang mga iba't ibang mga kadahilanan na drive social network evolutions.