Даследчыкі выкарыстоўвалі часопісы па электроннай пошце і адміністрацыйныя дадзеныя , каб зразумець фарміраванне дружбы. Гэта даследаванне патрабуе працы з непаўнатой вялікіх аб'ёмаў дадзеных.
У многіх сітуацыях, даследчыкі не дастаткова шанцавання, каб мець усё, што яны хочуць аўтаматычна збіраюцца ў адным месцы. Дзве агульныя праблемы няпоўнай інфармацыі аб людзях і неадпаведнасць паміж тэарэтычнымі канструкцыямі і дадзенымі. Абедзве гэтыя праблемы былі разгледжаны Kossinets і Ўотс (2009) у рамках сваіх намаганняў , каб зразумець , як сацыяльныя сеткі развіваюцца.
Груба кажучы, даследчыкі мяркуюць, што эвалюцыя сацыяльнай сеткі абумоўлена трыма асаблівасцямі: 1) структура існуючых адносін 2) сумеснай дзейнасці (напрыклад, інтэрнатаў, класаў) і 3) Дэмаграфічныя дадзеныя. Разуменне ўзаемасувязі паміж гэтымі трыма фактарамі патрабуюцца дадзеныя падоўжныя сеткі ў спалучэнні з інфармацыяй аб дэмаграфічнай сітуацыі і дзейнасці фізічных асоб. Больш раннія даследаванні былі некаторыя з гэтых асаблівасцяў, але ні адзін з іх усё тры.
Kossinets і Ўотс пачаў свае даследаванні шляхам набыцця часопісаў электроннай пошты з вялікага універсітэта. Тым не менш, гэтыя часопісы па электроннай пошце самі па сабе з'яўляюцца няпоўнымі, яны не ўключаюць у сябе ўсё неабходнае для разумення розных фактараў, якія прыводзяць да эвалюцыі сеткі. Таму Kossinets і Ўотс аб'яднаны гэтыя часопісы па электроннай пошце, з двума іншымі крыніцамі інфармацыі: дэмаграфічнай інфармацыі, сабранай у універсітэце і інфармацыю аб сумеснай дзейнасці (напрыклад, інфармацыя студэнцкі інтэрнат і поўны спіс залічэння на курсы). Пасля гэтых трох крыніц інфармацыі, кожная з якіх была няпоўнай, былі аб'яднаны разам Kossinets і Ўотс меў магутную структуру дадзеных для эвалюцыі разумення сеткі.
Але быў адзін апошні выклік, які яны павінны былі пераадолець. Kossinets і Ўотс хацеў вывучыць, як сацыяльная сетка ў гэтым універсітэце развіваліся такім чынам, яны мелі патрэбу ў спосабе выкарыстоўваць часопісы па электроннай пошце ў ацэнку таго, хто быў звязаны з кім і ў гэты час. Як ужо гаварылася ў раней (раздел 2.3.2.1), гэты від операционализации тэарэтычных пабудоў з'яўляецца вялікай праблемай пры выкарыстанні лічбавых слядоў сацыяльных даследаванняў. У рэшце рэшт, Kossinets і Ўотс вырашылі , што два чалавекі лічацца злучанымі падчас \ (т \) тады і толькі тады , калі яны абменьваліся электроннай пошты (\ (г \) па электроннай пошце \ (да \) і \ (да \) па электроннай пошце \ ( я \)) у папярэднія 60 дзён. Гэтыя выбары не былі адвольнымі; яны былі заснаваныя на дбайным разглядзе гэтай эмпірычнай налады, і Kossinets і Ўотс праверыў, што іх вынікі былі ўстойлівыя да гэтым выбарам. Увогуле, калі ваш увод у дзеянне ўключае выбар некаторых канкрэтных адсечак скажам 60 дзён замест 30 дзён ці 90 дзён, гэта добрая ідэя, каб пераканацца, што вашы вынікі не адчувальныя да гэтага выбару.
Пасля таго, як Kossinets і Ўотс вырашае праблему, выкліканую незавершанасцю (напрыклад, адсутныя дэмаграфічную інфармацыю, якая адсутнічае інфармацыю аб сумеснай дзейнасці, а таксама адсутнічаюць тэарэтычныя канструкцыі), яны мелі дадзеныя, якія дазволілі ім зразумець тры асноўныя сілы, якія могуць ездзіць эвалюцыі сеткі: 1) структура існуючых адносін 2) сумеснай дзейнасці (напрыклад, інтэрнатаў, класаў) і 3) дэмаграфіяй. У адпаведнасці з больш раннімі даследаваннямі, яны выявілі, што людзі з падобнымі дэмаграфіяй, больш верагодна, фарміраваць адносіны. Тым не менш, у адрозненне ад больш ранніх даследаванняў, яны выявілі, што гэтая мадэль была моцна змякчанае існуючай структуры сеткі і сумеснай дзейнасці. Іншымі словамі, шаблон, які мы бачылі раней даследчыкі часткова тлумачыцца дадзенымі, якія раней даследчыкі не мелі. Такім чынам, паспяхова спраўляецца з непаўнатой іх дадзеных, Kossinets і Ўотс змаглі ўдакладніць ўзаемадзеянне мноства розных фактараў, якія кіруюць эвалюцый сацыяльнай сеткі.