Ymchwilwyr a ddefnyddir logiau e-bost a chofnodion gweinyddol i ddeall ffurfio cyfeillgarwch. Mae'r ymchwil hwn yn gofyn am ymdrin â'r anghyflawnder o ddata mawr.
Mewn llawer o sefyllfaoedd, nid yw ymchwilwyr yn ddigon ffodus i gael popeth y maent eisiau ei gasglu yn awtomatig mewn un lle. Mae dau problemau cyffredin yw gwybodaeth anghyflawn am y bobl a'r diffyg cyfatebiaeth rhwng yn adeiladu damcaniaethol a data. Mae'r ddau o'r problemau hyn yn cael sylw gan Kossinets a Watts (2009) fel rhan o'u hymdrechion i ddeall sut cymdeithasol rwydweithiau esblygu.
Yn fras, mae ymchwilwyr yn credu bod esblygiad rhwydwaith cymdeithasol yn cael ei yrru gan dri nodweddion: 1) strwythur perthnasoedd sy'n bodoli eisoes 2) gweithgareddau a rennir (ee, dorms, dosbarthiadau) a 3 demograffeg). Mae deall y gydberthynas rhwng y tri ffactor yn gofyn am ddata rhwydwaith hydredol gyfuno â gwybodaeth am ddemograffeg a gweithgareddau unigolion. Roedd astudiaethau cynharach rai o'r nodweddion hyn, ond roedd dim pob un o'r tri.
Dechreuodd Kossinets a Watts eu hymchwil trwy gaffael y logiau e-bost gan prifysgol fawr. Fodd bynnag, logiau e-bost hyn yn unig yn anghyflawn, nid ydynt yn cynnwys popeth sydd ei angen i ddeall y ffactorau amrywiol gyrru esblygiad rhwydwaith. Felly, unodd Kossinets a Watts logiau e-bost yma, gyda dau ffynonellau eraill o wybodaeth: gwybodaeth ddemograffig a gesglir gan y brifysgol a gwybodaeth am weithgareddau a rennir (ee, gwybodaeth llety myfyrwyr a rhestr gyflawn o cofrestru mewn cyrsiau). Unwaith y bydd y tair ffynonellau gwybodaeth, pob un ohonynt yn anghyflawn, yn cael eu huno gyda'i gilydd Kossinets ac roedd gan Watts strwythur data pwerus ar gyfer esblygiad dealltwriaeth rhwydwaith.
Ond, roedd yna un her olaf bod yn rhaid iddynt oresgyn. Kossinets a Watts eisiau astudio sut mae'r rhwydwaith cymdeithasol yn y brifysgol hon esblygu fel eu bod angen ffordd i ddefnyddio'r logiau e-bost i mewn i amcangyfrif o pwy oedd yn gysylltiedig â pwy ac ar yr adeg. Fel y trafodwyd yn flaenorol (Adran 2.3.2.1), y math hwn o Gweithredoli o yn adeiladu damcaniaethol yn her fawr wrth ddefnyddio olion digidol ar gyfer ymchwil gymdeithasol. Yn y diwedd, penderfynodd Kossinets a Watts bod dau o bobl yn cael eu hystyried cysylltu ar adeg \ (t \) os a dim ond os ydynt wedi cyfnewid negeseuon e-bost (\ (i \) e-bostio \ (j \) a \ (j \) e-bostio \ ( ff \)) yn y 60 diwrnod blaenorol. Nid yw'r dewisiadau yn fympwyol; cawsant eu seilio ar ystyriaeth ofalus o osod empirig hon, a gwirio Kossinets a Watts bod eu canlyniadau yn gadarn i'r dewisiadau hyn. Yn gyffredinol, os yw eich Gweithredoli yn golygu dewis rhai penodol cutoffs-dweud 60 diwrnod yn hytrach na 30 diwrnod neu 90 diwrnod-mae'n syniad da i wneud yn siŵr nad yw eich canlyniadau yn sensitif i ddewis hwn.
Unwaith i'r afael Kossinets a Watts y broblem a achosir gan anghyflawnder (ee, ar goll gwybodaeth ddemograffig, ar goll gwybodaeth am weithgaredd a rennir, ac ar goll yn adeiladu damcaniaethol), roedd ganddynt data oedd yn eu galluogi i ddeall y tri prif rymoedd sy'n gallu gyrru esblygiad y rhwydwaith: 1) y strwythur y berthynas sy'n bodoli eisoes 2) gweithgareddau a rennir (ee, dorms, dosbarthiadau) a 3 demograffeg). Yn gyson â gwaith ymchwil cynharach, maent yn canfod bod pobl sydd â demograffeg tebyg yn fwy tebygol o ffurfio perthynas. Fodd bynnag, yn wahanol i astudiaethau cynharach, daethant o hyd bod y patrwm hwn ei liniaru yn gryf gan y strwythur rhwydwaith presennol a gweithgareddau a rennir. Mewn geiriau eraill, mae'r patrwm bod ymchwilwyr cynharach wedi gweld Eglurwyd rhannol gan ddata nad oedd ymchwilwyr cynharach oedd gan. Felly, drwy ymdrin yn llwyddiannus â anghyflawnder eu data, roedd Kossinets a Watts yn gallu egluro y rhyngweithio rhwng amrywiaeth o wahanol ffactorau sy'n gyrru esblygiadau rhwydwaith cymdeithasol.