Penyelidik menggunakan log e-mel dan rekod pentadbiran untuk memahami pembentukan persahabatan. Kajian ini memerlukan berurusan dengan ketidaklengkapan data yang besar.
Dalam banyak keadaan, penyelidik tidak bernasib baik untuk mempunyai segala-galanya yang mereka mahu secara automatik dikumpulkan di satu tempat. Dua masalah biasa adalah maklumat yang tidak lengkap mengenai orang dan ketidaksepadanan antara konstruk teori dan data. Kedua-dua masalah ini ditangani oleh Kossinets dan Watts (2009) sebagai sebahagian daripada usaha mereka untuk memahami bagaimana rangkaian sosial berkembang.
Kira-kira bercakap, penyelidik berfikir bahawa evolusi rangkaian sosial dipacu oleh tiga ciri-ciri: 1) struktur hubungan yang sedia ada 2) aktiviti bersama (contohnya, asrama, kelas) dan 3) demografi. Memahami saling-hubungan antara ketiga-tiga faktor memerlukan data rangkaian membujur digabungkan dengan maklumat tentang demografi dan aktiviti individu. Kajian awal mempunyai beberapa ciri-ciri ini, tetapi tidak mempunyai ketiga-tiganya.
Kossinets dan Watts memulakan penyelidikan mereka dengan memperoleh log e-mel dari universiti yang besar. Walau bagaimanapun, log e-mel sahaja tidak lengkap, mereka tidak termasuk semua yang diperlukan untuk memahami pelbagai faktor yang mendorong evolusi rangkaian. Oleh itu, Kossinets dan Watts digabungkan ini log e-mel, dengan dua sumber maklumat yang lain: maklumat demografi yang dikumpul oleh pihak universiti dan maklumat mengenai aktiviti bersama (contohnya, maklumat kediaman pelajar dan senarai lengkap enrolmen dalam kursus). Setelah ketiga-tiga sumber maklumat, setiap yang tidak lengkap, telah digabungkan bersama-sama Kossinets dan Watts mempunyai struktur data berkuasa untuk evolusi rangkaian pemahaman.
Tetapi, terdapat satu cabaran akhir yang mereka terpaksa diatasi. Kossinets dan Watts mahu belajar bagaimana rangkaian sosial di universiti ini berkembang begitu mereka memerlukan cara untuk menggunakan log e-mel ke dalam satu anggaran yang berkaitan dengan yang di mana pada masa. Seperti yang dibincangkan dalam sebelum ini (Seksyen 2.3.2.1), ini jenis pengoperasian konstruk teori adalah satu cabaran besar apabila menggunakan kesan digital untuk penyelidikan sosial. Akhirnya, Kossinets dan Watts memutuskan bahawa dua orang telah dianggap disambungkan pada masa \ (t \) jika dan hanya jika mereka telah bertukar-tukar e-mel (\ (i \) melalui e-mel \ (j \) dan \ (j \) melalui e-mel \ ( i \)) dalam tempoh 60 hari sebelumnya. Pilihan ini tidak sewenang-wenangnya; mereka adalah berasaskan pertimbangan yang teliti tetapan empirikal ini, dan Kossinets dan Watts diperiksa bahawa keputusan mereka adalah kukuh untuk pilihan-pilihan ini. Secara umum, jika pengoperasian anda melibatkan memilih beberapa tertentu cutoffs-mengatakan 60 hari berbanding 30 hari atau 90 hari-ia adalah idea yang baik untuk memastikan bahawa keputusan anda tidak sensitif dengan pilihan ini.
Setelah Kossinets dan Watts ditangani masalah yang disebabkan oleh tidak lengkap (contohnya, hilang maklumat demografi, maklumat mengenai aktiviti kongsi hilang, dan hilang membina teori), mereka mempunyai data yang membolehkan mereka memahami tiga kuasa utama yang boleh memandu evolusi rangkaian: 1) struktur hubungan yang sedia ada 2) aktiviti bersama (contohnya, asrama, kelas) dan 3) demografi. Selaras dengan penyelidikan sebelum ini, mereka mendapati bahawa orang dengan demografi yang sama lebih cenderung untuk menjalinkan hubungan. Walau bagaimanapun, tidak seperti kajian sebelum ini, mereka mendapati bahawa corak ini kuat dikurangkan dengan struktur rangkaian yang sedia ada dan aktiviti bersama. Dalam erti kata lain, corak penyelidik sebelum ini telah dilihat sebahagiannya dijelaskan oleh data yang penyelidik sebelum ini tidak ada. Oleh itu, dengan berjaya berurusan dengan ketidaklengkapan data mereka, Kossinets dan Watts dapat menjelaskan interaksi pelbagai faktor yang berbeza yang mendorong evolusi rangkaian sosial.