חוקרים השתמשו יומני דוא"ל ורשומים מנהלים להבין היווצרות ידידות. מחקר זה דורש התמודדות עם חוסר השלמות של נתונים גדולים.
במצבים רבים, החוקרים אינם ברי מזל מספיק כדי להיות כל מה שהם רוצים הנאספים באופן אוטומטי במקום אחד. שתי בעיות נפוצות הן מידע לא מושלם על אנשי חוסר התאמה בין מבנים ונתונים תיאורטי. שתי הבעיות הללו טופלו על ידי Kossinets ו ווטס (2009) כחלק מהמאמצים שלהם כדי להבין איך רשתות חברתיות להתפתח.
באופן כללי, חוקרים חושבים שאבולוצית רשת החברתית היא מונעת על ידי שלוש תכונות: 1) המבנה של קשרים קיימים 2) פעילויות משותפות (למשל, מעונות, כיתות) ו -3) הדמוגרפיה. הבנת יחסי הגומלין בין שלושת הגורמים הללו מחייב נתוני רשת אורך בשילוב עם מידע על "הדמוגרפיה ופעילויות אנשים. מחקרים קודמים היו חלק מהתכונות האלה, אבל אף אחד לא היו כל השלושה.
Kossinets ו ווטס התחיל המחקר שלהם באמצעות רכישת יומני דוא"ל מאוניברסיטה גדולה. עם זאת, יומני הדוא"ל האלה לבד לא היו שלמים, הם אינם כוללים את כל הדרוש כדי להבין את הגורמים השונים נהיגה התפתחות הרשת. לכן, Kossinets ו ווטס התמזגה יומני דוא"ל אלה, עם שני מקורות מידע אחרים: מידע דמוגרפי שנאספו על ידי האוניברסיטה ומידע על פעילויות משותפות (למשל, מידע מגורי סטודנטים ואת הרשימה המלאה של ההרשמה לקורסים). לאחר שלושה מקורות המידע הללו, שכל אחד מהם לא היה שלם, מוזגו יחד Kossinets ו ווטס היה מבנה נתונים רב עוצמה עבור האבולוציה רשת הבנה.
אבל, יש אתגר אחד סופי כי הם היו צריכים להתגבר. Kossinets ו ווטס רצה ללמוד כיצד הרשת החברתית באוניברסיטה זו התפתחו כך שהם זקוקים לדרך להשתמש ביומנים הדוא"ל לתוך אומדן שהיה קשור מי שאז. כפי שצוין קודם לכן (סעיף 2.3.2.1), זה סוג של operationalization של מבנים התיאורטיים הוא אתגר גדול בעת שימוש עקבות דיגיטליות למחקר חברתי. בסופו של דבר, Kossinets ו ווטס החליט ששני אנשים נחשבו מחוברים בשלב \ (\ t) אם ורק אם הם החליפו מיילים (\ (i \) בדוא"ל \ (j \) ו- \ (j \) בדוא"ל \ ( אני \)) ב -60 הימים האחרונים. בחירות אלה היו לא שרירותיות; הם התבססו על שיקול דעת מעמיק של הגדרה אמפירית זו, ואת Kossinets ו ווטס בדקו שהתוצאות שלהם היו חזקות כדי בחירות אלו. באופן כללי, אם operationalization שלך כרוך בבחירת חלק ספציפי הפסקות-לומר 60 ימים במקום 30 ימים או 90 ימים-זה רעיון טוב כדי לוודא שהתוצאות אינן רגישות הבחירה הזו.
לאחר Kossinets ו ווטס התייחס הבעיה נגרמת על ידי חוסר שלמות (למשל, חסר מידע דמוגרפי, חסר מידע על הפעילות המשותפת ולאחר חסר המבנים התיאורטיים), היו להם נתונים שאיפשרו להם להבין את שלושה כוחות עיקריים שיכולים לנהוג האבולוציה רשת: 1) מבנה של קשרים קיימים 2) פעילויות משותפות (למשל, מעונות, כיתות) ו -3) הדמוגרפיה. בקנה אחד עם מחקר קודם, הם גילו כי אנשים עם מאפיינים דמוגרפיים דומים נוטים יותר ליצור קשרים. עם זאת, בניגוד מחקרים קודמים, הם מצאו כי דפוס זה רוכך במידה רבה על ידי מבנה הרשת הקיימת ופעילויות משותפות. במילים אחרות, דפוס כי מוקדם יותר חוקרים ראתה הוסבר חלקית נתונים שהחוקרים קודם לכן לא היה. לכן, על ידי התמודדות בהצלחה עם אי-השלמות של הנתונים שלהם, Kossinets ו ווטס הצליח להבהיר את האינטראקציה של מגוון גורמים שונים שמניעים התפתחויות רשת חברתיות.