นักวิจัยใช้บันทึกอีเมลและบันทึกการบริหารที่จะเข้าใจการสร้างมิตรภาพ การวิจัยครั้งนี้ต้องมีการจัดการกับความไม่สมบูรณ์ของข้อมูลขนาดใหญ่
ในหลาย ๆ สถานการณ์นักวิจัยไม่โชคดีพอที่จะมีทุกอย่างที่พวกเขาต้องการเก็บไว้โดยอัตโนมัติในที่เดียว สองปัญหาที่พบบ่อยเป็นข้อมูลที่ไม่สมบูรณ์เกี่ยวกับคนและไม่ตรงกันระหว่างโครงสร้างทางทฤษฎีและข้อมูล ทั้งปัญหาเหล่านี้ได้รับการแก้ไขโดย Kossinets และวัตต์ (2009) เป็นส่วนหนึ่งของความพยายามที่จะเข้าใจวิธีการที่เครือข่ายทางสังคมมีวิวัฒนาการ
ประมาณพูดนักวิจัยคิดว่าวิวัฒนาการเครือข่ายทางสังคมคือการขับเคลื่อนด้วยสามคุณสมบัติ: 1) โครงสร้างของความสัมพันธ์ที่มีอยู่ 2) กิจกรรมที่ใช้ร่วมกัน (เช่นหอพักชั้นเรียน) และ 3) กลุ่มผู้เข้าชม ทำความเข้าใจเกี่ยวกับความสัมพันธ์ระหว่างสามปัจจัยเหล่านี้ต้องใช้ข้อมูลเครือข่ายยาวรวมกับข้อมูลเกี่ยวกับประชากรของแต่ละบุคคลและกิจกรรม การศึกษาก่อนหน้านี้มีบางส่วนของคุณสมบัติเหล่านี้ แต่ไม่มีผู้ใดได้ทั้งสาม
Kossinets และวัตต์เริ่มต้นการวิจัยของพวกเขาโดยการซื้อบันทึกอีเมลจากมหาวิทยาลัยขนาดใหญ่ แต่เหล่านี้บันทึกอีเมลเพียงอย่างเดียวไม่สมบูรณ์พวกเขาไม่ได้รวมถึงทุกอย่างที่จำเป็นในการทำความเข้าใจปัจจัยต่างๆที่ผลักดันการวิวัฒนาการเครือข่าย ดังนั้น Kossinets และวัตต์รวมบันทึกอีเมลเหล่านี้มีสองแหล่งอื่น ๆ มาของข้อมูล: ข้อมูลประชากรที่เก็บรวบรวมโดยมหาวิทยาลัยและข้อมูลเกี่ยวกับกิจกรรมที่ใช้ร่วมกัน (เช่นข้อมูลที่อยู่อาศัยของนักเรียนและรายการที่สมบูรณ์ของการลงทะเบียนในหลักสูตร) เมื่อทั้งสามแหล่งของข้อมูลแต่ละที่ไม่สมบูรณ์ถูกรวมกัน Kossinets และวัตต์มีโครงสร้างข้อมูลที่มีประสิทธิภาพสำหรับการวิวัฒนาการเครือข่ายความเข้าใจ
แต่มีเป็นหนึ่งในความท้าทายครั้งสุดท้ายที่พวกเขาจะต้องเอาชนะ Kossinets และวัตต์อยากจะศึกษาวิธีการเครือข่ายทางสังคมในการพัฒนามหาวิทยาลัยแห่งนี้เพื่อให้พวกเขาจำเป็นต้องมีวิธีที่จะใช้บันทึกอีเมลลงในประมาณการของผู้ที่ได้รับการเชื่อมต่อกับที่เวลาที่ ตามที่กล่าวไว้ในก่อนหน้านี้ (มาตรา 2.3.2.1) ชนิดของ operationalization ของโครงสร้างทางทฤษฎีนี้เป็นความท้าทายใหญ่เมื่อใช้ร่องรอยดิจิตอลสำหรับการวิจัยทางสังคม ในท้ายที่สุด Kossinets และวัตต์ตัดสินใจว่าคนสองคนที่ได้รับการพิจารณาการเชื่อมต่อได้ตลอดเวลา \ (T \) และถ้าหากพวกเขาได้แลกเปลี่ยนอีเมล (\ (i \) ส่งอีเมล \ (J \) และ \ (J \) ส่งอีเมล \ ( i \)) ใน 60 วันก่อนหน้า ตัวเลือกเหล่านี้ไม่ได้โดยพล; พวกเขาอยู่บนพื้นฐานของการพิจารณาอย่างรอบคอบของการตั้งค่าการทดลองนี้และ Kossinets และวัตต์การตรวจสอบว่าผลของพวกเขาที่มีประสิทธิภาพเพื่อเลือกเหล่านี้ โดยทั่วไปถ้า operationalization ของคุณเกี่ยวข้องกับการเลือกเฉพาะบางตัวตัดพูด 60 วันแทน 30 วันหรือ 90 วันมันเป็นความคิดที่ดีที่จะทำให้แน่ใจว่าผลลัพธ์ของคุณไม่ได้มีความไวต่อทางเลือกนี้
เมื่อ Kossinets และวัตต์แก้ไขปัญหาที่เกิดจากความไม่สมบูรณ์ (เช่นไม่มีข้อมูลประชากรข้อมูลเกี่ยวกับกิจกรรมที่ใช้ร่วมกันขาดหายไปและหายไปสร้างทฤษฎี) พวกเขามีข้อมูลที่ช่วยให้พวกเขาเข้าใจสามกองกำลังหลักที่สามารถขับรถวิวัฒนาการเครือข่าย: 1) โครงสร้างของความสัมพันธ์ที่มีอยู่ 2) ที่ใช้ร่วมกันกิจกรรม (เช่นหอพักชั้นเรียน) และ 3) กลุ่มผู้เข้าชม สอดคล้องกับงานวิจัยก่อนหน้านี้พวกเขาก็พบว่าคนที่มีประชากรที่คล้ายกันมีแนวโน้มที่จะสร้างความสัมพันธ์ แต่แตกต่างจากการศึกษาก่อนหน้านี้พวกเขาพบว่ารูปแบบนี้ได้รับการลดลงอย่างมากจากโครงสร้างเครือข่ายที่มีอยู่และการทำกิจกรรมร่วมกัน ในคำอื่น ๆ รูปแบบที่นักวิจัยก่อนหน้านี้เคยเห็นก็อธิบายบางส่วนจากข้อมูลที่ว่านักวิจัยก่อนหน้านี้ไม่ได้มี ดังนั้นโดยประสบความสำเร็จในการจัดการกับความไม่สมบูรณ์ของข้อมูลของพวกเขาและ Kossinets วัตต์ก็สามารถชี้แจงการทำงานร่วมกันของความหลากหลายของปัจจัยต่างๆที่ผลักดันการวิวัฒนาการเครือข่ายทางสังคม