محققان با استفاده از سیاهههای مربوط به ایمیل و سوابق اداری به درک شکل گیری دوستی است. این تحقیق نیاز به خرید و فروش با نبودن داده های بزرگ.
در بسیاری از موارد، محققان به اندازه کافی خوش شانس همه چیز که آنها می خواهند به طور خودکار در یک مکان جمع آوری نیست که. دو مشکل شایع هستند اطلاعات ناقص در مورد مردم و عدم تطابق بین سازه های نظری و داده ها. هر دو از این مشکلات توسط Kossinets و وات خطاب شد (2009) به عنوان بخشی از تلاش های خود را برای درک اینکه چگونه شبکه های اجتماعی تکامل.
به طور کلی، محققان فکر می کنند که تکامل شبکه اجتماعی است که توسط سه ویژگی های محور: 1) ساختار روابط موجود 2) فعالیت های به اشتراک گذاشته شده (به عنوان مثال، خوابگاه ها، کلاس ها) و 3) جمعیتی. درک متقابل بین این سه عامل نیاز به داده های شبکه طولی همراه با اطلاعات در مورد جمعیت و فعالیت های افراد. مطالعات قبلی برخی از این ویژگی بود، اما هیچ کدام سه بود.
Kossinets و وات تحقیقات خود را با کسب سیاهههای مربوط به ایمیل را از یک دانشگاه بزرگ آغاز شده است. با این حال، این سیاهههای مربوط ایمیل به تنهایی ناقص، آنها همه چیز مورد نیاز برای درک عوامل مختلف رانندگی تکامل شبکه را شامل نمی شد. بنابراین، Kossinets و وات با هم ادغام شدند این سیاهههای مربوط به ایمیل، با دو دیگر منابع اطلاعاتی: اطلاعات دموگرافیک جمع آوری شده توسط دانشگاه و اطلاعات در مورد فعالیت های به اشتراک گذاشته شده (به عنوان مثال، اطلاعات اقامت دانشجویی و یک لیست کامل از ثبت نام در واحد). هنگامی که این سه منبع اطلاعاتی، که هر کدام ناقص بود، با هم ادغام شدند Kossinets و وات یک ساختار داده قدرتمند برای تکامل درک شبکه بود.
اما، یک چالش نهایی که آنها مجبور به غلبه بر وجود دارد. Kossinets و وات می خواست به مطالعه و بررسی چگونگی شبکه های اجتماعی در این دانشگاه تکامل یافته به طوری که آنها نیاز به یک راه استفاده از سیاهههای مربوط به ایمیل را به یک تخمین از که به که به هم متصل شد که در آن زمان. همانطور که در قبلا (بخش 2.3.2.1) مورد بحث قرار گرفته، این نوع از عملیاتی سازه های نظری یک چالش بزرگ در هنگام استفاده از آثار دیجیتال برای تحقیقات اجتماعی است. در پایان، Kossinets و وات تصمیم گرفت که دو نفر متصل در زمان \ (T \) در نظر گرفته شد اگر و تنها اگر آنها ایمیل (\ (I \) ایمیل فرستاده \ (J \) و \ (J \) ایمیل فرستاده \ (رد و بدل شده بود من \)) در 60 روز گذشته است. این انتخاب بود خودسرانه نیست. آنها در نظر گرفتن دقیق از این تنظیم تجربی مبتنی شدند و Kossinets و وات بررسی که نتایج آنها قوی برای این انتخاب بود. به طور کلی، اگر عملیاتی خود را شامل انتخاب خاصی قطع-می گویند 60 روز به جای 30 روز یا 90 روز آن را یک ایده خوب برای مطمئن شوید که نتایج خود را حساس به این انتخاب است.
هنگامی که Kossinets و وات خطاب مشکل ناشی از ناقص بودن (به عنوان مثال، از دست رفته اطلاعات دموگرافیک، اطلاعات از دست رفته در مورد فعالیت های مشترک، و از دست رفته سازه های نظری)، آنها داده که آنها را قادر به درک سه نیروی اصلی است که می تواند تکامل شبکه رانندگی حال: 1) ساختار روابط موجود 2) فعالیت های به اشتراک گذاشته شده (به عنوان مثال، خوابگاه ها، کلاس ها) و 3) جمعیتی. سازگار با پژوهش های پیشین، آنها دریافتند که افراد با جمعیتی مشابه هستند احتمال بیشتری برای ایجاد رابطه. با این حال، بر خلاف مطالعات قبلی، آنها دریافتند که این الگوی به شدت از سوی ساختار شبکه موجود و فعالیت های به اشتراک گذاشته تقلیل یافت. به عبارت دیگر، الگوی است که محققان پیش از دیده بود بخشی از آن توسط داده توضیح داده شد که محققان پیش از ندارد. بنابراین، با موفقیت در برخورد با نبودن داده های خود، Kossinets و وات قادر مشخصات تعامل عوامل مختلف مختلف است که رانندگی تحولات شبکه های اجتماعی بود.