গবেষকরা ইমেল লগ এবং প্রশাসনিক রেকর্ড ব্যবহৃত বন্ধুত্ব গঠন বোঝার জন্য. এই গবেষণা বড় ডাটা অসম্পূর্ণতা মোকাবেলার প্রয়োজন.
শর্ত গবেষকরা যথেষ্ট ভাগ্যবান যা তারা স্বয়ংক্রিয়ভাবে এক জায়গায় সংগৃহীত চান না হয়. দুই সাধারণ সমস্যার মানুষ এবং তাত্ত্বিক নির্মান এবং তথ্য মধ্যে একটি পার্থক্য আছে সম্পর্কে অসম্পূর্ণ তথ্য আছে. এই সমস্যার উভয় Kossinets এবং ওয়াটস দ্বারা সম্বোধন করা হয়েছে (2009) বুঝতে সামাজিক নেটওয়ার্ক অভিব্যক্ত তাদের প্রচেষ্টার অংশ হিসেবে.
সাধারণভাবে বলতে গেলে, গবেষকরা মনে করেন যে, সামাজিক নেটওয়ার্কের বিবর্তনের তিনটি বৈশিষ্ট্য দ্বারা চালিত হয়: 1) বিদ্যমান সম্পর্ক 2) ভাগ কার্যক্রম (যেমন, দিয়েই জগন্নাথ হলের, ক্লাস) এবং 3) জনমিতি কাঠামো. এই তিনটি কারণের মধ্যে আন্তঃসম্পর্কের বুঝুন ব্যক্তি 'জনমিতি এবং কার্যক্রম সম্পর্কে তথ্য সঙ্গে মিলিত অনুদৈর্ঘ্য নেটওয়ার্কের তথ্য প্রয়োজন. এর আগে গবেষণায় এই বৈশিষ্ট্য কিছু ছিল, কিন্তু কেউ সব তিনটি ছিল.
Kossinets এবং ওয়াটস বৃহৎ বিশ্ববিদ্যালয় থেকে ইমেল লগ অর্জন দ্বারা তাদের গবেষণা শুরু. যাইহোক, এই ইমেল লগ একা অসম্পূর্ণ, তারা নেটওয়ার্কের বিবর্তন ড্রাইভিং বিভিন্ন কারণের বুঝতে প্রয়োজন সবকিছু অন্তর্ভুক্ত না ছিল. অতএব, Kossinets এবং ওয়াটস এই ইমেল লগ মার্জ, তথ্য অন্য দুই উৎসের সঙ্গে বিশ্ববিদ্যালয় এবং ভাগ কার্যক্রম (যেমন, ছাত্র বাসভবন তথ্য ও কোর্সে ভর্তির একটি সম্পূর্ণ তালিকা) সম্পর্কে তথ্য দ্বারা সংগৃহীত ডেমোগ্রাফিক তথ্য. একবার প্রতিটি যা অসম্পূর্ণ ছিল তথ্য এই তিন সূত্র, একসঙ্গে Kossinets নেমেছিল এবং ওয়াটস বোঝার নেটওয়ার্ক বিবর্তন জন্য একটি শক্তিশালী ডাটা স্ট্রাকচার ছিল.
কিন্তু, সেখানে এক চূড়ান্ত চ্যালেঞ্জ যে তারা পরাস্ত হয়েছিল. Kossinets এবং ওয়াটস অধ্যয়ন কিভাবে এই বিশ্ববিদ্যালয়ে সামাজিক নেটওয়ার্কের তাই প্রসূত তারা কে সংযুক্ত ছিল একটি অনুমান ইমেইল লগ ব্যবহার করার জন্য একটি উপায় প্রয়োজন চেয়েছিলেন যা সময়ে. যখন সামাজিক গবেষণার জন্য ডিজিটাল ট্রেস ব্যবহার পূর্বে হিসাবে (অনুচ্ছেদ 2.3.2.1) আলোচনা, তাত্ত্বিক নির্মান কার্যকারিতা এই ধরনের একটি বড় চ্যালেঞ্জ. শেষ পর্যন্ত, Kossinets এবং ওয়াটস সিদ্ধান্ত নিয়েছে যে দুটি মানুষ সময় \ (ন \) এ সংযুক্ত বিবেচনা করা হয় যদি এবং কেবল যদি তারা ইমেইলের (\ (i \) ইমেল \ (ঞ \) এবং \ (ঞ \) ইমেল \ (বিনিময় করেছে i \)) পূর্ববর্তী 60 দিনের মধ্যে. এই পছন্দ অবাধ ছিল না; তারা এই গবেষণামূলক সেটিং সযত্ন বিবেচনার উপর ভিত্তি করে করা হয়েছে, এবং Kossinets এবং ওয়াটস চেক করে তাদের ফলাফল এই পছন্দ শক্তসমর্থ ছিল. সাধারণভাবে, যদি আপনার কার্যকারিতা কিছু নির্দিষ্ট নির্বাচন জড়িত cutoffs-say 30 দিনের পরিবর্তে 60 দিন বা 90 দিন-এটা নিশ্চিত যে আপনার ফলাফল এই পছন্দ সংবেদনশীল নয় ভালভাবে নির্দেশ করার একটি ভাল ধারণা.
একবার Kossinets এবং ওয়াটস অসম্পূর্ণতা দ্বারা সৃষ্ট সমস্যা সুরাহা (যেমন, জনতাত্ত্বিক তথ্য, নিখোঁজ ভাগ কার্যকলাপ সম্পর্কে তথ্য, এবং তাত্ত্বিক নির্মান নিখোঁজ), তারা তথ্য যে তাদের সক্রিয় তিনটি প্রধান বাহিনী যে নেটওয়ার্কের বিবর্তন ড্রাইভ করতে পারেন বুঝতে হয়েছিলো: 1) বিদ্যমান সম্পর্ক 2) ভাগ কার্যক্রম (যেমন, দিয়েই জগন্নাথ হলের, ক্লাস) এবং 3) জনমিতি কাঠামো. আগের গবেষণা সঙ্গে সামঞ্জস্যপূর্ণ, তখন দেখতে পেল যে অনুরূপ জনমিতি ব্যক্তিদের আরো সম্পর্ক গঠন করার সম্ভাবনা বেশি. তবে, এর আগে গবেষণায় অসদৃশ, তখন দেখতে পেল যে এই প্যাটার্ন দৃঢ়ভাবে বিদ্যমান নেটওয়ার্ক গঠন এবং ভাগ কার্যক্রম দ্বারা নির্বাপিত হয়. অন্য কথায়, যে প্যাটার্ন এর আগে গবেষকরা দেখেছিলেন আংশিকভাবে তথ্য দ্বারা ব্যাখ্যা করা হয়েছিল আগেই গবেষকরা নি যে. সুতরাং, সফলভাবে তাদের তথ্য অসম্পূর্ণতা সঙ্গে তার আচরণ দ্বারা, Kossinets এবং ওয়াটস বিভিন্ন কারণের যে সামাজিক নেটওয়ার্কের বিবর্তন ড্রাইভ বিভিন্ন মিথষ্ক্রিয়া নির্মল পেরেছি.