اس بات سے کوئی فرق نہیں ہے کہ آپ کے بڑے اعداد و شمار کتنے بڑے ہیں، شاید آپ کی معلومات کی ضرورت نہیں ہے.
زیادہ سے زیادہ بڑے اعداد و شمار ناممکن ہیں ، اس لحاظ سے کہ ان کی معلومات نہیں ہے جو آپ اپنے تحقیق کے لئے چاہتے ہیں. یہ اعداد و شمار کی ایک عام خصوصیت ہے جسے تحقیق کے علاوہ مقاصد کے لئے تیار کیا گیا تھا. بہت سے سماجی سائنسدانوں نے پہلے سے ہی نامکمل نمٹنے کے بارے میں تجربہ کیا ہے، جیسے موجودہ سروے نے اس سوال سے نہیں پوچھا جو اس کی ضرورت تھی. بدقسمتی سے، ناکافی کے مسائل بڑے اعداد و شمار میں زیادہ انتہائی زیادہ ہوتے ہیں. میرے تجربے میں، بڑے اعداد و شمار سماجی تحقیق کے لئے مفید تین قسم کی معلومات لاپتہ ہوتے ہیں: شرکاء کے بارے میں ڈیموگرافک معلومات، دوسرے پلیٹ فارمز پر رویے، اور نظریات کو عملی کرنے کے لئے ڈیٹا.
تین قسم کے نامکمل، نظریاتی تعمیر کو عملی کرنے کے لئے نامکمل اعداد و شمار کا مسئلہ سب سے مشکل ہے. اور میرے تجربے میں، یہ اکثر آگاہی سے نظر انداز کررہا ہے. بہر حال، نظریاتی تعمیر خلاصہ خیالات ہیں کہ سماجی سائنسدانوں نے نظریاتی تعمیر کا مطالعہ اور عملی کرنے کا مطلب ہے کہ معقول اعداد و شمار کے ساتھ اس تعمیر پر قبضہ کرنے کا کوئی طریقہ پیش کرنا. بدقسمتی سے، اس سادہ آواز سے متعلق عمل بہت مشکل ہو جاتا ہے. مثال کے طور پر، چلو تصور کرتے ہوئے تصوراتی طور پر سادہ دعوی کی آزمائش کرنے کی کوشش کررہے ہیں کہ زیادہ تر ذہین افراد زیادہ پیسہ کماتے ہیں. اس دعوی کی جانچ کرنے کے لئے، آپ کو "انٹیلی جنس" کی پیمائش کرنے کی ضرورت ہوگی. لیکن انٹیلی جنس کیا ہے؟ Gardner (2011) نے دلیل دی کہ اصل میں آٹھ انٹیلی جنس کے مختلف قسم ہیں. اور کیا ایسے طریقہ کار ہیں جو انٹیلی جنس کے ان قسموں کو درست طریقے سے پیمانے پر لے سکتے ہیں؟ نفسیاتی ماہرین کی طرف سے بہت زیادہ کام کے باوجود، یہ سوالات اب بھی غیر معمولی جوابات نہیں ہیں.
اس طرح، یہاں تک کہ نسبتا سادہ دعوی بھی - زیادہ تر ذہین شخص زیادہ پیسہ کماتے ہیں- تجربہ کار کا اندازہ کرنے کے لئے مشکل ہوسکتا ہے کیونکہ یہ اعداد و شمار میں نظریاتی تعمیر کو عملی کرنے کے لئے مشکل ہوسکتا ہے. دیگر نظریاتی تعمیرات جو اہم ہیں لیکن عملی طور پر کام کرنے میں سختی شامل ہیں، "معیاریں،" "سماجی دارالحکومت" اور "جمہوریت" سماجی سائنسدانوں نے نظریاتی تعمیرات اور اعداد و شمار کی توثیق (Cronbach and Meehl 1955) درمیان میچ کا مطالبہ کیا. جیسا کہ تعمیرات کی اس مختصر فہرست سے پتہ چلتا ہے کہ، معتبر تعمیر کا ایک مسئلہ یہ ہے کہ سوشل سائنسدانوں نے طویل عرصے تک جدوجہد کی ہے. لیکن میرے تجربے میں، تحقیق کے مقاصد کے لئے پیدا نہیں کیا گیا کہ اعداد و شمار کے ساتھ کام کرتے وقت تعمیر موزونیت کے مسائل سے بھی زیادہ ہیں (Lazer 2015) .
جب آپ تحقیق کے نتائج کا جائزہ لے رہے ہیں تو، تعمیر کی توثیق کا اندازہ کرنے کا ایک فوری اور مفید ذریعہ نتیجہ لینے کے لئے ہے، جو عام طور پر تعمیرات کے لحاظ سے اظہار کیا جاتا ہے، اور اس کے استعمال کے اعداد و شمار کے لحاظ سے دوبارہ دوبارہ اظہار کیا جاتا ہے. مثال کے طور پر، دو نظریاتی مطالعے پر غور کریں جو یہ دکھانے کا دعوی کرتے ہیں کہ زیادہ تر ذہین افراد زیادہ پیسہ کماتے ہیں. پہلی مطالعہ میں، محققین نے پتہ چلا ہے کہ ریوے پروگریجک Matrices ٹیسٹ پر اچھی طرح سے اسکور والے لوگ تجزیاتی انٹیلیجنس کی ایک اچھی طرح سے مطالعہ کی جانچ (Carpenter, Just, and Shell 1990) - ان کے ٹیکس کی واپسیوں پر زیادہ سے زیادہ آمدنی حاصل کریں. دوسرا مطالعہ میں، محققین نے پتہ چلا ہے کہ ٹویٹر پر لوگ جو طویل الفاظ استعمال کرتے ہیں وہ عیش و آرام کے برانڈز کا ذکر کرنے کا امکان زیادہ ہیں. دونوں صورتوں میں، یہ محققین کا دعوی کیا جا سکتا ہے کہ انہوں نے ظاہر کیا ہے کہ زیادہ تر ذہین افراد زیادہ پیسہ کماتے ہیں. تاہم، پہلے مطالعہ میں نظریاتی تعمیرات ڈیٹا کی طرف سے اچھی طرح سے کام کر رہے ہیں، جبکہ دوسری میں وہ نہیں ہیں. اس کے علاوہ، مثال کے طور پر، مثال کے طور پر، زیادہ ڈیٹا خود کار طریقے سے تعمیر کے ساتھ مسائل کو حل نہیں کرتا. آپ کو دوسرا مطالعہ کے نتائج پر شک ہونا چاہئے کہ آیا یہ ایک ملین ٹویٹس، ایک ارب ٹویٹس، یا ٹریلین ٹائٹس شامل ہیں. محققین کی تعمیر کے خیال سے واقف نہیں ہیں، ٹیبل 2.2 اس طرح کے مطالعہ کے کچھ مثالیں فراہم کرتی ہیں جن میں ڈیجیٹل ٹریس ڈیٹا کا استعمال کرتے ہوئے نظریاتی تعمیرات کا کام کیا گیا ہے.
ڈیٹا کا ذریعہ | نظریاتی تعمیر | حوالہ جات |
---|---|---|
ایک یونیورسٹی سے ای میل لاگ ان (میٹا ڈیٹا صرف) | سماجی تعلقات | Kossinets and Watts (2006) ، Kossinets and Watts (2009) ، De Choudhury et al. (2010) |
ویوبو پر سوشل میڈیا پوسٹس | شہری مشغولیت | Zhang (2016) |
ایک فرم سے ای میل لاگ ان (میٹا ڈیٹا اور مکمل متن) | ایک تنظیم میں ثقافتی فٹ | Srivastava et al. (2017) |
اگرچہ نظریاتی تعمیر پر قبضہ کرنے کے لئے ناممکن اعداد و شمار کا مسئلہ بہت مشکل ہے، دیگر عام قسم کے ناممکنات کے لئے عام حل ہیں: دیگر پلیٹ فارمز پر غیر معمولی ڈیموگرافک معلومات اور غیر معمولی معلومات. پہلا حل اصل میں آپ کی ضرورت کے اعداد و شمار جمع کرنے کے لئے ہے؛ میں آپ کو سروے کے بارے میں بتاتا ہوں جب باب 3 میں آپ کے بارے میں بتوں گا. دوسرا اہم حل یہ ہے کہ سائنسدانوں کو کون سا صارف کی خصوصیت کی ترجیح دیتی ہے اور سماجی سائنسدانوں کو عدم اطمینان کا سامنا ہے . اس نقطہ نظر میں، محققین ان معلومات کو استعمال کرتے ہیں جو ان کے کچھ لوگوں پر دوسرے لوگوں کی خاصیت کو کم کرنے کے لئے ہے. ایک تہائی ممکنہ حل ایک سے زیادہ ڈیٹا ذرائع کو یکجا کرنا ہے. یہ عمل بعض اوقات ریکارڈ لنکس کہا جاتا ہے . اس عمل کے لئے میرا پسندیدہ استعار Dunn (1946) طرف سے تحریر کیا گیا تھا جو پہلے ہی لکھا گیا تھا، اس کا پہلا ریکارڈ تھا جو کبھی ریکارڈ ریکارڈ پر لکھا تھا.
"دنیا میں ہر انسان کو کتاب کی زندگی پیدا ہوتی ہے. یہ کتاب موت کے ساتھ پیدائش اور اختتام کے ساتھ شروع ہوتا ہے. اس کے صفحات زندگی میں پرنسپل واقعات کے ریکارڈ سے بنا رہے ہیں. ریکارڈ کا لنک اس کتاب کے صفحات کو ایک حجم میں جمع کرنے کے عمل کو دیا جاتا ہے. "
جب ڈن نے لکھا کہ جب وہ زندگی کی کتاب پیدائش، شادی، طلاق اور موت کی طرح اہم زندگی کے واقعات میں شامل ہوسکتا تھا تو وہ تصور کررہا تھا کہ وہ گزرتے ہیں. تاہم، اب کہ لوگوں کے بارے میں بہت ساری معلومات درج کی گئی ہے، کتاب کی زندگی ایک ناقابل یقین حد تک تفصیلی تصویر ہوسکتی ہے، اگر وہ مختلف صفحات (یعنی ہمارے ڈیجیٹل نشان) ایک دوسرے کے ساتھ پابند رہیں. زندگی کی یہ کتاب محققین کے لئے ایک عظیم وسائل ہوسکتی ہے. لیکن، یہ برباد (Ohm 2010) ایک ڈیٹا بیس بھی کہا جا سکتا ہے، جس میں تمام قسم کے غیر اخلاقی مقاصد کے لئے استعمال کیا جاسکتا ہے، جیسا کہ میں باب 6 (اخلاقیات) میں بیان کرتا ہوں.