یہ گندا ہو سکتا ہے، اگرچہ، افزودہ پوچھ طاقتور ہو سکتا ہے.
ڈیجیٹل ٹریس اعداد و شمار کے ادوریپن کے ساتھ نمٹنے کے لئے ایک مختلف نقطہ نظر کے سروے کے اعداد و شمار، ایک عمل میں افزودہ پوچھ فون کروں گا اس کے ساتھ براہ راست اسے مضبوط بنانے میں ہے. افزودہ پوچھ کی ایک مثال کا مطالعہ ہے Burke and Kraut (2014) ، میں نے باب میں پہلے بیان جس میں فیس بک پر بات چیت دوستی طاقت کو بڑھاتا ہے کہ آیا کے بارے، (دفعہ 3.2). اس صورت میں، برک اور ئدنساؤٹ فیس بک لاگ ڈیٹا ساتھ سروے کے اعداد و شمار مل کر.
ترتیب کہ برک اور ئدنساؤٹ میں کام کر رہے تھے، تاہم، کا مطلب ہے کہ وہ دو بڑے مسائل کہ محققین افزودہ سے پوچھ چہرہ کر کے ساتھ نمٹنے کے لئے کی ضرورت نہیں تھی کہ. سب سے پہلے، اصل ڈیٹا سیٹ-ایک عمل کو کہا جاتا ریکارڈ کے تعلق، ذیل میں اس مسئلہ کی دیگر ایک مثال ڈیٹاسیٹ-کر سکتے ہیں مشکل اور غلطی کا شکار ہو جائے (ہم دیکھیں گے میں مناسب ریکارڈ کے ساتھ ایک ڈیٹا سیٹ میں ایک ریکارڈ کے ملاپ سے باہم منسلک ). افزودہ پوچھ کے دوسرے اہم مسئلہ ڈیجیٹل نشانات کے معیار کو کثرت کا اندازہ کرنے کے محققین کے لئے مشکل ہو جائے گا ہے. مثال کے طور پر، کبھی کبھی ایسا عمل ہے جس کے ذریعے اسے جمع کیا جاتا ملکیتی ہے اور باب 2. میں بیان بالفاظ دیگر مسائل کے بہت سے کے لئے حساس ہو سکتا ہے، افزودہ پوچھ اکثر نامعلوم کے بلیک باکس کے اعداد و شمار کے ذرائع کے سروے کی غلطی کا شکار منسلک شامل ہوں گے معیار. کہ ان دو مسائل کو متعارف کرانے کے خدشات کے باوجود، کے طور اسٹیفن Ansolabehere اور سے Eitan Hersh کی طرف سے مظاہرہ کیا گیا تھا اس حکمت عملی کے ساتھ اہم تحقیق کرنا ممکن ہے (2012) امریکہ میں ووٹنگ پیٹرن پر ان کی تحقیق میں. یہ کچھ تفصیل سے اس تحقیق پر جانے کے لئے قابل قدر ہے کی حکمت عملی ہے کہ Ansolabehere اور Hersh تیار کیا افزودہ پوچھ کے دوسرے پروگراموں میں مفید ہو گا میں سے بہت سے ہیں کیونکہ.
ووٹر ٹرن آؤٹ سیاسیات میں وسیع تحقیق کا موضوع رہا ہے، اور ماضی میں، ووٹ اور کیوں عام طور پر سروے کے اعداد و شمار کے تجزیہ کی بنیاد پر کیا گیا ہے جو کے محققین کی تفہیم. امریکہ میں ووٹنگ، تاہم، کہ حکومت کے ریکارڈ ہر شہری ووٹ دیا ہے کہ آیا میں ایک غیر معمولی طرز عمل ہے (کورس کے، حکومت کے لئے جو ہر شہری ووٹ ریکارڈ نہیں کرتا). کئی سالوں کے لئے، ان حکومتی ووٹنگ کے ریکارڈ کو ملک بھر میں مختلف مقامی حکومت کے دفاتر میں بکھرے ہوئے کاغذ کے فارم پر دستیاب تھے،. یہ مشکل ہے لیکن ناممکن نہیں، سیاسیات ووٹر کی مکمل تصویر ہے کرنے کے لئے اور لوگوں کو ان کی اصل ووٹنگ کے رویے سے ووٹنگ کے بارے میں سروے میں کیا کہتے ہیں آپس میں موازنہ کرنے کے لئے بنایا (Ansolabehere and Hersh 2012) .
لیکن، اب ان ووٹنگ کے ریکارڈ ڈیجیٹائزڈ کیا گیا ہے، اور نجی کمپنیوں کی ایک بڑی تعداد کو منظم طریقے سے جمع کیا ہے اور جامع ماسٹر ووٹنگ فائلوں کہ تمام امریکیوں کی ووٹنگ کے رویے ریکارڈ کرنے کے لئے ان کے ووٹنگ کے ریکارڈ ملا دیا. Ansolabehere اور Hersh ووٹر کی ایک بہتر تصویر کی ترقی میں مدد کرنے کے لئے اپنے مالک ووٹنگ فائل کو استعمال کرنے کے لئے میں LCC-ان کمپنیوں-Catalist میں سے ایک کے ساتھ شراکت داری. اس کے علاوہ، یہ جمع اور ایک کمپنی کی طرف سے curated ڈیجیٹل ریکارڈز پر انحصار کی وجہ سے، اس کے محققین کی طرف سے گزشتہ کوششوں کمپنیوں کی مدد اور مطابق ریکارڈز کا استعمال کرتے ہوئے بغیر کیا گیا تھا کہ زیادہ فوائد کی ایک بڑی تعداد کی پیشکش کی.
باب 2 میں ڈیجیٹل ٹریس ذرائع میں سے کئی کی طرح، Catalist ماسٹر فائل، آبادیاتی رویوں، اور رویوں میں معلومات Ansolabehere اور Hersh ضرورت ہے کے زیادہ تر شامل نہیں تھا. اس کی معلومات کے علاوہ میں، Ansolabehere اور Hersh توثیق ووٹنگ کے رویے (یعنی، Catalist ڈیٹا بیس میں معلومات) کو اطلاع ووٹنگ کے رویے کا موازنہ کرنے میں خاص طور پر دلچسپی رکھتے تھے. لہذا، محققین کے اعداد و شمار ہے کہ وہ کوآپریٹو کانگریس الیکشن مطالعہ (CCES)، ایک بڑے سماجی سروے کے حصے کے طور پر چاہتے تھے کہ جمع کیا. اگلا، محققین Catalist لئے اس ڈیٹا دی، اور Catalist محققین (CCES سے) خود رپورٹ ووٹنگ رویے (Catalist سے) ووٹنگ کے رویے کی توثیق شامل ہے کہ ایک ملا دیا گیا ڈیٹا فائل، اور آبادیات اور مدعا کے رویوں واپس (CCES سے دی ). دوسرے الفاظ میں، Ansolabehere اور Hersh سروے کے ڈیٹا کے ساتھ ووٹنگ کے اعداد و شمار افزودہ، اور نتیجے میں ضم ہونے کی فائل انہیں نہ تو فائل کو انفرادی طور پر چالو حالت میں ہے کہ کچھ کرنے کے قابل بناتا ہے.
سروے کے اعداد و شمار کے ساتھ Catalist ماسٹر ڈیٹا فائل افزودگی کی طرف سے، Ansolabehere اور Hersh تین اہم نتائج اخذ کرنے کے لئے آئے. سب سے پہلے، زیادہ رپورٹنگ ووٹنگ کا روز بروز بڑھتی ہوئی ہے: غیر ووٹروں کی تقریبا نصف ووٹنگ رپورٹ کیا. یا، یہ دیکھنے کا ایک اور طریقہ کسی کو ووٹ ڈالنے کی خبر میں بتایا گیا ہے تو، صرف 80٪ امکان ہے کہ وہ اصل میں ووٹ دیا ہے ہے. دوسرا، زیادہ رپورٹنگ کے بے ترتیب نہیں ہے؛ زیادہ رپورٹنگ اچھی طرح تعلیم یافتہ، زیادہ آمدنی والے لوگوں میں زیادہ عام ہے، حامیوں عوامی امور میں مصروف ہیں جو. دوسرے الفاظ میں، لوگوں کو ووٹ ڈالنے کا سب سے زیادہ امکان ہے جو بھی سب سے زیادہ ووٹنگ کے بارے میں جھوٹ کا امکان ہے. تیسری، اور سب سے زیادہ شدید، کی وجہ سے زیادہ رپورٹنگ، ووٹروں اور غیر ووٹروں کے درمیان اصل اختلافات چھوٹا وہ سروے سے صرف نظر کے مقابلے میں ہیں منظم نوعیت کی. مثال کے طور پر، ایک انڈرگریجویٹ ڈگری کے ساتھ ان لوگوں کے بارے میں 22 فی صد ایشو ووٹنگ رپورٹ کرنے کے امکانات زیادہ ہوتے ہیں، لیکن اصل ووٹ صرف 10 فی صد ایشو زیادہ امکان ہے. اس کے علاوہ، ووٹنگ کے موجودہ وسائل کی بنیاد پر نظریات کی پیشن گوئی جو اصل میں ووٹ، نئے نظریات کو سمجھنے اور ووٹنگ کی پیشن گوئی کرنے کے لئے بلاتا ہے کہ ایک آخباخت تلاش کرنے سے زیادہ ووٹنگ رپورٹ کریں گے جو بہت بہتر ہیں.
لیکن، کتنا ہم ان نتائج پر اعتماد کرنا چاہئے؟ یاد رکھیں کہ ان نتائج کی خرابی کی نامعلوم مقدار کے ساتھ بلیک باکس ڈیٹا تک غلطی کا شکار منسلک پر انحصار. مزید خاص طور پر، کے نتائج دو اہم اقدامات پر قبضہ: 1) ایک درست ماسٹر datafile اور 2) اپنے مالک datafile سروے کے اعداد و شمار سے منسلک کرنے Catalist کی صلاحیت پیدا کرنے کے لئے بہت سے مختلف اعداد و شمار کے ذرائع کو اکٹھا کرنے Catalist کی صلاحیت. ان مراحل میں سے ہر ایک بہت مشکل ہے اور یا تو قدم پر غلطیاں غلط نتائج اخذ کرنے کے محققین کی قیادت کر سکتے. تو یہ اکثر محققین کا کوئی فرد تعلیمی محقق یا گروپ سے مطابقت کر سکتے ہیں کہ ایک پیمانے پر، ان کے مسائل کو حل کرنے میں وسائل کی سرمایہ کاری کر سکتے ہیں. تاہم، ڈیٹا پروسیسنگ اور ملاپ دونوں ایک کمپنی کے طور Catalist کی مسلسل موجودگی کے لئے اہم ہیں. باب کے آخر میں مزید پڑھنے میں، میں نے مزید تفصیل اور کس طرح Ansolabehere اور Hersh ان کے نتائج میں اعتماد کی تعمیر میں ان مسائل کی وضاحت. ان تفصیلات اس مطالعہ کے لئے مخصوص ہیں اگرچہ، ان کو بھی اسی طرح کے مسائل بلیک باکس ڈیجیٹل ٹریس اعداد و شمار ذرائع سے منسلک کرنے کی خواہش رکھتے ہیں دیگر محققین کے لئے پیدا کرے گا.
جنرل سبق محققین اس تحقیق سے اپنی طرف متوجہ کر سکتے ہیں کیا ہیں؟ سب سے پہلے، سروے کے اعداد و شمار کے ساتھ ڈیجیٹل نشانات کی افزودگی سے زبردست قیمت نہیں ہے. دوئم، ان مجموعی اگرچہ، تجارتی اعداد و شمار کے ذرائع "زمین سچائی" پر غور نہیں کیا جانا چاہئے، بعض صورتوں میں وہ مفید ہو سکتا ہے. اصل میں، یہ ان اعداد و شمار ذرائع (وہ ہمیشہ گر جائے گا جس سے مختصر) مطلق حقیقت کو نہ آپس میں موازنہ کرنے کے لئے بہترین ہے. بلکہ، اس کے دیگر دستیاب اعداد و شمار کے ذرائع، ہمیشہ اس کے ساتھ ساتھ غلطیاں ہیں جس سے ان کا موازنہ کرنے کے لئے بہتر ہے.