ڊجيٽل بصر ڪرڻ لاء توهان جي سروي ڳنڍيندڙ سڀ زماني ۾ هر ماڻهو پنهنجي سوالن پڇڻ وانگر ٿي سگهي ٿو.
نموني سروي ۽ censuses: عام پڇڻ ٻه مکيه ڀاڱا ۾ اچي ٿو. نموني سروي، جتي توهان کي ماڻهن جي هڪ ننڍڙي تعداد رسائي، لچڪدار بروقت، ۽ نسبتا سستو ٿي سگهي ٿو. تنهن هوندي به، نموني سروي، ڇاڪاڻ ته اهي هڪ نموني تي مشتمل آهن، اڪثر انهن جي قرارداد ۾ محدود آهن. هڪ نموني سروي سان گڏ، ان جي اڪثر مخصوص جاگرافيائي علائقن جي باري ۾ يا مخصوص ڊيموگرافڪ گروپن لاء انومان ڪرڻ ڏکي آهي. Censuses، ٻئي تي، سنڌ جي آبادي ۾ هر هڪ انٽرويو ڪرڻ جي ڪوشش ڪئي. انهن کي وڏو داد آهن، پر اهي عام مهانگو آهي، وڌائڻ ۾ تنگ (اھي رڳو سوال جو هڪ ننڍو انگ ۾ شامل آهي)، ۽ بروقت نه (اھي جيئن ته هر 10 سالن جي حيثيت ۾ هڪ مقرر شيڊول، تي ايڏو) (Kish 1979) . هاڻي تصور ته تحقيق نموني سروي ۽ censuses جي بهترين ڪنڀار تڏهن ٿي سگهي ٿو. تصور ته تحقيق هر ڏينهن هر هڪ کي هر سوال پڇن ٿا سگهي.
ڏٺل، هن مسلسل، ونظر، سروي هميشه-تي سماجي سائنس fantasy جو هڪ قسم آهي. پر، اهو ظاهر ٿئي ٿو ته اسان ڪيترن ئي ماڻهن کان ڊجيٽل بصر سان ماڻهن جي هڪ ننڍڙي تعداد کان سروي سوال گڏي جي هن ذري گهٽ ڪرڻ شروع ڪري سگهو ٿا. مون کي ميلاپ amplified پڇڻ جي هن قسم جي سڏ. جيڪڏهن چڱي طرح ٿي چڪو آهي، ان جي مدد ڪري سگهي ٿو ته اسان جو اندازو آهي ته (ننڍا جي جاگرافيائي علائقن لاء) وڌيڪ مقامي آهن، وڌيڪ granular (خاص ڊيموگرافڪ گروپن لاء)، ۽ وڌيڪ بروقت مهيا ڪري.
amplified پڇڻ جي هڪ مثال يشوع Blumenstock، جيڪو ڊيٽا ته غريب ملڪن ۾ ترقي ھدايت جي مدد ڪري ڇڏي گڏ ڪرڻ جو خواهشمند جي ڪم مان اچي ٿو. وڌيڪ خاص، Blumenstock مال ۽ چڱي-پئي ته زور ڏنو ۽ هڪ سروي جي گهڻي سان هڪ مردم خيز جو پورو ٿيل اندازو ڪرڻ لاء هڪ نظام کي پيدا ڪرڻ جو خواهشمند آهي (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . حقيقت ۾، مون کي اڳ ۾ ئي Blumenstock جي ڪم مختصر طور باب 1 ۾ بيان ڪيو آهي.
شروع ڪرڻ لاء، Blumenstock Rwanda ۾ سڀ کان وڏي موبائل فون فراهم ڪرڻ سان partnered. سندن ڪوٺيء جو کيس 2005 ع کان رويي ڇوڙ جي باري ۾ 1.5 ملين گراهڪن کان رکيا برو رڪارڊ ۽ 2009. مهيا هن جي لاگن اهڙي شروع ٿي وقت جي طور تي هر سڏ ۽ متن پيغام، مدو، ۽ سڏيندڙ ۽ رسيور جي ذري گهٽ جاگرافيائي مقام جي باري ۾ معلومات تي مشتمل. اڳ ۾ اسان جي انگن جي مسئلن جي باري ۾ ڳالهائڻ شروع ڪري، ان کي هن پهريون قدم ئي سڀ مان هڪ ٿي سگهي ٿو ته ٻاهر اشارو لڳي آهي. باب 2 ۾ بيان ڪيو ويو آهي، سڀ کان ڊجيٽل جو سراغ ڊيٽا تي تحقيق ڪرڻ لاء نه سگهبو آهي. ۽، ڪيترن ئي ڪمپنين justifiably سندن ڊيٽا حصيداري ڪري لنوائيندو آهي، ڇاڪاڻ ته ان کي نجي آهي. ته سندن گراهڪ شايد آسرو نه ھو ته سندن رڪارڊ گڏيل-۾ ڪيو ويندو کربين-سان تحقيق آهي. هن حالت ۾، سنڌ جي تحقيق جي انگن اکرن anonymize کي خبردار قدم کڻي ٿي گذريو آهي ۽ انهن جي ڪم جو هڪ ٽئين پارٽي (يعني سندن IRB) جي ڪئي.سعودي ويو. پر، انهن ڪوششن جي باوجود، انهن انگن اکرن کي شايد اڃا ڄاڻڻ لازمي آهن ۽ اهي امڪان حساس معلومات تي مشتمل (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . مون کي باب 6 ۾ انهن اخلاقي سوال ڏانھن موٽي ايندي.
پگهار ته Blumenstock مال ۽ چڱي-رهيو جريب ۾ دلچسپي هئي. پر، انهن فصلن جي سڏ رڪارڊ ۾ سڌو سنئون نه آهي. ٻين لفظن ۾، انهن سڏ رڪارڊ، هن تحقيق لاء اڻپورا آهن ڊجيٽل بصر ته سوره 2. ۾ تفصيل سان بحث ڪيو ويو آهي جو هڪ عام خصوصيت پر، ان جو امڪان لڳي ٿو ته ان جي سڏ رڪارڊ شايد مال ۽ چڱي-پئي جي باري ۾ ڪجهه معلومات آهي. پوء، Blumenstock جي سوال پڇڻ جي هڪ طريقو ٿي سگهي ٿو: ان گوئي کي ڪيئن ماڻهو سندن ڊجيٽل جو سراغ ڊيٽا جي بنياد تي هڪ سروي جو جواب ڏيندو ممڪن آهي؟ ته پوء، پوء ٿورا ماڻهو پڇڻ جي اسان کي ٻيو هر جي جواب اندازو ڪري سگهو ٿا.
هن empirically جو تعين ڪرڻ لاء، Blumenstock ۽ سائنس ۽ ٽيڪنالاجي جي Kigali انسٽيٽيوٽ کان تحقيق جي مددگارن موبائل فون صارفين هزار جي باري ۾ هڪ جو هڪ نمونو سڏيو. هن تحقيق جيئن ته "تون هڪ پنهنجو ٿا جيئن، ڌرين کي منصوبي جو مقصد بيان سندن رضامندي جي لاء پڇيو سڏ رڪارڊ جي سروي جا جواب ڪڙي لاء، ۽ پوء کين سوالن جو سلسلو پڇيو سندن مال ۽ چڱي-رهيو اندازو ڪرڻ، ريڊيو؟ "۽" تون هڪ سائيڪل پنهنجو ٿا؟ "(شڪل 3،11 ڏسي هڪ جزوي فهرست لاء). هن سروي ۾ سڀ ڌرين کي مالي تلافي ٿي ويا.
مضمون ۾ انجنيئرنگ جو ڪريڊ سکيا جي پٺيان: اڳيون، Blumenstock هڪ ٻه-قدم طريقيڪار ڊيٽا سائنس ۾ عام استعمال ڪيو. پهريون، ته مضمون ۾ انجنيئرنگ قدم ۾، هر ماڻهو ته انٽرويو ڪيو ويو لاء، Blumenstock جي سڏ رڪارڊ هر شخص جي باري ۾ ڪنڀار جي هڪ سيٽ ۾ تبديل ڪيو. ڊيٽا سائنسدانن سڏ ٿئي انهن ڪنڀار "خوبيون" ۽ سماجي سائنسدان کين سڏيندو هوس "variables." مثال طور، هر شخص، سرگرمي سان ڏينهن جي Blumenstock ڏوهه جي ڪل تعداد جي لاء، ھڪ قوم جي تعداد ۾ هڪ شخص سان رابطي ۾، ڪئي وئي آهي ته رقم رقم جي airtime تي خرچ ڪيو، ۽ پوء تي. تنقيدي، سٺي مضمون ۾ انجنيئرنگ جي تحقيق جي لھڻ جي علم جي ضرورت آهي. مثال طور، جيڪڏهن ان کي ملڪي ۽ بين الاقوامي مطالبن جي وچ ۾ فرق ڪرڻ ضروري آهي (اسان جي قوم جو عالمي سڏ wealthier ٿيڻ جي اميد وٺن)، پوء هن جي خاصيت انجنيئرنگ قدم تي ڪيو ويندو هجڻ ضروري آهي. Rwanda جو ٿورو ڌيان سان هڪ محقق هن مضمون ۾ شامل نه ٿئي، ۽ ان کان پوء سنڌ جي ماڊل جي predictive ڪارڪردگي جو شڪار ٿيندو.
اڳيون، جي ڪريڊ سکيا قدم ۾، Blumenstock سندن خاصيتن جي بنياد تي هر شخص جي لاء سروي جواب گوئي کي هڪ انگن ماڊل بڻايو. ان صورت ۾، Blumenstock 10-ٻٽو پار-تصدق سان logistic regression استعمال ڪيو، پر هن ٻين انگن يا مشين سکيا اچي هڪ قسم جي استعمال ھا.
پوء ان کي ڪيئن چڱي ڪم ڪيو؟ Blumenstock سڏ حوالن مان نڪتل خاصيتن کي استعمال ڪندي وانگر سوال سروي ڪرڻ جي جواب گوئي ڪرڻ جي قابل هو "توهان کي هڪ ريڊيو پنهنجو ڇا؟" ۽ "تون هڪ سائيڪل پنهنجو ڇا؟"؟ نمونو. هن ٿينديون جي درستگي ڪجهه فصلن (شڪل 3.11) لاء اعلي هئا. پر، ان کي هميشه هڪ سادي ڪيڏو جي خلاف هڪ پيچيده جي اڳڪٿي جو طريقو compare ڪرڻ لاء اهم آهي. ان صورت ۾، هڪ سادي ڪيڏو گوئي لاء ته هر هڪ جي سڀ کان عام جواب ڏيندو آهي. مثال طور، 97،3٪ هڪ ريڊيو صنعتن پوء جيڪڏھن Blumenstock اڳڪٿي ڪئي هئي ته هر هڪ ريڊيو هن 97،3٪، جنهن ماٿيلي سندس وڌيڪ پيچيده طريقيڪار (97.6٪ درستگي) جي ڪارڪردگي سان ملندڙ جلندڙ آهي جو هڪ درستگي پئي ھا ته صنعتن تي رپورٽ ڪري ڇڏي آهي. ٻين لفظن ۾، سڀني جي البيلي ڊيٽا ۽ ماڊلنگ 97،6٪ کي 97،3٪ کان اڳڪٿي جي درستگي وڌي. بهرحال، اهڙي "تون هڪ سائيڪل پنهنجو ڇا؟" جي حيثيت ٻين سوالن جا، لاء، ته ٿينديون 54،4٪ کان 67،6٪ کي بهتر. وڌيڪ عام، شخصيت 3،12 ڪجهه فصلن لاء ڏيکاري ٿو Blumenstock گهڻو صرف هن سادي بيس جي اڳڪٿي جي بازي کان بهتر نه ڪيو، پر ته ٻين فصلن جي لاء ڪجهه سڌارو نه هو.
هن موقعي تي اوهان کي، سوچ ٿئي ٿي ته انهن جا نتيجا سا disappointing آهن، پر صرف هڪ سال بعد ۾ Blumenstock ۽ ٻن ساٿيو-جبرائيل Cadamuro ۽ رابرٽ تي-شايع substantially بهتر نتيجا سان سائنس ۾ هڪ ڪاغذ (Blumenstock, Cadamuro, and On 2015) . مثال طور 1) اهي وڌيڪ جديد طريقن (يعني، انجنيئرنگ ۽ هڪ کان وڌيڪ جديد مشين سکيا ماڊل خصوصيت کي هڪ نئين اچڻ) ھوا ۽ 2) بدران انفرادي سروي سوالن جا جواب ويچار ڪرڻ جي تنھنجي ڪوشش جي ڀيٽ ۾ (،: نه جي بهتري لاء ٻه مکيه فني سبب هئا "توهان هڪ ريڊيو پنهنجو ٿا؟")، اھي هڪ جامع مال انڊيڪس ويچار ڪرڻ جي ڪوشش ڪئي.
Blumenstock ۽ ساٿيو ٻن طريقن ۾ انهن جي اچڻ جي ڪارڪردگي demonstrated. پهريون، اھي مليو سندن نموني ۾ سنڌ جي ماڻهن لاء، اهي سڏ رڪارڊ (شڪل 3.14) کان سندن مال predicting جي هڪ خوبصورت سٺي نوڪري ڪندا ٿي سگهي ٿو ته. ٻيو، ۽ هونئن به وڌيڪ ضروري، Blumenstock ۽ ساٿيو پهتا ته سندن طريقيڪار Rwanda ۾ مال جي جاگرافيائي ورڇ جي اعلي-معيار ڪاٿي پيدا ڪري سگهي ٿو. وڌيڪ خاص، (اھي) سندن مشين سکيا ماڊل آهي، جنهن کي 1.000 جي باري ۾ ماڻهن جو انهن جي نموني تي تربيت ويو استعمال ڪيو، جو سڏ رڪارڊ ۾ سڀ 1.5 ملين ماڻهن جي مال گوئي ڪري. وڌيڪ، هن geospatial ڊيٽا جي سڏ جي انگن اکرن ۾ سرايت ڪري (پگهار ته سڏ ڊيٽا هر سڏ لاء برهمڻ آباد سيل ٽاور جي مقام شامل آهي) سان گڏ، ان جي تحقيق هر شخص جي رهائش جي ذري گهٽ جاء جو اندازو ڪري سگهندا هئا. انهن ٻنهي ڪاٿي گڏجي لاڳو ڪري، سنڌ جي تحقيق انتهائي نفيس spatial granularity تي سبسڪرائيبر مال جي جاگرافيائي ورڇ جو هڪ ڪاٿو جي روپ ۾. مثال طور، اھي Rwanda جي 2148 خانا (جي ملڪ ۾ smallest انتظامي يونٽ) جي هر هڪ ۾ سراسري طور مال جو اندازو ٿي سگهي ٿو. اهي اڳڪٿي مال انهيء پوء granular اهي چيڪ ڪرڻ ڏکيو ٿي ويا هئا. پوء، سنڌ جي تحقيق انهن جي نتيجن کي اها Rwanda جي 30 ضلعن جي سراسري مال جي ڪاٿي پيدا ڪرڻ. اهي ضلعي سطح ڪاٿي تکو هڪ سون معياري روايتي سروي، جي Rwandan ڪري رهيا هئا ڊيموگرافڪ ۽ صحت سروي (شڪل 3.14) مان جي ڪاٿي سان ملندڙ هئا. جيتوڻيڪ ٻنهي ذريعن کان ڪاٿي جهڙيون هيون، Blumenstock ۽ ساٿيو کان ڪاٿي جي باري ۾ 50 دفعا سستي ۽ 10 ڀيرا تيزي سان (جڏھن ۾ خرچ variable خرچ جي مد ۾ ماپي) هئا. قيمت ۾ هي ڏسڻ وٽان جي ضايع ٿيڻ جو مطلب آهي هئا ڊيموگرافڪ ۽ صحت لاء معياري آهي ته بدران هر چند سال-طور تي هلائي رهيو کان ماپن-ويل ڊجيٽل جو سراغ ڊيٽا سان گڏ ٿيل ننڍي سروي جي ھائبرڊ هر مهيني هلائي ٿي سگهي.
نتيجي ۾، Blumenstock جي ڊجيٽل جو سراغ ڊيٽا سان اچڻ ٿيل سروي جي انگن اکرن پڇڻ سون-معياري سروي اندازي سان ئي صفت تمام ڪاٿي پيدا ڪرڻ amplified. هن خاص مثال به amplified پڇڻ ۽ روايتي سروي طريقن جي وچ ۾ واپاري-offs جي ڪجهه بيان ڪندو. پهريون، ته amplified پڇڻ ڪاٿي وڌيڪ بروقت، substantially سستي، ۽ وڌيڪ granular هئا. پر، ٻئي هٿ تي، هن وقت ۾، ڪو نه amplified پڇڻ جي هن قسم جي لاء هڪ مضبوط نظرياتي بنياد آهي. ته هن هڪ مثال ڏيکاري نه ڪندو آھي جڏھن ان کي نه سگهندو جڏهن ته ان ڪم ۽ ڪندو، آهي. وڌيڪ، هن amplified پڇڻ اچڻ موجود ان جي ڪاٿي جي چوڌاري غير يقيني quantify کي سٺي طريقي نه رکندو آھي. تنهن هوندي به، amplified پڇڻ انگ اکر-ماڊل جي بنياد تي پوسٽ-stratification ۾ ٽي وڏا علائقن کي رڙيون ڪنيڪشن اٿس (Little 1993) ، imputation (Rubin 2004) ، ۽ ننڍي-ايراضي اندازي مطابق (Rao and Molina 2015) -and پوء مون کي اميد آهي ته ترقي ڪندو دؤران ٿي.
Amplified پڇڻ هڪ بنيادي رشيد ته توهان جي مخصوص صورتحال کي ٽيلر ڪري سگهجي ٿو ھلي. نه ٻه ingredients ۽ ٻه قدم آهن. جڏهن ته ٻه ingredients 1 آهن) هڪ ڊجيٽل جو سراغ dataset ته وڏين پر پتلي آھي (ته آهي، ان ڪيترن ئي ماڻهن کي ڇڏيو آهي نه پر ڄاڻ آهي ته توهان هر شخص جي باري ۾ ضرورت آهي) ۽ 2) هڪ سروي ته تنگ پر ٿلھي آھي (ته آهي، ان ڪري چڪو آهي فقط چند ماڻهو، پر ان جي معلومات ته اوھان کي جن ماڻهن جي باري ۾ ضرورت اٿس). ان کان پوء، اتي ٻه قدم آهن. پهرين، ٻئي ڊيٽا وسيلن ۾ سنڌ جي ماڻهن لاء، هڪ اهڙي مشين سکيا ماڊل ڊجيٽل جو سراغ ڊيٽا کي استعمال ڪري ٿو ته سروي جواب گوئي ڪرڻ کپن. اڳيون، ته مشين سکيا نموني استعمال کي ڊجيٽل جو سراغ جي انگن اکرن ۾ هر ماڻهو جي سروي جواب سند لاء. اهڙيء طرح، جيڪڏهن ڪي سوال آهي ته توهان ماڻهن جي پکو کي پڇا ڳاڇا ڪرڻ چاهيو آهي، جن ماڻهن کي ته انهن جي جواب گوئي ڪرڻ لاء استعمال ڪري سگهي کان ڊجيٽل ڊيٽا جو سراغ لاء ڏسو.
Comparing Blumenstock جي ان مسئلي کي به ٽيون دور ڪرڻ لاء ٻيو دور کان ٺاٿو جي باري ۾ هڪ اهم سبق جي علامت تي پهرين ۽ ٻئي جي ڪوشش ڪئي سروي ڪرڻ لاء تحقيق پڙهجي: ابتدا جي آخر ۾ نه آهي. ته، آهي ڪيترائي ڀيرا، پهريون ڀيرو اچڻ جي چڱي نه ٿيندو، پر جيڪڏهن تحقيق ڪم کي اڳتي، شين کي بهتر حاصل ڪري سگهو ٿا. وڌيڪ عام طور تي، جڏهن ڊجيٽل عمر ۾ سماجي تحقيق ڪرڻ لاء نئين اچي ڪٿڻ، ان کي ٻن ھڪ evaluations بنائڻ لاء اهم آهي: 1) ڪھڙي طرح سان گڏوگڏ هاڻي هي ڪم ڪندو آهي ۽ 2) اوھان کي ڪيئن چڱي خيال هن جي ڊيٽا نظارن جي طور تي مستقبل ۾ ڪم وٺن ٿا تبديلين ۽ تحقيق جي مسئلي تي وڌيڪ ڌيان ڏيڻ ڪهڙو آهي. جيتوڻيڪ، تحقيق (ڪيئن سٺي تحقيق جي هن خاص ٽڪرو آهي) اوسر جي پهرين قسم ڪرڻ تربيت آهن، ٻيو ته اڪثر کان وڌيڪ اهم آهي.