2.4.3.2 سميلن

پري ڪيس pruning جي شفاف comparisons پيدا سميلن.

ٺيڪ comparisons يا randomized ڪنٽرول تجربن يا قدرتي تجربن مان اچي سگهي ٿو. پر، اتي ڪيترن ئي حال جتي تون نه هلائي سگهي ٿو ته مثالي آزمائش ۽ فطرت جو هڪ قدرتي آزمائش مهيا نه ڪيو آهي. انهن جي سيٽنگ ۾، هڪ چڱو مقابلو پيدا ڪرڻ جو بهترين طريقو سميلن ۾ آهي. سميلن ۾، سنڌ جي محقق ماڻهن کي ته کانسواء ته هڪ ئي علاج حاصل ڪئي ۽ هڪ نه ڪئي آهي ساڳي آهي جو جوڙو ٺاهي غير تجرباتي ڊيٽا وسيلي لڳندي. سميلن جي عمل ۾، تحقيق در به pruning آهن. ته ڪيس ڄڻ ته ڪو پڌرو مقابلو نه آهن discarding، آهي. اهڙيء طرح، هن جو طريقو وڌيڪ صحيح سميلن-۽-pruning سڏيو وڃي ھا، پر مون کي روايتي اصطلاح سان لٺ ويندس: سميلن ۾.

تمام وڏا غير تجرباتي ڊيٽا وسيلن سان حڪمت سميلن جي طاقت جو هڪ خوبصورت مثال Liran Einav ۽ طريقي جي صارفين جي رويي تي تحقيق کان اچي (2015) . Einav ۽ ساٿيو eBay تي جاء وٺڻ نيلامي ۾ دلچسپي هئا، ۽ انهن جي ڪم بيان ۾، مون کي هڪ مخصوص پاسو تي زور سين: نيلام جي اثر جيئن ته وڪري جي قيمت يا هڪ وڪري جي ممڪن طور تي نيلام مالڪي، پر قيمت ۾ ٿيندڙ.

وڪري جي قيمت تي قيمت ٿيندڙ جي اثر جي باري ۾ سوال جواب ڪرڻ جي سڀ کان naive واٽ رڳو مختلف ٿيندڙ قيمت سان نيلامي لاء آخري قيمت جو حساب ڏيڻو ٿئي ها. هن اچڻ ٺيڪ ٿي ته اوھان کي رڳو ھڪ ڏنو شيء آهي ته هڪ ڏنو ٿيندڙ قيمت سان eBay تي وجهي ٿي ويا جي وڪري جي قيمت گوئي ڪرڻ چاهيو ٿا ٿين. پر، ڇاڪاڻ ته ان کي چڱو comparisons جي بنياد تي نه آهي ته هن اچڻ مارڪيٽ مالڪي تي قيمت ٿيندڙ جي اثر ڪم نه ڪندو ته توهان جو سوال آهي، سو آهي؛ هيٺين ٿيندڙ قيمت سان نيلامي اعلي ٿيندڙ قيمت سان نيلامي کان ڪافي مختلف ٿي سگهي ٿو (مثال طور، اھي مال جي مختلف قسمن لاء ٿي يا وڪام جي مختلف قسمن ۾ شامل ٿئي).

توهان کي اڳ ۾ ئي مٺو comparisons بازي جي باري ۾ ڳڻتي آهي ته، توهان جي naive اچڻ ڇڏي ڏيو ۽ هڪ ميدان آزمائش جتي توهان کي هڪ مخصوص شيء-چون ٿا، هڪ گولف ڪلب-سان نيلام جي حراست ۾-جو چوڻ آهي جو هڪ مقرر مقرر، آزاد جھاز، نيلام وڪرو ڪري ڇڏي ڊوڙندو غور ٿئي ، وغيره-پر ٻن هفتن لاء کلي ٿيندڙ قيمت ترتيب مقرر سان. سنڌ جي نتيجي ۾ منڊي مالڪي comparing جو قسم، هن ميدان ۾ آزمائش وڪري جي قيمت تي قيمت ٿيندڙ جي اثر جو هڪ تمام صاف ماپ جي آڇ ڪري ڇڏي آهي. پر، هن ماپ صرف هڪ خاص پيداوار ۽ نيلام جي حراست جي سيٽ تي لاڳو ڪري ڇڏي آهي. هن جا نتيجا مختلف ٿي سگهي ٿي، مثال طور، شين جي مختلف قسمن لاء. مضبوط نظريي کان سواء، ان کي هن سخت آزمائش مان ممڪن تجربن هلائي وئي آهي ٿي سگهي ٿو ته جي مڪمل حد extrapolate ڪرڻ ڏکيو آهي. وڌيڪ، ميدان تي تجربن جي سڀني مهانگو آهي ته ان جي شين ۽ نيلام قسمن جي سڄي سميجي خلا ڪپڙا انھن جو ڪافي مٿي هلائڻ لاء ناممڪن ٿي سگهندي آهي.

سميلن ۾: سنڌ جي naive اچڻ ۽ تجرباتي اچڻ تائين ان جي ابتڙ، Einav ۽ ساٿيو هڪ ٽيون اچڻ کپي. سندن حڪمت عملي جي مکيه چال جي ميدان ۾ تجربن ته اڳ ۾ ئي eBay تي ائين ڪيو ڪرڻ جهڙيون شيون کوج ڪرڻ آهي. مثال طور، شخصيت 2،6 انهيء ساڳي گولف ڪلب-هڪ Taylormade ڪرڻ چاهيو 09 ڊرائيور-پئي انهيء ساڳي seller- "budgetgolfer" جي ايندي لاء 31 ستين جو ڪجهه ڏيکاري ٿو. تنهن هوندي به، انهن ستين ذرا مختلف ڪنڀار آهن. انھن جي يارهن $ 124،99 جي هڪ مقرر قيمت لاء ڊرائيور آڇ، جڏهن ته ٻين 20 مختلف آخر هيون سان نيلامي آهن. به، جو ستين مختلف جھاز بيهڻ آهي، يا ته $ 7،99 يا $ 9،99. ٻين لفظن ۾، اها آهي ته جيئن ته "budgetgolfer" جي تحقيق لاء تجربن ڊوڙندو آهي.

جي Taylormade ڪرڻ چاهيو 09 ڊرائيور "budgetgolfer" جي وڪرو ڪئي پئي جو ستين ستين جو هڪ ملائي لٿو، جتي ٺيڪ ٺاڪ هڪ ئي شيء ذرا مختلف ڪنڀار سان ٺيڪ ٺاڪ ساڳي رسوائي پر هر وقت جي وڪرو ڪئي پئي وڃي جو هڪ مثال آهي. eBay جي تمام وڏا بنڊ اندر موجود لفظي ملائي بيان جي هزارين مان سو ستين جي لکن جٽادار آهي. اهڙيء طرح، بلڪه هڪ ڏنو ٿيندڙ قيمت اندر سڀ نيلامي لاء آخري قيمت comparing جي ڀيٽ ۾، Einav ۽ ساٿيو ملائي بيان اندر comparisons ڪر. امان ملائي بيان جي هزارين جي انهن سو اندر comparisons کان نتيجن کي گڏ ڪرڻ ۾، Einav ۽ طريقي جي ٿيندڙ قيمت ۽ هر شيء (مثال طور، ان جي سراسري وڪري جي قيمت) جي حوالي قدر جي سلسلي ۾ حتمي قيمت ٻيهر مظاهرو ڪيو. مثال طور، جيڪڏهن Taylormade ڪرڻ چاهيو 09 ڊرائيور $ 100 (ان جي سيلز جي بنياد تي) جي حوالي قدر ڪيو آهي، ته پوء $ 10 جي هڪ ٿيندڙ قيمت طور 0،1 ۽ آخري $ 120 جي قيمت 1.2 جيئن جو اظهار ڪيو وڃي ها جو اظهار ڪيو وڃي ھا.

شخصيت 2،6: هڪ ملائي سيٽ جو هڪ مثال. هن جملي ساڳي گولف ڪلب (هڪ Taylormade ڪرڻ چاهيو 09 ڊرائيور) جي ٺيڪ ٺاڪ هڪ ئي شخص (budgetgolfer) جي وڪرو ڪئي پئي، پر هنن سيلز جي ڪجهه مختلف حالتون (مثال طور، مختلف ٿيندڙ ملهه) پرفارم هئا آهي. Einav تاڪين عن کان ورتو شخصيت. (2015).

شخصيت 2،6: هڪ ملائي سيٽ جو هڪ مثال. هن جملي ساڳي گولف ڪلب (هڪ Taylormade ڪرڻ چاهيو 09 ڊرائيور) جي ٺيڪ ٺاڪ هڪ ئي شخص ( "budgetgolfer") جي وڪرو ڪئي پئي، پر هنن سيلز جي ڪجهه مختلف حالتون (مثال طور، مختلف ٿيندڙ ملهه) پرفارم هئا آهي. کان ورتو شخصيت Einav et al. (2015) .

پگهار ته Einav ۽ ساٿيو نيلام مالڪي تي شروع قيمت جي اثر ۾ دلچسپي هئا. پهريون، سڌر regression اھي اندازي مطابق ته اعلي ٿيندڙ قيمت هڪ وڪري جي ممڪن ضايع، ۽ جيڪي اعلي ٿيندڙ قيمت جو آخري وڪري جي قيمت وڌي، هڪ وڪرو ٿيڻ تي conditional استعمال ڪري. سڀني شين تي averaged ۽ قيمت ۽ آخري مالڪي-آهن جيڪي دلچسپ نه ٿيندڙ جي وچ ۾ هڪ سڌر تعلق فرض آهن پاڻ جو قسم، انهن ڪاٿي-جنهن. پر، Einav ۽ ساٿيو به انهن جي ڊيٽا جي تمام وڏا سائيز جي استعمال کان وڌيڪ باريڪ پهچڻ جو هڪ قسم جو ڪاٿو ڪرڻ. پهريون، Einav ۽ ساٿيو مختلف قيمت جي ۽ سڌر regression استعمال ڪرڻ کان سواء شيون لاء الڳ الڳ انهن ڪاٿي ڪيو. انهن کي مليو آهي ته جڏهن شروع قيمت ۽ وڪري جو ممڪن جي وچ ۾ تعلق سڌر آهي، ٿيندڙ قيمت ۽ وڪري جي قيمت جي وچ ۾ تعلق چٽيء طرح غير سڌر (شڪل 2.7) آهي. خاص ۾، 0،05 ۽ 0،85 جي وچ ۾ جي ڀيٽ ۾ ٿيندڙ لاء، جو ٿيندڙ قيمت وڪري جي قيمت، هڪ خبر پئجي ويئي ته ان جي تجزيي ته هڪ سڌر تعلق فرض ھو ۾ وڃايو مڪمل ٿي ويو تي تمام ٿورو اثر ڇڏيو آهي.

شخصيت 2.7: نيلام شروع بدران ۽ هڪ وڪرو (ڇڏي پينل) جي ممڪن ۽ وڪري جي قيمت (حق پينل) جي وچ ۾ لاڳاپا. نه کوٽائي شروع قيمت ۽ وڪري جو ممڪن جي وچ ۾ هڪ سڌر تعلق آهي، پر شروع قيمت ۽ وڪري جي قيمت جي وچ ۾ هڪ غير سڌر تعلق آهي؛ 0،05 ۽ 0،85 جي وچ ۾ جي ڀيٽ ۾ ٿيندڙ لاء، جو ٿيندڙ قيمت وڪري جي قيمت تي تمام ٿورو اثر ڇڏيو آهي. ٻنهي حالتن ۾، سنڌ جي رشتي شيء جو قدر جي بنيادي طرح آزاد هوندا آهن. اهي گراف انجير 4a ۽ 4b Einav تاڪين عن ٻيهر. (2015).

شخصيت 2.7: نيلام شروع بدران ۽ هڪ وڪرو (ڇڏي پينل) جي ممڪن ۽ وڪري جي قيمت (حق پينل) جي وچ ۾ لاڳاپا. نه کوٽائي شروع قيمت ۽ وڪري جو ممڪن جي وچ ۾ هڪ سڌر تعلق آهي، پر شروع قيمت ۽ وڪري جي قيمت جي وچ ۾ هڪ غير سڌر تعلق آهي؛ 0،05 ۽ 0،85 جي وچ ۾ جي ڀيٽ ۾ ٿيندڙ لاء، جو ٿيندڙ قيمت وڪري جي قيمت تي تمام ٿورو اثر ڇڏيو آهي. ٻنهي حالتن ۾، سنڌ جي رشتي شيء جو قدر جي بنيادي طرح آزاد هوندا آهن. اهي گراف انجير 4a ۽ 4b ٻيهر Einav et al. (2015) .

ٻيو، بلڪه سڀ شيون تي averaging جي ڀيٽ ۾، Einav ۽ ساٿيو به انهن جي ڊيٽا جي تمام وڏا پيماني تي شيون (مثال طور، پالتو جانورن جو سامان، اليڪٽرانڪس، ۽ راند جي يادگارن) جي 23 مختلف ڀاڱا (شڪل 2.8) لاء قيمتي ٿيندڙ جي اثر جو اندازو ڪرڻ لاء استعمال ڪري. اهي ڪاٿي کان وڌيڪ امتيازي شيون-جيئن ته يادگارن-شروع قيمت جي طور تي لاء هڪ وڪري جي ممڪن ۽ آخري وڪري جي قيمت تي هڪ وڏو اثر تي ننڍا ننڍا اثر ڇڏيو آهي ته ڏيکاري. وڌيڪ، وڌيڪ commodified شيون-جيئن ته ڊي وي ڊي ۽ جيئن لاء وڊيو-شروع قيمت جي آخري قيمت تي لڳ ڀڳ ڪو به اثر ڇڏيو آهي. ٻين لفظن ۾، هڪ سراسري ته ادل جي 23 مختلف ڀاڱا کان نتيجا combines اهي شيون جي وچ ۾ اختلاف جي باري ۾ اهم معلومات ڳالھ ھوريان ڪري.

شخصيت 2،8: نتيجا انفرادي طور هر درجي کان ڪاٿي پهتا. سڀ ڀاڱا جي اندازي ۾ ئي بيڪار Dot گڏجي pooled، ٽيبل 11 (Einav تاڪين Al. 2015، ٽيبل 11). اهي ڪاٿي کان وڌيڪ امتيازي شيون-جيئن ته يادگارن-شروع قيمت هڪ وڪرو (ايڪس محور) جي ممڪن ۽ آخري وڪري جي قيمت (وائي-محور) تي هڪ وڏو اثر تي ننڍا ننڍا اثر ڇڏيو آهي ته جيئن لاء ڏيکاريو ته.

شخصيت 2،8: نتيجا انفرادي طور هر درجي کان ڪاٿي پهتا. سڀ ڀاڱا جي اندازي ۾ ئي بيڪار Dot گڏجي pooled (Einav et al. 2015, Table 11) . اهي ڪاٿي کان وڌيڪ امتيازي شيون-جيئن ته يادگارن-شروع قيمت هڪ وڪرو (ايڪس محور) جي ممڪن ۽ آخري وڪري جي قيمت (وائي-محور) تي هڪ وڏو اثر تي ننڍا ننڍا اثر ڇڏيو آهي ته جيئن لاء ڏيکاريو ته.

جيتوڻيڪ جيڪڏھن اوھان کي خاص طور تي eBay تي نيلامي ۾ دلچسپي نه آهن، توهان جي واٽ آهي ته شخصيت 2.7 ۽ شخصيت 2،8 آڇ سادو سڌر regression انومان آهي ته سڌر رشتا فرض ۽ شيون جي ڪيترن ئي مختلف ڀاڱا تڏهن کان eBay جي هڪ richer سمجهه ۾ هٽلر آهن. انهن کان وڌيڪ باريڪ ڪاٿي تمام وڏا ڊيٽا ۾ سميلن جي وس وارو بيان؛ اهي ڪاٿي جي ميدان ۾ تجربن جي هڪ شاندار نمبر، جنهن prohibitively مهانگو ٿي ھا کان سواء ممڪن نه ھجي ھا.

جي حقيقت، اسان کي اسان جو هڪ ئي صفت تمام آزمائش جي نتيجن ۾ هوس جي ڀيٽ ۾ ڪنهن به خاص سميلن ۾ مطالعي جي نتيجن ۾ گهٽ اعتماد ڪيو وڃي. جڏهن ڪنهن به سميلن ۾ مطالعي مان نتيجا ڇنڊڇاڻ، اتي ٻه اهم خدشن آهن. پهريون، اسان کي ياد رکڻ گهرجي ته اسان کي رڳو انهن شين کي ته سميلن لاء استعمال ڪيا ويا پر چڱو comparisons کي يقيني بڻائي سگهي ٿو آھي. حقیقت ID نمبر، شيء جو درجو، شيء جو عنوان، ۽ subtitle: سندن مکيه نتيجا ۾، Einav ۽ ساٿيو ٺيڪ ٺاڪ چار ڪنڀار تي سميلن ڪيو. جيڪڏهن شيون طريقن ته سميلن لاء استعمال نه ڪيا ويا ۾ مختلف هئا، ته هڪ ناجائز مقابلو پيدا ڪري سگهي ٿي. مثال طور، جيڪڏهن "budgetgolfer" جي سياري ۾ (جڏهن گولف ڪلب گهٽ مشهور آهن) ۾ Taylormade ڪرڻ چاهيو 09 ڊرائيور لاء قيمت انجام ڏنو ٿي، ان کان پوء ان کي، ظاهر ٿي سگهي ٿو ته هيٺين ٿيندڙ قيمت آخري قيمت ڍرو کي رسي جڏهن حقيقت ۾ هن موسمي جي هڪ artifact ٿئي ها طلب ۾ قسمين قسمين. عام ۾، هن مسئلي کي بهترين اچڻ سميلن ۾ ڪيترن ئي مختلف قسمن جي ڪوشش ڪري ٿي لڳي. مثال طور، Einav ۽ ساٿيو سندن تجزيو ورجائي جتي ملائي بيان هڪ سال اندر وڪري تي شيون، هڪ مهيني اندر، ۽ contemporaneously شامل آهن. هن وقت دري tighter بڻائي ٿي ملي سگهي سيٽن جو انگ گھڻي قدر، پر موسمي قسمين قسمين جي باري ۾ ڏک گھٽجي ٿي. خوشقسمتي، اهي ڏسي ته نتيجا سميلن معيار ۾ انهن تبديلين جي بدليل آهي. هن سميلن ۾ ادب ۾، خيالن جي اهڙي قسم جي عام observables ۽ unobservables جي سلسلي ۾ اظهار ڪيو آهي، پر سنڌ جي اهم خيال حقيقت ته تحقيق صرف سميلن ۾ استعمال جي خاصيتن تي چڱو comparisons ٺاهڻ آهن آھي.

ٻيو اهم تعلقو جڏهن سميلن ۾ نتيجا interpreting آهي ته اهي رڳو ملائي ڊيٽا کي لاڳو؛ اھي ڪيس ته ملائي نه ٿي سگهي تي لاڳو نه ڪندا آھن. مثال طور، شيون ته ھو وڌيڪ ستين Einav ۽ ساٿيو ور ۽ سيمي ور وڪام تي توجهه آهن کي سندن تحقيق جي حد بندي ڪندي. اهڙيء طرح، جڏهن انهن comparisons interpreting اسان کي ياد رکڻ گهرجي ته اھي رڳو eBay جي هن subset تي لاڳو.

سميلن وڏي datasets ۾ چڱو comparisons پئجي لاء هڪ طاقتور حڪمت عملي آهي. ڪيترن ئي سماجي سائنسدانن لاء، سميلن ۾ تجربن کي ٻيو-چڱي طرح رهندو آهي، پر آهي ته هڪ کي يقين آهي ته نظرثاني ڪرڻ گهرجي، صنعتڪار آهي. تمام وڏا ڊيٽا ۾ سميلن جي ميدان ۾ تجربن جي هڪ ننڍڙي تعداد کان بهتر ٿي سگهي ٿي: 1) اثرات ۾ heterogeneity اهم آهي ۽ 2) اتي سميلن لاء سٺو observables آهن. ٽيبل ۾ 2.4 ڪيئن سميلن ۾ وڏي ڊيٽا وسيلن سان استعمال ڪري سگهجي ٿو جي ڪجهه ٻين مثالن مهيا ڪري.

ٽيبل ۾ 2.4: پڙهائي ته ڊجيٽل بصر اندر چڱو comparisons سٽ کي سميلن ۾ استعمال جا مثال.
Substantive وڌائڻ وڏي ڊيٽا ذريعو Citation
پوليس تشدد تي shootings جو اثر بند-۽-frisk رڪارڊ Legewie (2016)
خاندانن ۽ پاڙيسري تي 11 سيپٽمبر 2001 جو اثر ووٽنگ جي رڪارڊ ۽ گير رڪارڊ Hersh (2013)
سماجي contagion ڪميونيڪيشن ۽ پيداوار اپنائڻ جي ڊيٽا Aral, Muchnik, and Sundararajan (2009)

نتيجي ۾، غير تجرباتي جي انگن اکرن کان estimating causal اثرات کي naive اچي خطرناڪ آهن. تنهن هوندي به، ھيڻو ڪري وڏا کان هڪ continuum گڏ ڪوڙي causal ڪاٿي آسان بڻائي ٿي، ۽ تحقيق غير تجرباتي ڊيٽا اندر چڱو comparisons جي کوج ڪري سگهي ٿو لاء حڪمت. قدرتي تجربن ۽ سميلن ۾: هميشه-تي، وڏي ڊيٽا نظام جي ترقي وس آهر ٻن موجود طريقا استعمال ڪرڻ لاء اسان جي صلاحيت وڌائي.