ဤအပိုင်းကိုတစ်ဦးဇာတ်ကြောင်းအဖြစ်ဖတ်ခံရဖို့မဟုတ်ဘဲထက်, တစ်ဦးကိုကိုးကားအဖြစ်အသုံးပြုခံရဖို့ဒီဇိုင်းပြုလုပ်ထားသည်။
လူမှုရေးသုတေသနတွင်ကြောင်းကျိုးဆက်စပ်အကြောင်းကိုမေးခွန်းလွှာမကြာခဏရှုပ်ထွေးပြီးအနုစိတ်ဖြစ်ကြသည်။ ကြောင်းကျိုးဆက်စပ်ဂရပ်များအပေါ်အခြေခံပြီးကြောင်းကျိုးဆက်စပ်တဲ့အခြေခံချဉ်းကပ်ဘို့အတွေ့ Pearl (2009) နှင့်အလားအလာရလဒ်များအပေါ် အခြေခံ. အခြေခံချဉ်းကပ်ဘို့အတွေ့ Imbens and Rubin (2015) (နှင့်ဤအခနျးတှငျနည်းပညာဆိုင်ရာနောက်ဆက်တွဲ) ။ အဲဒီနှစျခုချဉ်းကပ်မှုအကြားတစ်ဦးနှင့်နှိုင်းယှဉ်လျှင်အဘို့အတွေ့ Morgan and Winship (2014) ။ တစ်ရှက်ကြောက် defining မှတရားဝင်ချဉ်းကပ်ဘို့အတွေ့ VanderWeele and Shpitser (2013) ။
အခန်း၌ငါသည်စမ်းသပ်နှင့် Non-စမ်းသပ်မှုဒေတာမှကြောင်းကျိုးဆက်စပ်ခန့်မှန်းစေပါအောင်ကျွန်တော်တို့ရဲ့စွမ်းရည်အကြားတစ်ဦးတောက်ပလိုင်းတူသလိုပဲအဘယျသို့ဖန်တီးခဲ့သည်။ အဖြစ်မှန်မှာ, ငါခွဲခြား blurrier ကြောင်းထင်တယ်။ ဥပမာအားဖြင့်, လူတိုင်းဆေးလိပ်သောက်လူဆေးလိပ်သောက်ဖို့တွန်းအားပေးတဲ့ randomized ထိန်းချုပ်ထားသောစမ်းသပ်မှုပြုမိဖူးဘူးသော်လည်းကင်ဆာဖြစ်ပေါ်စေသည်ဟုလက်ခံထားသည်။ Non-စမ်းသပ် data ကိုမှကြောင်းကျိုးဆက်စပ်ခန့်မှန်းရာတွင်အပေါ်မြတ်သောစာအုပ်အရှည်ကုသမှုများအတွက်ကိုတွေ့မြင် Rosenbaum (2002) , Rosenbaum (2009) , Shadish, Cook, and Campbell (2001) နှင့် Dunning (2012) ။
၏အခန်းကြီး 1 နှင့် 2 ကို Freedman, Pisani, and Purves (2007) စမ်းသပ်ချက်, ထိန်းချုပ်ထားသောစမ်းသပ်ချက်များနှင့် randomized ထိန်းချုပ်ထားသောစမ်းသပ်ချက်များအကြားခြားနားချက်များသို့ရှင်းလင်းပြတ်သားတဲ့နိဒါန်းကိုဆက်ကပ်။
Manzi (2012) randomized ထိန်းချုပ်ထားသောစမ်းသပ်ချက်၏အတွေးအခေါ်နှင့်စာရင်းအင်းဆိုင်ရာကျောထောက်နောက်ခံသို့စိတ်ဝင်စားဖွယ်နှင့်ဖတ်လို့ရအောင်နိဒါန်းပေးစွမ်းသည်။ ဒါဟာအစစီးပွားရေးလုပ်ငန်းမှာလက်တွေ့စမ်းသပ်ချက်၏တန်ခိုး၏စိတ်ဝင်စားစရာကို real-ကမ္ဘာဥပမာပေးစွမ်းသည်။
Casella (2008) , Box, Hunter, and Hunter (2005) , Athey and Imbens (2016b) စမ်းသပ်ဒီဇိုင်းနှင့်ခွဲခြမ်းစိတ်ဖြာ၏စာရင်းအင်းရှုထောင့်မှကောင်းသောနိဒါနျးပေး။ ဘောဂဗေဒ: နောက်ထပ်အများအပြားကွဲပြားခြားနားသောနယ်ပယ်များတွင်စမ်းသပ်ချက်များအသုံးပြုခြင်း၏မြတ်သောကုသမှုရှိပါတယ် (Bardsley et al. 2009) , လူမှုဗေဒ (Willer and Walker 2007; Jackson and Cox 2013) , စိတ်ပညာ (Aronson et al. 1989) , နိုင်ငံရေးသိပ္ပံပညာ (Morton and Williams 2010) , နှင့်လူမှုရေးမူဝါဒက (Glennerster and Takavarasha 2013) ။
ပါဝင်သူစုဆောင်းမှု (ဥပမာ, နမူနာ) ၏အရေးပါမှုကိုအောက်မှာ-တန်ဖိုးထားစမ်းသပ်သုတေသနတွင်မကြာခဏဖြစ်ပါတယ်။ ကုသမှု၏အကျိုးသက်ရောက်မှုလူဦးရေအတွက်ပင်သောင်းပြောင်းထွေလာရောနှောပါလျှင်သို့သော်, ထို့နောက်နမူနာ။ အရေးကြီးသည် Longford (1999) သူကလူတွေကိုသိမ်းကျုံးနမူနာနှင့်အတူလူဦးရေစစ်တမ်းအဖြစ်စမ်းသပ်ချက်စဉ်းစားသုတေသီများသည်ဟုပြောသည်သောအခါရှင်းရှင်းလင်းလင်းဤအချက်မှန်ကန်စေသည်။
ငါဓာတ်ခွဲခန်းနှင့်လယ်ပြင်စမ်းသပ်ချက်များအကြားပေးအပ်ကြောင်းအဆိုပါ dichotomy နည်းနည်းရိုးရှင်းသောဖြစ်ပါတယ်။ တကယ်တော့အခြားသုတေသီများလယ်ပြင်စမ်းသပ်ချက်များအမျိုးမျိုးသောပုံစံများကိုခွဲခြားကြောင်းအထူးသဖြင့်သူတို့ကိုပိုပြီးအသေးစိတ် typologies အဆိုပြုထားကြပါပြီ (Harrison and List 2004; Charness, Gneezy, and Kuhn 2013) ။ ထို့ပြင်အဆိုပါဓာတ်ခွဲခန်းနှင့်လယ်ပြင် dichotomy သို့သေသပ်စွာ fit မလူမှုရေးသိပ္ပံပညာရှင်များကဖျော်ဖြေစမ်းသပ်ချက်နှစ်ယောက်အခြားအမျိုးအစားများရှိပါတယ်။ စစ်တမ်းစမ်းသပ်ချက်နှင့်လူမှုရေးစမ်းသပ်ချက်စစ်တမ်းစမ်းသပ်ချက်ရှိပြီးသားစစ်တမ်းများ၏အခြေခံအဆောက်အဦများ အသုံးပြု. စမ်းသပ်ဖြစ်ကြောင်းနှင့်၏အခြားရွေးချယ်စရာဗားရှင်းမှတုံ့ပြန်မှုနှိုင်းယှဉ် တူညီတဲ့မေးခွန်းများကို (အချို့စစ်တမ်းစမ်းသပ်ချက်အခန်း 3 မှာတင်ပြကြသည်); စစ်တမ်းစမ်းသပ်ချက်အပေါ်ပိုပြီးအဘို့မြင် Mutz (2011) ။ ကုသမှုတစ်ခုသာအစိုးရခြင်းဖြင့်အကောင်အထည်ဖော်နိုင်အချို့သောလူမှုရေးမူဝါဒကိုသည်အဘယ်မှာရှိလူမှုစမ်းသပ်ချက်စမ်းသပ်ချက်ဖြစ်ကြသည်။ လူမှုစမ်းသပ်ချက်အစီအစဉ်အကဲဖြတ်ဖို့နီးကပ်စွာဆက်စပ်နေပါတယ်။ မူဝါဒကိုစမ်းသပ်ချက်အပေါ်ပိုမိုတွေ့ Orr (1998) , Glennerster and Takavarasha (2013) နှင့် Heckman and Smith (1995) ။
စာတမ်းများတစ်အရေအတွက်စိတ္တဇအတွက်ဓာတ်ခွဲခန်းနှင့်လယ်ပြင်စမ်းသပ်ချက်နှင့်နှိုင်းယှဉ်ကြပါပြီ (Falk and Heckman 2009; Cialdini 2009) နှင့်နိုင်ငံရေးသိပ္ပံတိကျတဲ့စမ်းသပ်ချက်၏ရလဒ်များကို၏စည်းကမ်းချက်များ၌ (Coppock and Green 2015) , စီးပွားရေး (Levitt and List 2007a; Levitt and List 2007b; Camerer 2011; Al-Ubaydli and List 2013) နှင့်စိတ်ပညာ (Mitchell 2012) ။ Jerit, Barabas, and Clifford (2013) ဓာတ်ခွဲခန်းများနှင့်လယ်ပြင်စမ်းသပ်ချက်ကနေရလဒ်တွေကိုနှိုင်းယှဉ်ခြင်းအဘို့အလို့သုတေသနလုပ်ငန်းဒီဇိုင်းကိုဟောကြားခဲ့ပါတယ်။
သူတို့အနီးကပ်လေ့လာလျက်ရှိသည်ကိုသိသောကြောင့်သူတို့ရဲ့အမူအကျင့်ကိုပြောင်းလဲသင်တန်းသားများနှင့် ပတ်သက်. စိုးရိမ်ပူပန်မှုများတစ်ခါတစ်ရံတွင်ဝယ်လိုအားအကျိုးသက်ရောက်မှုများဟုခေါ်ကြသည်, ထိုသူတို့သည်စိတ်ပညာကိုလေ့လာခဲ့ကြ (Orne 1962) နှင့်ဘောဂဗေဒ (Zizzo 2009) ။ အများအားဖြင့်ဓာတ်ခွဲခန်းစမ်းသပ်ချက်နဲ့ဆက်စပ်ပေမယ့်အဲဒီအလားတူပြဿနာတွေအဖြစ်ကောင်းစွာလယ်ပြင်စမ်းသပ်ချက်အဘို့အပြဿနာများဖြစ်ပေါ်စေနိုင်ပါတယ်။ တကယ်တော့ဝယ်လိုအားအပေါ်သက်ရောက်မှုလည်းတစ်ခါတစ်ရံတွင်လယ်စမ်းသပ်မှု, အနောက်တိုင်းလျှပ်စစ်ကုမ္ပဏီ၏ Hawthorne အလုပ်လုပ်မှာ 1924 ခုနှစ်တွင်စတင်ခဲ့ပြီးကြောင်းအထူးသဖြင့်နာမည်ကြီး illumination စမ်းသပ်ချက်ကနေဆင်းသက်လာတဲ့အသုံးအနှုန်း, Hawthorne အကျိုးသက်ရောက်မှုများဟုခေါ်ကြသည် (Adair 1984; Levitt and List 2011) ။ နှစ်ဦးစလုံးဝယ်လိုအားအပေါ်သက်ရောက်မှုများနှင့် Hawthorn သက်ရောက်မှုများနီးကပ်စွာ (ကိုလညျးရှုအခန်း 2 မှာဆှေးနှေးတုံ့ပြန်တိုင်းတာခြင်း၏စိတ်ကူးနှင့်ဆက်စပ်သောကြသည် Webb et al. (1966) ) ။
လယ်ပြင်စမ်းသပ်ချက်များသမိုင်းဘောဂဗေဒမှာဖော်ပြထားတဲ့ခဲ့ (Levitt and List 2009) , နိုင်ငံရေးသိပ္ပံပညာ (Green and Gerber 2003; Druckman et al. 2006; Druckman and Lupia 2012) , စိတ်ပညာ (Shadish 2002) , နှင့်အများပြည်သူဆိုင်ရာမူဝါဒ (Shadish and Cook 2009) လယ်ပြင်စမ်းသပ်ချက်လျင်မြန်စွာထင်ရှားတဲ့ဖြစ်လာခဲ့သည်ဘယ်မှာလူမှုရေးသိပ္ပံပညာတစ်ခုမှာဧရိယာနိုင်ငံတကာဖွံ့ဖြိုးရေးဖြစ်ပါတယ်။ ဘောဂဗေဒအတွင်း၌အလုပ်၏အပြုသဘောဆောင်ပြန်သုံးသပ်ကြည့်ရှု Banerjee and Duflo (2009) နှင့်ဝေဖန်အကဲဖြတ်ဘို့မြင် Deaton (2010) ။ နိုင်ငံရေးသိပ္ပံ၌ဤအလုပ်၏ပြန်လည်သုံးသပ်ကြည့်ရှု Humphreys and Weinstein (2009) ။ နောက်ဆုံးအနေနဲ့လယ်ပြင်စမ်းသပ်ချက်များနှင့်ပတ်သက်သည့်ကျင့်ဝတ်ဆိုင်ရာစိန်ခေါ်မှုများကိုနိုင်ငံရေးအရသိပ္ပံစူးစမ်းခဲ့ကြ (Humphreys 2015; Desposato 2016b) နှင့်ဖွံ့ဖြိုးရေးဘောဂဗေဒ (Baele 2013) ။
အခန်း၌ငါသည် Pre-ကုသမှုသတင်းအချက်အလက်ခန့်မှန်းခြေကုသမှုသက်ရောက်မှုများ၏တိကျတိုးတက်လာဖို့အသုံးပွုနိုငျကြောင်းအကြံပြုသို့သော်ဤချဉ်းကပ်မှုအကြောင်းကိုအချို့သောဆွေးနွေးငြင်းခုံရှိပါတယ်: Freedman (2008) , Lin (2013) နှင့် Berk et al. (2013) ; မြင် Bloniarz et al. (2016) နောက်ထပ်သတင်းအချက်အလက်များသည်။
သက်တမ်း, ကုသမှုသက်ရောက်မှုများ၏သောင်းပြောင်းထွေလာရောနှောနှင့်ယန္တရားများ: ငါသုံးသဘောတရားများကိုအာရုံစိုက်ဖို့ရှေးခယျြထားပါဘူး။ ဤရွေ့ကားအယူအဆကွဲပြားခြားနားသောနယ်ပယ်များတွင်ကွဲပြားခြားနားသောအမည်များရှိသည်။ ဥပမာအားဖြင့်, စိတ်ပညာရှင်ပြုပြီနှင့်မော်ဒအပေါ်အာရုံစူးစိုက်အားဖြင့်ရိုးရှင်းတဲ့စမ်းသပ်ချက် ကျော်လွန်. ရွှေ့ဖို့လေ့ (Baron and Kenny 1986) ။ ပြုပြီ၏စိတ်ကူးငါယန္တရားများမခေါ်ဘယ်သို့သောအားဖြင့်ဖမ်းဆီးရမိသည်, မော်ဒ၏စိတ်ကူးငါပြင်ပသက်တမ်း (ကကွဲပြားခြားနားသောအခြေအနေများတွင် run ခဲ့မယ်ဆိုရင်ဥပမာစမ်းသပ်မှု၏ရလဒ်များကိုကွဲပြားလိမ့်မည်) နှင့်ကုသမှုသက်ရောက်မှုများ၏သောင်းပြောင်းထွေလာရောနှော (မခေါ်ဘယ်သို့သောအားဖြင့်ဘမ်းသည် ဥပမာတခြားလူထက်အချို့သောလူများအတွက်အကျိုးသက်ရောက်မှုများပိုကြီး) ဖြစ်ကြသည်။
၏စမ်းသပ်မှု Schultz et al. (2007) ထိရောက်သောဝင်ရောက်စွက်ဖက်ဒီဇိုင်းဖို့အသုံးပြုနိုင်ပါတယ်ဘယ်လိုလူမှုရေးသီအိုရီပြသထားတယ်။ ထိရောက်သောဝင်ရောက်စွက်ဖက်ဒီဇိုင်းအတွက်သီအိုရီ၏အခန်းကဏ္ဍကိုအကြောင်းကိုပိုပြီးယေဘုယျအငြင်းအခုံအဘို့အတွေ့ Walton (2014) ။
ပြည်တွင်းရေးနှင့်ပြင်ပသက်တမ်း၏သဘောတရားများကိုပထမဦးဆုံးမိတ်ဆက်ခဲ့ကြသည် Campbell (1957) ။ ကြည့်ရှုပါ Shadish, Cook, and Campbell (2001) တစ်ဦးထက်ပိုအသေးစိတ်သမိုင်းနှင့်စာရင်းအင်းနိဂုံးတရားဝင်မှု, ပြည်တွင်းရေးတရားဝင်မှု, တရားဝင်မှုကိုတည်ဆောက်ရန်နှင့်ပြင်ပသက်တမ်းတစ်သတိထားဘယ်သူကမှအလေးအနက်မထားသည်။
စမ်းသပ်ချက်အတွက်စာရင်းအင်းနိဂုံးသက်တမ်းနှင့်ဆက်စပ်သောကိစ္စများကိုခြုံငုံသုံးသပ်ကြည့်ရှု Gerber and Green (2012) (ကလူမှုရေးသိပ္ပံပညာရှုထောင့်အတွက်) နှင့် Imbens and Rubin (2015) (ကစာရင်းအင်းရှုထောင့်အတွက်) ။ အွန်လိုင်းလယ်ပြင်စမ်းသပ်ချက်အတွက်အထူးပျေါပေါကျကစာရင်းအင်းနိဂုံးသက်တမ်းတချို့ကကိစ္စများထိုကဲ့သို့သောမှီခိုဒေတာနှင့်အတူယုံကြည်မှုကြားကာလအတွက် computationally အကျိုးရှိစွာနည်းလမ်းများအဖြစ်ကိစ္စများပါဝင်သည် (Bakshy and Eckles 2013) ။
ပြည်တွင်းသက်တမ်းရှုပ်ထွေးတဲ့လယ်ပြင်စမ်းသပ်ချက်အတွက်အာမခံရန်ခက်ခဲစေနိုင်ပါတယ်။ ဥပမာ, ကိုကွညျ့ပါ Gerber and Green (2000) , Imai (2005) နှင့် Gerber and Green (2005) မဲနှင့် ပတ်သက်. ရှုပ်ထွေးပြီးလယ်ကွင်းစမ်းသပ်မှုများ၏အကောင်အထည်ဖော်မှုနှင့် ပတ်သက်. ဆွေးနွေးငြင်းခုံသည်။ Kohavi et al. (2012) နှင့် Kohavi et al. (2013) အွန်လိုင်းလယ်ပြင်စမ်းသပ်ချက်အတွက်ကြားကာလသက်တမ်း၏စိန်ခေါ်မှုများသို့တစ်ဦးမိတ်ဆက်ပေး။
ပြည်တွင်းရေးသက်တမ်းနှင့်အတူတစျခုမှာအဓိကစိုးရိမ်ပူပန် Randomization နှင့်အတူပြဿနာတွေဖြစ်ပါတယ်။ အလားအလာကျပန်းနှင့်အတူပြဿနာများ detect တလမ်း observable စရိုက်များပေါ်ကုသမှုနှင့်ထိန်းချုပ်မှုအုပ်စုများကိုနှိုင်းယှဉ်ဖို့ဖြစ်ပါတယ်။ နှိုင်းယှဉ်၏ဤကြင်နာချိန်ခွင်ကို check လို့ခေါ်ပါတယ်။ ကြည့်ရှုပါ Hansen and Bowers (2008) စစ်ဆေးမှုများဟန်ချက်မျှအောင်ပြုလုပ်ပေးတဲ့စာရင်းအင်းချဉ်းကပ်မှုအဘို့နှင့်မြင်ရ Mutz and Pemantle (2015) ချိန်ခွင်လျှာစစ်ဆေးမှုများနှင့် ပတ်သက်. စိုးရိမ်ပူပန်မှုများသည်။ ဥပမာအားဖြင့်, ချိန်ခွင်စစ်ဆေးသုံးပြီး Allcott (2011) ကျပန်းအ OPower စမ်းသပ်ချက် (; ဆိုဒ်များ 2, 6, 8 ဇယား 2 တွင်ကြည့်ပါ) ၏အချို့သောအတွက်စမ်းသပ်ချက်သုံးခုအတွက်မှန်ကန်စွာအကောင်အထည်မဖော်ခဲ့ကွောငျးအခြို့သောသက်သေအထောက်အထားရှိကွောငျးတှေ့ရ။ အခြားချဉ်းကပ်မှုအဘို့အတွေ့ Imbens and Rubin (2015) , အခန်း 21 ။
ပြည်တွင်းရေးသက်တမ်းနှင့်ဆက်စပ်သောအခြားအဓိကစိုးရိမ်ပူပန်မှုများဖြစ်ကြ: 2) နှစျဦးကုသမှုအုပ်စုထဲမှာမလူတိုင်းကုသမှုနှင့်အချို့သောအားလက်ခံတွေ့ဆုံဘယ်မှာ Non-လိုက်နာမှု, ဘက်ကုသမှုအုပ်စုထဲမှာမလူတိုင်းအမှန်တကယ်ကုသမှုခံယူဘယ်မှာ 1) တဦးတည်းတဖက်သတ် Non-လိုက်နာမှု, ထိန်းချုပ်မှုအုပ်စုတွင်လူကုသမှုရလဒ်အချို့သင်တန်းသားများသည်အတိုင်းတာကြသည်မဟုတ်ဘယ်မှာ, 3) attrition, နှင့်ကုသမှုထိန်းချုပ်မှုအခြေအနေလူတွေကိုကုသမှုအခြေအနေကလူကနေကျော်တွေဆီကိုကူးစက်ဘယ်မှာ 4) ဝင်ရောက်စွက်ဖက်မှုကိုခံယူလော့။ ကြည့်ရှုပါ Gerber and Green (2012) ကဤကိစ္စများအသီးအသီးအပေါ်မှာပိုပြီးအဘို့ကိုအခနျး 5, 6, 7, 8 ။
Construction တရားဝင်မှုအပေါ်ပိုမိုတွေ့ Westen and Rosenthal (2003) ကြီးမားတဲ့ဒေတာအရင်းအမြစ်, အတွက်, နှင့်ဆောက်လုပ်ရေးသက်တမ်းအပေါ်ပိုပြီးအဘို့အ Lazer (2015) နှင့်ဤစာအုပ်၏အခန်း 2 ။
ပြင်ပသက်တမ်းတစ်ခုမှာရှုထောင့်တစ်ဦးဝင်ရောက်စွက်ဖက်မှုကိုစုံစမျးသည်အဘယ်မှာရှိ setting ကိုဖြစ်ပါတယ်။ Allcott (2015) ရဲ့ site selection ကိုဘက်လိုက်မှုတစ်ခုသတိထားသီအိုရီနှင့်လက်တွေ့ကုသမှုပေးစွမ်းသည်။ ဤကိစ္စကိုလည်းတှငျဆှေးနှေးဖြစ်ပါတယ် Deaton (2010) ။ အများအပြားဆိုဒ်များအတွက်ပုံတူကူးယူခံရအပြင်, ပြည်ထဲရေးစွမ်းအင်ဝန်ကြီးဌာနအစီရင်ခံစာဝင်ရောက်စွက်ဖက်မှုကိုလည်းလွတ်လပ်စွာမျိုးစုံသုတေသနလုပ်ငန်းအုပ်စုများ (ဥပမာအားဖြင့်လေ့လာခဲ့ Ayres, Raseman, and Shih (2013) ) ။
လယ်ပြင်စမ်းသပ်ချက်အတွက်ကုသမှုသက်ရောက်မှုများ၏သောင်းပြောင်းထွေလာရောနှော၏အကောင်းဆုံးခြုံငုံသုံးသပ်ချက်အဘို့, အခန်း 12 ကိုကြည့်ပါ Gerber and Green (2012) ။ ဆေးဘက်ဆိုင်ရာစမ်းသပ်မှုတွေအတွက်ကုသမှုသက်ရောက်မှုများ၏သောင်းပြောင်းထွေလာရောနှောဖို့နိဒါနျးအဘို့အတွေ့ Kent and Hayward (2007) , Longford (1999) နှင့် Kravitz, Duan, and Braslow (2004) ။ ကုသသက်ရောက်မှုများ၏သောင်းပြောင်းထွေလာရောနှောယေဘုယျအားဖြင့် Pre-ကုသမှုဝိသေသလက္ခဏာများပေါ် အခြေခံ. ကွဲပြားမှုအပေါ်အာရုံစူးစိုက်။ သငျသညျ Post-ကုသမှုရလဒ်များအပေါ် အခြေခံ. သောင်းပြောင်းထွေလာရောနှောစိတ်ဝင်စားလျှင်ပိုမိုရှုပ်ထွေးချဉ်းကပ်မှုထိုကဲ့သို့သောကျောင်းအုပ်ကြီး stratification အဖြစ်လိုအပ်နေပါသည် (Frangakis and Rubin 2002) ; မြင် Page et al. (2015) ပြန်လည်သုံးသပ်သည်။
ဥပမာအားဖြင့်, အများစုကသုတေသီများ linear ဆုတ်ယုတ်သုံးပြီးကုသသက်ရောက်မှုများ၏သောင်းပြောင်းထွေလာရောနှောခန့်မှန်းပေမယ့်ပိုသစ်နည်းလမ်းများစက်သင်ယူမှုအပေါ်အားကိုး Green and Kern (2012) , Imai and Ratkovic (2013) , Taddy et al. (2016) နှင့် Athey and Imbens (2016a) ။
အကျိုးသက်ရောက်မှုများ၏သောင်းပြောင်းထွေလာရောနှော၏တွေ့ရှိချက်များနှင့် ပတ်သက်. အချို့သောသံသယရှိသောကြောင့်မျိုးစုံနှင့်နှိုင်းယှဉ်လျှင်ပြဿနာများနှင့်လည်းရှိ၏မျိုးစုံနှိုင်းယှဉ်အကြောင်းကိုလိပ်စာစိုးရိမ်ပူပန်မှုများကိုကူညီနိုငျသောစာရင်းအင်းချဉ်းကပ်မှုအမျိုးမျိုးရှိပါတယ် "ငါးဖမ်း။ " (Fink, McConnell, and Vollmer 2014; List, Shaikh, and Xu 2016) "ငါးဖမ်း" အကြောင်းကိုစိုးရိမ်ပူပန်မှုများမှတစျခုမှာချဉ်းကပ်မှုစိတ်ပညာ ပို. ပို. အဖြစ်များလာရာကို pre-မှတ်ပုံတင်ရေးသည် (Nosek and Lakens 2014) , နိုင်ငံရေးသိပ္ပံပညာ (Humphreys, Sierra, and Windt 2013; Monogan 2013; Anderson 2013; Gelman 2013; Laitin 2013) နှင့်ဘောဂဗေဒ (Olken 2015) ။
၏လေ့လာမှုမှာ Costa and Kahn (2013) မှာစမ်းသပ်မှုအတွက်အိမ်ထောင်စုများ၏ခန့်သာထက်ဝက်လူဦးရေဆိုင်ရာသတင်းအချက်အလက်နှင့်ဆက်စပ်ခံရဖို့နိုင်ခဲ့ကြတယ်။ ဒီသုံးသပ်ချက်တွေနဲ့အသေးစိတ်များနှင့်ဖြစ်နိုင်ခြေပြဿနာတွေကိုစိတ်ဝင်စားစာရှုသူများမူရင်းစက္ကူကိုရည်ညွှန်းသင့်သည်။
mechanisms မယုံနိုင်လောက်အောင်အရေးကြီးလှသည်, ဒါပေမဲ့သူတို့လေ့လာချက်ရန်အလွန်ခက်ခဲဖြစ်ထွက်လှည့်။ အနီးကပ်စိတ်ပညာပြုပြီ၏လေ့လာမှုနှင့်ဆက်စပ်သောယန္တရားများနှင့် ပတ်သက်. သုတေသန (သို့သော်လည်းမြင် VanderWeele (2009) နှစ်ဦးအတွေးအခေါ်များအကြားတစ်ဦးအတိအကျနှိုင်းယှဉ်လျှင်အဘို့) ။ ထိုကဲ့သို့သောအတွက်ဖွံ့ဖြိုးပြီးချဉ်းကပ်မှုအဖြစ်ယန္တရားများကိုရှာဖွေရန်စာရင်းအင်းချဉ်းကပ်မှု, Baron and Kenny (1986) , အတော်လေးဘုံဖြစ်ကြသည်။ ကံမကောင်းစွာပဲ, ဒါကြောင့်သူတို့ကိုအလုပျထုံးလုပျနညျးအခြို့သောခိုင်ခံ့သောယူဆချက်အပေါ်မူတည်ကြောင်းထွက်လှည့် (Bullock, Green, and Ha 2010) တဦးတည်းအများအပြားအခြေအနေများတွင်မျှော်လင့်ထားစေခြင်းငှါ, ကဲ့သို့၎င်း, မျိုးစုံကိုယန္တရားများရှိပါတယ်ကြသောအခါသည်းခံ (Imai and Yamamoto 2013; VanderWeele and Vansteelandt 2014) ။ Imai et al. (2011) နှင့် Imai and Yamamoto (2013) အချို့သောတိုးတက်လာသောစာရင်းအင်းနည်းလမ်းများဆက်ကပ်။ ထို့ပြင် VanderWeele (2015) sensitivity ကိုခွဲခြမ်းစိတ်ဖြာဖို့ဘက်စုံချဉ်းကပ်မှုအပါအဝင်အရေးကွီးသောရလဒ်များကို၏အရေအတွက်နှင့်အတူစာအုပ်-အရှည်ကုသပေးထားပါတယ်။
သီးခြားချဉ်းကပ်မှု (သင်္ဘောသားဗီတာမင် C ကိုပေးကမ်းဥပမာ,) တိုက်ရိုက်ယန္တရားကို manipulate ဖို့ကြိုးစားကြောင်းစမ်းသပ်ချက်အပေါ်အာရုံစိုက်။ ကံမကောင်းစွာပဲ, များစွာသောလူမှုရေးသိပ္ပံပညာ setting တွင်ရှိမျိုးစုံယန္တရားများမကြာခဏဖြစ်ကြပြီးကအခြားသူများကိုပြောင်းလဲနေတဲ့မပါဘဲတဦးတည်းကိုပြောင်းလဲကြောင်းကုသမှုဒီဇိုင်းရန်ခက်ခဲသည်။ စမ်းသပ်မှုတွေအယန္တရားများပြောင်းလဲဖို့တချို့ကချဉ်းကပ်မှုများမှာဖော်ပြထားတဲ့ကြသည် Imai, Tingley, and Yamamoto (2013) , Ludwig, Kling, and Mullainathan (2011) နှင့် Pirlott and MacKinnon (2016) ။
အားဖြင့်ဖော်ပြထားတဲ့အတိုင်းနောက်ဆုံးတွင်ယန္တရားများလည်းသိပ္ပံပညာ၏ဒဿနအတွက်ရှည်လျားသောသမိုင်းများ Hedström and Ylikoski (2010) ။
ခွဲခြားဆက်ဆံမှုကိုတိုင်းတာရန်စာပေးစာယူလေ့လာမှုများနှင့်စာရင်းစစ်လေ့လာမှုများ၏အသုံးပြုမှုအပေါ်ပိုမိုတွေ့မြင် Pager (2007) ။
သငျသညျတညျဆောကျကြောင်းစမ်းသပ်ချက်မှသင်တန်းသားများကိုစုဆောင်းဖို့အသုံးအများဆုံးလမ်း Amazon ကစက်မှု Turk (MTurk) ဖြစ်ပါသည်။ အစဉ်အလာဓာတ်ခွဲခန်းကလူအခမဲ့-အများအပြားသုတေသီများပြီးသားအစဉ်အလာထက်ပိုမိုမြန်ဆန်ပြီးစျေးနှုန်းချိုသာဒေတာစုဆောင်းအတွက်ရရှိလာတဲ့လူ့ဘာသာရပ်များစမ်းသပ်ချက်အတွက်သင်တန်းသားများအဖြစ် Turkers (MTurk ရက်နေ့တွင်လုပ်သားများ) ကို အသုံးပြု. စတင်နေပြီပြီသူတို့မလုပျမယ်လို့တာဝန်များကိုဖြည့်စွက်ရန်စမ်းသပ်ချက်-ပေးဆောင်၏ MTurk တုရှုထောင့်မိသောကြောင့် On-ကျောင်းဝင်းဓာတ်ခွဲခန်းစမ်းသပ်ချက် (Paolacci, Chandler, and Ipeirotis 2010; Horton, Rand, and Zeckhauser 2011; Mason and Suri 2012; Rand 2012; Berinsky, Huber, and Lenz 2012) ။
MTurk မှစုဆောင်းသင်တန်းသားများနှင့်အတူစမ်းသပ်ချက်၏အကြီးမားဆုံးအစွမ်းသတ္တိကိုထောက်ပံ့ပို့ဆောင်ရေးနေသောခေါင်းစဉ်: သူတို့သုတေသီများမြန်မြန်ဆန်ဆန်နဲ့လိုအပျတဲ့အဖြစ်သင်တန်းသားများကိုစုဆောင်းဖို့ခွင့်ပြုပါ။ ဓာတ်ခွဲခန်းစမ်းသပ်ချက်ကို run ဖို့ရက်သတ္တပတ်ယူနိုင်ပြီးလယ်ပြင်စမ်းသပ်ချက် set-အထိလအတွင်းယူနိုင်ပါသည်သွားရမည်အကြောင်း, MTurk မှစုဆောင်းသင်တန်းသားများနှင့်အတူစမ်းသပ်ချက်နေ့ရက်ကာလ၌ run နိုင်ပါတယ်။ ဥပမာအားဖြင့်, Berinsky, Huber, and Lenz (2012) 8 မိနစ်စမ်းသပ်မှုတွင်ပါဝင်ရန်တစ်ခုတည်းသောနေ့၌ 400 ဘာသာရပ်များစုဆောင်းနိုင်ခဲ့တယ်။ နောက်ထပ်အဲဒီသင်တန်းသားများကို (အခနျးကွီး 3 နဲ့ 5 မှာဆွေးနွေးထားတဲ့အတိုင်း, စစ်တမ်းများနှင့်အစုလိုက်အပြုံလိုက်ပူးပေါင်းအပါအဝင်) နီးပါးမည်သည့်ရည်ရွယ်ချက်များအတွက်စုဆောင်းနိုင်ပါသည်။ စုဆောင်းမှု၏ဤငြိမ်ဝပ်သုတေသီများလျင်မြန်စွာဆက်ခံအတွက်ဆက်စပ်စမ်းသပ်ချက်၏ပာ run နိုင်ပါတယ်ဆိုလိုသည်။
သင့်ကိုယ်ပိုင်စမ်းသပ်ချက်အဘို့အ MTurk မှသင်တန်းသားများကိုစုဆောင်းမီ, သိရန်လေးအရေးကြီးသောအရာများကိုရှိပါတယ်။ ပထမဦးစွာများစွာသောသုတေသီများ Turkers နှငျ့ပတျသကျသောစမ်းသပ်ချက်များ non-တိကျတဲ့သံသယရှိသည်။ ဒီသံသယသတ်သတ်မှတ်မှတ်မစျသောကွောငျ့, ကသက်သေအထောက်အထားများနှင့်အတူတန်ပြန်ရန်ခဲယဉ်းသည်။ သို့သော် Turkers အသုံးပြု. လေ့လာမှုများ၏နှစ်ပေါင်းများစွာပြီးနောက်ကျနော်တို့ယခုသံသယအထူးသဖြင့်မလိုအပ်ကြောင်းကောက်ချက်ချနိုင်ပါတယ်။ အခြားလူဦးရေနှင့်အခြားသောလူဦးရေအနေရလဒ်များကိုမှ Turkers နှင့်အတူစမ်းသပ်ချက်၏ရလဒ်များကိုနှိုင်းယှဉ်အများအပြားလေ့လာမှုများမှ Turkers ၏သူရဲ့လူဦးရေနှင့်နှိုင်းယှဉ်အများအပြားလေ့လာမှုများရှိခဲ့သည်။ ဤအမှုအလုံးစုံအလုပ်ပေးသော, သင်တို့ကိုငါကစဉ်းစားရန်အဘို့အအကောငျးဆုံးနညျးလမျး Turkers အများကြီးကျောင်းသားများကိုတူ, တစ်ဦးကျိုးကြောင်းဆီလျော်အဆင်ပြေနမူနာကားအနည်းငယ်ပိုမိုကွဲပြားခြားနားကြောင်းကြောင်းထင် (Berinsky, Huber, and Lenz 2012) ။ ထို့ကြောင့်ကိုယ့်ကျောင်းသားတွေအတွက်အချို့သောသို့သော်အားလုံးမဟုတ်စမ်းသပ်သုတေသနအတွက်တစ်ဦးကျိုးကြောင်းဆီလျော်သောလူဦးရေကြောင့်, Turkers အချို့သောသို့သော်အားလုံးမဟုတ်သုတေသနလုပ်ငန်းတွေအတွက်ကျိုးကြောင်းဆီလျော်သောလူဦးရေဖြစ်ကြသည်။ သငျသညျ Turkers နှင့်အတူအလုပ်လုပ်သွားနေတယ်ဆိုရင်, ထို့နောက်ဤနှိုင်းယှဉ်လေ့လာမှုအများအပြားဖတ်နှင့်၎င်းတို့၏တစ်ခုလုံးကိုပြည့်ပြည့်စုံစုံနားလည်သဘောပေါက်ရန်သဘာဝကျပါတယ်။
ဒုတိယအချက်မှာသုတေသီများ Turk စမ်းသပ်ချက်၏ပြည်တွင်းရေးသက်တမ်းတိုးမြှင့်မှုအတွက်အကောင်းဆုံးအလေ့အကျင့်ကိုတီထွင်ခဲ့ကြ, သင်အကြောင်းကိုလေ့လာသင်ယူနှင့်ဤအကောင်းဆုံးအလေ့အကျင့်အတိုင်းလိုက်နာသင့်ပါတယ် (Horton, Rand, and Zeckhauser 2011; Mason and Suri 2012) ။ ဥပမာအားဖြင့်, Turkers သုံးပြီးသုတေသီများ inattentive သင်တန်းသားများကိုဖယ်ရှားပစ်ရန် Screener အသုံးပွုဖို့အားပေးတိုက်တွန်းကြသည် (Berinsky, Margolis, and Sances 2014; Berinsky, Margolis, and Sances 2016) (သို့သော်လည်းမြင် DJ Hauser and Schwarz (2015b) နှင့် DJ Hauser and Schwarz (2015a) ) ။ သငျသညျ inattentive သင်တန်းသားများကိုမဖယ်ရှားဘူးဆိုရင်, ထိုကုသမှုမဆိုအကျိုးသက်ရောက် inattentive သင်တန်းသားများမှမိတ်ဆက်ဆူညံသံများကထုတ်ဆေးကြောခြင်းကိုခံရနိုင်ပြီး, အလေ့အကျင့်အတွက် inattentive သင်တန်းသားများ၏အရေအတွက်ကိုသိသိသာသာရှိနိုင်ပါသည်။ Huber နှင့်လုပ်ဖော်ကိုင်ဖက်များ၏စမ်းသပ်မှုများတွင် (2012) ပါဝင်သူများ၏အကြောင်း 30% အခြေခံပညာအာရုံစူးစိုက်မှုကို Screener ပျက်ကွက်ခဲ့သည်။ Turkers နှင့်အတူဘုံနောက်ထပ်ပြဿနာသည် non-နုံသင်တန်းသားများသည် (Chandler et al. 2015) ။
တတိယအချက်ဒစ်ဂျစ်တယ်စမ်းသပ်ချက်အချို့ကိုအခြားပုံစံများကိုမှဆွေမျိုး, MTurk စမ်းသပ်ချက်စကေးမနိုင်, Stewart et al. (2015) မဆိုအပ်ပေးတော်မူအချိန်တွင် MTurk အပေါ်ခန့်သာ 7000 လူရှိပါတယ်ခန့်မှန်းထားသည်။
နောက်ဆုံးအနေနဲ့, သင် MTurk ၎င်း၏ကိုယ်ပိုင်စည်းမျဉ်းများနှင့်စံချိန်စံညွှန်းနှင့်အတူတစ်အသိုင်းအဝိုင်းကြောင်းသိသင့် (Mason and Suri 2012) ။ သင်စမ်းသပ်ချက်ကို run ဖို့သွားခဲ့တဲ့နိုငျငံ၏ယဉျကြေးမှုအကြောင်းကိုထွက်ရှာတွေ့ဖို့ကြိုးစားမယ်လို့ထိုနည်းတူ, သင် Turkers ၏ယဉ်ကျေးမှုနှင့်စံချိန်စံညွှန်းနှင့် ပတ်သက်. ပိုမိုထွက်ရှာတွေ့ဖို့ကြိုးစားသင့်ပါတယ် (Salehi et al. 2015) ။ သငျသညျမသင့်လျော်သောသို့မဟုတ်သိက္ခာမဲ့တစ်ခုခုလုပ်လိုလျှင်, သင် Turkers သင့်ရဲ့စမ်းသပ်မှုအကြောင်းပြောနေတာကိုခံရလိမ့်မည်ဟုသိသင့် (Gray et al. 2016) ။
MTurk ကဲ့သို့သော, သူတို့ဓာတ်ခွဲခန်း-ကဲ့သို့ဖြစ်ကြ၏ဖြစ်စေ, သင့်စမ်းသပ်ချက်မှသင်တန်းသားများကိုစုဆောင်းဖို့မယုံနိုင်လောက်အောင်အဆင်ပြေနည်းလမ်းဖြစ်ပါတယ် Huber, Hill, and Lenz (2012) ကဲ့သို့သော, သို့မဟုတ်ထိုထက်ပိုသောလယ်-တူ, Mason and Watts (2009) , Goldstein, McAfee, and Suri (2013) , Goldstein et al. (2014) , Horton and Zeckhauser (2016) နှင့် Mao et al. (2016) ။
သင်သည်သင်၏ကိုယ်ပိုင်ထုတ်ကုန်ကိုဖန်တီးရန်ကြိုးစားနေစဉ်းစားနေတယ်ဆိုရင်, ငါသည်သင်၌အ MovieLens အဖွဲ့ကကမ်းလှမ်းခဲ့အကြံဉာဏ်ဖတ်ရှုဖို့အကြံပြုလိုပါတယ် Harper and Konstan (2015) ။ သူတို့ရဲ့အတွေ့အကြုံကနေတစ်ဦးက key ကိုထိုးထွင်းသိမြင်မှုအသီးအသီးအောင်မြင်သောစီမံကိနျးအတှကျအများကြီးဆုံးရှုံးမှုရှိပါတယ်ဖြစ်ပါသည်။ ဥပမာ, MovieLens အုပ်စုထိုကဲ့သို့သောပြီးပြည့်စုံကျရှုံးခဲ့ကြကြောင်း GopherAnswers ကဲ့သို့သောအခြားထုတ်ကုန်များစတင် (Harper and Konstan 2015) ။ ထုတ်ကုန်ဆောက်လုပ်ဖို့ကြိုးစားနေစဉ်ပျက်ကွက်တဲ့သုတေသီများ၏နောက်ထပ်ဥပမာအား Arden လို့ခေါ်တဲ့အွန်လိုင်းဂိမ်းတည်ဆောက်ရန်အက်ဒွပ် Castronova ရဲ့ကြိုးပမ်းမှုဖြစ်ပါသည်။ ရန်ပုံငွေ $ 250,000 ရှိနေသော်လည်းစီမံကိန်းကို Edgar မှာခဲ့ (Baker 2008) ။ GopherAnswers နှင့် Arden တူစီမံကိန်းများကံမကောင်းတာကပိုအဖြစ်များ MovieLens တူစီမံကိန်းများထက်ဖြစ်ကြသည်။ ငါအောင်မြင်စွာကဒီမှာထပ်ခါတလဲလဲလက်တွေ့စမ်းသပ်ချက်အဘို့ထုတ်ကုန်ကိုတည်ဆောက်ခဲ့သည့်အခြားသုတေသီများ၏မသိခဲ့ပါကပြောသည်သောအခါ, ငါ၏စံတွေကနောက်ဆုံးအနေနဲ့: 1) သင်တန်းသားများကြောင့်သူတို့ကို (ဥပမာကိုထောက်ပံ့ပေးရာ၏ထုတ်ကုန်ကိုအသုံးပြုပါ, သူတို့လစာမနှင့်သူတို့မဖြစ်ကြ၏ သိပ္ပံပညာကူညီပေးနေစေတနာ့ဝန်ထမ်း) နှင့် 2) ကိုထုတ်ကုန်ပစ္စည်းတစ်ခုထက် ပို. ကွဲပြားစမ်းသပ်မှု (ကွဲပြားပါဝင်သူရေကန်နှင့်အတူဆိုလိုသည်မှာမဟုတ်ဘဲတူညီတဲ့စမ်းသပ်မှုမျိုးစုံကြိမ်) အတွက်အသုံးပြုခဲ့သည်။ သင်သည်အခြားဥပမာများသိလျှင်ငါ့ကိုသိစေပါ။
ငါ Pasteur ရဲ့ Quadrant ၏စိတ်ကူးနည်းပညာကုမ္ပဏီတွေမှာမကြာခဏဆွေးနွေးခဲ့ကြပါသည်ကြားဖူးတယ်, ထိုသို့ Google မှာသုတေသနလုပ်ငန်းအားထုတ်မှုကိုစုစည်းပြီးကူညီပေးသည် (Spector, Norvig, and Petrov 2012) ။
ဘွန်းနှင့်လုပ်ဖော်ကိုင်ဖက်များက '' လေ့လာမှု (2012) လည်းသူတို့ကိုလက်ခံရရှိသူမြား၏မိတ်ဆွေများဒီကုသမှု၏အကျိုးသက်ရောက်မှု detect ရန်ကြိုးစားသည်။ အဘယ်ကြောင့်ဆိုသော်စမ်းသပ်မှု၏ဒီဇိုင်း၏, ဤ spillovers သန့်ရှင်းမှု detect ရန်ခက်ခဲပါ၏ စိတ်ဝင်စားစာဖတ်သူတွေမြင်ရပါလိမ့်မယ် Bond et al. (2012) တစ်ဦးထက်ပိုနှံ့နှံ့စပ်စပ်ဆွေးနွေးမှုသည်။ ဒီစမ်းသပ်မှုမဲပေးအားပေးဖို့ကြိုးစားအားထုတ်မှုအပေါ်နိုင်ငံရေးအရသိပ္ပံစမ်းသပ်ချက်တစ်ခုရှည်လျားသောအစဉ်အလာ၏အစိတ်အပိုင်းတစ်ရပ်ဖြစ်ပါတယ် (Green and Gerber 2015) ။ သူတို့ Pasteur ရဲ့ Quadrant အတွက်ကြောင့်ဤအရထွက်-The-မဲစမ်းသပ်ချက်အစိတ်အပိုင်းအတွက်ဘုံဖြစ်ကြသည်။ ဒါကမဲပေးနှင့်မဲပေးတိုးမြှင့်ဖို့လှုံ့ဆော်နေသောများစွာသောလူအပြုအမူပြောင်းလဲမှုနှင့်လူမှုရေးသြဇာလွှမ်းမိုးမှုအကြောင်းပိုမိုယေဘုယျသီအိုရီကိုစမ်းသပ်ဖို့စိတ်ဝင်စားစရာကောင်းတဲ့အမူအကျင့်ရှိနိုင်ပါသည်ရှိပါတယ်ဖြစ်ပါသည်။
အခြားသုတေသီများမိတ်ဖက်ထိုကဲ့သို့သောနိုင်ငံရေးပါတီများအဖြစ်အဖွဲ့အစည်းများ, အစိုးရမဟုတ်သောအဖွဲ့အစည်းများနှင့်စီးပွားရေးလုပ်ငန်းများနှင့်အတူလယ်ပြင်စမ်းသပ်ချက်အပြေးအကြောင်းကိုအကွံဉာဏျပေး (Loewen, Rubenson, and Wantchekon 2010; List 2011; Gueron 2002) ။ အခြားသူများကအဖွဲ့အစည်းများနှင့်အတူလက်တွဲသုတေသနလုပ်ငန်းဒီဇိုင်းများ impact နိုငျပုံကိုအကြောင်းအကွံဉာဏျပူဇျောပါပွီ (Green, Calfano, and Aronow 2014; King et al. 2007) ။ မိတ်ဖက်လည်းကျင့်ဝတ်ဆိုင်ရာမေးခွန်းများကိုဖို့ဦးဆောင်လမ်းပြနိုင် (Humphreys 2015; Nickerson and Hyde 2016) ။
သင်သည်သင်၏စမ်းသပ်မှုအပြေးရှေ့မှာခွဲခြမ်းစိတ်ဖြာအစီအစဉ်ကိုဖန်တီးသွားနေတယ်ဆိုရင်, ငါသည်သင်တို့ကိုအစီရင်ခံလမ်းညွှန်ချက်များကိုဖတ်ရှုခြင်းဖြင့်စတင်ပါကအကြံပေးချင်ပါတယ်။ အဆိုပါတှရေဲ့ (စမ်းသပ်မှု၏ Consolidated နျ Standard အစီရင်ခံ) လမ်းညွှန်ချက်ဆေးဝါးအတွက်တီထွင်ခဲ့ကြ (Schulz et al. 2010) နှင့်လူမှုရေးသုတေသနအတွက်ပြုပြင်ထားသော (Mayo-Wilson et al. 2013) ။ လမ်းညွှန်ချက်၏တစ်ဦးဆက်စပ် set ကိုစမ်းသပ်နိုင်ငံရေးသိပ္ပံဂျာနယ်၏အယ်ဒီတာကတီထွင်ခဲ့ (Gerber et al. 2014) (စမြင် Mutz and Pemantle (2015) နှင့် Gerber et al. (2015) ) ။ နောက်ဆုံးအနေနဲ့အစီရင်ခံလမ်းညွှန်ချက်များစိတ်ပညာတီထွင်ခဲ့ကြ (Group 2008) နှင့်လည်းကြည့်ရှု Simmons, Nelson, and Simonsohn (2011) ။
သင်တစ်ဦးခွဲခြမ်းစိတ်ဖြာအစီအစဉ်ကိုဖန်တီးခဲ့လျှင် Pre-မှတ်ပုံတင်ရေးအခြားသူများကိုသင့်ရဲ့ရလဒ်တွေအတွက်ရှိသည်သောယုံကြည်မှုကိုတိုးပွားစေလိမ့်မည်ဖြစ်သောကြောင့်သင်က Pre-မှတ်ပုံတင်ဖို့စဉ်းစားသင့်။ သင်တစ်ဦးအဖော်နှင့်အတူအလုပ်လုပ်ကြသည်လျှင်ထို့ပြင်ကြောင့်ရလဒ်တွေကိုမြင်လျှင်ပြီးနောက်ခွဲခြမ်းစိတ်ဖြာကိုပြောင်းလဲရန်သင့်လက်တွဲဖော်ရဲ့စွမ်းရည်ကိုကန့်သတ်ထားမည်ဖြစ်သည်။ pre-မှတ်ပုံတင်ရေးစိတ်ပညာ ပို. ပို. အဖြစ်များလာ (Nosek and Lakens 2014) , နိုင်ငံရေးသိပ္ပံပညာ (Humphreys, Sierra, and Windt 2013; Monogan 2013; Anderson 2013; Gelman 2013; Laitin 2013) နှင့်ဘောဂဗေဒ (Olken 2015) ။
သင့်ရဲ့ Pre-ခွဲခြမ်းစိတ်ဖြာအစီအစဉ်ဖန်တီးခြင်းချိန်တွင်အချို့ကိုသင်သုတေသီများကလည်းခန့်မှန်းကုသအကျိုးသက်ရောက်မှုများ၏တိကျတိုးတက်လာဖို့ဆုတ်ယုတ်နှင့်ဆက်စပ်ချဉ်းကပ်ကိုသုံး, ဤချဉ်းကပ်မှုအကြောင်းကိုအချို့သောဆွေးနွေးငြင်းခုံရှိကွောငျးသတိပြုမိဖြစ်သင့်: Freedman (2008) , Lin (2013) နှင့် Berk et al. (2013) ; မြင် Bloniarz et al. (2016) နောက်ထပ်သတင်းအချက်အလက်များသည်။
အထူးသဖြင့်အွန်လိုင်းလယ်ပြင်စမ်းသပ်ချက်အဘို့ဒီဇိုင်းအကွံဉာဏျလည်းရှိပေးအပ်သည် Konstan and Chen (2007) နှင့် Chen and Konstan (2015) ။
အ MusicLab စမ်းသပ်ချက်အပေါ်ပိုမိုတွေ့ Salganik, Dodds, and Watts (2006) , Salganik and Watts (2008) , Salganik and Watts (2009b) , Salganik and Watts (2009a) နှင့် Salganik (2007) ။ ဆုရှင်-ယူ-အားလုံးစျေးကွက်အပေါ်ပိုမိုတွေ့ Frank and Cook (1996) ။ ပိုပြီးယေဘုယျအားဖြင့် untangling ကံနှင့်ကျွမ်းကျင်မှုအပေါ်ပိုမိုတွေ့ Mauboussin (2012) , Watts (2012) နှင့် Frank (2016) ။
စစ်မှုထမ်း: သုတေသီများကသတိနဲ့အသုံးပြုသင့်ကြောင်းပါဝင်သူငွေပေးချေမှုဖျက်သိမ်းရေးမှအခြားချဉ်းကပ်မှုရှိပါတယ်။ များစွာသောအွန်လိုင်းလယ်ပြင်စမ်းသပ်ချက်များတွင်သင်တန်းသားများကိုအခြေခံအားဖြင့်စမ်းသပ်ချက်သို့ရေးဆွဲနဲ့ဘယ်တော့မှလျော်ကြေးငွေကြသည်။ ဒီချဉ်းကပ်မှု၏ဥပမာ Restivo နှင့်ဗန်က de Rijt ရဲ့ပါဝင် (2012) Wikipedia နဲ့ဘွန်းအတွက်ဆုလာဘ်များနှင့်လုပ်ဖော်ကိုင်ဖက်ရဲ့အပေါ်စမ်းသပ်မှု (2012) ကိုမဲပေးမှလူအားပေးမှုအပေါ်စမ်းသပ်မှု။ ဤရွေ့ကားစမ်းသပ်ချက်တကယ်သုည variable ကိုကုန်ကျစရိတ်ရှိသည်မဟုတ်ကြဘူး, သူတို့သုတေသီများမှသုည variable ကိုကုန်ကျစရိတ်ရှိသည်။ ဤအစမ်းသပ်ချက်အများအပြား၏ကုန်ကျစရိတ်အသီးအသီးပါဝင်သူဖို့အလွန်အမင်းသေးငယ်သည်ပင်လျှင်သော်လည်း, အသေးစားကုန်ကျစရိတ်သင်တန်းသားများတစ်ခုကြီးမားအရေအတွက်လျင်မြန်စွာတက် add နိုင်ပါတယ်ချမှတ်။ ဧရာအွန်လိုင်းစမ်းသပ်ချက်အပြေးသုတေသီများကမကြာခဏများစွာသောလူမှလျှောက်ထားသောအခါဤအသေးငယ်တဲ့အကျိုးသက်ရောက်မှုများအရေးကြီးသောဖွစျလာနိုငျဟုအားဖြင့်သေးငယ်သည့်ခန့်မှန်းခြေကုသမှုသက်ရောက်မှုများ၏အရေးပါမှုကိုအပြစ်လွတ်။ အတိအကျတူညီစဉ်းစားတွေးခေါ်သုတေသီများသင်တန်းသားများအပေါ်စည်းကြပ်ကြောင်းကုန်ကျစရိတ်သက်ဆိုင်သည်။ သင့်ရဲ့စမ်းသပ်လူတစ်သန်းတစ်မိနစ်ဖြုန်းစေလျှင်, စမ်းသပ်မှုမဆိုအထူးသဖြင့်ပုဂ္ဂိုလ်တစ်ဦးရန်အလွန်အန္တရာယ်ရှိသောသည်မဟုတ်, စုစုပေါင်းထဲမှာအချိန်နီးပါးနှစ်နှစ်ဖြုန်းသိရသည်။
သင်တန်းသားများကိုသုည variable ကိုကုန်ကျစရိတ်ငွေပေးချေမှုဖန်တီးခြင်းမှနောက်ထပ်ချဉ်းကပ်မှုတစ်ခုထီကိုလည်းစစ်တမ်းသုတေသနလုပ်ငန်းများတွင်အသုံးပြုခဲ့သည့်ချဉ်းကပ်မှုကိုအသုံးဖို့ဖြစ်ပါတယ် (Halpern et al. 2011) ။ နောက်ဆုံးအနေနဲ့ပျော်စရာအသုံးပြုသူ-အတွေ့အကြုံတွေကိုဒီဇိုင်းအကြောင်းကိုပိုမိုအဘို့မြင် Toomim et al. (2011) ။
ဒီနေရာတွင်ကနေသုံး R ကို၏မူရင်းအဓိပ္ပာယ်ရှိပါတယ် Russell and Burch (1959) :
"အစားထိုး insentient ပစ္စည်းသတိနေထိုင်သောပိုမိုမြင့်မားတိရိစ္ဆာန်များများအတွက်အစားထိုးဆိုလိုသည်။ လျှော့ချရေးပေးထားသောငွေပမာဏနှင့်တိကျ၏သတင်းအချက်အလက်များရယူဖို့အသုံးပြုတိရိစ္ဆာန်များ၏နံပါတ်များအတွက်လျော့ချရေးကိုဆိုလိုသည်။ သနျ့လူမဆန်လုပျထုံးလုပျနညျးမြား၏ဖြစ်ပွားမှုသို့မဟုတ်ပြင်းထန်မှုအတွက်မဆိုလျော့နည်းနေဆဲအသုံးပြုရရန်ရှိသည်သောတိရိစ္ဆာန်များမှလျှောက်ထားဆိုလိုသည်။ "
အဆိုပါသုံး R ကိုရဲ့ငါသူတို့တစ်တွေပိုပြီးပီပီဗားရှင်းသူတို့အားအခြေခံမူ-အထူးသ-ကောင်းတဲ့လူ့စမ်းသပ်ချက်၏ setting ကိုများအတွက်၏တဝတည်းဖြစ်ကြ၏, အဲဒီအစားအခန်း 6. မှာဖော်ပြထားတဲ့ကျင့်ဝတ်ဆိုင်ရာအခြေခံမူကို override ပါဘူးအဆိုပြုသော။
စိတ်ခံစားမှုဘယ်လိုကူးစက်စဉ်းစားတဲ့အခါ, ဒီစမ်းသပ်မှုပြန်ဆိုသောအခါစိတ်တွင်စောင့်ရှောက်ရန်သုံးသည် non-ကျင့်ဝတ်ဆိုင်ရာကိစ္စရပ်များကိုရှိပါတယ်။ ပထမဦးစွာကစမ်းသပ်မှု၏အမှန်တကယ်အသေးစိတျအသီအိုရီတောင်းဆိုမှုများကိုချိတ်ဆက်ပုံကိုရှင်းရှင်းလင်းလင်းမသိရပါဘူး, အခြားစကား, ဆောက်လုပ်ရေးသက်တမ်းနှင့် ပတ်သက်. မေးခွန်းများကိုရှိပါတယ်။ ဒါဟာကြောင်းရှင်းရှင်းလင်းလင်းမသိရပါဘူး) 1) ကလူတွေ post သောစကားကသူတို့ရဲ့စိတ်ခံစားမှုနှင့် 2 ၏ကောင်းတစ်ဦးညွှန်ပြချက်ဖြစ်ကြောင်းရှင်းရှင်းလင်းလင်းမသိရပါဘူးကြောင့်အ positive နဲ့ negative စကားလုံးအရေအတွက်ကတကယ်တော့သင်တန်းသားများ၏စိတ်ခံစားမှုပြည်နယ်၏ကောင်းတစ်ဦးညွှန်ပြချက်ဖြစ်ကြောင်းရှင်းရှင်းလင်းလင်းမသိရပါဘူး သုတေသီအသုံးပြုကြောင်းအထူးသဖြင့်စိတ်ဓါတ်များခွဲခြမ်းစိတ်ဖြာ technique ကိုယုံကြည်စိတ်ချရသောစိတ်ခံစားမှုအခြနိုင် (Beasley and Mason 2015; Panger 2016) ။ တစ်နည်းတစ်ဘက်လိုက် signal ကိုတစ်မကောင်းတဲ့တိုင်းတာစရာဖြစ်လိမ့်မယ်။ ဒုတိယ, စမ်းသပ်မှု၏ဒီဇိုင်းနှင့်ခွဲခြမ်းစိတ်ဖြာကျွန်တော်တို့ကိုအများဆုံးထိခိုက်ခဲ့တဲ့အကြောင်းဘာမှမ (ဆိုလိုသည်မှာ, ကုသမှုသက်ရောက်မှုများ၏သောင်းပြောင်းထွေလာရောနှောမရှိခွဲခြမ်းစိတ်ဖြာရှိပါတယ်) နှင့်ဘာယန္တရားဖြစ်စေခြင်းငှါ, ပြောပြသည်။ ဤကိစ္စတွင်ခုနှစ်, သုတေသီသင်တန်းသားများနှင့် ပတ်သက်. သတင်းအချက်အလက်အများကြီးရှိခဲ့ပါတယ်, ဒါပေမဲ့သူတို့မရှိမဖြစ်လိုအပ်တဲ့ခွဲခြမ်းစိတ်ဖြာခြင်းတွင် Widgets တွေအဖြစ်ဆက်ဆံခဲ့ကြသည်။ တတိယအချက်, ဒီစမ်းသပ်မှုအတွက်အကျိုးသက်ရောက်မှုအရွယ်အစားအလွန်သေးငယ်ရှိ၏ ကုသမှုနှင့်ထိန်းချုပ်မှုအခွအေနအကြားခြားနားချက်နှင့် ပတ်သက်. 1 1000 စကားဖြစ်ပါတယ်။ သူတို့ရဲ့စက္ကူခုနှစ်, Kramer နှင့်လုပ်ဖော်ကိုင်ဖက်များကလူသန်းပေါင်းများစွာရာပေါင်းများစွာဟာသူတို့ရဲ့သတင်းနေ့တိုင်း Feed ရယူသောကွောငျ့ဒီအရွယ်အစားတစ်ခုအကျိုးသက်ရောက်မှုအရေးကြီးသောသောအမှုလုပ်ရမည်။ တနည်းအားဖြင့်သူတို့ပင်သက်ရောက်မှုများသူတို့စုစုပေါင်းအကြီးအကျယ်ဖြစ်ကြောင်းလူတစ်ဦးချင်းစီသည်အသေးငယ်ကြောင်းငြင်းခုန်။ သငျသညျဤဆင်ခြေကိုလက်ခံခဲ့ရင်တောင်ဒီအရွယ်အစားတစ်ခုအကျိုးသက်ရောက်မှုစိတ်ခံစားမှုဘယ်လိုကူးစက်အကြောင်းကိုပိုပြီးယေဘုယျသိပ္ပံနည်းကျမေးခွန်းနှင့်စပ်လျဉ်းအရေးကြီးပါတယ်လျှင်, ဆဲရှင်းရှင်းလင်းလင်းမသိရပါဘူး။ သေးငယ်တဲ့အကျိုးသက်ရောက်မှုများအရေးကြီးသောနေရာအခြေအနေများအပေါ်ပိုမိုတွေ့မြင် Prentice and Miller (1992) ။
ထိုစိတ်ခံစားမှုဘယ်လိုကူးစက်စမ်းသပ်မှုနှိုင်းယှဉ်ပထမဦးဆုံး R ကို (အစားထိုး) ၏စည်းကမ်းချက်များ၌ (Kramer, Guillory, and Hancock 2014) နှင့်စိတ်ခံစားမှုဘယ်လိုကူးစက်သဘာဝအစမ်းသပ်မှု (Coviello et al. 2014) ကနေပြောင်းရွှေ့အတူပါဝင် trade-off အကြောင်းကိုအချို့သောယေဘုယျသင်ခန်းစာတွေကိုကမ်းလှမ်း သဘာဝကစမ်းသပ်ချက် (နှင့်အခန်း 2 ကိုကြည့်ပါ, Non-စမ်းသပ်ဒေတာအတွက်စမ်းသပ်ချက်ဆုံးခနျ့မှနျးဖို့ကြိုးပမ်းမှုကိုက်ညီတဲ့တူအခြားချဉ်းကပ်မှု) ကိုစမ်းသပ်။ ထိုကျင့်ဝတ်ဆိုင်ရာအကျိုးခံစားခွင့်များအပြင်၌, Non-စမ်းသပ်လေ့လာမှုများမှစမ်းသပ်ဆဲကနေ switching လည်းသူတို့ဖြစ်ဖြစ်လုပ်ငန်းတွေစတင်ဖို့နိုင်ခြင်းဖြစ်ကြောင်းကုသမှုလေ့လာဖို့သုတေသီများနိုင်ပါတယ်။ ဤရွေ့ကားကျင့်ဝတ်နှင့်ထောက်ပံ့ပို့ဆောင်ရေးအကျိုးခံစားခွင့်သို့သော်ကုန်ကျမှာလာကြ၏။ သဘာဝကစမ်းသပ်ချက်နဲ့အတူသုတေသီများလျော့နည်းသင်တန်းသားများ၏စုဆောင်းမှုနှင့်တူသောအရာတို့ကိုထိန်းချုပ် Random, နှင့်ကုသမှု၏သဘောသဘာဝရှိသည်။ ဥပမာ, ကုသမှုအဖြစ်မိုးရေချိန်၏တစ်န့်အသတ်ကြောင့်အပြုသဘောဆောင်တိုးပွါးခြင်းနှင့်အဆိုးမြင်စိတ်တွေလျော့နည်းနှစ်ဦးစလုံးဖြစ်ပါတယ်။ စမ်းသပ်လေ့လာမှုမှာ, သို့သော်, Kramer နှင့်လုပ်ဖော်ကိုင်ဖက်များကလွတ်လပ်စွာအပြုသဘောနှင့်အဆိုးမြင်စိတ်တွေထိန်းညှိဖို့နိုင်ခဲ့ကြတယ်။
အသုံးပြုတဲ့အထူးသဖြင့်ချဉ်းကပ်မှု Coviello et al. (2014) ထပ်မံအတွက်ရှင်းလင်းတင်ပြသည်ခဲ့ Coviello, Fowler, and Franceschetti (2014) ။ ဆာ variable တွေကိုတခုနိဒါန်းအဘို့မြင် Angrist and Pischke (2009) (လျော့နည်းတရားဝင်) သို့မဟုတ် Angrist, Imbens, and Rubin (1996) (အသေးစိတ်တရားဝင်) ။ ဆာ variable ကိုတစ်ဦးသံသယအကဲဖြတ်ဘို့မြင် Deaton (2010) နှင့်အားနည်းသောတူရိယာနှင့်အတူဆာပ variable တွေကိုတခုမိတ်ဆက် (မိုဃ်းကိုရွာစေအားနည်းတူရိယာဖြစ်ပါတယ်), မြင် Murray (2006) ။
ပိုများသောယေဘုယျအားဖြင့်သဘာဝစမ်းသပ်ချက်မှကောင်းတစ်ဦးနိဒါန်းဖြစ်ပါသည် Dunning (2012) နှင့် Rosenbaum (2002) , Rosenbaum (2009) နှင့် Shadish, Cook, and Campbell (2001) စမ်းသပ်ချက်မပါဘဲကြောင်းကျိုးဆက်စပ်အကျိုးသက်ရောက်မှုများခန့်မှန်းအကြောင်းကောင်းသောစိတ်ကူးများကိုဆက်ကပ်။
ပို့စ်များကိုတိုးတက်ရန်ရေးသားချက်များပိတ်ဆို့ခြင်းမှစိတ်ခံစားမှုဘယ်လိုကူးစက်များ၏ဒီဇိုင်းပုံစံကိုပြောင်းလဲစဉ်းစားသည့်အခါဒုတိယ R ကို (သန့်စင်ပြီး) ၏စည်းကမ်းချက်များ၌, သိပ္ပံနှင့်ထောက်ပံ့ပို့ဆောင်ရေး trade-off ရှိပါတယ်။ ဥပမာ, ပိတ်ဆို့ခြင်းရေးသားချက်များနှင့်အတူစမ်းသပ်မှုတစ်ခုအပေါ်အလွှာအဖြစ်အကောင်အထည်ဖော်နိုင်သတိပြုပါ (ထို News Feed ၏နည်းပညာဆိုင်ရာအကောင်အထည်ဖော်မှုကြောင့်ရေးသားချက်များတိုးမြှင်နှင့်အတူပိတ်ဆို့ခြင်းရေးသားချက်များနှင့်အတူစမ်းသပ်မှုတစ်ခုမဟုတ်ဘဲထက်စမ်းသပ်မှုတစ်ခုလုပ်ဖို့သိသိသာသာလွယ်ကူစေသည်ကိစ္စတွင်ဖြစ်စေခြင်းငှါ နောက်ကွယ်ရှိအခြေခံစနစ်၏မလုပ်ပဲအဘို့မည်သည့်လိုအပ်ချက်မရှိဘဲ News Feed တွေကိုစနစ်၏ထိပ်ဆုံး) ။ သိပ္ပံနည်းကျသို့သော်စမ်းသပ်မှုအားဖြင့်ကိုင်တွယ်ဖြေရှင်းသီအိုရီရှင်းရှင်းလင်းလင်းအခြားအပေါ်မှာတယောက်ဒီဇိုင်းကိုအကြံပြုမဟုတ်ခဲ့ပေ။
ကံမကောင်းစွာပဲ, ငါ News Feed ထဲမှာအကြောင်းအရာပိတ်ဆို့ခြင်းနှင့်တိုးတက်၏ဆွေမျိုးတန်ရာ ပတ်သက်. သိသိသာသာကြိုတင်သုတေသနသတိထားမဟုတ်ဖြစ်၏။ ဒါ့အပြင်သူတို့ကိုငါအန္တရာယ်နည်းပါးစေရန်ကုသအရည်ကျိုအကြောင်းကိုအများကြီးသုတေသနလုပ်ငန်းမြင်ကြပြီမဟုတ်; တဦးတည်းချွင်းချက်ဖြစ်ပါသည် Jones and Feamster (2015) တွင်အင်တာနက်ဆင်ဆာဖြတ်တောက်မှု (ငါ Encore လေ့လာမှုဆက်ဆံရေးအတွက်အခန်း 6 မှာဆွေးနွေးရန်ခေါင်းစဉ်၏တိုင်းတာခြင်း၏ဖြစ်ရပ်ဆင်ခြင်သော (Burnett and Feamster 2015; Narayanan and Zevenbergen 2015) ) ။
တတိယ R ကို (လျော့ပါးရေး) ၏စည်းကမ်းချက်များ၌, အစဉ်အလာအာဏာကိုခွဲခြမ်းစိတ်ဖြာဖို့ကောင်းတစ်ဦးနိဒါန်းဖြစ်ပါသည် Cohen (1988) ။ pre-ကုသမှု covariates ဒီဇိုင်းအဆင့်နှင့်စမ်းသပ်ချက်၏သုံးသပ်ချက်အဆင့်တွင်ထည့်သွင်းနိုင်ပါသည်; အခန်း 4 Gerber and Green (2012) နှစ်ဦးစလုံးချဉ်းကပ်ဖို့ကောင်းတစ်ဦးမိတ်ဆက်ပေးစွမ်းသည်နှင့် Casella (2008) တစ်ဦးထက်ပို In-depth ကိုကုသမှုပေးစွမ်းသည်။ ကျပန်းအတွက်ဒီ Pre-ကုသမှုသတင်းအချက်အလက်များအသုံးပြုနည်းစနစ်ပုံမှန်အားဖြင့်ဖြစ်စေဟုခေါ်တွင်စမ်းသပ်ဒီဇိုင်းများသို့မဟုတ် stratified စမ်းသပ်ဒီဇိုင်းများ (ထိုဝေါဟာရများရပ်ရွာအနှံ့တသမတ်တည်းအသုံးမသည်) ကိုပိတ်ဆို့ထားကြသည်, ဒီလိုနည်းပညာအခန်း 3 တွင်ကြည့်ရှုဆွေးနွေး stratified နမူနာနည်းစနစ်မှနက်ရှိုင်းစွာဆက်စပ်နေပါတယ် Higgins, Sävje, and Sekhon (2016) ဧရာစမ်းသပ်ချက်တွင်ဤဒီဇိုင်းများကို အသုံးပြု. အပေါ်ပိုပြီးအဘို့။ pre-ကုသမှု covariates လည်းခွဲခြမ်းစိတ်ဖြာခြင်းအဆင့်တွင်ထည့်သွင်းနိုင်ပါသည်။ McKenzie (2012) သာ. ကြီးအသေးစိတျထဲမှာလယ်ပြင်စမ်းသပ်ချက်ခွဲခြားစိတ်ဖြာဖို့ခြားနားချက်-In-ကွဲပြားခြားနားမှုချဉ်းကပ်လေ့လာ။ ကြည့်ရှုပါ Carneiro, Lee, and Wilhelm (2016) ကုသမှုသက်ရောက်မှုများ၏ခန့်မှန်းတွက်ချက်မှုအတွက်တိကျတိုးမြှင့်ဖို့ကွဲပြားခြားနားသောချဉ်းကပ်မှုများအကြား trade-off အပေါ်ပိုပြီးအဘို့။ ဒီဇိုင်းသို့မဟုတ်ခွဲခြမ်းစိတ်ဖြာခြင်းအဆင့် (သို့မဟုတ်နှစ်ဦးစလုံး) မှာ Pre-ကုသမှု covariates ထည့်သွင်းရန်ကြိုးစားရန်ရှိမရှိဆုံးဖြတ်ကြသောအခါနောက်ဆုံးတွင်စဉ်းစားရန်အချိန်အနည်းငယ်အချက်တွေရှိပါတယ်။ သုတေသီများသူတို့က "ငါးဖမ်း" မဖြစ်ကြောင်းပြသနိုင်ဖို့လိုခငျြတဲ့ setting ကိုခုနှစ်တွင် (Humphreys, Sierra, and Windt 2013) , ဒီဇိုင်းအဆင့်တွင် Pre-ကုသမှု covariates သုံးပြီးအထောကျအကူဖွစျနိုငျသ (Higgins, Sävje, and Sekhon 2016) ။ သင်တန်းသားများကိုဆင့်ကဲရောက်လာဘယ်မှာအခြေအနေများ, အထူးသဖြင့်အွန်လိုင်းလယ်ပြင်စမ်းသပ်ချက်ခုနှစ်, ဒီဇိုင်းအဆင့်တွင် Pre-ကုသမှုသတင်းအချက်အလက်ကိုအသုံးပြုပြီးဥပမာကိုကြည့်ပါ, ထောက်ပံ့ပို့ဆောင်ရေးခက်ခဲစေခြင်းငှါ Xie and Aurisset (2016) ။
ဒါဟာကွာခြားချက်-In-ကွဲပြားခြားနားမှုဒါအများကြီးပိုထိရောက်ခြားနားချက်-In-နည်းလမ်းများထက်ရှိနိုင်ပါသည်အဘယ်ကြောင့်အကြောင်းပင်ကိုယ်တစ်နည်းနည်းဖြည့်စွက်ရကျိုးနပ်သည်။ အတော်များများအွန်လိုင်းရလဒ်များအလွန်မြင့်မားကှဲလှဲရှိ (ဥပမာတွေ့ Lewis and Rao (2015) နှင့် Lamb et al. (2015) ) နှင့်အချိန်နှင့်အမျှအတော်လေးတည်ငြိမ်တဲ့ဖြစ်ကြသည်။ ဤကိစ္စတွင်ခုနှစ်, အပြောင်းအလဲကိုရမှတ်စာရင်းအင်းစမ်းသပ်မှု၏တန်ခိုးတိုးမြှင့်, သိသိသာသာသေးငယ်ကှဲလှဲကြလိမ့်မည်။ ဒီချဉ်းကပ်အကြောင်းရင်းတစ်ခုကပိုမကြာခဏအသုံးမသည်ကြိုတင်ဒီဂျစ်တယ်ခေတ်က Pre-ကုသမှုရလဒ်များရှိသည်ဖို့ဘုံမဟုတ်ခဲ့သောကွောငျ့ဖွစျသညျ။ ထိုသို့စဉ်းစားရန်တစ်ဦးထက်ပိုသောကွန်ကရစ်လမ်းတိကျတဲ့လေ့ကျင့်ခန်းလုပ်ရိုးလုပ်စဉ်ကိုယ်အလေးချိန်ကိုဖြစ်ပေါ်စေသည်ရှိမရှိတိုင်းတာရန်စမ်းသပ်မှုတစ်ခုစိတ်ကူးဖို့ဖြစ်ပါတယ်။ သင်တစ်ဦးခြားနားချက်-In-နည်းလမ်းချဉ်းကပ်မှုပြုလျှင်, သင်တို့၏ခန့်မှန်းချက်လူဦးရေအတွက်အလေးအတွင်းအမျိုးမျိုးပြောင်းလဲထံမှလာသည်ဟုအမျိုးမျိုးပြောင်းလဲကြလိမ့်မည်။ သင်တစ်ဦးခြားနားချက်-In-ခြားနားချက်ချဉ်းကပ်မှုပြုလျှင်, သို့သော်, အလေးအတွက်သဘာဝဖြစ်ပေါ်နေမူကွဲဖယ်ရှားခံရရရှိနှင့်သင်ပိုမိုလွယ်ကူစွာကုသမှုကြောင့်ဖြစ်ရတဲ့တစ်ဦးခြားနားချက် detect နိုင်ပါတယ်။
သင့်ရဲ့စမ်းသပ်မှုအတွက်သင်တန်းသားများ၏အရေအတွက်ကိုလျှော့ချဖို့တစ်ခုမှာအရေးကြီးသောလမ်း Kramer နှင့်လုပ်ဖော်ကိုင်ဘက်များကသဘာဝစမ်းသပ်မှုကနေလေ့လာတွေ့ရှိအကျိုးသက်ရောက်မှုအရွယ်အစားအပေါ်အခြေခံပြီးပွုပါပွီနိုင်သည့်အာဏာကိုခွဲခြမ်းစိတ်ဖြာ, လုပ်ဆောင်သွားရန်ဖြစ်ပါသည် Coviello et al. (2014) သို့မဟုတ် Kramer အားဖြင့်အစောပိုင်းက Non-စမ်းသပ်သုတေသနပြုမှု (2012) (တကယ်တော့တွင်ဤဤအခနျးရဲ့အဆုံးမှာလှုပ်ရှားမှုများဖြစ်ကြသည်) ။ အာဏာကိုခွဲခြမ်းစိတ်ဖြာ၏ဤအသုံးပုံမှန်ထက်အနည်းငယ်ကွဲပြားကြောင်းသတိပြုပါ။ အ Analog စအသက်အရွယ်ခုနှစ်, သုတေသီများယေဘုယျအားဖြင့်သူတို့ရဲ့လေ့လာမှု (ဆိုလိုသည်မှာ, အောက်မှာ-powered) သေးငယ်လွန်းမကြီးကြောင်းသေချာစေရန်အာဏာကိုခွဲခြမ်းစိတ်ဖြာကိုပြု၏။ သို့သျောယခုသုတေသနပညာရှင်များကသူတို့၏လေ့လာမှု (ဆိုလိုသည်မှာ, Over-powered) လည်းကြီးမားသောမဟုတ်ကြောင်းသေချာစေရန်အာဏာကိုခွဲခြမ်းစိတ်ဖြာပြုပါသင့်ပါတယ်။
Repurpose: နောက်ဆုံးအနေနဲ့ကျွန်မစတုတ္ထ R ကိုထည့်သွင်းစဉ်းစား။ ဒါကသုတေသီတွေကသူတို့ရဲ့မူရင်းသုတေသနလုပ်ငန်းမေးခွန်းကိုင်တွယ်ဖြေရှင်းရန်လိုအပ်ပါတယ်ထက်ပိုမိုစမ်းသပ်ဒေတာနှင့်အတူမိမိတို့ကိုယ်ကိုရှာဖွေလျှင်, သူတို့သည်အသစ်မေးခွန်းများကိုမေးရန်ကိုဒေတာ repurpose သင့်ပါသည်။ ဥပမာအားဖြင့်, Kramer နှင့်လုပ်ဖော်ကိုင်ဘက်တစ်ဦးခြားနားချက်-In-ကွဲပြားခြားနားမှုခနျ့မှနျးအသုံးပြုနဲ့သူတို့ရဲ့သုတေသနလုပ်ငန်းမေးခွန်းဖြေရှင်းရန်လိုအပ်ထက်ပိုဒေတာနှင့်အတူမိမိတို့ကိုယ်ကိုတွေ့ခဲ့ကွောငျးမြင်ယောင်ကြည့်ပါ။ အဲဒီအစားအပွညျ့အဝအတိုင်းအတာအထိ data ကိုမသုံးခြင်းထက်, သူတို့ Pre-ကုသမှုစိတ်ခံစားမှုစကားရပ်တစ်ခု function ကိုအဖြစ်အကျိုးသက်ရောက်မှုရဲ့အရွယ်အစားကိုလေ့လာနိုငျတယျ။ သကဲ့သို့ Schultz et al. (2007) ဖြစ်ကောင်း News Feed ၏သက်ရောက်မှုပြီးသားကိုပျော်ရွှင် (သို့မဟုတ်ဝမ်းနည်းဖွယ်) မက်ဆေ့ခ်ျ post မှထိန်းသူကလူများအတွက်ကွဲပြားခြားနားသောခဲ့ကြသည်, ကုသမှု၏အကျိုးသက်ရောက်မှုအလင်းနှင့်လေးလံသောအသုံးပြုသူများအတွက်ကွဲပြားခဲ့ကြောင်းတွေ့ရှိခဲ့ပါတယ်။ Repurposing "ငါးဖမ်း" မှဦးဆောင်လမ်းပြနိုင် (Humphreys, Sierra, and Windt 2013) နှင့် "ကို p-hacking" (Simmons, Nelson, and Simonsohn 2011) , ဒါပေမဲ့အဲဒီအကြီးအကျယ်ရိုးသားသောအစီရင်ခံများပေါင်းစပ်နှင့်အတူ addressable ကြသည် (Simmons, Nelson, and Simonsohn 2011) , Pre-မှတ်ပုံတင် (Humphreys, Sierra, and Windt 2013) နှင့် Over-လျောက်ပတ်ရှောင်ရှားရန်ကြိုးစားကြောင်းစက်သင်ယူမှုနည်းစနစ်။