Nonrepresentative ဒေတာ Out-of-နမူနာမျိုးဆက်မကောင်းတဲ့ရှိပါတယ်, ဒါပေမယ့်အတွင်း-နမူနာနှိုင်းယှဉ်ဘို့အတော်လေးအသုံးဝင်စေနိုင်ပါတယ်။
အချို့ကလူမှုရေးသိပ္ပံပညာရှင်များထိုကဲ့သို့သောအထူးသဖြင့်တိုင်းပြည်အတွက်အားလုံးအရွယ်ရောက်ပြီးသူအဖြစ်တစ်ဦးကိုကောင်းစွာသတ်မှတ်လူဦးရေကနေဖြစ်နိုင်ဖွယ်အလားအလာကျပန်းနမူနာကနေလာဒေတာကိုအတူလုပ်ကိုင်လေ့ရှိပါသည်။ နမူနာပိုကြီးတဲ့လူဦးရေ "ကိုကိုယ်စားပြု" ဘာဖြစ်လို့လဲဆိုတော့အချက်အလက်များ၏ဒါဟာကြင်နာကိုယ်စားလှယ်ဒေတာ 'ဟုဆိုအပ်၏။ အတော်များများကသုတေသီများဆုကိုယ်စားလှယ်ဒေတာနှင့် nonrepresentative ဒေတာမသေချာသောနှင့်အတူပြောရလျှင်သော်လည်းအချို့မှ, ကိုယ်စားလှယ်ဒေတာကိုတိကျခိုင်မာစွာသိပ္ပံနှင့်အတူပြောရလျှင်ဖြစ်ပါတယ်။ အများဆုံးအစွန်းရောက်မှာအချို့သံသယဝါဒီဘာမျှ nonrepresentative ဒေတာကနေလေ့လာသင်ယူနိုင်ယုံကြည်ပုံရသည်။ စစ်မှန်တဲ့လျှင်ဤပြင်းထန်စွာသူတို့ထဲကအတော်များများ nonrepresentative ကြောင့်ကြီးမားသောဒေတာရင်းမြစ်များမှသင်ယူနိုင်ပါသည်အဘယျသို့ကန့်သတ်ဟန်လိမ့်မယ်။ ကံကောင်းထောက်မစွာ, ဤသံသယဝါဒီသာတစ်စိတ်တစ်ပိုင်းဟုတ်မှန်ကြ၏။ nonrepresentative data တွေကိုရှင်းရှင်းလင်းလင်းကောင်းစွာသင့်လျော်မဟုတ်သောအရာအဘို့အအချို့သောသုတေသနရည်မှန်းချက်များရှိပါတယ်, ဒါပေမယ့်ဒါဟာအမှန်တကယ်အတော်လေးအသုံးဝင်ပါလိမ့်မယ်အရာအဘို့အခြားသူတွေရှိပါတယ်။
ဗြိတိန်နိုင်ငံလန်ဒန်မြို့မှာရှိတဲ့ 1853-54 ဝမ်းရောဂါဖြစ်ပွားဂျွန်နှင်းရဲ့လေ့လာမှု: ဤဂုဏ်ထူးနားလည်စေရန်, ရဲ့တစ်ဦးသိပ္ပံနည်းကျဂန္ထည့်သွင်းစဉ်းစားကြကုန်အံ့။ ထိုအချိန်ကများစွာသောဆရာဝန်များကဝမ်းရောဂါ "မကောင်းတဲ့လေထု" ကြောင့်ဖြစ်ရတဲ့ပေမယ့်နှင်းကြောင့်ဖြစ်ကောင်းမိလ္လာနဲ့ဧည်သောက်ရေများကပြန့်နှံ့ကာကူးစက်ရောဂါ, ဖြစ်ခဲ့သည်ဟုယုံကြည်ခဲ့ယုံကြည်သည်။ ဒီစိတ်ကူးကိုစမ်းသပ်ဖို့, နှင်းယခုကြှနျုပျတို့သဘာဝစမ်းသပ်မှုမခေါ်စေခြင်းငှါ, အဘယ်အရာကိုအခွင့်ကောင်းယူခဲ့ပါတယ်။ Lambeth နှင့် Southwark & Vauxhall: သူနှစ်ဦးကိုကွဲပြားခြားနားသောရေကုမ္ပဏီများကတာဝန်ထမ်းဆောင်အိမ်ထောင်စုများ၏ဝမ်းရောဂါနှုန်းထားများနှင့်နှိုင်းယှဉ်လျှင်။ အဲဒီကုမ္ပဏီတွေကအလားတူအိမ်ထောင်စုထမ်းဆောင်ခဲ့သည်, ဒါပေမဲ့သူတို့တဦးတည်းအရေးကြီးသောလမ်းအတွက်ကွဲပြား: 1849-နှစ်အနည်းငယ်အတွင်းကပ်ရောဂါ Southwark & Vauxhall မှမြစ်အောက်ပိုင်းကိုသူတို့စားသုံးမှုပိုက်ကျန်ရစ်သော်လည်း, လန်ဒန်မှာရှိတဲ့အဓိကမိလ္လာဥတုကနေသူ့ရဲ့စားသုံးမှုအမှတ်အထက်ပြောင်းရွှေ့-Lambeth စတင်ခဲ့ပြီးမတိုင်မီ မိလ္လာဥတု။ နှင်းကုမ္ပဏီနှစ်ခုတို့ကတာဝန်ထမ်းဆောင်အိမ်ထောင်စုများတွင်ဝမ်းရောဂါကနေသေဆုံးမှုနှုန်းနှင့်နှိုင်းယှဉ်တဲ့အခါသူ Southwark & Vauxhall-ဖောက်သည်မိလ္လာ-စှနျးပေးခဲ့ကုမ္ပဏီကို၏ဖောက်သည်များဝမ်းရောဂါထံမှသေဖို့က 10 ဆပိုမိုဖြစ်နိုင်ဖွယ်ရေကြောင်းတွေ့ရှိခဲ့ရသည်။ ဤရလဒ်ကဗြိတိန်နိုင်ငံလန်ဒန်မြို့ရှိလူများ၏ကိုယ်စားလှယ်တစ်ဦးနမူနာအပေါ်အခြေမခံသော်လည်း, ဝမ်းရောဂါများ၏အကြောင်းရင်းနှင့် ပတ်သက်. နှင်းရဲ့အငြင်းအခုံအဘို့ခိုင်ခံ့သိပ္ပံနည်းကျသက်သေအထောက်အထားပေးစွမ်းသည်။
ဤအကုမ္ပဏီနှစ်ခုအနေဖြင့်ဒေတာများ, သို့သော်, တစ်ဦးကွဲပြားခြားနားဆိုတဲ့မေးခွန်းကိုဖြေဆိုခြင်းအဘို့စံပြမဖြစ်လိမ့်မယ်: ဖြစ်ပွားစဉ်ကာလအတွင်းလန်ဒန်မြို့ရှိဝမ်းရောဂါများပျံ့နှံ့ဘာပါလဲ? လညျးအရေးကွီးသောအရာတို့ကိုဒုတိယမေးခွန်းသည်ဗြိတိန်နိုင်ငံလန်ဒန်မြို့ကနေလူမျိုး၏ကိုယ်စားလှယ်တစ်ဦးနမူနာရှိသည်ဖို့အများကြီးပိုကောင်းပါလိမ့်မယ်။
နှင်းရဲ့အလုပ်သရုပ်ဖော်အဖြစ်, nonrepresentative ဒေတာအတော်လေးထိရောက်နိုင်ပါတယ်ကြောင့်ကောင်းစွာသင့်လျော်မဟုတ်သောအရာအဘို့အခြားသူတွေရှိပါတယ်ရသောအဘို့အခြို့သောသိပ္ပံနည်းကျမေးခွန်းများကိုရှိပါတယ်။ မေးခွန်းများကိုဤနှစ်မျိုးခွဲခြားရန်တစ်ခုမှာရေနံစိမ်းလမ်းအချို့မေးခွန်းများကိုအတွင်း-နမူနာနှိုင်းယှဉ်အကြောင်းကိုဖြစ်ကြပြီးအချို့ Out-of-နမူနာယေဘုယျအကြောင်းကိုဖြစ်ပါတယ်။ ဗြိတိသျှဆရာဝန်များလေ့လာမှု, ဆေးလိပ်သောက်ကင်ဆာဖြစ်ပေါ်စေကြောင်းသရုပ်ပြအတွက်အရေးပါသောအခန်းကဏ္ဍကစားရာ: ဒီဂုဏ်ထူးနောက်ထပ်ရောဂါအတွက်အခြားဂန္လေ့လာမှုအားဖြင့်သရုပ်ဖော်နိုင်ပါတယ်။ ဤလေ့လာမှု၌, ရစ်ချတ် Doll နှင့်အေဘရက်ဖို့ဒဟေးလ်နှစ်ပေါင်းများစွာခန့်မှန်းခြေအားဖြင့် 25000 အထီးဆရာဝန်များကနောက်တော်သို့လိုက်နှင့်လေ့လာမှုစတင်သောအခါသောက်သည်သောငွေပမာဏအပေါ်အခြေခံပြီးသူတို့ရဲ့သေဆုံးမှုနှုန်းနှင့်နှိုင်းယှဉ်ပါ။ အရုပ်နှင့်ဟေးလ် (1954) အားကြီးသောထိတွေ့-တုံ့ပြန်မှုဆက်ဆံရေးမျိုးကိုတွေ့ရှိခဲ့: ပိုအကြီးအကျယ်လူတွေကသူတို့အဆုတ်ကင်ဆာကနေသေဆုံးကြပိုဖွယ်ရှိ, သောက်သည်။ ဟုတ်ပါတယ်, အထီးဆရာဝန်တွေရဲ့ဒီအုပ်စုတစ်စုအပေါ်အခြေခံပြီးအားလုံးဗြိတိန်လူတို့တွင်အဆုတ်ကင်ဆာ၏ပျံ့နှံ့ခန့်မှန်းရန်ပညာမဲ့လိမ့်မယ်, ဒါပေမဲ့အတွင်း-နမူနာနှိုင်းယှဉ်နေဆဲဆေးလိပ်သောက်အဆုတ်ကင်ဆာဖြစ်စေသောအထောက်အထားကိုပေးပါသည်။
ယခုငါအတွင်း-နမူနာနှိုင်းယှဉ်ခြင်းနှင့် Out-of-နမူနာယေဘုယျအကြားခြားနားချက်ရုပ်ပြသွားပါပြီ, နှစ်ဦးကိုအသိပေးချက်နိုင်ရန်အတွက်ဖြစ်ပါသည်။ ပထမဦးစွာရသောအထီးဗြိတိန်ဆရာဝန်တစ်ဦးနမူနာအတွင်းရရှိထားသူတစ်ဦးကြားဆက်ဆံရေးမှာလည်းအမျိုးသမီး, ဗြိတိသျှဆရာဝန်များသို့မဟုတ်အထီးဗြိတိန်စက်ရုံလုပ်သားများသို့မဟုတ်မိန်းမနှစ်ယောက်တည်းကိုဂျာမန်စက်ရုံလုပ်သားများသို့မဟုတ်များစွာသောအခြားအုပ်စုများနမူနာအတွင်းကျင်းပလိမ့်မည်မှအတိုင်းအတာနှင့် ပတ်သက်. မေးခွန်းများကိုသဘာဝကျကျရှိပါတယ်။ ဤမေးခွန်းများကိုစိတ်ဝင်စားဖို့နှင့်အရေးကြီးလှသည်, ဒါပေမဲ့သူတို့ကျွန်တော်တစ်ဦးလူဦးရေတစ်နမူနာကနေယေဘုယျနိုင်သည့်ရန်အတိုင်းအတာနှင့် ပတ်သက်. မေးခွန်းများကိုထံမှကွဲပြားခြားနားပါသည်။ သငျသညျဖြစ်ကောင်းအထီးဗြိတိန်ဆရာဝန်များ၌တွေ့သောဆေးလိပ်သောက်ခြင်းနှင့်ကင်ဆာကြားဆက်ဆံရေးဖြစ်ကောင်း, ဤသည်အခြားအုပ်စုများအတွက်ဆင်တူဖြစ်လိမ့်မည်ဟုသံသယကြောင်းဥပမာအားအသိပေးစာ, ။ ဒီ extrapolation လုပ်ဖို့သင့်ရဲ့စွမ်းရည်ကိုအထီးဗြိတိန်ဆရာဝန်များကမဆိုလူဦးရေကနေဖြစ်နိုင်ဖွယ်အလားအလာကျပန်းနမူနာများမှာဆိုတဲ့အချက်ကိုကနေမလာပါဘူး, အစားကြောင့်ဆေးလိပ်သောက်ခြင်းနှင့်ကင်ဆာဆက်သွယ်သောယန္တရားတစ်ခုနားလည်မှုမှသည်လာပါတယ်။ ထို့ကြောင့်ရေးဆွဲသောနေနမူနာအနေဖြင့်လူဦးရေမှအစဉ်အဆက်တစ်အကြီးအကျယ်တစ်စာရင်းအင်းကိစ္စဖြစ်ပါတယ်, ဒါပေမယ့်အခြားအုပ်စုတဦးတည်းအုပ်စုတွင်တွေ့ရှိခဲ့ပုံစံ၏သယ်ယူပို့ဆောင်ရေးနှင့် ပတ်သက်. မေးခွန်းများကိုအကြီးအကျယ်တစ် nonstatistical ပြဿနာ (Pearl and Bareinboim 2014; Pearl 2015) ။
ဤအချက်မှာ, တစ်ဦးသံသယအရှိဆုံးလူမှုရေးပုံစံများဖြစ်ကောင်းဆေးလိပ်သောက်ခြင်းနှင့်ကင်ဆာကြားဆက်ဆံရေးထက်အုပ်စုများကိုဖြတ်ပြီးလျော့နည်းသယ်ဆောင်သွားဖြစ်ကြောင်းထောက်ပြပေလိမ့်မည်။ ထိုအခါငါသဘောတူသည်။ ကျနော်တို့ပုံစံများသယ်ဆောင်သွားဖြစ်ဖို့မြျှောလငျ့သငျ့ပါသောအတိုင်းအတာနောက်ဆုံးမှာသီအိုရီများနှင့်သက်သေအထောက်အထားအပေါ်အခြေခံပြီးဆုံးဖြတ်ခဲ့ပါတယ်ခံရဖို့ရှိပါတယ်တဲ့သိပ္ပံနည်းကျမေးခွန်းဖြစ်ပါသည်။ ဒါဟာအလိုအလြောကျပုံစံများသယ်ဆောင်သွားလိမ့်မည်ဟုယူဆမဖြစ်သင့်ပေမယ့်မဟုတ်သလိုသူတို့သယ်ဆောင်သွားလိမ့်မည်မဟုတ်ပေကြောင့်ယူဆရပါမည်။ သငျသညျဘွဲ့ကြိုကျောင်းသားများကိုလေ့လာခွငျးအားဖွငျ့လူ့အပြုအမူနှင့် ပတ်သက်. လေ့လာသင်ယူနိုင်ပါတယ်ဘယ်လောက်သုတေသီများ ပတ်သက်. ဆွေးနွေးငြင်းခုံနောက်တော်သို့လိုက်လျှင်ပို့ဆောင်ရေးနှင့် ပတ်သက်. ဤရွေ့ကားအတန်ငယ်စိတ္တဇမေးခွန်းများကိုသည်သင်အကျွမ်းတဝင်ဖြစ်လိမ့်မည် (Sears 1986, [@henrich_most_2010] ) ။ ဤအငြင်းခုံမှုများရှိနေသော်လည်း, သို့သော်, ဒါကြောင့်သုတေသီများဘွဲ့ကြိုကျောင်းသားများကိုလေ့လာနေမှတစုံတခုကိုလေ့လာသင်ယူလို့မရဘူးဆိုမိုပါလိမ့်မယ်။
ဒုတိယအသိပေးချက် nonrepresentative ဒေတာနှင့်အတူပါဆုံးသုတေသီများနှင်းသို့မဟုတ် Doll နှင့်ဟေးလ်သကဲ့သို့သတိထားမဟုတ်သောကြောင့်ဖြစ်သည်။ ဒါကြောင့်သုတေသီများ nonrepresentative ဒေတာတစ်ဦးထံမှ Out-of-နမူနာ General လုပ်ရန်ကြိုးစားသောအခါမှားယွင်းတဲ့သွားနိုင်ပါတယ်အဘယ်အရာကိုသရုပျဖျောဖို့, ငါ Andranik Tumasjan နှင့်လုပ်ဖော်ကိုင်ဘက်များက 2009 ခုနှစ်ဂျာမန်ပါလီမန်ရွေးကောက်ပွဲများ၏လေ့လာမှုတစ်ခုအကြောင်းကိုသင်ပြောပြချင်ပါတယ် (2010) ။ ထက်ပိုမို 100,000 tweets ခွဲခြားစိတ်ဖြာခြင်းအားဖြင့်, သူတို့တစ်တွေနိုင်ငံရေးပါတီဖော်ပြ tweets များ၏အချိုးအစားပါတီပါလီမန်ရွေးကောက်ပွဲမှာ (ပုံ 2.3) တွင်လက်ခံရရှိကြောင်းမဲများ၏အချိုးအစားကိုက်ညီကြောင်းတွေ့ရှိခဲ့ရသည်။ တနည်းအားဖြင့်ဒါဟာမရှိမဖြစ်လိုအပ်တဲ့အခမဲ့ခဲ့သည့် Twitter ကိုဒေတာ, ဘာဖြစ်လို့လဲဆိုတော့ကိုယ်စားလှယ်ဒေတာပေါ်တွင်သူတို့အလေးပေး၏စျေးကြီးနေသောရိုးရာအများပြည်သူအမြင်စစ်တမ်းများအစားထိုးနိုင်ကြောင်းထင်ရှား၏။
သင်ဖြစ်နိုင်ပြီးသားတွစ်တာအကြောင်းကိုသိအပ်သငျသညျခကျြခငျြးဒီရလဒ်များ၏သံသယဖြစ်သင့်သည်။ 2009 ခုနှစ်တွင် Twitter တွင်ဂျာမန်ဂျာမန်မဲဆန္ဒရှင်တစ်ဦးဖြစ်နိုင်ဖွယ်အလားအလာကျပန်းနမူနာမဟုတ်ကြ, အချို့ပါတီထောက်ခံသူများပိုပြီးမကြာခဏကအခြားပါတီများကိုထောက်ခံသူတွေထက်နိုင်ငံရေးနှင့် ပတ်သက်. tweet ပေလိမ့်မည်။ ထို့ကြောင့်ဒီဒေတာကိုဂျာမန်မဲဆန္ဒရှင်များ၏တိုက်ရိုက်ရောင်ပြန်ပါလိမ့်မယ်ဒါကြောင့်သင်စိတ်ကူးနိုင်ဖြစ်နိုင်ချေဘက်လိုက်မှုရှိသမျှတို့ကိုတစ်နည်းနည်းနဲ့ထွက် cancel မယ်လို့အံ့သြစရာပုံရသည်။ တကယ်တော့အတွက်ရလဒ်တွေကို Tumasjan et al. (2010) မယုံကြည်နိုင်လောက်အောင်ကောင်းဖြစ်ဖို့ထွက်လှည့်။ Andreas Jungherr, Pascal Jurgen နှင့် Harald Schoen နေဖြင့်တစ်ဦးကနောက်ဆက်တွဲစာရွက် (2012) ဟာ Pirate ပါတီ, အစိုးရစည်းမျဉ်းတိုက်တဲ့သေးငယ်တဲ့ပါတီ: မူရင်းခွဲခြမ်းစိတ်ဖြာအမှန်တကယ်ပါဆုံး Twitter ပေါ်တွင်ဖျောပွထားသလက်ခံရရှိခဲ့ကြောင်းနိုင်ငံရေးပါတီဖယ်ထုတ်ထားခဲ့ကြောင်းထောက်ပြခဲ့သည် အင်တာနက်။ အဆိုပါ Pirate ပါတီခွဲခြမ်းစိတ်ဖြာခြင်းတွင်ထည့်သွင်းခဲ့ပါတယ်အခါ, Twitter ကိုရွေးကောက်ပွဲရလဒ်များသည် (ပုံ 2.3) ၏ကြောက်မက်ဘွယ်သောခန့်မှန်းဖြစ်လာဖော်ပြထားတယ်။ ဒီဥပမာသရုပ်ဖော်အဖြစ်, Out-of-နမူနာယေဘုယျလုပ်ဖို့ nonrepresentative ကြီးတွေဒေတာသတင်းရင်းမြစ်ကို အသုံးပြု. အလွန်မှားယွင်းတဲ့သွားနိုင်ပါတယ်။ ဒါ့အပြင်သင် 100,000 tweets ရှိခဲ့သည်ဆိုတဲ့အချက်ကိုအခြေခံအားဖြင့်ဆီလျှော်ခဲ့တာကိုသတိပြုမိသင့်တယ်: nonrepresentative အချက်အလက်များ၏စာရေးနေဆဲငါစစ်တမ်းများဆွေးနွေးရန်သောအခါငါအခန်း 3 ခုနှစ်သို့ပြန်လာလိမ့်မယ်တဲ့ဆောင်ပုဒ် nonrepresentative ဖြစ်ပါတယ်။
ကောက်ချက်ချရန်, များစွာသောကြီးမားသောဒေတာသတင်းရပ်ကွက်အချို့ကောင်းမွန်စွာသတ်မှတ်လူဦးရေကနေကိုယ်စားလှယ်နမူနာမရှိကြပေ။ ကရေးဆွဲခဲ့သည့်အနေဖြင့်လူဦးရေနမူနာထံမှ General ရလဒ်များကိုလိုအပ်ကြောင်းမေးခွန်းများကိုအဘို့, ဒီဟာလေးနက်ပြဿနာဖြစ်ပါတယ်။ ဒါပေမယ့်အတွင်း-နမူနာနှိုင်းယှဉ်နဲ့ပတ်သက်တဲ့မေးခွန်းတွေအဘို့, nonrepresentative data တွေကိုဤမျှကာလပတ်လုံးသုတေသီများသီအိုရီသို့မဟုတ်ပင်ကိုယ်မူလသက်သေအထောက်အထားများနှင့်အတူပို့ဆောင်ရေးနှင့် ပတ်သက်. ၎င်းတို့၏နမူနာများနှင့်ထောက်ခံမှုတောင်းဆိုမှုများ၏ဝိသေသလက္ခဏာများနှင့်ပတ်သက်ပြီးရှင်းရှင်းလင်းလင်းဖြစ်သကဲ့သို့, အစွမ်းထက်စေနိုင်ပါတယ်။ တကယ်တော့ငါမြော်လင့်ကြီးတွေဒေတာသတင်းရင်းမြစ်အများအပြား nonrepresentative အုပ်စုများအတွက်ပိုပြီးအတွင်း-နမူနာနှိုင်းယှဉ်စေသုတေသီများကို enable ပါလိမ့်မယ်, ငါ့မှန်းဆအများအပြားကွဲပြားခြားနားသောအုပ်စုများထံမှခန့်မှန်းခြေတစ်ဦးဖြစ်နိုင်ဖွယ်အလားအလာကျပန်းကနေတစ်ခုတည်းခန့်မှန်းချက်ထက်လူမှုရေးသုတေသနတိုးဖို့ပိုလုပျမညျဖွစျကွောငျးဖြစ်ပါတယ် နမူနာ။