Nonrepresentative маалымат чыккан үлгүдөгү жалпылоо үчүн жаман эмес, бирок ичинде-үлгүдөгү салыштыруу үчүн абдан пайдалуу болушу мүмкүн.
Кээ бир илимпоздордун мындай өлкөдө бардык кишилер катары так аныкталган калктын бир ыктымалдык кокус иргелген келген маалыматтар менен иштеп көнүп калган. Үлгү ири калк "билдирет", анткени бул дайындар өкүлү маалыматтарды деп аталат. Көптөгөн окумуштуулар байге өкүлү маалыматтарды, nonrepresentative маалыматтар калпак синоними болуп саналат, ал эми кээ бир өкүлү маалымат катаал илим синоними болуп саналат. абдан оор учурда айрымдар эч нерсе nonrepresentative маалыматтар үйрөнсөк болот деп эсептешет. Эгерде бул чын болсо, бул катуу алардын көбү nonrepresentative, анткени кандай чоң маалымат булактарынан үйрөнсөк болот чектөө көрүнөт. Бактыга жараша, бул скептиктер гана жарым-жартылай туура. nonrepresentative маалыматтар так, ошондой эле ылайыктуу эмес, ал үчүн белгилүү бир илимий-изилдөө максаттары, бирок, чынында, абдан пайдалуу болушу мүмкүн, ал үчүн башкалар да бар.
бул айырманы түшүнүү үчүн, анын илимий классик карап көрөлү: Лондондогу 1853-54 холера эпидемиясынан Жон Сноу окуу. учурда, көптөгөн дарыгерлер холера менен шартталган деп эсептеген "жаман аба", бирок кар балким чыкма-ыдыратып, ичүүчү суу менен жайылып, жугуштуу оору деп эсептешчү. Бул ойду сынаш үчүн, Snow азыр биз табигый эксперимент деп аталган нерсени пайдаланып алды. Lambeth жана Southwark & VAUXHALL: Ал эки түрдүү суу компаниялар тарабынан кызмат кылган үй-холера чендерди салыштырган. Бул компаниялар сыяктуу үй кызмат кылган, бирок алар бир маанилүү жол менен айырмаланды: Southwark & VAUXHALL Чыгашаны чоор ылдый тартып калган, ал эми эпидемияга алдында 1849-, бир нече жылдардан кийин Lambeth-башталган, анын керектөө пункту Лондондогу башкы чыкма сууларды агызуу жогору жылдырылды агып чыкма. Snow эки компаниялар тарабынан кызмат кылган үй-холера өлүм чендерди салыштырганда, ал Southwark & VAUXHALL-компаниясынын кардарлары экенин чыкма себепкери суу болгон 10 эсе көп холера тартып өлүүдө кардарларды камсыз болгон. Бул жыйынтык, ал Лондондо элинин өкүлү үлгү боюнча жок болсо да, холера себебин кар билимде күчтүү илимий далилдерди камсыз кылат.
Бул эки компаниялардан маалыматтарды, Бирок, ар кандай суроого жооп алуу үчүн идеалдуу болмок эмес: тумоосу учурунда Лондондо холера таралышы кандай эле? Ошондой эле маанилүү деп экинчи суроо, анткени, ал Лондон элинин өкүлү үлгүсүн ээ болуу алда канча жакшы болмок.
Snow иши көрсөтүп тургандай, кээ бир илимий суроолор nonrepresentative маалыматтар бар кыйла натыйжалуу жана ошондой эле ылайыктуу эмес, ал үчүн да бар болушу мүмкүн. маселелер боюнча бул эки түрүн айырмалай бир чийки жолу кээ бир суроолор алкагында-үлгүдөгү салыштыруу жөнүндө жана айрым тууралуу чыккан үлгүсүндөгү жалпылоо болуп саналат. Бул айырмачылык андан ары эпидемиялык дагы бир классикалык изилдеп көрүүгө болот: ал тамекини көрсөтүүдө маанилүү ролду ойногон британиялык дарыгер-изилдөө, рак пайда болот. Бул изилдөөдө, изилдөө баштаган Ричард Doll А. Уимблдон Hill бир нече жыл бою болжол менен 25000 эркек дарыгерлер ээрчип, аларды өлүм санынын алар ышталган өлчөмүнө негизденүү менен салыштырган. Барби жана Hill (1954) күчтүү таасир-жооп мамиледе табылган: көбүрөөк эл чегип, алар өпкө рагынан каза болгон көп. Албетте, эркек дарыгерлердин бул топтун негизинде Улуу Британиянын эл арасында, өпкөнүн рак таркашын аныктоо үчүн акылсыздык болор эле, бирок ичинде-үлгүдөгү салыштыруу деле тамеки өпкө рагына себеп болот деген далилдер бар.
Азыр мен алкагында-үлгүдөгү салыштыруу жана-жылдын үлгүсүндөгү жалпы жалпылоого айырмасын мисал менен алгандан кийин, эки иштеди, тартип бар. Биринчиден, ошондой эле аялдар, британиялык дарыгер же эркек Британиянын ишканаларынын жумушчулары, же аял Германиянын фабрика жумушчулар же башка топтордун бир үлгүдөгү ичинде нааразычылыгым бар: табигый эркек Британиянын дарыгерлердин бир үлгүдөгү ичинде кармап мамилеси болгон өлчөмдө тууралуу суроолор болуп саналат. Бул суроолор кызыктуу жана маанилүү болуп саналат, бирок алар биз калктын бир үлгүдөн жалпылап турган даражада байланыштуу суроолорго айырмаланат. Мисалы, сиз, балким, эркек британиялык дарыгер табылган тамеки тартуу жана рак ортосундагы мамилелер, балким, бул башка топтордун да ошондой болот деген шек бар. Бул орундуу, эмне үчүн Сенин жөндөмү эркек британиялык дарыгер ар кандай калктын бир ыктымалдык кокустук үлгү экенин келген эмес; эмес, тамекини жана рак шилтемелер механизмин түшүнүү келип чыккан. Ошентип, тартылып турган калктын бир үлгүдөн жалпылоо бир негизинен статистикалык көйгөй болуп саналат, ал эми дагы бир топко бир топ табылган үлгүдөгү шайлык тууралуу суроолор негизинен бир nonstatistical маселе (Pearl and Bareinboim 2014; Pearl 2015) .
Бул жерде, качан шектенгендерден көпчүлүк коомдук үлгүлөрү, балким, тамеки тартуу жана рак ортосундагы мамиле караганда топтордо аз ташуу бар экенин айтса болот. Мен макулмун. Биз узоры ташуу боло турган канчалык акыры теориясы жана далилдердин негизинде чечим керек болгон бир илимий маселе болуп саналат. Бул эсеп жазуусу узоры ташуу боло алат деп болжолдошкон болушу керек, бирок да алар ташуу мүмкүн эмес деп болжолдонот болушу керек. Эгер студенттер изилдеп, адамдын жүрүм-турум жөнүндө билүү көп изилдөөчүлөр кантип талаш-тартыш менен кылып жүрсө, анда шайлык жөнүндө Бул бир абстрактуу суроолор сизге тааныш болот (Sears 1986, [@henrich_most_2010] ) . Бул талаш-карабастан, ал изилдөөчүлөр студенттер окуган бир нерсе үйрөнө албайт деп айтуу акылга сыйбайт.
Экинчи эскертүү nonrepresentative маалыматтар менен көпчүлүк изилдөөчүлөр Snow же Барби жана Хилл сыяктуу кылдат эмес. Демек, илимий изилдөөчү nonrepresentative маалыматтардын бир чыккан үлгүсүндөгү жалпылоо үчүн аракет кылып жатканда, эмне туура эмес, мен Андраник Tumasjan жана кесиптештери тарабынан 2009-жылдын Германиянын парламенттик шайлоодо бир изилдөөгө байланыштуу, силерге чындыкты айтып коёюн дедим эле мисал үчүн (2010) . 100000ден ашуун Tweets талдоо менен, алар саясий партия сөз сөзмө үлүшү партиясы парламенттик шайлоодо (сүрөттү 2.3) алынган добуштардын саны туура деп табылган. Башка сөз менен айтканда, бул Twitter маалыматтар олуттуу болчу, анткени өкүлү маалыматтар боюнча, алардын басым кымбат салттуу коомдук пикирди сурамжылоо, алмаштыруу мүмкүн экен.
Сиз, балким, буга чейин Twitter жөнүндө эмнени эске алып, тез арада бул натыйжасында карата туура эмес көз карашта болушу керек. 2009-жылы Twitter боюнча немистер немис шайлоочулардын бир ыктымалдык кокустук үлгү болгон эмес, ал эми кээ бир партиялар башка партиялардын жактоочулары көп учурда саясатка караганда бакшасын мүмкүн жактоочулары. Ошентип, бул маалымат сиз кандайдыр бир жол менен жокко болмок деп ойлойм мүмкүн кызыкчылыктардан бардык Ошентип немис шайлоочулардын түздөн-түз түрдө чагылдырганына болорун калыштуу көрүнөт. Чынында эле, натыйжалар Tumasjan et al. (2010) өтө эле жакшы болуп калды. А кийинки кагаз менен Андреас Jungherr, Pascal Jurgens жана Harald Schoen (2012) баштапкы талдоо, чынында, абдан Twitter боюнча сөз алган саясий партиядан чыгарылып айткан: Pirate партиясы, мамлекеттик жөнгө салууну согушуп кичинекей партия Интернет. Pirate Party талдоо кирген кезде, Twitter, шайлоо жыйынтыгы жөнүндө, коркунучтуу божомолдоолордун (сүрөт 2.3) болуп айтылат. Бул мисал, nonrepresentative чоң маалымат булактарын чыккан үлгүсүндөгү жалпылоо үчүн колдонуп турат абдан туура болот эле. Ошондой эле, сиз 100000 Tweets бар экени чындык, негизинен, кандай тиешеси жок экенин байкабай керек: nonrepresentative маалыматтар көп деле nonrepresentative, мен изилдөөлөр талкуулап жатканда, мен 3-бөлүмдө кайтып аласыз темасы.
Жыйынтыктасак, көптөгөн чоң маалымат булактары кээ бир жакшы аныкталган калктын өкүлү үлгүлөр эмес. ал тартылган болгон калкка үлгүдөн чыгаруу болуп натыйжаларын талап кылган суроолор боюнча, бул олуттуу маселе болуп саналат. Бирок ичинде-үлгүдөгү салыштыруу жөнүндө суроолорго жооп берүү үчүн, nonrepresentative маалыматтар күчтүү болушу мүмкүн, ошондуктан, көп изилдөөчүлөр теориялык же илимий далилдер менен шайлык жөнүндө үлгү жана колдоо көрсөтүү талаптарын сапаттар тууралуу ачык-айкын болуп саналат. Чынында, мен үмүт көп nonrepresentative топтордун дагы алкагында-үлгүдөгү салыштырууга чоң маалымат булактары мүмкүндүк берет, башкача айтканда, мен жөн эле ар кайсы топтордун баасы бир ыктымалдык туш келген бир изилдөөгө караганда, коомдук изилдөөлөрдү жүргүзүү үчүн дагы бир нерсе кылат деп үлгү.