Nümayəndə olmayan məlumatlar, nümunə xaricində olan ümumiləşdirmələr üçün pisdir, lakin nümunə müqayisələrində olduqca faydalı ola bilər.
Bəzi ictimai elmlər müəyyən bir ölkədə yaşayan bütün böyüklər kimi yaxşı təsbit edilmiş əhalidən ehtimal olunan təsadüfi nümunədən gələn məlumatlarla işləmək üçün alışmış olurlar. Nümunə böyük əhali "təmsil" Çünki məlumatların bu cür məlumatın adlanır. Bir çox tədqiqatçı təmsilçi məlumatlarını mükafatlandırır və bəzilərinə məlumat verən məlumatlar ciddi elmlə sinonimdir, halbuki informasiyalı olmayan məlumatlar sloppiness ilə eşitdirilir. Ən həddindən artıq dərəcədə, bəzi şübhəçilər, heç bir şeyin nümayəndəsi olmayan məlumatlardan öyrənilməyəcəyinə inanırlar. Doğrudur, bu böyük məlumat mənbələrindən öyrənilə biləcək şeyləri məhdudlaşdırmaq kimi görünür, çünki onların əksəriyyəti qeyri-nümayəndəlik edir. Xoşbəxtlikdən, bu şübhəçilər yalnız qismən haqlıdırlar. Bəzi araşdırma məqsədləri üçün qeyri-nümayəndəlik məlumatları dəqiq uyğun gəlmir, amma əslində olduqca faydalı ola biləcək başqaları vardır.
Bu fərqləri anlamaq üçün, elmi bir klassikliyi nəzərdən keçirək: John Snowin Londonda 1853-54 kolera epidemiyasının öyrənilməsi. Halbuki, bir çox həkimlər kolera xəstəliyinə "pis hava" gətirdiklərinə inanırdılar, lakin Qar qarın suyunu içməli su ilə yayılan bir yoluxucu xəstəlik olduğuna inanırdılar. Bu fikri sınamaq üçün Qar indi təbii bir təcrübə adlandırdığımız şeydən faydalandı. Lambeth və Southwark & Vauxhall, iki müxtəlif su şirkətinin xidmət etdiyi ev təsərrüfatlarının kolera nisbətlərini müqayisə etdi. Bu şirkətlər oxşar ailələrə xidmət edirdilər, lakin bir əhəmiyyətli şəkildə fərqləndilər: 1849-cu ildə epidemiyanın başlamasından bir neçə il əvvəl - Lambeth Londonda əsas kanalizasiya qazıntılarından yuxarı axınını hərəkətə keçirdi, halbuki Southwark & Vauxhall onların boru kəmərindən kanalizasiya axını. Qar iki şirkətin xidmət etdiyi ev təsərrüfatlarında xoleriyadan ölüm nisbətlərini müqayisə edərkən, o, müştərilərə kanalizasiya suyunu verən "Southwark & Vauxhall" şirkətinin müştərilərinin xoleradan ölmək ehtimalının 10 qat daha çox olduğunu aşkar etdi. Bu nəticə Londonda insanların nümunə nümunəsinə əsaslanmırsa da, qarın xolerinin səbəbi ilə bağlı Qar argümanının güclü elmi sübutudur.
Bununla yanaşı, bu iki şirkətin məlumatları fərqli bir suala cavab vermək üçün ideal olmazdı: baş vermiş epizod zamanı Londonda xoleriyanın yayılması nə idi? Həm də vacib olan ikinci sual üçün, Londondan gələn nümayəndələrin nümunəsi olması daha yaxşı olardı.
Qar işi göstərir ki, qeyri-nümayəndəlik məlumatları olduqca səmərəli ola biləcək bəzi elmi suallar var və bunlar üçün uyğun olmayan bir çox var. Bu iki növ sualdan birini ayırmaq üçün bir xam yol, bəzi sualların nümunə nümunələri ilə müqayisə olunduqları, bəziləri isə nümunə xaricində olan ümumiləşdirmələrdir. Bu fərq epidemioloji bir klassik araşdırma ilə daha da izah edilə bilər: siqaretin xərçəngə səbəb olduğunu göstərməkdə mühüm rol oynayan İngilis Həkimləri Tədqiqatı. Bu işdə, Richard Doll və A. Bradford Hill, bir neçə ildir təxminən 25,000 kişi həkimini izlədi və tədqiqat başladıqlarında çəkdikləri miqdarda ölüm nisbətlərini müqayisə etdi. Doll və Hill (1954) güclü təsirə məruz qalma münasibəti tapdı: daha ağır insanlarda bişmiş, ağciyər xərçəngindən daha çox öləcək. Əlbəttə ki, bu kişi həkimlər qrupu əsasında bütün İngilislər arasında ağciyər xərçəngi yayılmasının qiymətləndirilməsi ağılsızlıq olardı, lakin içərisində nümunə müqayisədə hələ də siqaretin ağciyər xərçənginə səbəb olduğunu sübut edir.
İndi nümunə müqayisələri və nümunə xaricindəki generalizasiyalar arasındakı fərqi təsvir etdiyimiz üçün iki xəbərdarlıq var. Birincisi, ingilis həkimlərinin bir nümunəsi içərisində olan əlaqələrin nə dərəcədə olduğu barədə təbii suallar var, qadınlar, İngilis həkimləri və ya İngilis qadın işçiləri və ya digər qadın işçiləri və ya bir çox digər qruplar. Bu suallar maraqlı və vacibdir, lakin onlar bir nümunədən bir əhaliyə necə ümumiləşdirə biləcəyi ilə bağlı suallardan fərqlidirlər. Misal üçün, kişi İngilis həkimlərindəki siqaret və kanser arasındakı əlaqənin digər qruplarda da oxşar olacağına şübhə edirsiniz. Bu ekstrapolyasiya etmək qabiliyyətiniz, kişi İngilis həkimlərinin hər hansı bir əhalidən ehtimal olunan təsadüfi nümunəsidir; əksinə, siqaret və xərçənglə əlaqələndirən mexanizm anlayışından gəlir. Nümunədən əhaliyə çəkilən ümumiləşdirmə əsasən statistik bir məsələdir, lakin bir qrupda başqa bir qrupa aid nümunənin nəqlinə dair suallar əsasən qeyri- (Pearl and Bareinboim 2014; Pearl 2015) məsələdir (Pearl and Bareinboim 2014; Pearl 2015) .
Bu nöqtədə, bir skeptik, əksəriyyətlə sosial modellərin, qruplar arasında siqaret və xərçəng arasında əlaqələrdən daha az nəql edilə biləcəyinə işarə edir. Və razıyam. Nəqllərin nəql ediləcəyini gözləmək məcburiyyətindəyik, nəticə etibarilə nəzəriyyə və sübutlara əsaslanaraq həll edilməli olan elmi bir sualdır. Olan nümunələrin nəql ediləcəyi avtomatik olaraq qəbul edilməməli, amma onların nəql edilə bilməyəcəyi ehtimal edilməməlidir. Taşınabilirlik ilə bağlı bir qədər mübahisəli suallar, tələbə təhsilini öyrənməklə, tədqiqatçıların insan davranışları haqqında nə qədər öyrənə biləcəyi barədə müzakirələrə (Sears 1986, [@henrich_most_2010] ) təqdirdə sizə tanış olacaqdır (Sears 1986, [@henrich_most_2010] ) . Bununla belə, bu müzakirələrə baxmayaraq, tədqiqatçılar bakalavr tələbələri arasında heç bir şey öyrənə bilməyəcəklərini söyləmək əsassız olardı.
İkinci xəbərdarlıq, əksər məlumatları olmayan tədqiqatçıların Snow və ya Doll və Hill kimi diqqətli olmadığıdır. Beləliklə, tədqiqatçılar qeyri-nümayəndəlik məlumatlarından nümunə nümunəsi ümumiləşdirməsini etməyə çalışdıqda yanlışlaşa biləcək şeyləri göstərmək üçün, sizə 2009-cu ildə Almaniyada keçirilən parlament seçkilərinin Andranik Tumasjan və həmkarlarının (2010) verdiyi bir tədqiqat barədə məlumat vermək istərdim. 100.000-dən çox tweets analiz edərək, siyasi partiyanı qeyd edən tweetlərin nisbəti, partiyanın parlament seçkilərində aldıqları səslərin nisbətinə uyğun olduğunu tapdılar (şəkil 2.3). Başqa sözlə, əsasən azad olan Twitter məlumatları nümayəndələrin məlumatlarına vurğu etdikləri üçün bahalı olan ənənəvi ictimai rəy sorğularını əvəz edə biləcəkləri ortaya çıxdı.
Yəqin ki, artıq Twitter haqqında bildiklərinizi nəzərə alaraq, dərhal bu nəticəyə şübhə ilə yanaşmalısınız. 2009-cu ildə Twitter-də Almanlar Alman seçicilərinin ehtimal olunan təsadüfi nümunəsidirlər və bəzi partiyaların tərəfdarları digər partiyaların tərəfdarlarından daha tez-tez siyasət haqqında tweet edə bilərlər. Beləliklə, təəccüblü görünə bilər ki, təsəvvür edə biləcəyiniz ehtimal olunan bütün yanaşmalar, bu məlumatların Alman seçicilərinin birbaşa əks etdirəcəyi nəticəsidir. Əslində Tumasjan et al. (2010) gerçək olmaq üçün çox yaxşı olduğu ortaya çıxdı. Andreas Jungherr, Pascal Jürgens və Harald Schoen (2012) tərəfindən aparılan təqib sənədində, əsl təhlilin həqiqətən Twitter-də ən çox danışılan siyasi partiyanı istisna etdiyini vurğulamışdır: Pirate Party, hökumət tənzimləməsinə qarşı mübarizə aparan kiçik bir partiya İnternet. Qarışıq Partiya analizə daxil edildikdə, Twitter-də qeyd edildiyi kimi seçki nəticələrinin dəhşətli bir proqnozu olur (şəkil 2.3). Bu nümunədə göstərildiyi kimi, nümunə xaricində olmayan geniş məlumat mənbələri istifadə etmək çox səhv ola bilər. Bundan əlavə, 100 min tweets olduğuna diqqət yetirməliyik ki, çoxsaylı məlumatlar hələ də qeyri-nümayəndəsidir, anketlərin müzakirəsi zamanı mən 3-cü fəsildə qayıdacağam.
Xülasə etmək üçün bir çox böyük məlumat mənbələri bəzi yaxşı əhali əhalisindən nümayəndələrin nümunələri deyildir. Nümunədən nümunədən ümumiləşdirmə tələb edən suallar üçün bu, çəkilən əhali üçün ciddi bir problemdir. Lakin nümunə nümunələri ilə bağlı suallar üçün, tədqiqatçılar öz nümunələrinin xüsusiyyətləri və nəzəriyyə və ya ampirik sübutlarla ötürülmə qabiliyyətinə dair dəstək iddiaları barədə aydın olduğu müddətdə, qeyri-nümayəndəlik məlumatları güclü ola bilər. Ümid edirəm ki, böyük məlumat mənbələri tədqiqatçılara bir çox qeyri-nümayəndəlik qrupunda nümunə müqayisə etmək imkanı verəcəkdir və mənim fikrimcə, bir çox müxtəlif qruplardan gələn təxminlər sosial tədqiqatların olimpiadaya təsadüfi bir təsirin nümunə.