ውክልና አልባ የሆኑ መረጃዎች ለነጠላ ናሙና ማጠቃለያዎች መጥፎ ናቸው, ነገር ግን ለቅሞሽ ናሙናዎች በጣም ጠቃሚ ሊሆን ይችላል.
አንዳንድ የማኅበራዊ ሳይንስ (ሳይንቲስቶች) በአንድ የተወሰነ አገር ውስጥ ከሚገኙ ሁሉም ጎልማሶች (ለምሳሌ አንድ ጎልማሳ) ከተወሰኑ ሰዎች በተወሰኑ ናሙናዎች ውስጥ በተዘዋዋሪ ናሙና ናሙና ናሙናዎች ላይ በመመርኮዝ መስራት የተለመደ ነው. ይህ ዓይነቱ መረጃ ሰፋ ያለ ትልቁን ቁጥር "የሚወክለው" ስለሆነ ውክልና ውሂብን ይባላል. ብዙ ተመራማሪዎች የተወካዮች መረጃን ሽልማት ያስገኙ ሲሆን ለአንዳንዶቹ ደግሞ ውክልና ያላቸው መረጃዎች በጣም ጥብቅ ከሆነ የሳይንስ ጋር ሲሆኑ ውክልና ያላቸው መረጃዎች ደግሞ ከቁጥጥሩ ጋር ተመሳሳይ ናቸው. በጣም ተጨባጭ የሆኑ አንዳንድ ተጠራጣሪዎች ከማይመዘገቡ መረጃዎች ምንም ሊማሩ የሚችል ምንም ነገር እንደሌለ ያምናሉ. እውነት ከሆነ ይህ ከትልቅ የውሂብ ምንጮች ሊገኝ የሚችለውን ከመጠን በላይ የሚገድብ ይመስላል. ምክንያቱም ብዙዎቹ የሚወክሉት ናቸው. እንደ እድል ሆኖ እነዚህ ተጠራጣሪዎች በከፊል ትክክለኛ ናቸው. የሚወክለው መረጃ በግልጽ በግልጽ የማይታሰብባቸው አንዳንድ የጥናት ግብዎች አሉ, ነገር ግን ይህ በጣም ጠቃሚ ሊሆን የሚችልባቸው ሌሎችም አሉ.
ይህንን ልዩነት ለመረዳት የሳይንስ ክብረ ወሰን እንመልከት-የጆን ኖው በ 1853-54 ኮሌራ በለንደኑ ላይ ለኮሎው ያጠጋ ነበር. በወቅቱ ብዙ ዶክተሮች ኮሌራ "መጥፎ አየር" እንደሚከሰት ያምኑ ነበር. ሆኖም ኖቬም ይህ በሽታ ተላላፊ በሽታ እንደሆነ ተሰምቶት ነበር. ይህን ሀሳብ ለመሞከር, ኖው አሁን ተፈጥሯዊ ሙከራ ብለን ልንጠራጠር እንችላለን. በሁለት የተለያዩ የውኃ ኩባንያዎች ያገለገሉትን የቀበሮ የመኖሪያ ፍጥነቶች ያወዳድራሉ ሊንት እና ሳውዝራክ እና ቪሽሃል. እነዚህ ኩባንያዎች ተመሳሳይ ቤተሰቦችን ያገለገሉ ቢሆንም በጣም አስፈላጊ በሆነ መንገድ ይገለጡ ነበር-በ 1849 ማለትም ወረርሽኝ ከመጀመሩ ከጥቂት ዓመታት በፊት ሊባዝ ወደ ለንደን ከተፈሰሰው የውኃ ፍሳሽ ማሽኖች ወደታች ማዞር ሲገባ, ሳውዝራክ እና ቮልሃል ደግሞ ከምንጩ ውኃ ወደታች ከወጡ በኋላ የፍሳሽ ፍሳሽ. ሃውስ በሁለቱ ኩባንያዎች ከሚያገለግለው ቤተሰቦች መካከል ከኮሌጥ ጋር ሲወዳደር የደም ዌስት እና ቪሽ ሆል የተባሉ ደንበኞች ከኮሌጥ ለመሞት በአማካይ የ 10 እጥፍ ዕድል አላቸው. ይህ ውጤት በለንደን ከተማ በሚገኙ ተወካዮች ላይ የተመሠረተ ባይሆንም ለኮሎል ምክንያት ስለሆነው ኮንቬንሽን ጠንካራ የሆነ ሳይንሳዊ መረጃ ይሰጣል.
ይሁን እንጂ ከእነዚህ ሁለት ኩባንያዎች የተገኘው መረጃ ለተለያዩ ጥያቄዎች መልስ ለመስጠት ጥሩ አይሆንም ነበር; ወረርሽኙ በተከሰተበት ጊዜ ለንደን ውስጥ የኮሌራ በሽታ ምን ያህል ነበር? ለሁለተኛው ጥያቄ, ይህ ደግሞ አስፈላጊ ነው, ለንደን ውስጥ ተወካይ የሆኑ የተወካዮች ናሙና መኖር በጣም የተሻለ ይሆናል.
የበረዶው ሥራ እንደሚያሳየው የገለጻዎች ውክልና እጅግ በጣም ውጤታማ የሆነ እና ሌሎች ተገቢ ያልሆኑ ሌሎችም አሉ. እነዚህን ሁለት ዓይነት ጥያቄዎችን ለመለየት አንድ ድፍጣጣዊ መንገድ አንዳንድ ውስጣዊ-ናሙናዎች ውስጥ ስለሆኑ እና አንዳንዶቹ ከቅሞ የዋጋ ማጠቃለያዎች የተገኙ ናቸው. በሽታው እንዴት እንደሚያመጣ ለማሳየት አስችሏል. በዚሁ ጥናት ሪቻርድ ፑል እና ኤ.አርበርድ ፎል ወደ 25,000 ያህል ወንድ ዶክተሮችን ለበርካታ ዓመታት ተከታትለዋል እናም ጥናቱ ሲጀመር ሲጋራ በሚያጨሱት መጠን መሠረት የሞት መሞላት ተከታትሏል. ፑፕል እና ሂል (1954) ጠንካራ የተጋላጭነት እና ግንኙነት ምላሽ አግኝተዋል: በጣም በተጨነቁ ሰዎች ሲጨሱ በሳንባ ካንሰር ይሞቱ ነበር. እርግጥ ነው, በቡድን ዶክተሮች ውስጥ በብዛት የሚገኙትን የብሪታንያ ነዋሪዎች ሁሉ በሳንባ ካንሰር የመያዝ እድሉ ምንም አያስገርምም, ነገር ግን በንፅፅር ማወዳደር አሁንም ማጨስ የሳንባ ካንሰርን ያስከትላል.
በንጽመት ናሙናዎች እና ከንጥቅ ውጭ የሆኑ አጠቃላሜቶች መካከል ያለውን ልዩነት እኔ እስካሁን ያየሁ ሁለት ስሌኮች በቅደም ተከተል የተቀመጡ ናቸው. በመጀመሪያ, በወንድ ብሪቲሽ ዶክተሮች ናሙና ውስጥ የሴት ግንኙነት, የሴቶች እንግዶች, የእንግሊዘኛ ዶክተሮች ወይም ወንድ ብሪታንያዊ የፋብሪካ ሰራተኞች ና የሴት የጀርመን ፋብሪካ ሠራተኞች ወይም ሌሎች ብዙ ቡድኖች ውስጥ ሊኖር ይችላል. እነዚህ ጥያቄዎች አስደሳች እና አስፈላጊ ናቸው, ነገር ግን ከ ናሙና ወደ ህዝብ በምን ዓይነት ደረጃ ላይ መድረስ እንደምንችል ከማንሳት የተለዩ ናቸው. ለምሳሌ ያህል, በወንድ ብሪቲሽ ዶክተሮች ውስጥ በሚታየው ማጨስ እና ካንሰር መካከል ያለው ዝምድና ከሌሎች ቡድኖች ጋር ተመሳሳይ እንደሚሆን መጠራጠር ይጠበቅብዎታል. ይህንን ያለ ትርጓሜ የማድረግ ችሎታዎ ወንድ ወንዶችን የብሪታኒያ ዶክተሮች ከማንኛውም ህዝብ በተራ መዘዞች ነው. ይልቁንም ማጨስ እና ካንሰርን እንደሚያያይዝ ስለሚረዱት መገንዘብ ነው. በመሆኑም ሲሳል ይህም ከ ህዝብ ናሙና ከ ከምትታየው አንድ በአብዛኛው ስታትስቲካዊ ጉዳይ ነው, ነገር ግን ወደ ሌላ ቡድን በአንድ ቡድን ውስጥ የሚገኘው ጥለት ያለውን transportability ጥያቄዎች በአብዛኛው nonstatistical ጉዳይ ነው (Pearl and Bareinboim 2014; Pearl 2015) .
በዚህ ነጥብ ላይ ተጠራጣሪ የሆነ ሰው, ማጨስ እና ካንሰር ከሚለው ግንኙነት ይልቅ በአብዛኛው ማህበራዊ ቅጦች በተወሰኑ ቡድኖች ውስጥ የሚጓዙ ናቸው. እኔም በዚህ ተስማምቻለሁ. የትራንስፖርት ስርዓቶች ሊጓጓዙ እንደሚችሉ መጠበቅ የምንችልበት ደረጃ ላይ የሚሆነው በሳይንሳዊ ጥያቄ እና በንድፈ ሐሳብ እና በምስክሮች ላይ የተመረኮዘ ጥያቄ ነው. ንድፍ አውቶማቲክ መትከል የሚቻል ቢሆንም, መጓጓዣ አይኖረውም ብለን መገመት የለበትም. የመጀመሪያ ደረጃ ትምህርቶችን በመከታተል (Sears 1986, [@henrich_most_2010] ) ስለ ተመራማሪው ምን ያህል ሰዎች ስለእነርሱ ባህሪዎች ምን እንደሚማሩ ክርክሮች ተከትለው (Sears 1986, [@henrich_most_2010] ) ስለ ተንቀሳቃሽ የመጓጓዣ ጥያቄ ትንሽ ውስጣዊ ጥያቄዎች ያውቃሉ (Sears 1986, [@henrich_most_2010] ) . ይሁን እንጂ እነዚህን ውይይቶች ቢያስቆሙ ተመራማሪዎች የመጀመሪያ ዲግሪ ተማሪዎችን ከመማር ማስተማር እንደማይችሉ ማሰብ ምክንያታዊነት አይሆንም.
በሁለተኛው ማስጠንቀቂያ ላይ ያሉ አብዛኞቹ ተመራማሪዎች የበረዶ ወይም የፑትና ሂል እንደ ጥንቃቄ አይቆጠሩም. እናም, ተመራማሪዎች ከምርጫው መረጃ ውጭ ያለ ናሙና ማነጣጠር ለማድረግ ሲሞክሩ ምን እንደሚሳለጉ ለመግለጽ, ስለ አልጄራኒ ሙስዬጃን እና ባልደረቦቼ (2010) 2009) ስለ 2009 የጀርመን ፓርላማ ጥልቀት ስላለው ጥናት ልንነግርዎ እፈልጋለሁ. ከ 100,000 በላይ ትንተናዎችን በመተንተን, አንድ የፖለቲካ ፓርቲን የሚጠቁሙ ድህረቶች በፓርላማ ምርጫ የቀረቡትን ፓርቲዎች ብዛት ከግምት ውስጥ በማስገባት ተስተውለዋል (ምስል 2.3). በሌላ አነጋገር በዋናነት በነጻ የነበረው የዊንዶውስ መረጃ በተወካይ ውሂቡ ላይ አጽንኦ በመስጠት ምክንያት ውድ የሆኑትን የህዝብ አስተያየት ዳሰሳዎች ሊተካ ይችላል.
ስለ Twitter ስለምታዋውቅዎ ወዲያውኑ ይህንን ውጤት ተጠራጣ መሆን ይገባዎታል. ጀርመናውያን በቲውተር ላይ በ 2009 በጀርመን ውስጥ ድምጽ ሰጪዎች ናሙና አልነበሩም እናም አንዳንድ ፓርቲዎች ደጋፊዎች ከሌሎች ፖለቶች ይልቅ ደጋግመው ፖለቲካን ሊሰርዙ ይችላሉ. ስለዚህም, ሊታዩ የሚችሉዋቸው ሊሆኑ የሚችሉ ማናቸውንም ጭብጦች ይገለላሉ, ይህም ይህ መረጃ በቀጥታ የጀርመን መራጮች እንዲያንፀባርቅ ያደርጋል. እንዲያውም, Tumasjan et al. (2010) በጣም ጥሩ ሆኖ ተገኝቷል. በፓርላማ ውስጥ አንድ ፓርላማ ጁርግንስ እና ሃራልድ ሻን (2012) የተባለ የክትትል ወረቀቱ ቀደምት ትንታኔው በፖስታ ላይ የበለጠ መረጃውን በፖስታ ያገኙትን ፖለቲካዊ ፓርቲን ለፓርተር ሰጥቷል - ፒርፓት ፓርቲ, አንድ የመንግስት ደንብ ስለ ኢንተርኔት. የፓሪው ፓርቲ በትምርት ውስጥ ተካትቶ በነበረበት ጊዜ, የ Twitter መድረኮች የምርጫ ውጤቶችን አስከፊ ትንበያ (ስዕል 2.3). ይህ ምሳሌ እንደሚያሳየው, ከቅጽጽ ውጭ የሆኑ ትላልቅ የውሂብ ምንጮችን በመጠቀም ለትርፍ ያልተሠሩ ትላልቅ አጠቃቀሞች መጠቀም በጣም የተሳሳቱ ሊሆኑ ይችላሉ. በተጨማሪም 100,000 ትራንስቶች እንደማያነቡ መገንዘብ አስፈላጊ አለመሆኑን ልብ ይበሉ: ብዙ ውክልና ያልሆነ መረጃ አሁንም ተወካይ ሆኖ ወደ ምእራፍ 3 እመለሳለሁ.
ለማጠቃለል ብዙ ትላልቅ የመረጃ ምንጮች በተወሰኑ በደንብ ከተወሰኑ ህዝብ የሚወክሉ ናሙናዎች አይደሉም. ከ ናሙናው የተገኘ ውጤትን ወደ ተሰብሳቢው ህዝብ ማጤን ለሚጠይቁ ጥያቄዎች ይህ ከባድ ችግር ነው. ሆኖም ግን በአነስተኛ ናሙና ሲነጻጸር ለሚነሱ ጥያቄዎች, ተመራማሪዎቹ ስለ ናሙና ባህሪያት እና ስለ መጓጓዣ ጥያቄ ከንድፈ ሃሳባዊ ወይም ከተጨባጩ ማስረጃዎች ጋር ግልጽነት እስከላቸው ድረስ, የቀረበ ውክልና ሊኖረው ይችላል. እንደ እውነቱ ከሆነ, ትላልቅ የመረጃ ምንጮችን ተመራማሪዎች ብዙ የፕሮጅክቶች ጥምርተኞችን በንፅጽር ጥቃቅን ተመጣጣኝ ጥቆማዎች ውስጥ እንዲጨምሩ ያስችላቸዋል, እናም በእኔ ግምቶች ከብዙ የተለያዩ ቡድኖች ግምቶች ማህበራዊ ምርምርን የበለጠ ለማምጣት ከ "ሊደርሱበት" ናሙና.