غیر غیرمعمولي معلومات د نمونو څخه د نمونې عمومي کولو لپاره خراب دي، مګر کیدای شي د نمونې پرتله کولو لپاره خورا ګټور وي.
ځینې ټولنیز ساینس پوهان د هغو معلوماتو سره کار کوي چې د یوې باثباته اوسیدونکي نفوس څخه د ناڅاپي ناڅاپي نمونې څخه راځي، لکه د یو ځانګړي هیواد ټول لویان. دا ډول معلومات د استازو ډاټا په نامه یادېږي ځکه چې نمونه "لوی" نفوس استازیتوب کوي. ډیری څیړونکي د انعام نماینده ډاټا، او ځینې، د استازو ډاټا د سختو ساینس سره مطابقت لري پداسې حال کې چې غیر غیرمقانوني معلومات د وړتیا سره مطابقت لري. په ډیری سختو کې، ځینې شکایات داسې انګیرل کیږي چې د غیر غیرقانوني معلوماتو څخه هیڅ شی نشي زده کولی. که سمه وي، داسې ښکاري چې په جدي ډول محدودیت محدود شي چې د سترو ارقامو سرچینو څخه زده شوي وي ځکه چې ډیری یې غیر غیرمعمولي دي. له نېکه مرغه، دا شکایات یوازې یوه برخه ده. د څیړنې ځینې موخې شتون لري چې لپاره غیر غیرمعمولي معلومات په روښانه توګه نه دي برابر شوي، مګر داسې نور شتون لري چې دا به په حقیقت کې خورا ګټور وي.
د دې توپیر په پوهیدو سره، اجازه راکړئ یو ساینسي کلاسيک وګورئ: په لندن کې د 1853-54 د کولرا د وینې د جان سنوس مطالعه. په هغه وخت کې ډیری ډاکټرانو په دې باور وو چې کولرا د "هوا هوا" له کبله رامنځ ته شوی و، مګر واورې په دې باور وو چې دا یو انتاني ناروغي وه، شاید د څښاک د څښلو څښلو اوبو له لارې خپور شي. د دې مفکورې ازموینې لپاره، سنوس د هغه څه څخه ګټه پورته کړه چې اوس موږ طبیعی تجربه غواړو. هغه د کولرا د کور نرخونه پرتله کړل چې د دوو مختلفو کمپنیو لخوا یې کار کاوه: لامټیت او ساوتروک او ویک اله. دا شرکتونو ورته کورنۍ ورته خدمت کړی، مګر دوی په یو مهم طریقه سره توپیر درلود: په 1849 کې - د ایډیډیمیک څو کاله مخکې پیل شو - لیمت د لندن په ختیځ کې د فاضله موادو د ویجاړولو څخه خپل وقف ځای ته واړاوه، پداسې حال کې چې ساوتروک او ویک الهال له خپل کانال څخه د پایپ پایپ لرې پریښوده د فاضله موادو ویستل. کله چې واورې د کولرا په کورنۍ کې د دوو کورنیو شرکتونو لخوا د مړینې کچه راټیټ کړه، هغه وموندله چې د سایټارک او ویکس هلال مشتریانو پیرودونکي چې د مشتریانو خړوبونکي اوبه چمتو کوي - د کولرا څخه مره لس ځله ډیر احتمال لري. دا نتیجه د کولرا د لامل په اړه د واورې د بحث لپاره قوي سائنسي شواهد وړاندې کوي، حتی که دا د لندن په خلکو کې د استازیتوب نمونې پر بنسټ نه وي.
په هرصورت، د دغو دوو شرکتونو معلومات به د مختلف پوښتنو ځواب ویلو لپاره مثالی نه وي: په لندن کې د وینې په جریان کې کولرا کول څه و؟ د دویمې پوښتنې لپاره، کوم چې خورا مهم دی، دا به ډیر ښه وي چې د لندن څخه د خلکو استازي نمونې ولري.
لکه څنګه چې د واورې کار څرګندوي، ځیني علمي پوښتنې شتون لري چې غیر غیرمعمولي معلومات ډیر اغیزمن وي او داسې نور شتون لري چې دا ښه نه وي. د دوو ډوله پوښتنو توپیر لپاره یو خامه لاره دا ده چې ځینې پوښتنې د نمونې په دننه نمونو کې دي او ځینې یې له نمونو څخه بهر نمونې په اړه دي. دا توپیر کولی شي د ایډیدیمولوژۍ په برخه کې د بل کلاسیک مطالعې لخوا نور هم روښانه شي: د برتانوي ډاکټرانو مطالعې، چې په ښودلو کې یې مهم رول لوبولی و، سرطان یې د سرطان سبب ګرځي. په دې څیړنه کې، ریچارډ ګیګ او اې برادفیل هیل د څو کلونو لپاره شاوخوا 25،000 نارینه ډاکټران پیروي او د دوی د مړینې کچه یې د مطالعې په پیل کې د هغو پیسو پر بنسټ پرتله کړه. ګیګ او هیل (1954) د پیاوړتیا د غبرګون اړیکه موندلې ده: د ډیرو زیاتو خلکو ساه اخیستلو، ممکن د دوی د سږو د سرطان څخه مړ شي. البته دا به د نارینه ډاکټرانو د دې ډلې پر بنسټ د بریتانوي خلکو په منځ کې د عفونت سرطان پراخیدو اټکل نه وي، مګر د نمونې دننه پرتله هم لاهم شواهد چمتو کوي چې سګرټ د سږو د سرطان سبب ګرځي.
اوس چې ما د دننه نمونو پرتله کولو او نمونه عمومي نمونې ترمنځ توپیر روښانه کړی، دوه caveats په ترتیب کې دي. لومړی، په طبیعي توګه د نارینه برتانوي ډاکټرانو نمونه کېدای شي هغه اړیکې چې د ښځینه، بریتانوي ډاکټرانو یا د بریتانیا د برتانوي فابریکه کارمندانو یا د آلمان د ښځینه فابریکه کارمندانو یا ډیری نورو ډلو کې ساتل کیږي. دا پوښتنې په زړه پورې او مهم دي، مګر دوی د هغه حد په اړه توپیر لري چې موږ یې د نمونې څخه د خلکو نمونه عمومي کولی شو. یادونه، د مثال په توګه، تاسو شاید شک ولرئ چې د سګرټ څښاک او سرطان ترمنځ اړیکه چې د بریتانیا نارینه ډاکټرانو کې موندل شوي وي شاید ممکن په دې نورو ډلو کې ورته وي. ستاسو د لیږد توان د دې واقعیت څخه نه دی راغلی چې د بریتانیا نارینه ډاکټران د هر نفوس له پلوه یو باثباته نمونه وي؛ بلکې دا د میکانیزم د پوهې څخه راځي چې د سګرټ څکولو او سرطان سره تړاو لري. په همدې توګه، د نفوس لپاره د نمونې عمومي کول په لویه کچه د احصایوي مسلو موضوع ده، مګر په یوه ګروپ کې د یوې ډلې په ډله کې د نمونو د لېږدولو په اړه پوښتنې تر ډیره حده غیر غیر (Pearl and Bareinboim 2014; Pearl 2015) مسله ده (Pearl and Bareinboim 2014; Pearl 2015) .
په دې وخت کې، یو شکمن ښایي دا معلومه کړي چې ډیری ټولنیز نمونې د سګرټ څکولو او سرطان ترمنځ اړیکو په پرتله د ډلو په پرتله لږ ترانسپورت وړ دي. او زه موافق یم تر کومه حده موږ باید داسې توقع وکړو چې د نقل وړ وړتیاوې په پای کې یو ساینسي پوښتنه ده چې باید د تیورۍ او شواهدو پر بنسټ پریکړه وشي. دا باید په اتوماتیک ډول ونه پیژندل شي چې نمونه به د لېږد وړ وي، مګر نه باید دا فرض شي چې دوی به د لېږد وړ نه وي. د ټرانسپورتنې په اړه د دې ځینې لنډیز پوښتنې به تاسو ته خبر وي که تاسو د مناظرو تعقیب کړی چې د لیسانس محصلینو (Sears 1986, [@henrich_most_2010] ) مطالعې له لارې د انساني چلند په اړه څومره څیړونکي زده کولی شي. په هرصورت، د دې بحثونو سره سره، دا به نامناسب وي چې ووایې چې څیړونکي نشي کولی د لیسانس زده کونکو د زده کړې څخه څه شی زده کړي.
دوهم سمیټ دا دی چې ډیری څیړونکي د غیر غیرمعمولي معلوماتو سره سم د واورو یا ګیرو او هیل په څیر د پام وړ ندي. نو، دا معلومه کړئ چې کله څیړونکي هڅه کوي د غیر غیرمعمولي معلوماتو څخه د نمونې عمومي کولو څخه ډډه وکړي، زه غواړم تاسو ته د 2009 کال د آلمان پارلمان پارلماني ټولټاکنو په اړه اندریک تیماسان او همکاران (2010) مطالعه کړي. د 100،000 څخه زیات د میتودونو تحلیل سره، دوی وموندل چې د ټیمونو تناسب سیاسي ګوند ته په پارلماني ټاکنو کې د رایو د هغه برخې تناسب بیانوي (شمیره 2.3). په بل عبارت، دا معلومه شوه چې د ټویټر ډاټا، کوم چې په اصل کې وړیا و، کیدای شي د دودیزو عامه نظرونو سروې بدل کړي، چې د نمایندګۍ ډاټا باندې د دوی ټینګار له امله ګرانه دي.
تاسو ته د ټویټر په اړه څه پوهیږئ، تاسو باید ژر تر ژره د دې پایلې شکمن شي. په 2009 کال کې په ټویټر کې آلمانانو د آلمان د رایه ورکونکو احتمالي بې ساري نمونه نه درلوده، او د ځینو ګوندونو پلویان ښايي د سیاست په اړه د نورو ګوندونو د ملاتړو په پرتله ډیر تکرار کړي. په دې توګه، حیرانیدونکي ښکاري چې ټول ممکنه اړخونه چې تاسو تصور کولی شئ یو څه به رد شي ترڅو دا ډاټا په مستقیم ډول د آلمان رایه ورکوونکو څخه منعکس وي. په حقیقت کې، Tumasjan et al. (2010) د ریښتیا واقع کیدو لپاره ښه وګرځید. د آرریس جونګیر، پیسل جورسن، او هارډال شینګ (2012) لخوا د تعقیب شوي کاغذ لخوا اشاره وشوه چې اصلي تحلیل هغه سیاسي ګوند نه دی ګوښه کړی چې په حقیقت کې په ټویټر باندې تر ټولو زیات نظرونه لري: د سمندری غړی ګوند، یو کوچنی ګوند چې د حکومتي مقرراتو سره مبارزه کوي. د انټرنېټ. کله چې د قزاقستان ګوند په تحلیل کې شامل شو، د ټویټر یادونه د ټولټاکنو د پایلې یو خطرناکه پیژندل کیږي) 2.3 شکل (. لکه څنګه چې د دې مثال څرګندوي، د نمونې عمومي نمونې ترسره کولو لپاره د غیر متمرکز لوی ډیټا سرچینې کارول کیدای شي ډیر غلط وي. همدارنګه، تاسو باید په دې پوه شئ چې د 100،000 تیلیفونونه شتون لري اساسا غیرمعمولي وو: ډیری غیرمعمول معلومات اوس هم غیر استازی دی، هغه موضوع چې زه به په درېم څپرکی کې بیرته راشم. کله چې زه سروې ګانو خبرې کولې.
د پای ته رسولو لپاره، ډیری لوی ارقام سرچینې د ځینې ښه ټاکل شوي نفوس څخه استازیتوب نمونې ندي. د هغو پوښتنو لپاره چې د نمونې پایلې عمومي کولو ته اړتیا لري د اړتیا له مخې چې دا راټیټ شوی وي، دا یو جدي ستونزه ده. مګر د داخلي نمونې پرتله کولو په اړه د پوښتنو لپاره، غیر غیرمعمولي معلومات ممکن ځواکمن وي، تر څو چې محققین د خپل نمونې ځانګړتیاو او د تیوریکي یا تجربه شواهدو سره د ټرانسپورت کولو په اړه د ادعاونو مالتړ کوي. په حقیقت کې، زما هیله دا ده چې د ډاټا لوی لوی سرچینې به څیړونکي په ډیرو غیرمعمولي ډلو کې نور داخلي نمونې پرتله کړي، او زما اټکل دا دی چې د ډیرو مختلفو ډلو اټکل به د یو واحد اټکل له مخې د یوې اټکل په پرتله د ټولنیزې څیړنې دمخه ډیر څه وکړي. نمونه.