Rapprisintazzioni hè di circa facennu inferences da u vostru respondents to your pupulazzioni testu.
In u modu di fà capiscia u tipu di sbagghi chi pò capitari quandu inferring da respondents à la pupulazzioni cchiù granni, ch'elli l'guardà u tabac paglia Lingua Digest ca pruvò a predict u risultatu di l'elezzione US Presidential 1936. Puru siddu si era più di 75 anni fa, stu Débâcle hà sempri una lezziò di primura di trasmetta circadori oghje.
Lingua Digest era una rivista ginirali-intaressu pupulare, è principianu in u 1920, si messe in polls paglia à predict u outcomes di Culture Presidential. Pi fari sti divi ch'elli si mandà à Méral a carchi di pòpulu, e poi simpricimenti tally up u Méral ca vìnniru turnò; Lingua Digest fiertà cuntatu ca lu Méral ch'elli ricivutu si né "linguistic, pulito, nè interpretati." Sta prucedura di l 'uperazione prividiri lu vincitrice di l 'elezzioni in 1920, 1924, 1928 è u 1932 in 1936, a l' internu di l 'Granni Diprissioni, Lingua Digest mannò fora Méral a 10 miliuna di pirsuni, li cui nomi guasgi vinia da cartulari liberta, è ricordi iscrizzione Automobile. Quì l'cuòmu avièvanu discrittu e so mituduluggìa:
"Movi màcchina liscia-curriri LA l'aime cù u sveltu, a precisione di trenta anni 'sperienza à accurtà guesswork à custatti dura. . . .This Semaine 500 pens spuntati di più chè un quartu di un miliuni di saluti di un ghjornu. Ogni ghjornu, in una stanza granni altu sopra à moteur-ribboned Rafale Avenue, in New York, 400 travagliadori lampu deftly un miliuni d 'oru di stampato a materia-abbastanza to pave quarantina di a cità blocchi-ni la envelops infurmazione [santo]. Ogni ora, in a so Post Office d 'Ogliastriccia LA Digest'S, trè chattering machini, affrancatura, di metering murata è solare u oblongs bianchi; Dipoi sempre, pustali abili elli flipped in stralunati mailsacks; Camion, la flotta di Digest sped elli à ricaccià email-treni. . . simana dopu, lu primu risposte da sti deci millioni si mittaranu i marea ricevuti di Méral marcate, à esse triplici-verificatu, liste, cincu-volte cross-coureur e totaled. Quandu l 'ultima fiura has been totted è cuntrullà, s'ellu sperienza passatu hè un critère, u paese si cunnosce à moins de una Fraction di 1 pi centu u votu populari di cuncertazione di quaranta miliuna [elettori]. "(22 di austu, 1936)
fetishization l'aime di taglia è a necessità recognizable à ogni militante "grandi données" oggi. Di lu 10 miliuna di Méral distribuitu, un maravigghiusu 2.4 millioni Méral foru ritornu-ca l'armali 1,000 volte più maiò cà mudernu polls pulitica. Da sti 2.4 millioni respondents u appillari era chjaru: Lingua Digest prividiri chì u spurghi Alf Landon, andavanu à batta u Incumbent Franklin Ambert. Ma, in fattu, accadutu u esattu cuntrariu. Roosevelt battenu Landon a statu na frana. Cumu pudia Lingua Digest andà di mali cu tantu di dati? A nostra capiscitura muderna di sediment faci errori, d'Lingua Digest chjaru è ci aiuta à noi evitari di fari errori, sìmili a lu futuru.
Stantare è decisi su sediment ci hè bisognu à guardà quattru gruppi di pirsuni (Figura 3.1). U primu gruppu di persone è a pupulazioni testu; chistu è lu gruppu chi la ricerca definisce com'è a populazione d'interessu. Nta lu casu di Lingua Digest la pupulazzioni testu era elettori à l 'air france 1936. Dopu à purtau nantu à una populazione di testu, un militante ci vole à cantu à u sviluppu di una lista di genti ca pò essiri usatu pi sediment. Sta lista si chjama un quadru sediment e la pupulazzioni era in u quadru sediment veni chiamatu a pupulazioni ind'u quadru. Nta lu casu di Lingua Digest la pupulazzioni quadru era u 10 miliuna di pirsuni ca de famille fù guasgi da cartulari liberta, è ricordi iscrizzione Automobile. Manera ideali di la pupulazzioni di testu, è a pupulazioni ind'u quadru saria esattamente a stessa, ma in pratica chista è spissu nun è lu casu. Diffirenzi tra li pupulazzioni di testu, è a pupulazioni ind'u quadru sò chjamati errore animali. errore MariaRita ùn, par iddu stissu a guaranzia di prublemi. Ma, si lu populu in la pupulazzioni frame, chjamate sfarente da populu ùn a li pupulazzioni frame, ùn ci sarà lu priggiudizziu animali. Errore MariaRita fu lu primu di la maggiuri pecchì cu lu tabac Lingua Digest. Ci vulia à amparà elettori-ca era u so testu pupulazzioni-ma avianu custruitu un quadru sediment guasgi da cartulari liberta e registries Automobile, fonti chì più di-rapprisintatu wealthier miricani ca eranu di più atta à cuncretizà Alf Landon (richiamari ca tutti dui di sti ticnoluggìa, chì sò oghje cumunu, èranu rilitivamenti nova à u tempu è chì u US era in l 'internu di l' Granni Diprissioni).
Dopu à definisce a pupulazioni ind'u quadru, u passu prossimu è chiddu di na ricerca di selezziunà i pupulazioni campionu; chisti sunnu lu pòpulu ca li so ricerca vi puru à u candidatu. Sè u campionu hà caratteristiche diffirenti ca la pupulazzioni quadru, tandu si pò presentà errore sediment. Chistu è lu tipu di sbagghiu quantificà in i margini di errore ca di sòlitu accumpagna estimates. Nta lu casu di li scars Lingua Digest, ùn ci intreccia era micca campionu; si cuntinuava pruvari a cuntattu tutti in a pupulazioni ind'u quadru. Ancu sè ùn ci era nimu errore sediment, ci era viotu o ancora errore. Stu clarifies chì i marghjini di sbagli chì sò tipicamenti cuntatu cun estimates da Salumeria sunnu di sòlitu misleadingly piccula; ch'elli ùn s'intendi cù tutti i fonti di errore.
Infine, un militante prova a Salentu ognunu in a pupulazioni campionu. Ddi pirsuni ca sunnu interviewed successu sò chjamati respondents. Manera ideali, la pupulazzioni campionu e lu respondents saria esattamente a stessa, ma in pratica ùn ci hè micca risposta. Pirtantu, li genti chi sò ritenuti à u campionu ricusu di participà. Si la genti chi rispunniri paroli sunnu diffirenti di chiddi ca nun rispunnì, tandu ùn ci pò esse lu priggiudizziu non-risposta. Priggiudizziu Non-risposta era lu secunnu prubblema cu lu tabac Lingua Digest. Solu 24% di a ghjente chì ghjunghje à bientôt tantu, e si girava subbitu ca genti ca scigghìu Eau eranu più atta à almanaccà risposte contru.
Vangelo, ghjustu esse un asempiu à presentà u idee di rapprisintazzioni, u tabac Lingua Digest hè una paràbula rulogghiu di-ripetutu, cautioning circadori circa lu rinunziò di sediment haphazard. Per disgrazia, mi pari ca lu lezzioni ca tanti pirsuni invintà da sta storia, hè quellu chì hè tortu. Li murali più cumuna di u racontu hè chì circadori ùn pò amparà nunda da analise non-prubabilità (vale à dì, analise senza i so custumi regule prubabilità-based di sceltu i participanti). Ma, comu I Mulateri Di L'vede più tardi in stu capitulu, chì ùn hè calmu diritta. Invece, pensu chi ci sunnu propriu du 'morals à sta storia; morals ca sunnu comu veru oghje mentre ch'elli eranu in 1936. Prima, un gran numeru di dati haphazardly racolta ùn sarà guaranzia di un bon stimata. Siconda, circadori tuccherà à un cuntu di quantu so dati fu arricugghiutu, quand'elli sò solu estimates da lu. Nta àutri paroli, picchì lu prucessu di cullezzione di dati dans le tabac Lingua Digest era digià skewed versu certi respondents, circadori tocca à aduprà un prucessu Aurelia più cumplessu chì pesi certi respondents più chè l 'altri. In seguitu à stu capitulu, I Mulateri Di L'mustrà unu tali chila a prucedura-post-stratificazzioni-ca pò parmetta à voi di fà megliu estimates cu analise non-prubabilità.