Képviselet arról szól, hogy következtetéseket a válaszadók a célcsoportot.
Ahhoz, hogy megértsük az ilyen típusú hibák, ami történhet, ha arra következtetett válaszadók a népesség nagyobb, nézzük meg az Irodalmi Digest szalma szavazást, amely megpróbálta megjósolni a kimenetelét a 1936 amerikai elnökválasztás. Annak ellenére, hogy több mint 75 évvel ezelőtt, ez a bukás még egy fontos tanulsága a kutatók manapság.
Irodalmi Digest volt népszerű közérdekű magazin, és a kiindulási 1920 kezdték futó szalma-kutatások megjósolni a kimenetelét Elnökválasztás. Ahhoz, hogy ezek a jóslatok, hogy elküld szavazólapok sok emberrel, majd egyszerűen nem illeszkednek be a fordulót, hogy visszaadták; Irodalmi Digest büszkén számolt be, hogy a szavazólapon kaptak arra sem "súlyozott, be, sem értelmezhető." Ez az eljárás helyesen jósolta a győztes a választások 1920, 1924, 1928 és 1932-ben 1936, a közepén a nagy gazdasági világválság, irodalmi Digest kiküldött fordulót a 10 millió ember, akiknek a nevét túlnyomórészt származott telefonkönyvek és a gépjármű nyilvántartás alapján. Itt van, hogyan le a módszertan:
"A Digest zavartalan gép mozog a gyors precíziós harminc év tapasztalat, hogy csökkentsék a találgatás, hogy a kemény tényeket. . . .A Héten 500 toll karcos ki több mint egy negyed millió címet egy nap. Minden nap, egy nagy szobában magasan motor hajdíszes Fourth Avenue, New York-ban, 400 munkást ügyesen csúszik egy millió darab nyomtatott anyag-elég, hogy előkészítsék negyven háztömbök-be a címzett borítékok [sic]. Minden órában, a Digest saját Post Office alállomás, három fecsegő postai adagoló gépek lezárt és lepecsételt fehér téglalapok; képzett postai alkalmazottak tükrözött őket domború mailsacks; flotta DIGEST- teherautók száguldott számukra, hogy kifejezzék mail-vonatok. . . A jövő héten az első válaszok ezektől tízmillió kezdődik a dagály jelzett szavazatok, hogy tripla ellenőrizni, ellenőrizni, ötször több minősített, és elérte. Amikor az utolsó szám már totted, ellenőrizni, hogy a múltbeli tapasztalatok olyan kritérium, az ország tudni fogja, hogy töredéke alatt 1 százalékos tényleges népszavazáson negyvenmillió [szavazók]. "(Augusztus 22, 1936)
A Digest fetisizálása mérete azonnal felismerhető minden "nagy adat" kutató ma. A 10 millió fordulót elosztott, egy csodálatos 2,4 millió szavazateltulajdonításról vissza-ez nagyjából 1000-szer nagyobb, mint a modern politikai közvélemény-kutatások. Ezekből 2400000 válaszadók a döntés egyértelmű volt: Irodalmi Digest azt jósolta, hogy a kihívó Alf Landon fog legyőzni az inkumbens Franklin Roosevelt. De valójában az ellenkezőjét történt. Roosevelt legyőzte Landon egy földcsuszamlás. Hogy Irodalmi Digest baj annyi adatot? A modern megértését mintavételi teszi Irodalmi Digest hibákat világos, és segít elkerülni a hasonló hibák a jövőben.
Tisztán gondolkodni körülbelül mintavétel esetén bennünket arra, hogy négy különböző embercsoportok (3.1). Az első csoport az emberek a célcsoportot; ez a csoport, amely a kutatás határozza meg, mint a lakosság érdekeit. Abban az esetben, irodalmi Digest a célcsoportot volt szavazók a 1936 elnökválasztást. Miután eldöntötte, a célcsoport, a kutató mellett ki kell alakítania egy listát az emberek, hogy lehet használni a mintavételhez. Ez a lista az úgynevezett mintavételi keret, valamint a lakosság a mintavételi keret az úgynevezett keret lakosságot. Abban az esetben, irodalmi Digest keret lakosság 10 millió ember, akiknek a neve jött túlnyomórészt telefonkönyvek és a gépjármű nyilvántartás alapján. Ideális esetben a célcsoport és a keret lakosság lenne pontosan ugyanaz, de a gyakorlatban ez gyakran nem így van. Különbségek a célcsoport és a keret lakosság nevezzük lefedettségi hiba. Lefedettségi hiba nem önmagában garantálja problémákat. De, ha az ember a keretben népesség szisztematikusan eltérnek az emberek nem a keretben lakosság nem lesz fedezet elfogultság. Lefedettségi hiba volt az első a nagy hibákat a Literary Digest közvélemény-kutatás. Azt akarták, hogy megtudjuk, a szavazók-ez volt a célcsoportot, de építettek egy mintavételi keret túlnyomórészt telefonkönyvek és személygépkocsi nyilvántartások, források, hogy felülreprezentáltak gazdagabb amerikaiak, akik nagyobb valószínűséggel támogatják Alf Landon (visszahívás, hogy mindkét technológia, amelyek gyakoriak a mai, viszonylag új idején, és hogy az Egyesült Államok volt a közepén a nagy gazdasági világválság).
Meghatározása után a keret lakosság, a következő lépés egy kutató, hogy kiválassza a vizsgált populáció; Ezek azok az emberek, hogy a kutató megpróbálja interjút. Ha a minta eltérő tulajdonságokkal rendelkezik, mint a keret lakosság, akkor tudjuk be a mintavételi hiba. Ez a fajta hiba mennyiségileg a hibahatár, mely a leggyakrabban becsléseket. Abban az esetben, az Irodalmi Digest fiaskó, ott valóban nem volt példa; megpróbálták felvenni a kapcsolatot mindenki a keretben lakosság. Annak ellenére, hogy nem volt mintavételi hiba, ott nyilván mindig hiba. Ez egyértelművé teszi, hogy a különbözetet a hiba, hogy jellemzően jelentett becslései felmérések általában félrevezető kicsi; azok nem tartalmaznak minden hibaforrást.
Végül, a kutató megpróbálja interjút mindenki a vizsgált populáció. Azok az emberek, amelyek sikeresen megkérdezett válaszadók nevezzük. Ideális esetben a vizsgált populáció és a válaszadók pontosan ugyanaz, de a gyakorlatban igen nem választ. Vagyis az emberek, akik a mintaként kiválasztott nem vesznek részt. Ha az emberek, akik reagálnak eltérnek, akik nem reagálnak, akkor lehet nem választ elfogultság. Nem válasz elfogultság volt a második fő probléma az Irodalmi Digest közvélemény-kutatás. Csak 24% -át az emberek, akik a szavazás válaszolt, és kiderült, hogy az emberek, akik támogatták Landon nagyobb valószínűséggel reagálnak.
Többet jelent egy példát, hogy vezessenek be az ötletek képviseletének, az Irodalmi Digest közvélemény-kutatás egy sokat ismételt példázat, figyelmeztetve a kutatók, hogy milyen veszélyekkel hányva mintavétel. Sajnos, azt hiszem, hogy a leckét, hogy sokan merítenek ez a történet a rossz. A leggyakoribb történet tanulsága az, hogy a kutatók nem tudják megtanulni semmit nem valószínűségi mintát (azaz mintákat anélkül, hogy szigorúan valószínűség-alapú kiválasztási szabályai résztvevő). De, mint én megmutatom később ebben a fejezetben, ez nem egészen igaz. Ehelyett azt hiszem, valóban két erkölcs ezt a történetet; erkölcs, amelyek olyan igaz ma, mint volt 1936-ban először, nagy mennyiségű véletlenszerűen gyűjtött adatok nem garantálják a jó becslést. Másodszor, a kutatók számításba kell venni, hogy milyen az adatokat gyűjtötték, ha ők így becslések belőle. Más szóval, mivel az adatgyűjtés az irodalmi Digest közvélemény-kutatás rendszeresen ferde felé néhány válaszadó kutatók kell használni a bonyolultabb becslési folyamat, amely súlyok egyes válaszadók több, mint mások. Később ebben a fejezetben megmutatom, egy ilyen súlyozás eljárás post-rétegződés-, amelyek lehetővé teszik, hogy jobban meg tudják becsülni a nem valószínűségi mintákon.