Edustus on kyse siitä päätelmiä oman vastaajien omaan kohderyhmä.
Jotta ymmärtää sellaista virheitä, jotka voivat tapahtua, kun päätellyt vastanneista enemmän asukkaita, Tarkastellaan Literary Digest vaaligallup jotka yrittivät ennustaa vuoden 1936 Yhdysvaltain presidentinvaaleissa. Vaikka se oli yli 75 vuotta sitten, tämä fiasko on edelleen tärkeä opetus opettaa tutkijat tänään.
Literary Digest oli suosittu yleisen edun aikakauslehti, ja vuodesta 1920 he alkoivat käynnissä olki gallupit ennustaa tuloksia presidentinvaalit. Jotta nämä ennustukset he lähettää äänestyslippujen paljon ihmisiä, ja sitten yksinkertaisesti täsmäävät ylös äänestysliput jotka palautettiin; Literary Digest ylpeänä kertoi, että äänestysliput he saivat olivat ole "painotettu, säädetty, eikä tulkitaan." Tämä menettely oikein ennusti voittaja vaalien vuonna 1920, 1924, 1928 ja 1932. vuonna 1936, keskellä Great Depression, Literary Digest lähetetään äänestysliput 10 miljoonaa ihmistä, joiden nimet pääasiassa tuli puhelinluetteloita ja auto rekisteröinti kirjaa. Näin he kuvasivat menetelmää:
"THE Digest kitkaton kone liikkuu nopeaa tarkkuus kolmenkymmenen vuoden kokemus vähentää arvailua koviin tosiasioihin. . . .Tämä Viikko 500 kynät naarmuuntua pois yli neljännesmiljoona osoitteita päivässä. Joka päivä, joka suuri huone korkealla moottori-ribboned Fourth Avenue, New York, 400 työntekijää taitavasti liukua miljoona kappaletta painotuotteet-riitä tasoittamaan neljäkymmentä kortteleita-osaksi osoitettu kirjekuoret [sic]. Joka tunti, Digest oma posti Substation, kolme kalisten postikulut mittaus koneita suljettu ja leimattu valkoista oblongs; taitava postin työntekijät kääntää ne pullottava mailsacks; laivaston DIGEST kuorma kiiti heitä pikapostipalveluun-junia. . . Ensi viikolla, ensimmäinen vastauksia näistä kymmenen miljoonaa alkavat saapuvan vuorovesi merkittyjä äänestysliput, olla kolminkertainen tarkastetaan, tarkastetaan viisi kertaa rajat luokiteltu ja oli. Kun viimeinen luku on totted ja tarkastettu, jos aikaisempi kokemus on kriteeri, maa tietää sisällä murto-1 prosenttia todellista kansanvaalilla on neljäkymmentä miljoonaa [äänestäjät]. "(22 elokuu 1936)
Digest n fetishization koosta on heti tunnistettavissa mitään "iso tiedot" tutkija tänään. Niistä 10 miljoonaa äänestysliput jaettu, hämmästyttävä 2,4 miljoonaa äänestyslippuja palautettiin-se noin 1000 kertaa suurempi kuin nykyaikainen poliittisia äänestyksiä. Näistä 2,4 miljoonaa vastaajat tuomio oli selvä: Kirjallisuuden Digest ennustaa, että haastaja Alf Landon aikoi voittaa vakiintuneiden Franklin Roosevelt. Mutta itse asiassa juuri päinvastaiseen suuntaan. Roosevelt voitti Landon on murskavoiton. Miten Literary Digest mennä vikaan niin paljon tietoa? Nykyaikainen käsitys näytteenoton tekee Literary Digest virheitä selkeä ja auttaa meitä välttämään vastaavat virheet tulevaisuudessa.
Ajatella selkeästi noin näytteenotto vaatii meitä pohtimaan neljään eri ihmisryhmiin (Kuva 3.1). Ensimmäinen ryhmä ihmisiä on kohderyhmän; tämä on ryhmä, että tutkimus määrittelee väestön etua. Kun kyseessä kirjallisten Digest kohderyhmä oli äänestäjien 1936 presidentinvaaleissa. Sen jälkeen päätetään kohderyhmä, tutkija vieressä on kehitettävä lista ihmisistä, joita voidaan käyttää näytteenottoon. Tätä luetteloa kutsutaan otoskehikkona ja väestön otantakehikkoa kutsutaan runko väestöstä. Kun kyseessä kirjallisten Digest kehyksen väestöstä oli 10 miljoonaa ihmistä, joiden nimet olivat pääasiassa peräisin puhelinluetteloita ja auto rekisteröinti kirjaa. Ihannetapauksessa kohderyhmä ja rungon väestö olisi täsmälleen sama, mutta käytännössä tämä ei useinkaan ole. Erot kohderyhmä ja perusjoukko kutsutaan kattavuus virhe. Kattavuus virhettä ei sellaisenaan takaa ongelmia. Mutta, jos ihmiset rungossa väestöstä on systemaattisesti poikkeavat ihmiset eivät kehykseen väestö tulee olemaan kattavuus harhaa. Kattavuus virhe oli ensimmäinen suuria puutteita kanssa Literary Digest kyselyssä. He halusivat oppia äänestäjät-, joka oli heidän kohderyhmä mutta he rakennettu otoskehikkona pääasiassa peräisin puhelinluetteloita ja auto rekisterit, lähteet että yliedustettuina varakkaampia amerikkalaiset, jotka olivat todennäköisesti tukea Alf Landon (recall että molemmat näistä teknologioista, jotka ovat nykyään yleisiä, olivat suhteellisen uusi tuolloin ja että Yhdysvallat oli keskellä Great Depression).
Määritettyään kehyksen väestö, seuraava askel on tutkijalle poimittaessa väestön nämä ovat ihmisiä, että tutkija yrittää haastatella. Jos näyte on erilaisia ominaisuuksia kuin runko väestöstä, voimme esitellä otantavirhe. Tämä on sellainen virhe määrällisesti virhemarginaali että yleensä mukana arvioita. Kun kyseessä on Literary Digest fiasko, ei oikeastaan ole näyte; he yrittivät ottaa yhteyttä jokainen runko väestöstä. Vaikka ei ollut otantavirheen oli ilmeisesti vielä virhe. Tämä selventää, että marginaalit virheistä, joita tyypillisesti ilmoitetuista arvioiden tutkimukset ovat yleensä harhaanjohtavasti pieniä; ne eivät sisällä kaikkia virhelähteitä.
Lopuksi, tutkija yrittää haastatella kaikille otosryhmästä. Ne ihmiset, joita on haastateltu onnistuneesti kutsutaan vastaajat. Ihannetapauksessa näyte väestön ja vastaajat olisivat täsmälleen samat, mutta käytännössä on kato. Eli ihmiset on valittu otokseen kieltäytyä osallistumasta. Jos ihmiset, jotka reagoivat ovat erilaisia kuin ne, jotka eivät vastaa, niin ei voi olla ei-vastaus bias. Kato bias oli toinen pääasiallinen ongelma Literary Digest kyselyssä. Vain 24% ihmisistä, jotka saivat äänestyksessä vastasi, ja kävi ilmi, että ihmiset, jotka tukevat Landon olivat todennäköisesti vastata.
Enää vain esimerkki esitellä ajatuksia edustuksessa Literary Digest kysely on useasti vertauksen, varoittaa tutkijat vaaroista sattumanvaraista näytteenotto. Valitettavasti uskon, että opetus, että monet ihmiset vetää tästä tarina on väärä. Yleisin Tarinan on, että tutkijat eivät voi oppia mitään kuin todennäköisyys näytettä (eli näytteet ilman tiukkaa todennäköisyys perustuvia sääntöjä osallistujien valinnassa). Mutta kuten näytän myöhemmin tässä luvussa, se ei ole aivan oikea. Sen sijaan mielestäni on oikeastaan kaksi moraalin tämän tarinan; moraali, jotka ovat yhtä totta tänään kuin ne olivat vuonna 1936. Ensin suuri määrä sattumanvaraisesti kerättyjen tietojen ei takaa hyvä arvio. Toiseksi, tutkijoiden on selittää, kuinka heidän kerättiin kun he tekevät arvioita siitä. Toisin sanoen, koska tiedonkeruu prosessi Literary Digest kyselyn järjestelmällisesti painottua joidenkin vastaajien, tutkijat täytyy käyttää monimutkaisempia estimointiprosessia että painoja jotkut vastaajat enemmän kuin toiset. Myöhemmin tässä luvussa, näytän sinulle yksi tällainen painotus menettely-jälkiositukseen-, joka voi auttaa sinua tekemään parempia arvioita ei-todennäköisyysotantaan.