Tõenäosus proovid ja mitte-valimid ei ole, et erinevad praktikas; Mõlemal juhul, see on kõik umbes kaaluga.
Proovide võtmine on oluline uuringu tulemustest. Teadlased peaaegu kunagi küsida oma küsimusi kõigile oma sihtrühmale. Seoses sellega on uurimine ei ole unikaalne. Enamik uurimistöös, ühel või teisel viisil, hõlmab proovide võtmist. Mõnikord on see proovid võetakse selgesõnaliselt teadlane; Teinekord juhtub kaudselt. Näiteks teadur, mis töötab laboris eksperimendi üliõpilast tema ülikooli võtnud ka proovi. Seega proovi võtmine on probleem, mis kerkib kogu selle raamatu. Tegelikult on üks levinumaid muresid, et ma kuulda digitaalajastul andmeallikad on "nad ei esinda." Nagu näeme, vastavalt sellele osale, see probleem on nii kergemaid ja peenem kui paljud skeptikud realiseerida. Tegelikult ma väita, et kogu kontseptsioon "esinduslikkus" ei ole kasulik mõelda tõenäosusega ja mitte-valimid. Selle asemel, oluline on mõelda, kuidas andmeid koguti ja kuidas tahes peensusi, et andmete kogumist saab tagasi võtta prognooside tegemisel.
Praegu valitsev teoreetiline käsitlus esindatus on valimit. Kui andmeid kogutakse tõenäosusega valimi meetod, mis on täiesti täidetud, teadlased suudavad kaalu oma andmed põhinevad nii, et nad koguti teha erapooletu prognoos sihtrühma. Kuid täiuslik valimit põhimõtteliselt kunagi juhtub reaalses maailmas. Seal on tavaliselt kaks põhiprobleemi 1) erinevused sihtrühma ja raami elanikkonnast ja 2) mitte-vastus (need on täpselt probleeme, et avariiline Kirjandusmuuseumi Digest küsitluse). Seega, selle asemel mõelda valimit realistliku mudeli, mis tegelikult juhtub maailmas, siis on parem mõelda valimit kui kasulikku, abstraktne mudel, meelega teed füüsikud mõelda sujuvat palli veerema alla lõpmata kaua kaldtee.
Alternatiiv valimit empiirilist valikut. Peamine erinevus tõenäosus ja empiirilist valikut on see, et valimit kõigile elanikkonnast on tuntud tõenäosus kaasamine. Seal on tegelikult palju erinevaid empiirilist valikut ning need meetodid andmete kogumiseks on muutumas üha tavalisemaks digitaalajastul. Aga empiirilist valikut on kohutav maine ühiskonnateadlased ja statistikud. Tegelikult empiirilist valikut seostatakse mõned kõige dramaatilisi ebaõnnestumisi uuring teadlased, nagu Kirjanduse Digest fiasko (eelpool mainitud) ja vale prognoosi, kuidas USA presidendivalimised 1948 ( "Dewey Kaotusi Truman") (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) .
Samas on õige aeg üle vaadata empiirilist valikut ja seda kahel põhjusel. Esiteks, kui valimid on muutunud üha raskemaks teha praktikas piiri valimid ja mitte-valimid on hägustumas. Kui on kõrged vastamata jätmise (kui on olemas reaalne uuringud nüüd), tegelik tõenäosus kandmisel vastajatele ei ole teada, ja seega, valimid ja mitte-valimid ei ole nii erinevad, kui paljud teadlased usuvad. Tegelikult, nagu näeme allpool, mõlemad lähenemised põhimõtteliselt tugineda sama hindamismeetodit: järelkihistamisega. Teiseks, on olnud palju arenguid kogumine ja analüüs empiirilist proovid. Need meetodid on erinevad piisavalt meetoditest, mis põhjustas probleeme minevikus, et ma arvan, et see on mõistlik mõelda neist kui "mitte-valimit 2.0." Me ei tohiks olla irratsionaalne vastumeelsus empiirilist meetodid vigade tõttu, mis juhtus kaua aega tagasi.
Järgmine, et muuta see argument konkreetsemaks, ma vaatama standard tõenäosus proovide võtmine ja kaalumine (punkt 3.4.1). Põhiidee on, et kuidas te koguda oma andmed tuleks avaldada, kuidas teha prognoosi. Eriti siis, kui kõik ei ole sama tõenäosus kaasatus, siis igaüks ei tohiks olla sama kaal. Teisisõnu, kui teie valimi ei ole demokraatlik, siis teie hinnangul ei tohiks olla demokraatlik. Pärast vaadates kaalumine, ma kirjeldada kaks lähenemist empiirilist valikut: üks, mis keskendub kaalumine tegelema probleemi juhuslikult kogutud andmeid (§ 3.4.2), ja üks, mis püüab panna rohkem kontrolli selle üle, kuidas andmed on kogutud (punktis 3.4.3). Argumendid põhitekstis allpool selgitatakse sõnade ja pilte; lugejad, kes sooviksid rohkem matemaatilist ravi ka näha tehnilises lisas.