Probablo specimenoj kaj ne-probablo specimenoj ne malsimila praktike; en ambaŭ kazoj, ĝi estas ĉio pri la pezoj.
Specimenigo estas fundamenta por inspekti esploradon. Esploristoj preskaŭ neniam demandas iliajn demandojn al ĉiuj en ilia celo loĝantaro. Tiurilate, enketoj estas ne unika. Plej esploro, en unu maniero aŭ alia, engaĝas muestreo. Kelkfoje tiu specimenigo estas farita eksplicite per la esploristo; alifoje ĝi okazas implice. Ekzemple, esploristo kiu kuras laboratorio eksperimento sur studentaj studentoj en ŝia universitato ankaŭ prenis specimenon. Tiel, specimenigo estas problemo kiu venas supre ĉie ĉi libro. Fakte, unu el la plej komunaj konzernoj ke mi aŭdas pri diĝita aĝo fontoj de datumoj estas "ili ne estas reprezentaj." Kiel ni vidos en ĉi tiu sekcio, tiu zorgo estas ambaŭ malpli seriozaj kaj pli subtila ol multaj skeptikuloj realigi. Fakte, mi argumentas ke la tuta koncepto de "representatividad" ne helpema por pensi pri probablo kaj ne-probablo specimenoj. Anstataŭe, la ŝlosilo estas pensi pri kiel la datumoj estis kolektitaj kaj kiom ajn antaŭjuĝoj en tiu datenkolektado povas esti malfarita kiam faranta taksoj.
Nuntempe, la reganta teoria aliro al reprezento estas probablo muestreo. Kiam datumoj estas kolektitaj kun probablo muestreo metodo kiu estis perfekte ekzekutitaj, esploristoj kapablas pezo ilia datumoj bazita sur la vojo, kiun ili kolektis fari nedekliva taksoj pri la celo loĝantaro. Tamen perfekta probablo muestreo esence neniam okazas en la reala mondo. Ekzistas tipe du ĉefaj problemoj 1) diferencoj inter la objektiva loĝantaro kaj la kadro loĝantaro kaj 2) ne-respondo (tiuj estas precize la problemojn kiuj ruinigis la Literary Digest balotenketo). Tiel, prefere ol pensas probablo muestreo kiel realisma modelo de kio vere okazas en la mondo, estas pli bone pensi pri probablo muestreo kiel helpema, abstrakta modelo, tre kiel la maniero fizikistoj pensi frictionless pilko ruliĝanta malsupren senfine longa ramplo.
La alternativo al probablo specimenigo estas ne-probablo muestreo. La ĉefa diferenco inter probablo kaj ne-probablo specimenigo estas ke kun probablo muestreo ĉiuj en la loĝantaro havas konata probablo de inkludo. Estas, fakte, multaj varioj de ne-probablo specimenigo, kaj tiuj metodoj de datuma kolekto estas ĉiufoje pli komuna en la cifereca erao. Sed, ne-probablo muestreo havas teruran reputacion inter sociaj sciencistoj kaj statistikistoj. Fakte, ne-probablo specimenigo estas asociita kun kelkaj el la plej dramaj fiaskoj de enketo esploristoj, kiel la Literary Digest fiasko (diskutitaj antaŭe) kaj la malĝusta antaŭdiro pri la usonaj prezidantaj elektoj de 1948 ( "Dewey Defeats Truman") (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) .
Tamen la tempo estas ĝusta rekonsideri ne- probablo muestreo por du kialoj. Unue, kiel probablo specimenoj fariĝis pli malfacile fari en praktiko, la linio inter probablo specimenoj kaj ne-probablo specimenoj estas neklara. Kiam estas altaj impostoj de ne-respondo (kiel ekzistas en reala enketoj nun), la reala probablo de inkludoj por respondantoj ne konas, kaj tiel, probablo specimenoj kaj ne-probablo specimenoj ne tiel malsamaj kiel multaj investigadores kredas. Fakte, kiel ni vidos sube, ambaŭ aliroj esence fidi la sama taksado metodo: post-tavoliĝo. Due, ekzistis multaj evoluoj en la kolekto kaj analizo de ne-probablo specimenoj. Tiuj metodoj estas sufiĉe malsama de la metodoj kiuj kaŭzis problemojn en la pasinteco, ke mi kredas ke havas sencon pensi ilin kiel "ne-probablo muestreo 2.0." Ni ne havas neracian aversión al ne-probablo metodoj pro eraroj kiu okazis antaŭ longe.
Sekva, por fari tiun argumenton pli konkreta, mi revizios normo probablo muestreo kaj ponderación (Sekcio 3.4.1). La ŝlosila ideo estas ke kiel vi kolektis vian datumon devus efiki kiel vi faras taksoj. Precipe, se ĉiuj ne havas la saman probablon de inkludo, tiam ĉiuj devus havi la sama pezo. En aliaj vortoj, se via muestreo ne demokratia, tiam via taksado devas esti demokratia. Post revizii ponderación, mi priskribi du aliroj al ne-probablo muestreo: kiu temigas ponderación trakti la problemon de haphazardly datumoj akiritaj (Sekcio 3.4.2), kaj kiu provas meti pli kontrolo super kiel la datumoj estas kolektita (Sekcio 3.4.3). La argumentoj en la ĉefa teksto estos klarigita sube kun vortoj kaj bildoj; legantoj, kiuj ŝatus pli matematika traktado ankaŭ devus vidi la teknikan apendico.