Вероватноћа узорци и узорци нису вероватноће се не разликују у пракси; у оба случаја, то је све о тежини.
Узорковање је од суштинског значаја за анкетирање истраживање. Истраживачи готово никада не питају своја питања свима у својој циљној популацији. У том смислу, истраживања нису јединствени. Већина истраживања, на овај или онај начин, подразумева узорковање. Понекад то узорковање врши изричито истраживача; Други пут је имплицитно дешава. На пример, истраживач који води лабораторијски експеримент на студенте у свом универзитету је такође узети узорак. Тако је, узорковање је проблем који се појављује у овој књизи. У ствари, један од најчешћих проблема да чујем о дигиталних извора старосне групе података "нису репрезентативни." Као што ћемо видети у овом одељку, овај проблем је и мање озбиљна и суптилнији него сто многи скептици схватити. У ствари, ја ћу рећи да је цео концепт "репрезентативности" није корисно за размишљање о вероватноћи и не вероватноће узорака. Уместо тога, кључно је да размишља о томе како су подаци прикупљени и како било пристрасности у том прикупљање података може поништити приликом процене.
Тренутно, доминантна теоријски приступ заступљености вероватноћа узорковање. Када се прикупљају подаци са методом случајног узорковања која је савршено извршен, истраживачи су у стању да тежину своје податке на основу начина на који су прикупљени да поуздане процене о циљној популацији. Међутим, савршен вероватноћа за узорковање у основи никада не догађа у стварном свету. Обично постоје два основна проблема 1) разлике између циљне популације и оквира становништва и 2) не-одговор (то су управо проблеми који уништена књижевног Дигест изборе). Тако, уместо да размишља о вероватноће узорковања као реалан модел оно што се дешава у свету, то је боље размишљати о вероватноће узорковања као помоћне, апстрактног модела, баш као начин на који физичари мисле о трења котрљања лопту доле бескрајно дуго рампа.
Алтернатива вероватноће узорковања је не вероватноћа узорковање. Основна разлика између вероватноће и не вероватноће узорковања је да са вероватноћа узорковања све у популацији има познату вероватноћу инклузије. Постоје, у ствари, многе врсте не-вероватноће узорковања, а ове методе прикупљања података постају све чешћи у дигиталном добу. Али, не вероватноћа узорковање има велики углед међу друштвени научници и статистичари. У ствари, не вероватноћа узорковање је повезан са неким од најдраматичнијих неуспеха истраживача истраживања, као што је књижевна Дигест фијаска (раније разговарали) и погрешног предвиђања о америчким предсједничким изборима 1948 ( "Дјуи Пораз Трумана") (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) .
Међутим, да је право време да се преиспита не-случајног узорковања из два разлога. Прво, као што узорци вероватноће су постали све теже урадити у пракси, линија између узорака вероватноћа и узорцима не вероватноћа замућење. Када постоје високе стопе без одговора (као што постоје у стварним истраживањима сада), стварна вероватноћа инклузије за испитаника нису познати, и на тај начин, узорци вероватноћа и узорци нису вероватноће нису различити као многи истраживачи верују. У ствари, као што ћемо видети у наставку, оба приступа у основи ослањају на истом процјене начин: пост-стратификације. Друго, било је много дешавања у прикупљање и анализу узорака не вероватноће. Ове методе су довољно различити од метода који су изазвали проблеме у прошлости да мислим да има смисла да мислим о њима као "не-вероватноће узорковања 2.0." Ми не треба да ирационалну аверзију према не-вероватноће методама због грешака које су се догодиле давно.
Затим, како би овај аргумент више бетона, ја ћу прегледати стандардни случајног узорковања и пондер (поглавље 3.4.1). Кључна идеја је да како прикупљају податке би требало да утиче како се врши процене. Посебно, ако немају сви људи исту вероватноћу инклузије, онда свако треба да има исту тежину. Другим речима, ако ваш узорковања није демократски, онда ваше процјене не би требало да буде демократска. Након разматрања пондер, ја ћу описати два приступа не-случајног узорковања: онај који се фокусира на тежини да се баве проблемом насумице прикупљених података (Одељак 3.4.2), и онај који покушава да стави већу контролу над колико су подаци прикупљени (Одељак 3.4.3). Аргументи у главном тексту ће бити објашњени са речима и сликама; читаоци који желе да више математички третман треба да види техничку слепо црево.