Ўяўленне пра тое , каб высновы з вашых рэспандэнтаў да вашай мэтавай аўдыторыі.
Для таго , каб зразумець выгляд памылак , якія могуць адбыцца , калі выводзячы ад рэспандэнтаў да большай часткі насельніцтва, давайце разгледзім выбарачны апытанне Literary Digest , якія спрабавалі прадказаць зыход выбараў 1936 года прэзідэнта ЗША. Хоць гэта было больш за 75 гадоў таму, гэта Разгром па-ранейшаму мае важны ўрок, каб навучыць даследчыкаў сёння.
Literary Digest быў папулярны часопіс агульны інтарэс, а пачынаючы з 1920 года яны пачалі працаваць саламяныя апытанні , каб прадказаць вынікі прэзідэнцкіх выбараў. Для таго, каб зрабіць гэтыя прадказанні яны будуць пасылаць бюлетэні да вялікай колькасці людзей, а потым проста падлічваць бюлетэні , якія былі вернутыя; Literary Digest з гонарам паведамілі , што бюлетэні , якія яны атрымалі не былі ні "узважанае, з папраўкай, ні інтэрпрэтаваць" . Гэтая працэдура правільна прадказаў пераможцу выбараў ў 1920, 1924, 1928 і 1932 г. у 1936 годзе, у разгар Вялікай дэпрэсіі, Literary Digest разаслаў бюлетэні да 10 мільёнаў чалавек, чые імёны пераважна прыйшлі з тэлефонных даведнікаў і рэгістрацыйных запісаў аб аўтамабілі. Вось як яны апісалі сваю методыку:
"Адладжаная машына рухаецца дайджэста з хуткай дакладнасцю вопыту трыццаць гадоў, каб паменшыць здагадак да жорсткіх фактах. , , .Гэта Тыдзень 500 ручкі закрэсліў больш за чвэрць мільёна адрасоў у дзень. Кожны дзень, у вялікім пакоі, высока над маторна-авеню чацвёртай стужкамі, у Нью-Ёрку, 400 рабочых спрытна слізгаюць мільён штук друкаванай прадукцыі, дастаткова, каб пракласці сорак гарадскіх кварталаў, запісанымі ў адрасаваных канвертах [так у арыгінале]. Кожную гадзіну, ва ўласнае паштовае аддзяленне ПС дайджэста'S, тры дыскутуюць дастаўку дозировочные машыны герметызуюць і штампаваныя белыя прастакутнікі; кваліфікаваныя работнікі пошты перакінуў іх у вытарашчанымі mailsacks; флот Дайджэст грузавікі паскорыла іх экспрэс-пошты цягнікоў. , , На наступным тыдні, першыя адказы з гэтых дзесяці мільёнаў чалавек пачне прылівам адзначаных бюлетэняў, каб быць патройным праверана, праверана, пяць разоў крыжаванай класіфікацыі і склаў. Калі апошняя лічба была totted і правяраецца, калі мінулы вопыт з'яўляецца крытэрыем, краіна будзе ведаць з дакладнасцю да доляй 1 адсотка фактычнага ўсенароднага галасавання за сорак мільёнаў [выбаршчыкаў]. "(22 жніўня 1936 г.)
фетышызацыя дайджэста па памеры імгненна вядомым для любога даследчыка "вялікія дадзеныя" сёння. З 10 мільёнаў бюлетэняў размеркаваны, дзіўныя 2,4 мільёна бюлетэняў былі вернутыя, што прыкладна ў 1000 разоў больш, чым сучасных палітычных апытанняў. З гэтых 2,4 мільёна рэспандэнтаў вердыкт быў зразумелы: Literary Digest прадказаў , што прэтэндэнтам Альфаў Лэндон збіраўся перамагчы дзеючага Франкліна Рузвельта. Але, па сутнасці, прама супрацьлеглае адбылося. Рузвельт перамог Лэндон ў апоўзняў. Як Literary Digest можа пайсці не так , з такой колькасцю дадзеных? Наша сучаснае разуменне выбаркі робіць памылкі Literary Digest ясна і дапамагае нам пазбегнуць падобных памылак у будучыні.
Мысленне ясна аб выбарцы патрабуе ад нас разгледзець чатыры розныя групы людзей (Малюнак 3.1). Першая група людзей з'яўляецца мэтавай групы насельніцтва; гэта група, што даследаванне вызначае як цікавасць насельніцтва. У выпадку Literary Digest мэтавая група насельніцтва была выбаршчыкі ў 1936 годзе прэзыдэнцкіх выбарах. Пасля прыняцця рашэння аб мэтавай групе насельніцтва, даследчык наступны неабходна распрацаваць спіс людзей, якія могуць быць выкарыстаны для адбору пробаў. Гэты спіс называецца структура выбаркі і насельніцтва на выбарачнай сукупнасці называецца насельніцтва кадраў. У выпадку Literary Digest насельніцтва кадраў было 10 мільёнаў чалавек , чые імёны прыйшлі галоўным чынам з тэлефонных даведнікаў і рэгістрацыйных запісаў аб аўтамабілі. У ідэале мэтавая група насельніцтва і насельніцтва кадраў будзе сапраўды такі ж, але на практыцы гэта часта не так. Адрозненні паміж мэтавай групы насельніцтва і насельніцтва кадра называюцца памылкі ахопу. Памылка Пакрыццё не само па сабе гарантуе праблемы. Але, калі людзі ў кадры насельніцтва сістэматычна адрозніваюцца ад людзей не ў папуляцыі кадраў будзе ўхіл пакрыцця. Памылка пакрыцця была першай з галоўных недахопаў з апытання Literary Digest. Яны хацелі даведацца аб выбаршчыкаў-гэта іх мэтавая група насельніцтва, але яны пабудавалі структуру выбаркі пераважна з тэлефонных даведнікаў і аўтамабільных рэестраў крыніц, якія празмерна прадстаўлены багацей амерыканцаў, якія былі больш схільныя падтрымліваць Альфаў Лэндон (нагадаем, што абедзве гэтыя тэхналогіі, якія з'яўляюцца агульнымі сёння, былі адносна новым у той час і што ЗША ў разгар Вялікай дэпрэсіі).
Пасля вызначэння папуляцыі кадра, наступны крок для даследчыка , каб выбраць выбаркі насельніцтва; гэта тыя людзі, якія даследчык будуць спрабаваць узяць інтэрв'ю. Калі ўзор мае розныя характарыстыкі , чым насельніцтва кадра, то можна ўвесці памылку выбаркі. Гэта свайго роду памылка колькасна ў межах хібнасці, якая звычайна спадарожнічае ацэнкі. У выпадку правалу Literary Digest, там на самай справе не было ніякага ўзору; яны паспрабавалі звязацца з усімі ў папуляцыі кадра. Нягледзячы на тое, што не было ніякай памылкі выбаркі, то, відавочна, да гэтага часу памылка. Гэта растлумачвае, што палі памылак, якія, як правіла, паведамляецца з ацэнкамі па выніках абследаванняў, як правіла, зманліва малыя; яны не ўключаюць у сябе ўсе крыніцы памылак.
Нарэшце, даследчык спрабуе ўзяць інтэрв'ю ў любога ў групе людзей. Тыя людзі, якія паспяхова Апытаныя называюць рэспандэнтаў. У ідэале, насельніцтва выбаркі і рэспандэнты былі б дакладна такімі ж, але на практыцы не з'яўляецца адказам. Гэта значыць, людзі, якія выбіраюць ва ўзоры адмовіцца ад удзелу. Калі людзі , якія адказваюць адрозніваюцца ад тых , хто не адказвае, гэта значыць можа быць без адказу зняцця з пасады. Без адказу зрушэння была другая галоўная праблема апытання Literary Digest. Толькі 24% людзей, якія атрымалі выбарчы бюлетэнь адказаў, і аказалася, што людзі, якія падтрымлівалі Лэндон былі больш схільныя рэагаваць.
Акрамя проста быць прыкладам прадставіць ідэі прадстаўлення, апытанне Літаратурны дайджэст з'яўляецца часта паўтараецца прытча, папярэджваючы даследчыкаў аб небяспецы бессістэмнай выбаркі. На жаль, я думаю, што ўрок, што многія людзі атрымаць з гэтай гісторыі з'яўляецца не той. Найбольш распаўсюджаным мараль гэтай гісторыі з'яўляецца тое, што даследчыкі не могуць што-небудзь з узораў неверагоднасці пазнаць (г.зн. узораў без строгіх правілаў на аснове імавернасных адбору ўдзельнікаў). Але, як я пакажу далей у гэтым раздзеле, гэта не зусім дакладна. Замест гэтага, я думаю, што на самой справе ёсць дзве маралі гэтай гісторыі; маралі, якія так жа дакладна сёння, як яны былі ў 1936 г. Па-першае, вялікая колькасць бессістэмна сабраных дадзеных не гарантуе добрую адзнаку. Па-другое, даследчыкі павінны ўлічваць, як збіралі іх дадзеныя, калі яны робяць ацэнкі ад яго. Іншымі словамі, так як працэс збору дадзеных у апытанні Literary Digest сістэматычна перакос у бок некаторых рэспандэнтаў, даследчыкі павінны выкарыстоўваць больш складаны працэс ацэнкі , што вагі некаторыя рэспандэнты больш , чым іншыя. Пазней у гэтым раздзеле я пакажу вам адзін такі вагавой парадак-постстратификация-што можа дазволіць вам зрабіць лепшыя ацэнкі узораў неверагоднасці.