Ўяўленне пра тое , каб высновы з вашых рэспандэнтаў да вашай мэтавай аўдыторыі.
Для таго , каб зразумець выгляд памылак , якія могуць адбыцца , калі выводзячы з рэспандэнтаў у большай частцы насельніцтва, давайце разгледзім выбарачны апытанне Literary Digest , якія спрабавалі прадказаць зыход 1936 году прэзыдэнцкіх выбараў у ЗША. Нягледзячы на тое, што адбыўся больш за 75 гадоў таму, гэта фіяска яшчэ ёсць важны ўрок, каб навучыць даследчык сёння.
Літаратурны дайджэст быў папулярным часопісам агульнага інтарэсу, і , пачынаючы з 1920 годам яны пачалі працуюць саламяныя апытанні , каб прадказаць вынікі прэзідэнцкіх выбараў. Для таго, каб зрабіць гэтыя прадказанні, яны будуць пасылаць бюлетэні шмат людзей, а затым проста падлічваць бюлетэні, якія былі вернутыя; Літаратурныя Digest з гонарам паведаміла , што бюлетэні , якія яны атрымалі , не былі ні «узважаных, з папраўкай, ні інтэрпрэтаваныя.» Гэтая працэдура адгаданых пераможцаў выбараў ў 1920 годзе, 1924, 1928 і 1932. У 1936 годзе, у разгар Вялікай дэпрэсіі, Літаратурна дайджэст разаслаў бюлетэні да 10 мільёнаў людзей, чыіх імёны прыйшлі ў асноўным з тэлефонных даведнікаў і рэгістрацыйных аўтамабільных запісаў. Вось як яны апісалі сваю методыку:
«Легкотекучая машына рухаецца дайджэст з хуткай дакладнасцю вопыту трыццаць гадоў, каб паменшыць здагадкі на цвёрдыя факты ... На гэтым тыдні 500 ручкі закрэсліла больш чвэрць мільёна адрасоў у дзень. Кожны дзень, у вялікім пакоі, высока над маторным стужкамі Чацвёртай авеню ў Нью-Ёрку, 400 рабочых спрытна слізгаюць мільён штук друкаванай прадукцыі, дастаткова, каб пракласці сорак гарадскіх кварталаў, запісаныя ў адрасаваных канверты [так у арыгінале]. Кожную гадзіну, ва ўласным паштовым аддзяленні ПС дайджэста'S, тры дыскутуюць паштовыя выдаткі дозировочные машыны герметызуюць і штампаваныя белыя прастакутнікі; кваліфікаваныя работнікі пошты перавярнулі іх у выпуклым mailsacks; флот Дайджэст грузавікі паскорыла іх экспрэс-пошту-цягнік. , , На наступным тыдні, першыя адказы з гэтых дзесяці мільёнаў пачнуцца прыліў адзначаных бюлетэняў, каб быць патройным праверана, праверана, за пяць разоў кроса-сакрэтнымі і склаў. Калі апошняя лічба была totted і правяраецца, калі мінулы вопыт з'яўляецца крытэрыем, краіна будзе ведаць, у долі 1 працэнт фактычнага ўсенародным галасаваннем сарака мільёнаў [выбаршчыкаў]. »(22 жніўня 1936 г.)
Фетышызацыя Literary Digest па памеры імгненна вядомая для любога даследчыка «вялікіх дадзеных» сёння. З 10 мільёнаў бюлетэняў размеркаваны, дзівосная 2,4 мільёна былі вернутыя, што прыкладна ў 1000 разоў больш, чым сучасныя палітычныя апытаньні. З гэтых 2,4 мільёна рэспандэнтаў, вердыкт быў зразумелы: Альфаў Лэндон збіраўся перамагчы дзеючы Франклін Рузвельт. Але, на самой справе, Рузвельт перамог Лэндон ў апоўзняў. Як літаратурны Digest можа пайсці не так , з такой колькасцю дадзеных? Наша сучаснае разуменне выбаркі робіць памылкі Literary Digest ясна і дапамагае нам пазбегнуць падобных памылак у будучыні.
Мысленне ясна аб выбарцы патрабуе, каб мы разгледзім чатыры розныя групы людзей (малюнак 3.2). Першая група з'яўляецца мэтавай папуляцыі; гэта група, даследчык вызначае як цікавасць насельніцтва. У выпадку Literary Digest, мэтавая група насельніцтва была выбаршчыкаў у 1936 годзе прэзыдэнцкіх выбарах.
Пасля прыняцця рашэння аб мэтавай групе насельніцтва, даследчык павінен распрацаваць спіс людзей, якія могуць быць выкарыстаны для адбору пробаў. Гэты спіс называецца структурай выбаркі і людзі на ім называюцца насельніцтвам кадраў. У ідэале, мэтавая група насельніцтва і насельніцтва кадраў будзе сапраўды такі ж, але на практыцы гэта часта не так. Напрыклад, у выпадку Literary Digest, насельніцтва кадраў было 10 мільёнаў людзей , чые імёны прыйшлі галоўным чынам з тэлефонных даведнікаў і рэгістрацыйных аўтамабільных запісаў. Адрозненні паміж мэтавай групай насельніцтвам і насельніцтвам кадра называюцца памылкамі пакрыцця. Памылка пакрыцця не сам па сабе гарантуе праблемы. Тым ня менш, гэта можа прывесці да зрушэння пакрыцця , калі людзі ў папуляцыі кадраў сістэматычна адрозніваюцца ад людзей у мэтавай групе насельніцтва , якія не ў папуляцыі кадра. Гэта, па сутнасці, менавіта тое , што адбылося ў апытанні Literary Digest. Людзі ў сваёй раме насельніцтва, як правіла, больш схільныя падтрымліваць Альфаў Лэндон, збольшага таму, што яны былі багацей (нагадаем, што абодва тэлефона і аўтамабілі былі адносна новым і дарагім у 1936 годзе). Так, у апытанні Literary Digest, памылка пакрыцця прывяло да зрушэння пакрыцця.
Пасля вызначэння папуляцыі кадра, наступны крок для даследчыка , каб выбраць насельніцтва ўзору; гэта тыя людзі, якія даследчык будзе спрабаваць узяць інтэрв'ю. Калі ўзор мае розныя характарыстыкі , чым насельніцтва кадра, то адбор пробаў можна ўвесці памылку выбаркі. У выпадку правалу Literary Digest, аднак, на самай справе не было ніякай выбаркі-часопіс , каб звязацца са ўсімі ў кадры насельніцтва, і таму не было ніякай памылкі выбаркі. Многія даследчыкі схільныя засяроджвацца на адбор пробаў памылак звычайна гэта адзіны від памылкі захопленай хібнасці паведамілі ў апытаннях, але аблом Літаратурны дайджэст нагадвае нам , што мы павінны ўлічваць усе крыніцы памылак, як выпадковыя і сістэматычныя.
Нарэшце, пасля выбару папуляцыі ўзору, даследчык спрабуе ўзяць інтэрв'ю ва ўсіх сваіх членаў. Тыя людзі , якія паспяхова Апытаныя называюць рэспандэнтаў. У ідэале, насельніцтва выбаркі і рэспандэнты былі б дакладна такімі ж, але на практыцы ёсць неатрыманне. Гэта значыць, людзі, якія выбіраюць ва ўзоры часам не ўдзельнічаюць. Калі людзі , якія адказваюць адрозніваюцца ад тых , хто не адказвае, гэта значыць можа быць неатрыманне зрушэння. Ўлонне ўхіл быў другі асноўнай праблемай апытання Literary Digest. Толькі 24% людзей, якія атрымалі выбарчы бюлетэнь адказалі, і аказалася, што людзі, якія падтрымлівалі Лэндон былі больш схільныя рэагаваць.
Акрамя проста быць прыкладам прадставіць ідэі прадстаўлення, апытанне Literary Digest з'яўляецца часта паўтараецца прытча, папярэджваючы даследчыкаў аб небяспецы бессістэмнай выбаркі. На жаль, я думаю, што ўрок, які многія людзі атрымаць з гэтай гісторыі з'яўляецца няправільным адзін. Найбольш распаўсюджаная Мараль гэтай гісторыі з'яўляецца тое, што даследчыкі не могуць нічога з узораў без верагоднасці пазнаць (г.зн. узораў без строгіх правілаў верагоднасці на аснове адбору ўдзельнікаў). Але, як я пакажу далей у гэтым раздзеле, гэта не зусім дакладна. Замест гэтага, я думаю, што ёсць на самой справе дзве маралі ў гэтай гісторыі; маральнасці, якія таксама верна сёння, як яны былі ў 1936 году Па-першае, вялікая колькасць бессістэмна сабраных дадзеных не гарантуе добрую адзнаку. Увогуле, які мае вялікую колькасць рэспандэнтаў памяншае дысперсію ацэнкі, але гэта не абавязкова памяншаць зрушэнне. З вялікай колькасцю дадзеных, даследчыкі могуць часам атрымаць дакладную ацэнку няправільных рэчаў; яны могуць быць сапраўды недакладнымі (McFarland and McFarland 2015) . Другі галоўны ўрок з фіяска Literary Digest з'яўляецца тое , што даследчыкі павінны ўлічваць , як збіралі іх выбаркі пры правядзенні ацэнак. Іншымі словамі, паколькі працэс адбору пробаў у апытанні Literary Digest сістэматычна перакос у бок некаторых рэспандэнтаў, даследчыкі неабходна выкарыстоўваць больш складаны працэс ацэнкі , што ўзважаная некаторыя рэспандэнты больш , чым іншыя. Пазней у гэтым раздзеле я пакажу вам адзін такі вагавой парадак-постстратификацию-што можа дазволіць вам зрабіць лепшыя ацэнкі ад выпадковых выбарак.