Uwakilishi ni kuhusu kufanya inferences kutoka waliohojiwa yako kwa lengo idadi ya watu wako.
Ili kuelewa aina ya makosa ambayo yanaweza kutokea wakati inferring kutoka waliohojiwa kwa idadi kubwa, hebu fikiria Fasihi Digest majani uchaguzi kwamba alijaribu kutabiri matokeo ya 1936 Marekani Rais uchaguzi. Pamoja na kwamba ni zaidi ya miaka 75 iliyopita, debacle hii bado ina somo muhimu kufundisha watafiti leo.
Fasihi Digest alikuwa maarufu kwa ujumla maslahi magazine, na kuanzia mwaka 1920 walianza kukimbia uchaguzi majani kutabiri matokeo ya Uchaguzi wa Rais. Kufanya utabiri hizi wangeweza kutuma kura kwa kura ya watu, na kisha tu jumlisha kura waliokuwa wamerudi; Fasihi Digest kujigamba taarifa kwamba kura walipata walikuwa wala "mizigo, kubadilishwa, wala kufasiriwa." Utaratibu huu alitabiri kwa usahihi mshindi ya uchaguzi wa mwaka 1920, 1924, 1928 na 1932. mwaka 1936, katikati ya Unyogovu Mkuu, Literary Digest kupelekwa nje kura kwa watu milioni 10, ambao majina yao kudhibitiwa alikuja kutoka directories simu na kumbukumbu magari usajili. Hapa ni jinsi gani wao ilivyoelezwa mbinu zao:
"Digest ya laini-mbio mashine hatua kwa usahihi mwepesi wa uzoefu wa miaka thelathini 'ili kupunguza guesswork kwa hoja ngumu. . . .Hii Wiki 500 kalamu kukwangua nje zaidi ya robo ya anwani milioni siku. Kila siku, katika chumba kubwa juu juu motor-ribboned Fourth Avenue, mjini New York, wafanyakazi 400 deftly slide vipande milioni ya kuchapishwa jambo-ya kutosha kusafisha arobaini mji vitalu-katika lifunika kushughulikiwa [sic]. Kila saa, katika Digest'S mwenyewe idadi ya Posta Substation, tatu maneno mengi postage metering mashine muhuri na mhuri oblongs nyeupe; wafanyakazi wenye ujuzi posta flipped yao katika bulging mailsacks; meli Digest malori sped yao kueleza mail-treni. . . Wiki ijayo, majibu kwanza kwa hao milioni kumi itaanza wimbi zinazoingia ya kura alama, kuwa mara tatu-checked, kuthibitishwa, mara tano msalaba-classified na ilifikia. Wakati takwimu mwisho imekuwa totted na kuangaliwa, kama uzoefu wa zamani ni kigezo, nchi watajua ya ndani ya sehemu ya 1 asilimia halisi maarufu kura ya milioni arobaini [wapiga kura]. "(Agosti 22, 1936)
fetishization Digest ya kawaida ni instantly kumtambua kwa mtu yeyote "data kubwa" mtafiti leo. Ya kura milioni 10 kusambazwa, ajabu milioni 2.4 kura yalirudishwa-hiyo ni takribani mara 1,000 kubwa kuliko kura za kisasa za kisiasa. Kutoka hizi waliohojiwa milioni 2.4 uamuzi huo ulikuwa wazi: Fasihi Digest alitabiri kwamba mpinzani Alf Landon alikuwa anaenda kushindwa madarakani Franklin Roosevelt. Lakini, kwa kweli, kinyume kabisa kilichotokea. Roosevelt kushindwa Landon katika ushindi wa kishindo. Jinsi gani Fasihi Digest kwenda vibaya na data sana? Uelewa wetu wa kisasa wa sampuli hufanya makosa Fasihi Digest ya wazi na inatusaidia kuepuka kufanya makosa sawa katika siku zijazo.
Kufikiri wazi kuhusu sampuli inahitaji sisi kufikiria makundi manne tofauti ya watu (Kielelezo 3.1). Kundi la kwanza la watu ni walengwa; hii ni kundi kwamba utafiti amefafanua kama wakazi wa riba. Katika kesi ya Fasihi Digest Lengo idadi ya watu ilikuwa wapiga kura mwaka 1936 Uchaguzi wa Rais. Baada ya kuamua juu ya lengo idadi ya watu, mtafiti ijayo mahitaji ya kuendeleza orodha ya watu ambayo yanaweza kutumika kwa ajili ya sampuli. Orodha hii inaitwa sampuli sura na idadi ya watu juu ya sura sampuli inaitwa idadi ya watu frame. Katika kesi ya Fasihi Digest idadi ya watu sura ilikuwa watu milioni 10 ambao majina alikuja kudhibitiwa kutoka Directories simu na kumbukumbu magari usajili. Kimsingi walengwa na idadi ya watu sura itakuwa sawa, lakini katika mazoezi hii ni mara nyingi si kesi. Tofauti kati ya walengwa na idadi ya watu sura zinaitwa chanjo makosa. Chanjo makosa haina, kwa yenyewe kuhakikisha matatizo. Lakini, kama watu katika idadi ya watu sura ni utaratibu tofauti na watu si katika idadi ya watu sura kutakuwa na chanjo upendeleo. Chanjo makosa mara ya kwanza ya dosari kubwa na uchaguzi Fasihi Digest. Walitaka kujifunza kuhusu wapiga kura-kwamba alikuwa walengwa-lakini wao yalijengwa sampuli hii kudhibitiwa kutoka Directories simu na usajili magari, vyanzo kwamba juu-kuwakilishwa tajiri yao Wamarekani ambao walikuwa zaidi uwezekano wa kusaidia Alf Landon (kukumbuka kwamba wote wawili wa teknolojia hizi, ambayo ni ya kawaida leo, walikuwa kipya wakati huo na kwamba Marekani ilikuwa katikati ya Unyogovu Mkuu).
Baada ya kufafanua idadi ya watu sura, hatua inayofuata ni kwa mtafiti wa kuchagua idadi ya watu sampuli; hawa ni watu kwamba mtafiti jaribio mahojiano. Kama sampuli ina sifa tofauti kuliko wakazi sura, basi tunaweza kuanzisha kosa sampuli. Hii ni aina ya makosa kukaguliwa katika kiasi ya makosa kwamba kwa kawaida unaambatana makadirio. Katika kesi ya Fasihi Digest fiasco, kuna kweli hakuna sampuli; walijaribu kuwasiliana na kila mtu katika idadi ya watu frame. Hata ingawa kulikuwa hakuna makosa sampuli, kulikuwa na wazi bado makosa. Hii inafafanua kuwa pembezoni mwa makosa ambayo ni kawaida taarifa na makadirio kutoka tafiti ni kawaida kuwapotosha ndogo; hawana ni pamoja na vyanzo vyote vya makosa.
Hatimaye, mtafiti kujaribu kuhoji kila mtu katika idadi ya watu sampuli. Wale watu kwamba ni mafanikio waliohojiwa zinaitwa washiriki. Kimsingi, sampuli idadi ya watu na waliohojiwa itakuwa sawa, lakini katika mazoezi kuna zisizo majibu. Yaani, watu ambao wanachaguliwa katika sampuli kukataa kushiriki. Kama watu ambao kujibu ni tofauti na wale ambao hawana kujibu, basi kuna inaweza kuwa yasiyo ya mwitikio upendeleo. Zisizo mwitikio upendeleo alikuwa wa pili kuu tatizo na uchaguzi Fasihi Digest. Tu 24% ya watu ambao walipata kura alijibu, na aligeuka kuwa watu ambao mkono Landon walikuwa zaidi uwezekano wa kujibu.
Zaidi tu kuwa mfano kuanzisha mawazo ya uwakilishi, uchaguzi Fasihi Digest ni mfano somwa mara kwa mara, na kuonya watafiti kuhusu hatari ya sampuli isiyokuwa na mpangilio. Kwa bahati mbaya, nadhani kwamba somo kwamba watu wengi kujifunza kutokana na hadithi hii ni moja vibaya. maadili ya kawaida ya hadithi ni kwamba watafiti hawawezi kujifunza kitu chochote kutoka sampuli zisizo uwezekano (yaani, sampuli bila sheria kali uwezekano makao kwa kuchagua washiriki). Lakini, kama mimi itabidi kuonyesha baadaye katika sura hii, kwamba si haki kabisa. Badala yake, nadhani kuna kweli maadili mbili kwa hadithi hii; maadili ambayo ni kama kweli leo kama walikuwa katika 1936. Kwanza, kiasi kikubwa cha data mpangilio zilizokusanywa si kuhakikisha makisio nzuri. Pili, watafiti haja ya akaunti kwa ajili ya jinsi data zao zilikusanywa wakati wao ni kufanya makadirio ya kutoka humo. Kwa maneno mengine, kwa sababu ukusanyaji wa takwimu mchakato katika uchaguzi Fasihi Digest ilikuwa utaratibu umekiuka kuelekea baadhi ya waliohojiwa, watafiti haja ya kutumia ngumu zaidi kukadiria mchakato kwamba uzito baadhi waliohojiwa zaidi kuliko wengine. Baadaye katika sura hii, mimi nitakuonyesha mmoja kama Viktning utaratibu-baada ya stratification-ambayo inaweza kuwawezesha wewe kufanya makadirio bora na sampuli zisizo uwezekano.