Uwakilishi ni kuhusu kufanya inferences kutoka waliohojiwa yako kwa lengo idadi ya watu wako.
Ili kuelewa aina ya makosa ambayo yanaweza kutokea wakati unapojiunga na washiriki kwa idadi kubwa, hebu tuchunguze uchaguzi wa majani ya Literary Digest ambayo ilijaribu kutabiri matokeo ya uchaguzi wa rais wa Marekani wa 1936. Ingawa kilichotokea zaidi ya miaka 75 iliyopita, tamaa hii bado ina somo muhimu la kufundisha watafiti leo.
Literary Digest ilikuwa gazeti maarufu la maslahi ya jumla, na kuanzia mwaka wa 1920 walianza kuendesha uchaguzi wa majani kutabiri matokeo ya uchaguzi wa rais. Kufanya utabiri huu, wangeweza kutuma kura kwa kura ya watu na kisha tu kufikisha kura zilizorejeshwa; Literary Digest kwa kujigamba iliripoti kwamba kura walizozipata hazikuwa "zimepimwa, zimeelekezwa, wala hazifafanuzi." Utaratibu huu uliwatabiri kwa hakika washindi wa uchaguzi mwaka wa 1920, 1924, 1928 na 1932. Mwaka wa 1936, katikati ya Mkuu wa Unyogovu, Kitabu Digest ilipelekwa kura kwa watu milioni 10, ambao majina yao alikuja kwa kiasi kikubwa kutoka kwa directories za simu na rekodi za usajili wa magari. Hapa ndivyo ilivyoelezea mbinu zao:
"MASHARA ya mashine ya uendeshaji mzuri huenda kwa usahihi wa haraka wa uzoefu wa miaka thelathini ili kupunguza guesswork kwa ukweli mgumu ... Juma hili 500 kalamu zilisema zaidi ya robo milioni anwani kwa siku. Kila siku, katika chumba kikubwa juu ya kibanda cha Nne Avenue, huko New York, wafanyakazi 400 wanajenga vipande milioni vya vipengee vya kuchapishwa-vya kutosha kupiga vitalu vya jiji la arobaini-ndani ya ufumbuzi. Kila saa, katika kituo cha Post Office mwenyewe, mitambo mitatu ya kuzungumza mitambo imefungwa na kuziba mviringo nyeupe; Wafanyakazi wenye ujuzi wa posta waliwapeleka kwenye mailsacks yaliyojaa; meli DIGEST malori waliwapeleka kueleza treni za barua. . . Juma lililofuata, majibu ya kwanza kutoka kwa milioni kumi itaanza wimbi linaloingia la kura za alama, kuwa hundi tatu, kuthibitishwa, mara tano zimewekwa na kuigwa. Wakati takwimu ya mwisho imechukuliwa na kuchunguza, ikiwa uzoefu uliopita ni kigezo, nchi itatambua ndani ya sehemu ya asilimia 1 ya kura halisi ya watu milioni arobaini [wapiga kura]. "(Agosti 22, 1936)
Kutafishwa kwa ukubwa wa Literary Digest ni mara moja inayojulikana kwa mtafiti wowote wa "data" leo. Kati ya kura za milioni 10 ziligawanyika, milioni 2.4 ya kurejeshwa yalirudi-hiyo mara zaidi ya mara 1,000 kuliko uchaguzi wa kisiasa wa kisasa. Kutoka kwa washiriki hawa milioni 2.4, uamuzi huo ulikuwa wazi: Alf Landon angeenda kumshinda Franklin Roosevelt aliyehusika. Lakini, kwa kweli, Roosevelt alishinda Landon katika shida. Je! Literary Digest ingewezaje kushindwa kwa data nyingi? Uelewa wetu wa kisasa wa sampuli hufanya makosa ya Literary Digest na hutusaidia kuepuka kufanya makosa sawa katika siku zijazo.
Kufikiri wazi juu ya sampuli inahitaji sisi kufikiria makundi manne tofauti ya watu (Faili 3.2). Kikundi cha kwanza ni idadi ya watu ; hii ni kundi ambalo mtafiti anafafanua kama idadi ya watu wenye riba. Katika kesi ya Literary Digest , idadi ya wakazi walikuwa wapiga kura katika uchaguzi wa rais wa 1936.
Baada ya kuamua juu ya idadi ya watu, mtafiti anahitaji kuendeleza orodha ya watu ambayo inaweza kutumika kwa sampuli. Orodha hii inaitwa sura ya sampuli na watu walio juu yake huitwa idadi ya watu . Kwa kweli, idadi ya wakazi na sura ya wakazi itakuwa sawa, lakini katika mazoezi hii mara nyingi sio kesi. Kwa mfano, katika kesi ya Literary Digest , idadi ya idadi ilikuwa watu milioni 10 ambao majina yao yalikuja kwa kiasi kikubwa kutoka kwa rekodi za simu na rekodi za usajili wa magari. Tofauti kati ya idadi ya wakazi na idadi ya watu huitwa kosa la chanjo . Hitilafu ya ufikiaji sio, yenyewe, kuhakikisha matatizo. Hata hivyo, inaweza kusababisha utoaji wa habari kama watu katika sura ya idadi ya watu hutofautiana na watu katika idadi ya watu ambao hawana sura ya idadi ya watu. Hiyo ni kwa kweli, hasa kilichotokea katika uchaguzi wa Literary Digest . Watu katika frame yao idadi ya watu walikuwa na uwezekano mkubwa wa kuunga mkono Alf Landon, kwa sehemu kwa sababu walikuwa wenye tajiri (kumbuka kuwa simu na magari zote zilikuwa mpya na za gharama kubwa mwaka 1936). Kwa hiyo, katika uchaguzi wa Literary Digest , kosa la chanjo limepelekea uhaba wa chanjo.
Baada ya kufafanua idadi ya wakazi , hatua inayofuata ni kwa mtafiti kuchagua chache idadi ya watu ; hawa ndio watu ambao watafiti watajaribu kuhojiana. Ikiwa sampuli ina tabia tofauti kuliko idadi ya watu, basi sampuli zinaweza kuanzisha kosa la sampuli . Katika kesi ya fiasco ya Literary Digest , hata hivyo, kuna kweli hakuna sampuli-gazeti kuwasiliana na kila mtu katika sura ya idadi ya watu-na kwa hiyo hapakuwa na hitilafu ya sampuli. Watafiti wengi huelekea kuzingatia kosa la sampuli-hii ni aina pekee ya kosa iliyobakiwa na kiasi cha kosa kilichoripotiwa katika uchunguzi-lakini fiasco ya Literary Digest inatukumbusha kwamba tunahitaji kuchunguza vyanzo vyote vya makosa, kwa nasibu na kwa utaratibu.
Hatimaye, baada ya kuchagua idadi ya sampuli, mtafiti anajaribu kuhojiana na wanachama wake wote. Watu hao ambao wanaohojiwa kwa ufanisi wanaitwa washiriki . Kwa kweli, wakazi wa sampuli na wahojiwa watakuwa sawa, lakini katika mazoezi kuna yasiyo ya kupinga. Hiyo ni, watu waliochaguliwa katika sampuli wakati mwingine hawashiriki. Ikiwa watu wanaoitikia ni tofauti na wale wasiojibu, basi kunaweza kuwa na ubaguzi usiofaa . Uchaguzi usio na hatia ulikuwa shida kuu ya pili na uchaguzi wa Literary Digest . Ni asilimia 24 tu ya watu waliopata kura walijibu, na ikawa kwamba watu ambao waliunga mkono Landon walikuwa zaidi ya kujibu.
Zaidi ya kuwa tu mfano wa kuanzisha mawazo ya uwakilishi, uchaguzi wa Literary Digest ni mfano unaorudiwa mara nyingi, wakionya wachunguzi kuhusu hatari za sampuli isiyofaa. Kwa bahati mbaya, nadhani kwamba somo ambalo watu wengi hutoka kwenye hadithi hii ni sawa. Maadili ya kawaida ya hadithi ni kwamba watafiti hawawezi kujifunza kitu chochote kutoka kwenye sampuli zisizowezekana (yaani, sampuli bila sheria kali za uwezekano wa kuchagua washiriki). Lakini, kama nitakavyoonyesha baadaye katika sura hii, sio haki kabisa. Badala yake, nadhani kuna maadili mawili kwa hadithi hii; maadili ambayo ni ya kweli leo kama ilivyokuwa mwaka wa 1936. Kwanza, kiasi kikubwa cha takwimu zilizokusanywa hazitajifanyia hakika. Kwa ujumla, kuwa na idadi kubwa ya wahojiwa hupunguza tofauti ya makadirio, lakini haipaswi kupunguza upendeleo. Kwa data nyingi, watafiti wanaweza wakati mwingine kupata makadirio sahihi ya jambo baya; wanaweza kuwa sahihi sana (McFarland and McFarland 2015) . Somo la pili kuu kutoka fiasco ya Literary Digest ni kwamba watafiti wanahitaji kuhesabu jinsi sampuli zao zilizokusanywa wakati wa kufanya makadirio. Kwa maneno mengine, kwa sababu mchakato wa sampuli katika Uchaguzi wa Literary Digest ulikuwa ukielekezwa kwa utaratibu kwa washiriki wengine, watafiti walihitaji kutumia mchakato wa kukadiriwa zaidi ambao wamesimamia washiriki wengine zaidi kuliko wengine. Baadaye katika sura hii, nitakuonyesha utaratibu huo wa uzito-baada ya stratification-ambayo inaweza kukuwezesha kufanya makadirio bora kutoka kwa sampuli za hatari.