Cynrychiolaeth yn ymwneud â ffurfio casgliadau o dy ymatebwyr at eich boblogaeth darged.
Er mwyn deall y math o gamgymeriadau a all ddigwydd wrth gywiro'r ymatebwyr i'r boblogaeth fwy, gadewch i ni ystyried yr arolwg gwenith Crynhoad Llenyddol a geisiodd ragfynegi canlyniad etholiad arlywyddol yr Unol Daleithiau yn 1936. Er iddo ddigwydd dros 75 mlynedd yn ôl, mae gan y ddadl hon wers bwysig o hyd i addysgu ymchwilwyr heddiw.
Roedd Cylchgrawn Llenyddol yn gylchgrawn poblogaidd poblogaidd, ac yn dechrau ym 1920, dechreuodd redeg arolygon gwellt i ragfynegi canlyniadau etholiadau arlywyddol. Er mwyn gwneud y rhagfynegiadau hyn, byddent yn anfon pleidleisiau i lawer o bobl ac yna'n syml i dalu'r pleidleisiau a ddychwelwyd; Llenyddol Crynhoad adroddodd yn falch bod y pleidleisiau a dderbyniwyd ganddynt y naill ffordd "pwysoli, wedi'i addasu, nac dehongli." Mae'r weithdrefn a ragwelir yn gywir enillwyr yr etholiadau yn 1920, 1924, 1928 a 1932. Yn 1936, yng nghanol y Dirwasgiad Mawr, llenyddol Fe wnaeth Digest anfon pleidleisiau i 10 miliwn o bobl, a daeth eu henwau yn bennaf o gyfeirlyfrau ffôn a chofnodion cofrestru automobile. Dyma sut y disgrifiwyd eu methodoleg:
"Mae peiriant rhedeg y DIGEST yn symud yn fanwl gywir â thri deg mlynedd o brofiad i leihau gwaith dyfalu i ffeithiau caled ... Yr wythnos hon, cafodd 500 o brennau sgrifennu mwy na chwarter miliwn o gyfeiriadau y dydd. Bob dydd, mewn ystafell ardderchog uwchben y Fourth Avenue, yn Efrog Newydd, mae 400 o weithwyr yn llithro miliwn o ddarnau o ddeunydd printiedig - yn ddigon i blygu deugain o flociau'r ddinas - i'r amlenni dan sylw [sic]. Bob awr, yn Is-orsaf Swyddfa'r Post THE DIGEST, roedd tair peiriant mesur sgwrsio yn selio a stampio'r oblongs gwyn; gweithwyr cyflogedig medrus yn eu troi i mewn i fagiau bras; fe wnaeth tryciau DIGEST fflyd eu troi i fynegi post-drenau. . . Yr wythnos nesaf, bydd yr atebion cyntaf o'r deg miliwn hyn yn dechrau ar y llanw sy'n dod i mewn o bleidleisiau a farciwyd, i gael eu gwirio yn driphlyg, eu gwirio, bum gwaith wedi eu dosbarthu yn groes a chyfanswm. Pan gafodd y ffigwr olaf ei gyfansawdd a'i wirio, os yw profiad yn y gorffennol yn faen prawf, bydd y wlad yn gwybod o fewn ffracsiwn o 1 y cant y bleidlais boblogaidd gwirioneddol o ddeugain miliwn [pleidleiswyr]. "(Awst 22, 1936)
Mae fetishization o faint Crynodeb Llythrennol yn cael ei adnabod yn syth i unrhyw ymchwilydd "data mawr" heddiw. O'r 10 miliwn o bleidleisiau a ddosbarthwyd, dychwelwyd 2.4 miliwn anhygoel - mae hynny'n fras 1,000 gwaith yn fwy na phleidleisiau gwleidyddol modern. O'r 2.4 miliwn o ymatebwyr hyn, roedd y dyfarniad yn glir: roedd Alf Landon yn mynd i drechu Franklin Roosevelt. Ond, mewn gwirionedd, treuliodd Roosevelt Landon mewn tirlithriad. Sut y gallai Cryno Llenyddol fynd o'i le gyda chymaint o ddata? Mae ein dealltwriaeth fodern o samplu yn gwneud camgymeriadau Crynoad Llythrennol yn glir ac yn ein cynorthwyo i osgoi gwneud camgymeriadau tebyg yn y dyfodol.
Mae meddwl yn glir am samplu yn gofyn i ni ystyried pedwar gwahanol grŵp o bobl (ffigur 3.2). Y grŵp cyntaf yw'r boblogaeth darged ; dyma'r grŵp y mae'r ymchwilydd yn ei ddiffinio fel y boblogaeth o ddiddordeb. Yn achos Crynodeb Llythrennol , roedd y boblogaeth darged yn bleidleiswyr yn etholiad arlywyddol 1936.
Ar ôl penderfynu ar boblogaeth darged, mae angen i ymchwilydd ddatblygu rhestr o bobl y gellir eu defnyddio ar gyfer samplu. Gelwir y rhestr hon yn ffrâm samplu a gelwir y bobl arno yn ffrâm poblogaeth . Yn ddelfrydol, byddai'r boblogaeth darged a'r boblogaeth ffrâm yn union yr un fath, ond yn ymarferol nid yw hyn yn wir yn aml. Er enghraifft, yn achos Crynodeb Llythrennol , y boblogaeth ffrâm oedd y 10 miliwn o bobl y daeth eu henwau yn bennaf o gyfeirlyfrau ffôn a chofnodion cofrestru automobile. Gelwir gwahaniaethau rhwng y boblogaeth darged a'r boblogaeth ffrâm yn gwallau sylw . Nid yw gwall y cwmpas, trwy ei hun, yn gwarantu problemau. Fodd bynnag, gall arwain at ragfarn o ran ymdriniaeth os yw pobl yn y boblogaeth ffrâm yn wahanol yn systematig i bobl yn y boblogaeth darged nad ydynt yn y boblogaeth ffrâm. Mae hyn, mewn gwirionedd, yn union beth ddigwyddodd yn yr arolwg Pwnc Llenyddol . Roedd y bobl yn eu poblogaeth ffrâm yn dueddol o fod yn fwy tebygol o gefnogi Alf Landon, yn rhannol oherwydd eu bod yn fwy cyfoethog (dwyn i gof bod y ddau ffon ac automobiles yn gymharol newydd ac yn ddrud ym 1936). Felly, yn yr arolwg Pwnc Llythrennedd , roedd gwallau darlledu yn arwain at ragfarn yn y ddarpariaeth.
Ar ôl diffinio'r boblogaeth ffrâm , y cam nesaf yw i ymchwilydd ddewis poblogaeth y sampl ; Dyma'r bobl y bydd yr ymchwilydd yn ceisio cyfweld. Os oes gan y sampl nodweddion gwahanol na'r boblogaeth ffrâm, yna gall samplu gyflwyno gwall samplu . Yn achos y fiasco Digwyddiad Llenyddol , fodd bynnag, nid oedd unrhyw samplu mewn gwirionedd - y cylchgrawn i gysylltu â phawb yn y boblogaeth ffrâm-ac felly nid oedd unrhyw wallau samplu. Mae llawer o ymchwilwyr yn tueddu i ganolbwyntio ar wallau samplu - fel arfer, yr unig fath o wallau a ddelir gan yr ymyl gwallau a adroddir mewn arolygon - ond mae'r ffiasgo Crynhoad Llenyddol yn ein atgoffa bod angen inni ystyried pob ffynhonnell o wall, ar hap a systematig.
Yn olaf, ar ôl dewis poblogaeth sampl, mae ymchwilydd yn ceisio cyfweld ei holl aelodau. Gelwir y bobl hynny sy'n cael eu cyfweld yn llwyddiannus yn ymatebwyr . Yn ddelfrydol, byddai'r boblogaeth sampl a'r ymatebwyr yn union yr un fath, ond yn ymarferol nid oes ateb. Hynny yw, nid yw pobl sy'n cael eu dewis yn y sampl weithiau'n cymryd rhan. Os yw'r bobl sy'n ymateb yn wahanol i'r rhai nad ydynt yn ymateb, yna gall fod tuedd di-ateb . Tuedd di-reswm oedd yr ail brif broblem gyda'r arolwg Digwyddiad Llenyddol . Dim ond 24% o'r bobl a dderbyniodd bleidlais a ymatebodd, a daeth yn amlwg bod pobl a gefnogodd Landon yn fwy tebygol o ymateb.
Y tu hwnt dim ond bod yn enghraifft i gyflwyno syniadau cynrychiolaeth, mae'r arolwg Digwyddiad Llythrennol yn ddameg ailadroddus, gan roi rhybudd i ymchwilwyr am beryglon samplu haphazard. Yn anffodus, rwy'n credu mai'r wers y mae llawer o bobl yn tynnu o'r stori hon yw'r un anghywir. Moeseg mwyaf cyffredin y stori yw na all ymchwilwyr ddysgu unrhyw beth o samplau nad ydynt yn debygol o fod yn debygol (hy, samplau heb reolau llym tebygolrwydd ar gyfer dewis cyfranogwyr). Ond, fel y byddaf yn dangos yn ddiweddarach yn y bennod hon, nid yw hynny'n iawn. Yn lle hynny, credaf fod yna ddau moesau gwirioneddol i'r stori hon; moesau sydd mor wir heddiw fel yr oeddent yn 1936. Yn gyntaf, ni fydd llawer iawn o ddata a gasglwyd yn hapus yn gwarantu amcangyfrif da. Yn gyffredinol, mae cael nifer fawr o ymatebwyr yn lleihau amrywiant yr amcangyfrifon, ond nid yw o reidrwydd yn lleihau'r rhagfarn. Gyda llawer o ddata, gall ymchwilwyr weithiau gael amcangyfrif manwl o'r peth anghywir; gallant fod yn fanwl gywir (McFarland and McFarland 2015) . Yr ail brif wers o'r fiasco Crynodeb Llythrennedd yw bod angen i ymchwilwyr roi cyfrif am sut y casglwyd eu sampl wrth wneud amcangyfrifon. Mewn geiriau eraill, oherwydd bod y broses samplu yn yr arolwg Pwnc Llythrennedd wedi'i atal yn systematig tuag at rai ymatebwyr, roedd angen i ymchwilwyr ddefnyddio proses amcangyfrif mwy cymhleth a bwysleisiodd rhai ymatebwyr yn fwy nag eraill. Yn ddiweddarach yn y bennod hon, byddaf yn dangos i chi un weithdrefn bwysoli o'r fath-ôl-haen-gall hynny eich galluogi i wneud amcangyfrifon gwell o samplau haphazard.