jarduerak

  • zailtasun maila: erraza erraza , ertaina medium , gogorra hard , Oso gogorra Oso gogorra
  • matematika eskatzen du Matematika eskatzen du )
  • kodeketa eskatzen du kodeketa eskatzen du )
  • datuen bilketa ( datuen bilketa )
  • nire gogokoenak ( nire gogokoena )
  1. [ hard , Matematika eskatzen du ] Kapituluan, post-estratifikazioari buruzko oso positiboa izan nintzen. Hala ere, hori ez da beti kalkuluen kalitatea hobetzen. Eraikitzeko egoera bat non post-estratifikazioak kalkuluen kalitatea gutxitu dezakeen. (Argibide bat lortzeko, ikus Thomsen (1973) .)

  2. [ hard , datuen bilketa , kodeketa eskatzen du ] Amazoniako Turkiko mekanikari buruzko probabilitate inkesta bat diseinatu eta burutzea pistola kontrolatzeko norabidea eta jarrerak galdetu. Zure estimazioak probabilitate-laginetik eratorritakoen arabera konparatu ahal izateko, kopiatu galdera-testua eta erantzun-aukerak zuzenean, kalitate handiko inkesta bat, esate baterako, Pew Research Center-ek zuzentzen dituenak.

    1. Zenbat denbora egiten du zure inkesta? Zenbat balio du? Nola egiten da zure lagineko demografia AEbetako biztanleen demografia?
    2. Zein da laginaren bidez pistaren jabetzako estimazio gordinak?
    3. Egiaztatu zure laginaren ez errepresentatiboak post-estratifikazioa edo beste teknika batzuk erabiliz. Orain, zein da pistaren jabetza baloratzea?
    4. Nola kalkulatu zure estimazioak probabilitatean oinarritutako lagin baten azken estimazioa? Zer deritzozu desadostasunak azaltzen, baldin badago?
    5. Errepikatu galderak (b) - (d) pistola kontrolatzeko jarrerak lortzeko. Nola aurkitzen dituzu zure aurkikuntzak?
  3. [ Oso gogorra , datuen bilketa , kodeketa eskatzen du ] Goel eta lankideek (2016) Gizarte Inkestaren (GSS) 49 aukerazko aukera anitzeko aukera administratiboak kudeatu zituzten eta Pew Research Center-k egindako inkesten arabera, Amazon Makineko Turk-ek egindako inkestatuen lagin ez probabilitatea. Orduan, datuen ez ordezkagarritasuna egokitu egin zuten ereduak oinarritutako estratifikazioa egin eta kalkulatutako doikuntzak probabilitatean oinarritutako GSS eta Pew inkestekin alderatuta. Amazoneko mekaniko turistaren inkesta bera egitea eta 2a irudia eta 2b irudia errepikatzea saiatzen dira kalkulatutako doikuntzak alderatuz GSS eta Pew inkesten azken txanden berrietatik. (Ikusi eranskina, A2 taula, 49 galderen zerrenda.)

    1. Zure emaitzak Pew eta GSS-rekin alderatu eta kontrastatu.
    2. Zure emaitzak alderatu eta alderatu Goel, Obeng, and Rothschild (2016) Mekaniko Turkiar inkestak.
  4. [ medium , datuen bilketa , kodeketa eskatzen du ] Ikasketa askok telefono mugikorren erabilerari buruzko autoebaluazio neurriak erabiltzen dituzte. Inguru interesgarria da ikertzaileek portaera Boase and Ling (2013) portaera automatikoki alderatzea (ikus, adibidez, Boase and Ling (2013) ). Bi ohiko jokabideei buruzko deiak eta mezuak bidaltzen dira, eta bi denbora-marko komunak "atzo" eta "azken astean" dira.

    1. Datu guztiak biltzeko, norberaren txostenaren neurriak zehatzagoak direla uste al duzu? Zergatik?
    2. Zure lagunen bost lagun biltzea zure inkestan. Laburki laburbildu bost lagun hauen laginak nola egiten diren. Laginketa-prozedurak zure estimazioetan prebentzio zehatzak bultzatu ditzake?
    3. Eska iezaiezu ondorengo mikrosorkuntzako galderak:
    • "Zenbat aldiz erabili zenuen zure telefono mugikorra atzo besteei deitzeko?"
    • "Zenbat testu mezu bidali zenuen atzo?"
    • "Zenbat aldiz erabili zenuen zure telefono mugikorra azken 5 egunetan besteei deitzeko?"
    • "Zenbat aldiz erabili zenuen zure telefono mugikorra azken 7 egunetan testu-mezuak edo SMSak bidaltzeko edo jasotzeko?"
    1. Behin mikrosurkidura hori amaitu ondoren, galdetu haien erabilera-datuak beren telefonoaren edo zerbitzu-hornitzailearen arabera erregistratzeko. Nola auto-txostenaren erabilera datuen erregistroarekin konparatzen du? Zein da zehatzena, gutxienez zehatza?
    2. Orain zure klasean beste pertsona batzuen datuekin bildu dituzun datuak konbinatu (jarduera hau egiten baduzu klase batean). Datu multzo handiago honekin, errepikatu parte (d).
  5. [ medium , datuen bilketa ] Schuman eta Presser (1996) argudiatu galdera-aginduak bi galderekiko axolagabeak izango liratekeela: galdera partzialak bi galderek zehaztasun maila berean (adibidez, bi lehendakaritza hautagaien kalifikazioak); Galdera orokor bat galdera zehatzago bati jarraitzen dion galdera osagarrien zati bat da (adibidez, galdetu "Zein pozik zaude zure lanarekin?" eta "Zein pozik zaude zurekin?").

    Galdera-ordenako bi efektu mota bereizten dituzte: koherentzia-ondorioak hurrengo galderara hurbiltzen direnean (aurretik izan ezean) hurbileko galdera bati emandako erantzunak hurbilago daudenean gertatzen dira; Kontraste-efektuak bi galderei erantzuten arteko desberdintasun handiagoak gertatzen dira.

    1. Sortu pare bat galdera galdera pare bat galdera ordena efektu handi bat izango duzula; Galdera partzialeko pare bat uste duzu, ordena efektu handia izango duzula; eta uste duzun ordenaren pare bat ez litzateke axola. Exekutatu inkestako esperimentua Amazoneko Turk mekanikoari zure galderei probatzeko.
    2. Zein partzialki efektu handi bat sortu zenuen? Koherentzia edo kontraste efektua izan al zen?
    3. Zein tamainako efektu osoa sortu zenuen? Koherentzia edo kontraste efektua izan al zen?
    4. Ba al dago galderarik zure bikotearengan eragina, non ez duzu uste ordena eskatuko lukeenik?
  6. [ medium , datuen bilketa ] Schuman eta Presser-en lanetan oinarrituta, Moore (2002) galdera-ordena efektuaren dimentsio bereizi bat deskribatzen du: efektu gehigarriak eta kenketak. Kontrastea eta koherentzia efektuak elkarren artean elkarrizketatutako bi elementuen ebaluazioen ondorioz sortzen diren bitartean, ondorioak gehitu eta kendu egiten zaizkie inkestek galdera gehiago planteatzen dizkieten esparru zabalagoei. Irakurri Moore (2002) , ondoren MTurk inkestaren esperimentua diseinatu eta burutzeko efektu gehigarriak edo kenketak erakusteko.

  7. [ hard , datuen bilketa ] Christopher Antounek eta lankideek (2015) aztertu dute lau kontratazio iturri desberdinetan lortutako erosotasun-laginak alderatuz: MTurk, Craigslist, Google AdWords eta Facebook. Azterketa sinple bat diseinatu eta parte-hartzaileen biltzea gutxienez bi lineako kontratazio iturri ezberdinetatik (iturri horiek Antoun et al. (2015) erabilitako lau iturrietatik desberdina izan daiteke).

    1. Konparatu kostua kontratatzeko-dirua eta denbora-iturri ezberdinen arabera.
    2. Iturri ezberdinetatik lortutako laginen konposizioa alderatzea.
    3. Konparatu laginen arteko datuen kalitatea. Inkestatuen datuen kalitatea neurtzeko ideiak lortzeko, ikus Schober et al. (2015) .
    4. Zein da zure iturri gogokoena? Zergatik?
  8. [ medium ] 2016ko EBren erreferentzien (hau da, Brexit) emaitzen aurreikuspenean, YouGov-ek Interneten oinarritutako merkatuen ikerketarako konpainia bat egin du, Erresuma Batuko 800.000 inkestatu inguruko panelen galdeketen online.

    YouGov-en estatistika-ereduaren deskribapen zehatza at https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/ helbidean dago. Gutxi gorabehera, YouGov-ek hauteskunde-boto orokorrak, adina, tituluak, generoa eta elkarrizketaren eguna izan ziren oinarritutako hautesleek partekatzen zituzten motak, baita bizi zuten barrutia ere. Lehenik eta behin, YouGov-eko panelek bildutako datuak erabili zituzten, hautesleek botoa emateko duten boto mota bakoitzeko pertsonen proportzioa kalkulatzeko. Hautesle mota bakoitzaren parte hartzea kalkulatu dute 2015eko hauteskundeetako hauteskunde britainiarrak (BES), hauteskundeetako hautagaiek hautesleen hautaketa baliozkotzerako hauteskundeetako hauteskundeetako hauteskundeetarako. Azkenean, hautesleek hautesle bakoitzaren zenbat jende zeuden kalkulatu zituzten, azken errolda eta urteko biztanleriaren inkesta (datuen iturri batzuetatik beste batzuekin batera).

    Hiru eguneko botoa baino lehen, YouGovek bi puntu lortu zituen Leave-en. Botoaren bezperan, galdeketaren emaitza oso hurbil zegoen (49/51 Jarrai). Azkeneko eguneko azterketaren arabera 48/52 aurreikusitakoa (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/) iragarri zuen. Izan ere, estimazio hori galdu egin zuen azken emaitza (52/48 Utzi) lau puntu ehuneko.

    1. Erabili inkestaren errore-marko osoa, kapitulu honetan eztabaidatu dena, zer oker egon daitekeen ebaluatzeko.
    2. YouGov-en hauteskundeen ondoren erantzun (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) azaldu du: "Horrek zati handi batean badirudi parte-hartzea dela-zerbait esan dugunez, ezinbestekoa izango litzateke lasterketa orekatu eta finantzario baten emaitza. Gure parte-hartze eredua, neurri batean, hauteskunde orokorren azken bozketan bozkatu zuten eta hauteskunde orokorretan baino gehiagoko partaidetza-maila bat aldarrikatu zuten, batez ere Iparraldean. "Aldaketaren bat aldatzen al da parte (a)?
  9. [ medium , kodeketa eskatzen du ] 3. irudian irudikapen errore bakoitzaren ilustrazioa simulatzea.

    1. Errore hauek bertan behera uzteko egoera sortu.
    2. Sortu akatsak non konposatzen diren beste egoera bat.
  10. [ Oso gogorra , kodeketa eskatzen du ] Blumenstock-en eta lankideen (2015) ikerketek makina ikasketen eredua eraikitzen dute, trazatu digitalen datuak erabil ditzaten inkesten erantzunak aurreikusteko. Orain, gauza bera beste datu-multzo batekin saiatuko zara. Kosinski, Stillwell, and Graepel (2013) Facebookek gustuko duten ezaugarriak eta atributuak iragartzeko aurkitu dute. Harrigarria bada ere, aurreikuspen horiek lagun eta lankideek baino are zehatzagoak izan daitezke (Youyou, Kosinski, and Stillwell 2015) .

    1. Irakurri Kosinski, Stillwell, and Graepel (2013) , eta 2. irudia errepikatu. Datu horiek eskuragarri daude: http://mypersonality.org/
    2. Orain, 3. irudia errepikatu.
    3. Azkenean, saiatu zure eredua zure Facebook datuetan: http://applymagicsauce.com/. Nola funtzionatzen du zuretzat?
  11. [ medium ] Toole et al. (2015) Deialdien xehetasunen erregistroak (CDRak) erabiltzen dira telefono mugikorretan, langabezi osoaren joerak iragartzeko.

    1. Toole et al. (2015) azterketa diseinua alderatu eta kontrastatu Toole et al. (2015) Blumenstock, Cadamuro, and On (2015) .
    2. CDRk inkesta tradizionalak ordeztu behar lituzkeela uste al duzu? Zergatik?
    3. Zer froga litzateke konbentzitzea CDRk langabezia-tasaren neurri tradizionalak erabat ordezkatzea?