jarduerak

  • zailtasun maila: erraza erraza , ertaina medium , gogorra hard , Oso gogorra Oso gogorra
  • matematika eskatzen du Matematika eskatzen du )
  • kodeketa eskatzen du kodeketa eskatzen du )
  • datuen bilketa ( datuen bilketa )
  • nire gogokoenak ( nire gogokoena )
  1. [ Oso gogorra , kodeketa eskatzen du , datuen bilketa , nire gogokoena ] Benoit eta lankideen (2016) adierazpen politikoen multzokatzeen inguruko ikerketen zirrararik zirraragarrienetako bat emaitzek erreproduzitzen dute. Merz, Regel, and Lewandowski (2016) Manifestu Corpuserako sarbidea ematen du. Saiatu Benoit et al. (2016) 2 irudia erreproduzitzea Benoit et al. (2016) Amazon Mekaniko Turkeko langileekin. Nola antzekoak ziren zure emaitzak?

  2. [ medium ] InfluenzaNet proiektuan, pertsona boluntarioek eragina duten gaixotasunekin zerikusia duten jokaerak, prebalentzia eta osasun-jokabidea (Tilston et al. 2010; Noort et al. 2015) .

    1. InfluenzaNet-en, Google Gripearen joerak eta gripearen jarraipen sistema tradizionalen diseinua, kostuak eta ziurrenik akatsak alderatu eta kontrastatu.
    2. Etengabeko denbora kontuan hartu, hala nola, gripearen forma eleberri baten agerraldia. Deskribatu sistema bakoitzeko akatsak posibleak.
  3. [ hard , kodeketa eskatzen du , datuen bilketa ] The Economist aldizkari asteko aldizkaria da. Sortu giza konputazio-proiektua, emakumeek estalkian gizonezkoen ratioa denboran zehar aldatzen joan dela jakiteko.

    1. Aldizkariak zortzi eskualde desberdinetan (Afrika, Asia Pazifikoa, Europa, Europar Batasuna, Latinoamerikako, Ekialde Ertaina, Ipar Amerika eta Erresuma Batua) azalak izan ditzake eta aldizkariaren webgunetik deskargatu ahal izango dira. Hautatu eskualde horietako bat eta egin azterketa. Ziurtatu zure prozedurak xehetasun nahikorik deskribatu, besteek errepikatu dezaketela.

    Galdera hau Justin Tenuto proiektuaren antzekoa zen, CrowdFlower crowdsourcing enpresaren datu zientzilaria: ikusi "Time Magazine Really Likes Dudes" (http://www.crowdflower.com/blog/time-magazine-cover-data). .

  4. [ Oso gogorra , kodeketa eskatzen du , datuen bilketa ] Aurreko galderari jarraiki, gaur egun aztertu zortzi eskualde guztietarako.

    1. Zer desberdintasun zeuden eskualde guztietan?
    2. Zenbat denbora gehiago eta dirua eskualdearen zortzi eskualdeetan azterketa eskala handitu al da?
    3. Imajina ezazu Economistek astebeteko 100 estalkiak dituela. Aurrekontua zenbat denbora eta dirua aste bakoitzeko 100 azaleratan azterketak eskalatzea izango litzateke.
  5. [ hard , kodeketa eskatzen du ] Webgune ugari daude irekita dauden deialdi proiektuak, hala nola, Kaggle. Proiektu horietako batean parte hartu, eta proiektu jakin horri buruzko informazioa eta orokorrean deialdi irekiei buruzkoa deskribatu.

  6. [ medium ] Begiratu zure alorreko aldizkari baten azkeneko alea. Ba al dago deialdi irekiko proiektuen berrikusketarako paperik? Zergatik edo zergatik ez?

  7. [ erraza ] Purdam (2014) egindako eskaera datu bildumak deskribatzen ditu. Laburbildu ikerketa diseinu honen indarguneak eta ahuleziak.

  8. [ medium ] Redundancy datu banatuaren bildumako kalitatea ebaluatzeko modu garrantzitsu bat da. Windt and Humphreys (2016) garatu eta probatu zuten Kongoko Kongoko gatazka gertaeren txostenak biltzeko sistema bat. Paper irakurtzea.

    1. Nola funtzionatzen dute diseinuek erredundantzia?
    2. Hainbat ikuspegi eskaintzen dituzte beren proiektutik jasotako datuak baliozkotzeko. Laburbildu itzazu. Zein izan zen zuretzako konbentzigarriena?
    3. Datuak baliozkotu ahal izateko modu berri bat proposatzea. Iradokizunek datuek izan ditzaketen konfiantza areagotuko da, kostu-eraginkorra eta etikoa.
  9. [ medium ] Karim Lakhani eta lankideek (2013) deialdi ireki bat sortu zuten algoritmo berriak eskatzeko, biologia konputazionalean arazo bat konpontzeko. 600 proposamen konbinazio berrien 89 proposamen baino gehiago jaso dituzte. Bidalketen arabera, 30ek AEBko Osasun Institutu Nazionalen MegaBLAST errendimendua gainditu zuten, eta aurkezpenik onena zehaztasun handiagoz eta azkarragoa izan zen (1.000 aldiz azkarrago).

    1. Irakurri bere papera, eta, ondoren, proposamen irekiko lehiaketa berdina erabil dezaketen ikerketa sozialeko arazo bat proposatu. Bereziki, lehiaketa ireki mota hau lehendik dagoen algoritmo baten errendimendua hobetzeko eta hobetzeko bideratuta dago. Ezin baduzu zure eremu honetako arazo hau pentsatu, zergatik ez azaldu.
  10. [ medium , nire gogokoena ] Hainbat giza konputazio proiektuek Amazoneko Mekaniko Turkiarrak parte hartzen dute. Erregistratu langile bihurtzeko Amazoneko Turk mekanikoan. Pasa ordu bat lanean. Nola eragiten du zure pentsamenduak giza konputazioko proiektuen diseinuan, kalitatean eta etikan?