gweithgareddau

allwedd:

  • rhywfaint o anhawster: hawdd hawdd , canolig canolig , yn galed caled , Yn galed iawn yn galed iawn
  • ei gwneud yn ofynnol mathemateg ( ei gwneud yn ofynnol mathemateg )
  • ei gwneud yn ofynnol codio ( ei gwneud yn ofynnol codio )
  • casglu data ( casglu data )
  • fy ffefrynnau ( fy ffefryn )
  1. [ canolig , fy ffefryn ] Dryslyd algorithmig yn broblem gyda Tueddiadau Ffliw Google. Darllenwch y papur gan Lazer et al. (2014) , ac ysgrifennu e-bost byr, clir i beiriannydd yn Google esbonio'r broblem a chynnig syniad o sut i ddatrys y broblem.

  2. [ canolig ] Bollen, Mao, and Zeng (2011) yn honni y gall data o Twitter yn cael ei ddefnyddio i ragweld y farchnad stoc. Arweiniodd y canfyddiad at greu gwrych cronfa-Derwent Cyfalaf Marchnadoedd-i fuddsoddi yn y farchnad stoc yn seiliedig ar ddata a gasglwyd o Twitter creu (Jordan 2010) . Pa dystiolaeth y byddech am weld cyn rhoi eich arian yn y gronfa honno?

  3. [ hawdd ] Er bod rhai eiriolwyr iechyd cyhoeddus Hail e-sigaréts fel cymorth effeithiol ar gyfer rhoi'r gorau i ysmygu, mae eraill rhybuddio am y peryglon posibl, megis y uchel-lefelau nicotin. Dychmygwch fod yn ymchwilydd yn penderfynu i astudio barn y cyhoedd tuag at e-sigaréts drwy gasglu swyddi Twitter gysylltiedig ag e-sigaréts a chynnal dadansoddiad sentiment.

    1. Beth yw'r tri tueddiadau posibl eich bod yn fwyaf poeni am yn yr astudiaeth hon?
    2. Clark et al. (2016) yn rhedeg yn unig astudiaeth o'r fath. Yn gyntaf, maent yn casglu 850,000 tweets oedd yn defnyddio geiriau allweddol sy'n gysylltiedig ag e-sigarét o fis Ionawr 2012 trwy Rhagfyr 2014. Ar ôl edrych yn fanylach, maent yn sylweddoli bod llawer o'r tweets hyn yn cael eu awtomataidd (hy, heb eu cynhyrchu gan bobl) ac mae llawer o'r tweets awtomataidd rhain yn y bôn hysbysebion. Maent yn datblygu Canfod Algorithm Dynol i wahanu tweets awtomataidd o tweets organig. Gan ddefnyddio'r Dynol hon Canfod Algorithm daethant o hyd bod 80% o tweets eu awtomataidd. A yw canfyddiad hwn yn newid eich ateb i ran (a)?
    3. Pan fyddant yn cymharu â'r teimlad mewn tweets organig a awtomataidd maent yn gweld bod y tweets awtomataidd yn fwy cadarnhaol na'r tweets organig (6.17 erbyn 5.84). A yw canfyddiad hwn yn newid eich ateb i (b)?
  4. [ hawdd ] Ym mis Tachwedd 2009, newidiodd Twitter y cwestiwn yn y blwch tweet o "Beth ydych chi'n ei wneud?" I "Beth sy'n digwydd?" (Https://blog.twitter.com/2009/whats-happening).

    1. Sut ydych chi'n meddwl y bydd y newid o anogeiriau effeithio ar bwy trydar a / neu beth y maent yn trydar?
    2. Enwch un prosiect ymchwil y byddai'n well gennych y brydlon "Beth ydych chi'n ei wneud?" Eglurwch pam.
    3. Enwch un prosiect ymchwil y byddai'n well gennych y brydlon "Beth sy'n digwydd?" Eglurwch pam.
  5. [ canolig ] Kwak et al. (2010) a ddadansoddwyd 41,700,000 broffiliau defnyddwyr, 1.47 biliwn o gysylltiadau cymdeithasol, 4262 Pynciau poblogaidd, a 106 miliwn i tweets rhwng 6 Mehefin a 31 Mehefin, 2009. Yn seiliedig ar y dadansoddiad hwn daethant i'r casgliad bod Twitter yn gwasanaethu mwy fel cyfrwng newydd o rannu gwybodaeth na rhwydwaith cymdeithasol.

    1. O ystyried canfyddiad Kwak et al, pa fath o waith ymchwil fyddech chi'n ei wneud gyda data Twitter? Pa fath o waith ymchwil na fyddech yn ei wneud gyda'r data Twitter? Pam?
    2. Yn 2010, ychwanegodd Twitter a phwy I ddilyn gwasanaeth yn gwneud awgrym wedi'i deilwra i ddefnyddwyr. Tri argymhelliad yn cael eu dangos ar y tro ar y brif dudalen. Argymhellion aml yn cael eu tynnu o un o "cyfeillion-of-ffrindiau," a chysylltiadau i'r ddwy ochr hefyd yn cael eu harddangos yn yr argymhelliad. Gall defnyddwyr adnewyddu i weld set newydd o argymhellion neu ewch dudalen gyda rhestr hwy o argymhellion. Ydych chi'n meddwl y byddai hyn yn nodwedd newydd yn newid eich ateb i ran a)? Pam neu pam ddim?
    3. Su, Sharma, and Goel (2016) gwerthuso effaith bwy I ddilyn gwasanaeth a gwelwyd bod tra bod defnyddwyr ar draws y sbectrwm poblogrwydd elwa o argymhellion, y defnyddwyr mwyaf poblogaidd elwa yn sylweddol fwy na'r cyfartaledd. A yw canfyddiad hwn yn newid eich ateb i ran b)? Pam neu pam ddim?
  6. [ hawdd ] "Retweets" yn cael eu defnyddio'n aml i fesur dylanwad a lledaenu o ddylanwad ar Twitter. I ddechrau, roedd defnyddwyr i gopïo a gludo y tweet oeddent yn ei hoffi, tagio awdur gwreiddiol gyda ef / hi trin, ac â llaw deipio "RT" cyn y tweet i ddangos ei fod yn retweet. Yna, yn 2009 Twitter ychwanegu botwm "retweet". Ym mis Mehefin 2016, a wnaed Twitter yn bosibl i ddefnyddwyr i retweet eu tweets hunain (https://twitter.com/twitter/status/742749353689780224). Ydych chi'n meddwl y dylai'r newidiadau hyn yn effeithio ar sut yr ydych yn defnyddio "retweets" yn eich ymchwil? Pam neu pam ddim?

  7. [ canolig , casglu data , ei gwneud yn ofynnol codio ] Michel et al. (2011) a adeiladwyd corpws dod i'r amlwg o ymdrech Google i ddigido llyfrau. Gan ddefnyddio'r fersiwn cyntaf y corpws, a gyhoeddwyd yn 2009 ac roedd yn cynnwys dros 5 miliwn o lyfrau digideiddio, mae'r awduron a ddadansoddwyd amlder defnydd geiriau i ymchwilio i newidiadau ieithyddol a thueddiadau diwylliannol. Yn fuan daeth y Llyfrau Corpus Google ffynhonnell ddata poblogaidd ar gyfer ymchwilwyr, a fersiwn 2il o'r gronfa ddata ei ryddhau yn 2012.

    Fodd bynnag, Pechenick, Danforth, and Dodds (2015) yn rhybuddio bod angen i ymchwilwyr i nodweddu'r llawn y broses samplu y corpws cyn ei ddefnyddio i lunio casgliadau cyffredinol. Y prif fater yw bod y corpws yn llyfrgell-fel, sy'n cynnwys un o bob un llyfr. O ganlyniad, yn unigolyn, awdur toreithiog yn gallu mewnosod amlwg ymadroddion newydd i mewn i'r eirfa Google Books. Ar ben hynny, testunau gwyddonol gyfystyr â gyfran gynyddol sylweddol y corpws drwy gydol y 1900au. Yn ogystal, drwy gymharu dau fersiwn o'r setiau data Ffuglen Saesneg, Pechenick et al. tystiolaeth fod digon o hidlo yn cael ei ddefnyddio i gynhyrchu fersiwn cyntaf. Mae pob un o'r data sydd ei angen ar gyfer gweithgarwch ar gael yma: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html

    1. Yn Michel et al. Yn papur gwreiddiol (2011) , maent yn defnyddio y fersiwn 1af y set ddata Saesneg, plotio mor aml y defnydd o'r blynyddoedd "1880", "1912" a "1973", a daeth i'r casgliad bod "rydym yn anghofio ein gorffennol yn gynt gyda phob blwyddyn fynd heibio "(Ffig. 3A, Michel et al.). Dyblygwch yr un plot gan ddefnyddio 1) fersiwn 1af y corpws, Saesneg ddata (un fath ag Ffig. 3A, Michel et al.)
    2. Nawr ailadrodd yr un plot gyda'r fersiwn 1af, Saesneg ffuglen set ddata.
    3. Nawr ailadrodd yr un plot gyda'r 2il fersiwn o'r corpws, set ddata Saesneg.
    4. Yn olaf, ailadrodd yr un plot gyda'r 2il fersiwn, Saesneg ffuglen set ddata.
    5. Disgrifiwch y gwahaniaethau a'r tebygrwydd rhwng y pedwar plot. Ydych chi'n cytuno â Michel et al. Yn dehongliad gwreiddiol y duedd a welwyd? (Awgrym: c) Dylid a d) yr un fath ag Ffigur 16 yn Pechenick et al).
    6. Nawr eich bod wedi ailadrodd hyn un canfyddiad gan ddefnyddio gwahanol Google Books corpora, dewiswch newid ieithyddol arall neu ffenomena diwylliannol a gyflwynir yn Michel et al. Yn papur gwreiddiol. Ydych chi'n cytuno â eu dehongliad yng ngoleuni'r cyfyngiadau a gyflwynir yn Pechenick et al.? I wneud eich dadl gryfach, ceisiwch ailadrodd yr un graff gan ddefnyddio gwahanol fersiynau o osod fel uchod data.
  8. [ yn galed iawn , casglu data , ei gwneud yn ofynnol codio , fy ffefryn ] Penney (2016) yn edrych ar a yw'r cyhoeddusrwydd cyffredinol ynghylch NSA gwyliadwriaeth / PRISM (hy, y datgeliadau Snowden) ym mis Mehefin 2013 yn gysylltiedig â gostyngiad sydyn ac yn sydyn mewn traffig i erthyglau Wicipedia ar bynciau sy'n codi pryderon preifatrwydd. Os felly, byddai'r newid hwn mewn ymddygiad fod yn gyson gydag effaith oeri sy'n deillio o gwyliadwriaeth torfol. Mae'r dull o Penney (2016) Weithiau gelwir dyluniad cyfres amser torri ar draws ac mae'n gysylltiedig â dulliau yn y bennod am frasamcanu arbrofion o ddata arsylwadol (Adran 2.4.3).

    I ddewis y geiriau allweddol pwnc, cyfeiriodd Penney at y rhestr a ddefnyddir gan yr Unol Daleithiau Adran Diogelwch y Famwlad ar gyfer olrhain a monitro cyfryngau cymdeithasol. Mae'r rhestr DHS categorizes dermau chwilio penodol i mewn i ystod o faterion, hy "Age Iechyd," "Security Seilwaith," a "Terfysgaeth." Am y grŵp astudio, a ddefnyddiwyd Penney y deugain ac wyth allweddeiriau cysylltiedig â "Terfysgaeth" (gweler Tabl 8 Atodiad). Yna hagregu Wicipedia barn erthygl cyfrif yn fisol ar gyfer y pedwar deg wyth o erthyglau Wikipedia cyfatebol dros gyfnod o tri deg dau fis, gan ddechrau Ionawr 2012 i ddiwedd mis Awst 2014. I gryfhau ei ddadl, mae hefyd yn creu nifer o gymhariaeth grwpiau drwy olrhain barn erthygl ar bynciau eraill.

    Nawr, rydych yn mynd i ailadrodd ac ymestyn Penney (2016) . Mae'r holl ddata crai y bydd angen i chi ar gyfer y gweithgaredd hwn ar gael gan Wikipedia (https://dumps.wikimedia.org/other/pagecounts-raw/). Neu gallwch ei gael oddi wrth y wikipediatrend pecyn R (Meissner and Team 2016) . Pan fyddwch yn ysgrifennu-up eich ymatebion, nodwch pa ffynhonnell ddata a ddefnyddiwyd gennych. (Sylwer: Mae'r un gweithgaredd hefyd yn ymddangos ym Mhennod 6)

    1. Darllenwch Penney (2016) ac ailadrodd Ffigur 2 sy'n dangos safbwyntiau dudalen ar gyfer "Terfysgaeth" tudalennau cysylltiedig â cyn ac ar ôl y datguddiad Snowden. Dehongli canfyddiadau.
    2. Nesaf, ailadrodd Ffig 4A, sy'n cymharu'r grŵp astudio ( "Terfysgaeth" erthyglau cysylltiedig â) gyda grŵp cymharol gan ddefnyddio geiriau allweddol categoreiddio o dan "DHS & Eraill Asiantaethau" o'r rhestr DHS (gweler Atodiad Tabl 10). Dehongli canfyddiadau.
    3. Yn rhannol b) i chi o gymharu â'r grŵp astudio i un grwp cymharol. Penney hefyd o gymharu â dau grŵp arall cymharydd: "Security Isadeiledd" erthyglau cysylltiedig â (Atodiad Tabl 11) a thudalennau Wikipedia poblogaidd (Atodiad Tabl 12). Dewch o hyd i grwp cymharol amgen, ac yn profi os yw'r canfyddiadau o ran b) yn sensitif i eich dewis o grŵp cymharol. Pa dewis o grŵp cymharol gwneud y synnwyr gorau? Pam?
    4. Dywedodd y awdur y keywords sy'n ymwneud â "Terfysgaeth" yn cael eu defnyddio i ddewis y erthyglau Wikipedia am fod y llywodraeth yr Unol Daleithiau a nodwyd terfysgaeth fel cyfiawnhad allweddol ar gyfer ei arferion gwyliadwriaeth ar-lein. Fel gwiriad o'r rhain 48 "Terfysgaeth" keywords cysylltiedig â, Penney (2016) a gynhaliwyd hefyd arolwg ar MTurk gofyn i ymatebwyr raddio pob un o eiriau allweddol yn nhermau Trouble y Llywodraeth, Preifatrwydd-Sensitif, ac Osgoi (Atodiad Tabl 7 ac 8). Dyblygwch yr arolwg ar MTurk a chymharu eich canlyniadau.
    5. Yn seiliedig ar y canlyniadau yn rhannol d) ac eich darllen yr erthygl, ydych chi'n cytuno â'r dewis yr awdur o keywords pwnc yn y grŵp astudiaeth? Pam neu pam ddim? Os na, beth fyddech chi'n ei awgrymu yn lle hynny?
  9. [ hawdd ] Efrati (2016) adroddiadau, yn seiliedig ar wybodaeth gyfrinachol, fod "cyfanswm rhannu" ar Facebook wedi gostwng tua 5.5% y flwyddyn dros y flwyddyn tra bod "rhannu darlledu gwreiddiol" i lawr 21% y flwyddyn dros y flwyddyn. Mae'r dirywiad yn arbennig o ddifrifol â defnyddwyr Facebook dan 30 mlwydd oed. Roedd yr adroddiad yn priodoli dirywiad dau ffactor. Mae un yn y twf yn y nifer o "ffrindiau" pobl yn ei chael ar Facebook. Y llall yw bod rhywfaint o weithgarwch o rannu wedi symud i negeseuon ac i gystadleuwyr fel SnapChat. Mae'r adroddiad hefyd yn dangos y nifer o dactegau oedd Facebook ceisio i roi hwb i rannu, yn cynnwys tweaks algorithm Newyddion Feed sy'n gwneud swyddi gwreiddiol yn fwy amlwg, yn ogystal â nodiadau atgoffa cyfnodol y gwreiddiol ddefnyddwyr swyddi "Ar y Diwrnod" sawl blwyddyn yn ôl. Pa oblygiadau, os o gwbl, a oes gan y canfyddiadau hyn yn cael ar gyfer ymchwilwyr sydd am ddefnyddio Facebook fel ffynhonnell data?

  10. [ canolig ] Tumasjan et al. (2010) fod cyfran y tweets sôn plaid wleidyddol yn cyfateb i'r gyfran o bleidleisiau y blaid honno a dderbyniwyd yn yr etholiad seneddol Almaen yn 2009 (Ffigur 2.9). Mewn geiriau eraill, roedd yn ymddangos y gallech eu defnyddio Twitter i ragweld yr etholiad. Ar adeg yr astudiaeth hon ei gyhoeddi ystyrid ei bod yn hynod o gyffrous gan ei fod yn ymddangos i awgrymu defnydd gwerthfawr ar gyfer ffynhonnell gyffredin o ddata mawr.

    O ystyried y nodweddion drwg o ddata mawr, fodd bynnag, dylech fod yn amheus o ganlyniad hwn ar unwaith. Almaenwyr ar Twitter yn 2009 yn eithaf yn grŵp di-cynrychioliadol, a gallai gefnogwyr o un parti tweet am wleidyddiaeth yn fwy aml. Felly, mae'n ymddangos yn syndod y byddai'r holl tueddiadau posibl y gallech eu dychmygu rhywsut canslo allan. Yn wir, mae'r canlyniadau yn Tumasjan et al. (2010) drodd allan i fod yn rhy dda i fod yn wir. Yn eu papur, Tumasjan et al. (2010) yn ystyried chwe plaid wleidyddol: Democratiaid Cristnogol (CDU), Democratiaid Cymdeithasol Christian (CSU), SPD, Rhyddfrydwyr (FDP), The Chwith (Die Linke), a'r Blaid Werdd (Grüne). Fodd bynnag, mae'r blaid wleidyddol yr Almaen mwyaf grybwyllwyd ar Twitter ar y pryd oedd y Blaid Môr-ladron (Piraten), parti sy'n ymladd rheoleiddio llywodraeth y Rhyngrwyd. Pan sefydlwyd y Blaid Môr-ladron cynnwys yn y dadansoddiad, Twitter sôn yn dod yn rhagfynegydd ofnadwy o canlyniadau etholiad (Ffigur 2.9) (Jungherr, Jürgens, and Schoen 2012) .

    Ffigur 2.9: Twitter crybwyll yn ymddangos i ragfynegi canlyniadau'r 2009 etholiad German (Tumasjan et al 2010.), Ond mae'r canlyniad hwn yn troi allan i ddibynnu ar rai dewisiadau mympwyol ac na ellir ei gyfiawnhau (Jungherr, Jurgens, a Schoen 2012).

    Ffigur 2.9: Twitter crybwyll yn ymddangos i ragfynegi canlyniadau'r 2009 etholiad Almaeneg (Tumasjan et al. 2010) , Ond y canlyniad hwn yn troi allan i ddibynnu ar rai dewisiadau mympwyol ac na ellir ei gyfiawnhau (Jungherr, Jürgens, and Schoen 2012) .

    Yn dilyn hynny, ymchwilwyr eraill o gwmpas y byd wedi defnyddio dulliau-megis ffansi fel defnyddio dadansoddiad teimlad i wahaniaethu rhwng cadarnhaol a negyddol yn sôn o'r partïon-er mwyn gwella gallu'r data Twitter i ragweld amrywiaeth o wahanol fathau o etholiadau (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . Dyma sut Huberty (2015) crynhoi canlyniadau'r ymdrechion hyn i ragweld etholiadau:

    "Mae pob dulliau darogan hysbys yn seiliedig ar gyfryngau cymdeithasol wedi methu pan destun i ofynion y gwir rhagolygon etholiadol-edrych ymlaen. Ymddengys bod y methiannau i fod oherwydd eiddo sylfaenol y cyfryngau cymdeithasol, yn hytrach nag at anawsterau methodolegol neu algorithmig. Yn fyr, nid cyfryngau cymdeithasol yn ei wneud, ac yn ôl pob tebyg byth yn, cynnig sefydlog diduedd lun,, cynrychiolydd o'r etholaeth; a samplau cyfleus cyfryngau cymdeithasol diffyg digon o ddata at atgyweiria y problemau hyn ar ôl hoc. "

    Darllenwch rai o'r ymchwil sy'n arwain Huberty (2015) i'r casgliad hwnnw, ac ysgrifennu memo un dudalen i'r ymgeisydd gwleidyddol disgrifio os a sut y dylid Twitter yn cael ei ddefnyddio i ragweld etholiadau.

  11. [ canolig ] Beth yw'r gwahaniaeth rhwng cymdeithasegwr a hanesydd? Yn ôl Goldthorpe (1991) , y prif wahaniaeth rhwng cymdeithasegwr a hanesydd yw rheolaeth dros gasglu data. Haneswyr yn cael eu gorfodi i ddefnyddio creiriau tra gall cymdeithasegwyr deilwra eu casgliad data i ddibenion penodol. Darllenwch Goldthorpe (1991) . Sut y gwahaniaeth rhwng cymdeithaseg a hanes sy'n gysylltiedig â'r syniad o Custommades a Readymades?

  12. [ caled ] Gan adeiladu ar y cwestiwn blaenorol, Goldthorpe (1991) Tynnodd nifer o ymatebion beirniadol, gan gynnwys un gan Nicky Hart (1994) a heriodd defosiwn Goldthorpe i deilwra data gwneud. Er mwyn egluro'r cyfyngiadau posibl o ddata wedi'u teilwra, disgrifiodd Hart y Prosiect Gweithwyr cefnog, arolwg mawr i fesur y berthynas rhwng dosbarth cymdeithasol a phleidleisio a gafodd ei gynnal gan Goldthorpe a chydweithwyr yng nghanol y 1960au. Fel y gellid ei ddisgwyl gan ysgolhaig a oedd yn ffafrio data dros data hyd i gynllunio, casglodd y Prosiect Gweithwyr cefnog data a oedd wedi'u teilwra i fynd i'r afael damcaniaeth a gynigiwyd yn ddiweddar ynghylch dyfodol dosbarth cymdeithasol mewn cyfnod o gynyddu safonau byw. Ond, Goldthorpe a chydweithwyr rhywsut "anghofio" i gasglu gwybodaeth am y patrwm pleidleisio o fenywod. Dyma sut Nicky Hart (1994) yn crynhoi'r holl ddigwyddiad:

    ". . . mae'n [yw] anodd osgoi dod i'r casgliad bod menywod wedi'u hepgor oherwydd bod hyn yn 'teilwra' set ddata wedi'i gyfyngu gan resymeg paradigmatic nad oedd yn cynnwys profiad benywaidd. Yrru gan weledigaeth damcaniaethol o ymwybyddiaeth dosbarth a gweithredu fel diddordebau gwrywaidd. . . , Goldthorpe a'i gydweithwyr adeiladwyd set o broflenni empirig oedd yn bwydo ac yn meithrin eu rhagdybiaethau damcaniaethol eu hunain yn hytrach na'u datgelu i brawf dilys o ddigonolrwydd. "

    Parhaodd Hart:

    "Mae canfyddiadau empirig y Prosiect Gweithwyr Cefnog dweud mwy wrthym am y gwerthoedd masculinist o gymdeithaseg canol y ganrif nag y maent yn llywio'r prosesau o haenu, gwleidyddiaeth a bywyd materol."

    Allwch chi feddwl am enghreifftiau eraill lle mae casglu data wedi'u teilwra y tueddiadau y casglwr data a adeiladwyd i mewn iddo? Sut mae hyn yn cymharu â dryslyd algorithmig? Pa oblygiadau y gallai hyn ei gael ar gyfer pryd y dylai ymchwilwyr ddefnyddio Readymades a phryd y dylent ddefnyddio Custommades?

  13. [ canolig ] Yn y bennod hon, yr wyf yn cyferbynnu data a gasglwyd gan ymchwilwyr i ymchwilwyr â chofnodion gweinyddol a grëwyd gan gwmnïau a llywodraethau. Mae rhai pobl yn galw gofnodion gweinyddol y "dod o hyd i ddata," y maent yn cyferbynnu â "data a gynlluniwyd." Mae'n wir bod cofnodion gweinyddol yn cael eu canfod gan ymchwilwyr, ond maent hefyd yn cael eu cynllunio yn fawr. Er enghraifft, mae cwmnïau technoleg fodern yn gwario symiau enfawr o amser ac adnoddau i gasglu a churadu eu data. Felly, cofnodion gweinyddol y rhain yn cael eu canfod a'u dylunio ddau, 'i jyst yn dibynnu ar eich safbwynt (Ffigur 2.10).

    Ffigur 2.10: Mae'r darlun yn y ddau hwyaden a chwningen; hyn a welwch yn dibynnu ar eich safbwynt. Llywodraeth a busnesau cofnodion gweinyddol ill dau hyd i ac wedi'u cynllunio; hyn a welwch yn dibynnu ar eich safbwynt. Er enghraifft, mae'r cofnodion data alwad a gasglwyd gan gwmni ffôn gell i'w cael data o safbwynt ymchwilydd. Ond, mae'r rhain yr un cofnodion union yn cael eu cynllunio bersbectif data rhywun sy'n gweithio yn yr adran bilio y cwmni ffôn. Ffynhonnell: Wikimedia Commons

    Ffigur 2.10: Mae'r darlun yn y ddau hwyaden a chwningen; hyn a welwch yn dibynnu ar eich safbwynt. Llywodraeth a busnesau cofnodion gweinyddol ill dau hyd i ac wedi'u cynllunio; hyn a welwch yn dibynnu ar eich safbwynt. Er enghraifft, mae'r cofnodion data alwad a gasglwyd gan gwmni ffôn gell i'w cael data o safbwynt ymchwilydd. Ond, mae'r rhain yr un cofnodion union yn cael eu cynllunio bersbectif data rhywun sy'n gweithio yn yr adran bilio y cwmni ffôn. Ffynhonnell: Wikimedia Commons

    Rhowch enghraifft o ffynhonnell ddata lle ei weld fel dod o hyd i ac a gynlluniwyd yn ddefnyddiol wrth ddefnyddio y ffynhonnell ddata ar gyfer ymchwil.

  14. [ hawdd ] Mewn traethawd meddylgar, Christian Sandvig a Eszter Hargittai (2015) yn disgrifio dau fath o ymchwil digidol, lle mae'r system ddigidol yw "offeryn" neu "wrthrych astudio." Un enghraifft o'r math cyntaf o astudio yn lle Bengtsson a chydweithwyr (2011) yn defnyddio data ffôn symudol i olrhain mudo ar ôl y daeargryn yn Haiti yn 2010. enghraifft o'r ail fath yw lle Jensen (2007) astudiaethau sut mae cyflwyno ffonau symudol ledled Kerala, India effeithio ar weithrediad y farchnad ar gyfer pysgod. Rwy'n cael hyn yn ddefnyddiol gan ei fod yn egluro y gall astudiaethau gan ddefnyddio ffynonellau data digidol wedi eithaf gwahanol nodau, hyd yn oed os ydynt yn defnyddio yr un math o ffynhonnell ddata. Er mwyn pwysleisio'r gwahaniaeth hwn ymhellach, disgrifiwch pedair astudiaeth eich bod wedi gweld: dau sy'n defnyddio system ddigidol fel offeryn a dau sy'n defnyddio system ddigidol fel gwrthrych astudio. Gallwch ddefnyddio enghreifftiau o'r bennod hon os ydych yn dymuno.