Activités

Santa Margherita di:

  • gradu di difficultà: facile fàciule , maculata medie , dura aspra , Assai difficiuli assai difficiuli
  • Abbisogna math ( abbisogna a matimatica )
  • abbisognu di scrittura ( abbisogna linguistic )
  • racolta di dati ( cullezzione données )
  • u mio favoritos ( my favorite )
  1. [ medie , my favorite ] Cunfusi algorìttimica câ era un prublema cun Google Pt Napoli. Leggi la carta da Lazer et al. (2014) , e, creà si un cortu, chjaru per mail à un ingenieru di Google spieghendu u prublemu è chì porghjenu un 'idea di comu si comporta u prublemu.

  2. [ medie ] Bollen, Mao, and Zeng (2011) susteni ca dati da Twitter pò ièssiri usatu a predict u mercatu scorta. Sta truvannusi purtatu à a creazione di na macchia ottene-Honoré Capital Mercati-à ​​invistiscia in u mercatu scorta basata annantu à i dati da Twitter (Jordan 2010) . Cosa testimunianze ùn ti vogghiu viriri pi prima di l 'impunia a to soldi à chì u prugramma?

  3. [ fàciule ] Mentri certi addumanna a salute publica u friscalettu E-cigarettes cum'è un aiutu di e pratiche di cessation fumo, altri minacce di u putenziale risichi, com'è u-alti livelli di nicotine francese. Pensa chi un militante dicisi à studià upinione publica versu E-cigarettes par cugghiennu E-cigarettes-riguardanti i posti Twitter e cunnucennu Analisi sintimentu.

    1. Qualessi sò i trè pussibule biases chì tù sì più u pinseri à circa in issu studiu?
    2. Clark et al. (2016) curriri sulu comu un studiu. Prima, si cugliva 850,000 Dating chi eranu sciolte e-sigaretta-riguardanti da ghjennaghju di u 2012 per mezu di dicembre 2014. À u biancu pirmittennu na majuri, si resenu contu parechji di sti Dating foru autumàtiche (vale à dì, ùn venenu prudotte da l 'omini) e tanti di chisti Dating autumàticu eranu pè u più spot. Ci si sviluppau na algutitimu détection Human a siparari Dating autumàticu da Dating biulogica. Praticà Detect stu Human algutitimu ùn trovu chì 80% di Dating foru autumàticu. Dunqua stu S. cambià a vostra risposta à part (un)?
    3. Quand'elli paragunevuli à u sintimentu in Dating urgànichi e funziunalità autumàtiche truvonu ca i Dating email sò più pusitiva chè Dating AB (6.17 contra 5.84). Dunqua stu S. cambià a vostra risposta a (b)?
  4. [ fàciule ] In nuvembre di u 2009, Twitter canciata a quistione di a scatula Play da "chi faciti?" À "Chì d'ricurrenza?" (Https://blog.twitter.com/2009/whats-happening).

    1. Cumu ne pensate u cambiamentu di cuneiforme ti scummove chì Play e / o di ciò ch'elli Play?
    2. Nome un prughjettu di ricerca per chì vo vulite prifiriscinu li souhaitons "chi faciti?" A spiegari u picchì.
    3. Nome un prughjettu di ricerca per chì vo vulite prifiriscinu li souhaitons "Cosa hè pusitivu?" A spiegari u picchì.
  5. [ medie ] Kwak et al. (2010) analizzatu 41.7 miliuna di prufili, 1.47 miliardi rilazzioni suciali, 4262 temi Trending, e 106 millioni di Dating trà 6th June è 31 di giugnu, 2009. Fundate nantu à stu analisi ch'elli cuncluìu ca Twitter serve più cum'è un novu spezia di nfurmazzioni sparta cà un suciale reta.

    1. Cunsidirari S. l'Kwak et al, ciò chì tippu di ricerche avissi a pudete fà cù dati Twitter? Chì tippu di ricerche si tu nun fari cu dati Twitter? Perchè?
    2. In u 2010, Twitter aghjustatu un Quale To FAQ serviziu facennu suggerimentu Sartoria à utilizatori. Tre ci voli li mustra at a tempu nantu à a pagina principali. Ci voli sunnu spissu tirata da unu d' "amici-di-amici," è cuntatti mutuale sò dinù e appizzatu nta l 'avvisu. Users pò ricaricà à vede un novu ghjocu di ci voli o visitare una pagina incù una lista di ci voli cchiù. Nun ti pari 'stu novu dispusitivu avissi canciari a vostra risposta à parte un)? Perchè, o perchè micca?
    3. Su, Sharma, and Goel (2016) rivalutatu effettu di Quale To FAQ serviziu, è truvonu ca mentri utilizatori à traversu u peni pupularità ciu da lu voli, u utilizatori cchiù pupulari di guadagnà u so varietà più chè mediu. Dunqua stu S. cambià a vostra risposta à parte b)? Perchè, o perchè micca?
  6. [ fàciule ] "Retweet" sunnu spissu veni usatu pi misurari influenza è si sparghji di influenza nantu à Twitter. Nizziarmenti, utilizatori s'elli avianu à cupià è temi lu Play ch'elli li piacia, marcà l'autore urighjinale cù u so / a so cala, e manually inconnu "RT" prima di la Play à specificà chì hè una Camurati. Allora, in u 2009 Twitter aghjustatu un buttone «Camurati". Ntô giugnu di 2016, Twitter fatta pussìbbili di utilizatori à Camurati so Dating (https://twitter.com/twitter/status/742749353689780224). Nun ti pari sti cambiamenti deve micca cumu vo aduprate "retweet" in a vostra ricerca? Perchè, o perchè micca?

  7. [ medie , cullezzione données , abbisogna linguistic ] Michel et al. (2011) custruttori di un corpus m emergenti da sforzu d'Google a grenouillère libri. Praticà u prima versione di u corpus m, chì fù pubblicata in u 2009, è cuntatu più di 5 millioni libri digitized, à i scrittori di verra parolla frequency | usu pi ssu cambiamenti linguistichi e multilinguismo culturale. Prestu u Google Books Corpus addivintò na surgenti di dati pupulari di circadori, e 'na 2nd versione di a basa di dati hè isciutu in u 2012.

    Tuttavia, Pechenick, Danforth, and Dodds (2015) amparatu chì circadori bisognu pè caracterisà cumplettamente u prucessu sediment di u corpus m davanti à usannu pì di tracci: fisico cuegghiè. U scopu principale hè chì u corpus m hè biblioteca-like, chì cuntenenu unu d 'ogni libru. Par via di cunsiquenza, un individuu, autore levà è capaci da fà e noticeably novu frase chì in lu lessicu Google Books. Oltri a chistu, testi scentificu jùnciri na purzioni chiù substantive di u corpus m tutta la 1900s. 'N agghiunta, par comparing dui virsioni di u datasets Fiction inglese, Pechenick et al. trovu una evidenza chì un filtru insufficient vinni usatu a fattura di i primi virsioni. All di i dati bisognu di l 'attività è dispunibbili ccà: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html

    1. In Michel et al. D'a carta previstu (2011) , usàvanu l '1st versione di u gruppu data, inglese, cunciura e la ultrahigh di utilizzu di l' anni, "1880", "1912" è "1973", e ficiru chi "simu scurdannu lu nostru passatu a suprana, ogni annu chi passavanu "(Fig. 3a, Michel et al.). Replicate a listessa cumbriccula cù 1) 1st versione di u corpus m, dataset inglese (stissu comu Fig. 3a, Michel et al.)
    2. Avà replicate a listessa cumbriccula cù u 1u versione, inglese fiction: dataset.
    3. Avà replicate a listessa cumbriccula cù u 2nd versione di u corpus m, inglese dataset.
    4. Infine, replicate a listessa cumbriccula cù u 2nd versione, inglese fiction: dataset.
    5. Discrìviri la paci, e similarità trà sti quattru lenzi. Ùn li cunnizzioni di usu cun Michel et al. L'intarpritazioni urighjinariu di u tendenza osservatu? (Amarore: c) e d ') avissi a essiri lu stissu comu Figura 16 in Pechenick et al).
    6. Avà chì v'aghju replicated stu unu S. cù sfarenti Google Books letteratura, sceglie un altru cambiamentu linguisticu o finòmini culturale mintuvate in Michel et al. D'a carta urigginali. Nun ti accordu cù i so intarpritazioni a luce di u inevitevuli mintuvate in Pechenick et al.? Per fà u vostru argumentu forte, pruvà replicate lu stissu grafico, usendu diverse versioni di data set cum'è sopra.
  8. [ assai difficiuli , cullezzione données , abbisogna linguistic , my favorite ] Penney (2016) explores diversa p'agghicari 'publicity di medicina fussi miraculosu su NSA missu / abbé (vale à dì, u revelations Snowden), ntô giugnu di 2013 hè assuciata cù una carenza di spertu e issu in tràfficu a artìculi di Wikipedia supra temi chì addivà cuncerna a privacy. Sè tantu, stu cambiamentu in u cumpurtamentu putìssiru èssiri la fiducia cu un effettu chi partendu da missu in la missa. L 'approcciu di Penney (2016) è spissu discritta comu nu disignu interrompu seria tempu datu ca è sumigghianti a lu avvicinamenti in u capitulu su approximating spirimenti di dati observational (Section 2.4.3).

    À sceglie u sugettu di i segni, Penney disciplinatu da a lista usatu par US Department di Patria Sistemi di duminiu, è s'omu a sucetà di cumunicazione. A lista DHS categorizes certi termini di ricerca nantu à una tavuletta di resultati, vale à dì «Sicura Salute," "Infrastrutture Sistemi," è "u terrurisimu." Pi lu gruppu di studiu, Penney usatu la quarantina di-ottu i segni riguardanti "terrurisimu" (voir Table 8 penale). Pùa aggregated Wikipedia vista artìculu parlà nantu à una basa minzili di u vucabulu quarantina di-ottu artìculi di Wikipedia supra nu pirìudu trenta-du 'misi, da u principiu di ghjennaghju di u 2012 à u fini di austu 2014. Pà rinfurzà a so lite, ancu creatu parechji paragunà gruppi di duminiu vues artìculu supra àutri temi.

    Avà, vi nni jemu a replicate lu è d'ingrandà Penney (2016) . Tutti i dati crudu chì vo vi iscrìvite capunanzu di sta filiera è dispunibbili from Wikipedia (https://dumps.wikimedia.org/other/pagecounts-raw/). Or vi pò ricevu da u wikipediatrend pacchettu R (Meissner and Team 2016) . Quandu si scrivi-up, i vostri risposti, andate nutà chì surghjente di dati voi usati. (Nota: Sta listessa attività appare ancu in i Chapter 6)

    1. Leggi Penney (2016) e replicate Figura 2 ca ammustra lu vues pagina di "terrurisimu" pagine -related nanzu è dopu à u sonu Snowden. Interpret Canta u bellissima.
    2. Next, replicate Fig 4a, chi si pò cumparari u gruppu studiu ( "terrurisimu" artìculi -related) cù un gruppu comparator cù segni categurisatu sutta "DHS & Autres Divers" da a lista DHS (voir penale Table 10). Interpret Canta u bellissima.
    3. In parte b) tu n cunfrontu di u gruppu studiu d 'unu gruppu comparator. Penney ancu paragunatu à altri dui gruppi comparator: "Infrastrutture Sistemi di" artìculi -related (penale Table 11) e pagine di Wikipedia pupulari (penale Table 12). Cullatu incù un gruppu comparator alternativa, è pruvà s'ellu li scuperti da parte b) hè fattivu à a vostra scelta di gruppu comparator. Qualessu scelta di gruppu comparator face più sensu? Perchè?
    4. L 'auturi dettu chì i segni chì si raportanu à "terrurisimu", èranu usatu à sceglie l'artìculi di Wikipedia picchì lu guvernu US citatu u terrurismu, comu' na justificazzioni chjave di a so pratiche missu in ligna. Comu un arrigistramentu di ste 48 "terrurisimu" laccatura -related, Penney (2016) ancu purtatu à nantu à i MTurk dumandendu respondents à mumentu ognunu di i segni in u nivellu di Trouble Guvernu, Privacy-fattivu, è avidité (Table penale 7 e 8). Replicate u log in u MTurk e lu parauni di u vostru risultati.
    5. Fundate nantu à i risultati in parti d '), è a vostra lettura di l'artìculu, ùn li cunnizzioni di usu cu scelta di l'autore di u sugettu di i segni in u gruppu studiu? Perchè, o perchè micca? Si nun, ciò chì vi mitafìsica, nveci?
  9. [ fàciule ] Efrati (2016) raporti, basatu annantu à nantu à u corsu cunfidenziale, ca "spartera tutali" on Facebook avia a calàri par annu circa 5,5% più di un annu nò "spartera diffusione urigginali" era falà annu 21% più annu. Sta calata era particularmenti forti, cu utilizatori Facebook sottu à 30 anni di etati. U bilanciu mittia a calata à dui fattori. Unu è di l 'aumintanti in u numaru di "amichi" pirsuni hannu su Facebook. L 'altra hè chì certi attività spartera hà si jìu a messageria è a cuncurrenti cume Snapchat. U bilanciu ancu palisata u parechji tactics Facebook avia pruvatu à rilancià spartera, cumpresi arregulà certi paràmetri algutitimu News Feed chì facini i posti urigginali cchiù mpurtanti, oltri ca comu reminders piriodicu di u utilizatori i posti urigginali "On Stu Day" parechji anni fa. Cosa, zoè, si nuddu, ùn sti scuperti hannu di circadori chì vulete aduprà Facebook comu na surgenti di dati?

  10. [ medie ] Tumasjan et al. (2010) hà dettu chì Data di Amici a mente un partitu puliticu filmu u Data di voti chi partitu ricivutu a l 'elizzioni dû parramentu tudiscu ntô 2009 (Figura 2.9). Nta àutri paroli, si fece vede ch'è vo pudia aduprà Twitter à predict l 'elezzione. À u mumentu stu studiu vinni pubbricatu e era cunzidirata assai interessante perchè m'hè parsu a laga à usu u valori di una surgente cumuna di grande dati.

    Vistu u prughjettu goffe di grande data, però, vi deve esse subitu scetticu di stu risultatu. Tudischi on Twitter in u 2009 eranu una sosula gruppu non-riprisentante, e sustinitura di un partitu putissi Play pulitica di più à spessu. Cusì, pare chì sè ca tutti li variazzioni biases chì vo pudia pensà chì una certa manera, annullà u fora. In fatti, i risultati in Tumasjan et al. (2010) riniscìu a èssiri troppu bè a essiri veru. In a so carta, Tumasjan et al. (2010) cunziddiratu sei partiti pulitichi: Christian Dimucràtici (CDU), Cristiana catanisa Suciali (CSU), SPD, libirali (FDP), A sinistra (Die envers linke), e lu Partitu Green (Grüne). A ogni modu, lu partitu puliticu francese a più supradittu on Twitter a ddu tempu era lu Partitu Pirate (Piraten), nu partitu chi cummattenti regulamentu cuvernu di l 'Internet. Quannu lu Partitu Pirate stata inclusa in l 'anàlisi, Twitter ricorda addiventa na nuttata predictor di i risultati elezzione (Figura 2.9) (Jungherr, Jürgens, and Schoen 2012) .

    Accussìni 2.9: Twitter ricorda cumpariri a predict i risultati di l'elezzione tedesco 2009 (Tumasjan et al di u 2010.), Ma stu risultatu s'arrivela à addipenni nantu à certi Rrttttt arbitrariu è l (Jungherr, Koch, è Malin di u 2012).

    Accussìni 2.9: Twitter ricorda cumpariri a predict i risultati di l'elezzione tedesco 2009 (Tumasjan et al. 2010) , Ma stu risultatu s'arrivela à addipenni nantu à certi Rrttttt arbitrariu è l (Jungherr, Jürgens, and Schoen 2012) .

    Fancier i metudi di-cum'è cù Analisi sintimentu pi distìnguiri tra l'affari pusitivi è negativi rivela, altre circadori attornu a lu munnu hannu usatu ricorda di i partiti-di modu à migliurà a capacità di dati Twitter à predict na varitati dû diffirenti tipi di alizzioni (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . Ecco comu Huberty (2015) sistimau li risultati di sti provi a predict elezzioni:

    «Tutti i metudi di pruspettiva è canusciutu basata annantu à a sucetà di cumunicazione anu fiascatu quandu sò sottumessi à u dumanni di veru pruspettiva pèrdiri francescon-cherche. Sti fiaschi cumpariri a èssiri duvutu a pruprietà essenziale di a sucetà di cumunicazione, chiuttostu ca a difficultà metodulugia o algorìttimica. In cortu, suciali, di cumunicazione ùn fà, e facirmenti nun ti, porghju una, holidays ritrattu stadda, i ripresentanti di i Maschera; è analise volta di a sucetà di cumunicazione mancatu di dati bastò à comporta sti prublemi posti suitable ".

    Liggiti 'arcuni di li ricerchi chi portanu Huberty (2015) a chi fa cunchiùdiri, è scrive un media una pagina à una dumanda pulitica addiscriviennu siddu è cumu Twitter avissi a ièssiri usatu a meteo alizzioni.

  11. [ medie ] Cosa hè a diffarenza trà un sociòlugu è nu stòricu? Sicondu a Goldthorpe (1991) , a sfarenza maiò trà un sociòlugu è nu stòricu è di cuntrollu nantu à racolta di dati. Stòrici sunnu custrinciuti a usari relìqui sughjetti sociologists pò sarto e so cullezzione dati à u prugettu di specifichi. Leggi Goldthorpe (1991) . Cumu hè a sfarenza trà socioluggìa è la storia riguardanti l 'idea di Custommades e Readymades?

  12. [ aspra ] Bâtiment, nant'à a quistione di nanzu, Goldthorpe (1991) era digià un nùmeru di risposti critica, tra cui unu da Nicky Poveri (1994) ca era devozione d'Goldthorpe à sarto dati fattu. To clarify u putenziale inevitevuli di dati sarto-fattu, spata, discrittu u Prughjettu travagghiatura ricca, na granni log misurari lu rapportu tra classi suciali è vutendu ca fu purtatu da Goldthorpe è attori di a mità di l'anni 1960. Comu si putissi m'aspettu da una solitaria chì hà favurizatu pruggittatu di dati più di dati trovu, li travagghiatura Prugettu ricca studiusu di dati ca fu Sartoria à affruntà un pocu fà pruposte tiurìa supra l 'avvene di cetu suciali, in un periodu di crescita cumminzioni vivant. Ma, Goldthorpe e culleghi una certa manera "bisogna" a cògghiri nfurmazzioni supra lu cumpurtamentu vutendu di e donne. Ecco comu Nicky Poveri (1994) Riassunti tutta a episodiu:

    ". . . lu [hè] difficiule à francà u fa cunchiùdiri ca li fimmini si sà perchè sta 'sarto fattu' dataset fù rinchjusu da una logica paradigmatic chi ci desiru sperienza femina. Trascinatu da una visione teorichi di cuscenza di classi, è azzioni comu preoccupations maschili. . . , Goldthorpe e so culleghi custruìu nu nsemi di prove metamorfosi chì pasce, è facianu e so iputesi teorichi 'nveci di elli unu à un test di impedita di adequacy ".

    Hart cuntinuatu:

    "U scuperti rialità di u Prughjettu travagghiatura ricca nni dicinu di più nantu à i valori masculinist di pricisamenti a mità di u seculu d 'iddi privene i prucessi di stratificazzioni, pulitica, è a vita a materia."

    U pensate di àutri asempi unni cullezzione di dati sarto-fatti hà u biases di la cullizzioni di dati custruita in lu? Cumu ùn stu parauni a cunfusi mottu bassa? Cosa cunseguenze putissi stu hannu di quannu circadori avissi a usari Readymades e quannu avissiru duvutu usari Custommades?

  13. [ medie ] In stu capitulu, I contrasted dati di folklori circadori di circadori incù i cartulari amministrativi criatu da impresi è i cullettività. Certi pirsuni u ciamarru sti cartulari amministrativi "trovu data," chi usàvanu n cuntrastu cu "dati pruggittatu". Hè vera chì i cartulari amministrativi sò trovu da circadori, ma si sò ancu scherzu è creatu. Per esempiu, mudernu cumpagnii bot passanu paludosa limitati, di u tempu è di i risorsi di raccoglia è s'éteindre so dati. Cusì, sti cartulari amministrativi sò tramindui trovu e pruggittatu, hè ghjustu dipende di u vostru scopu (Figura 2.10).

    Figura 2.10: U ritrattu hè à tempu una anatra è un cunigliulu; ciò chì vo vidite dipende di u vostru scopu. Government affari amministrativi sò tramindui trovu e pruggittatu; ciò chì vo vidite dipende di u vostru scopu. Per esempiu, i cartulari di dati d racolta da un impresa telefoninu si ncòntranu dati da u scopu di un militante. Ma, chisti stissi dischi esattu una vulintà à un scopu di dati di calchissia travaglià in u dipartimentu Bilingue di i so cumpagni di telefunu. Source: Wikipedia

    Figura 2.10: U ritrattu hè à tempu una anatra è un cunigliulu; ciò chì vo vidite dipende di u vostru scopu. Government affari amministrativi sò tramindui trovu e pruggittatu; ciò chì vo vidite dipende di u vostru scopu. Per esempiu, i cartulari di dati d racolta da un impresa telefoninu si ncòntranu dati da u scopu di un militante. Ma, chisti stissi dischi esattu una vulintà à un scopu di dati di calchissia travaglià in u dipartimentu Bilingue di i so cumpagni di telefunu. Source: Wikipedia

    Ch'ellu ci sia un esempiu di surghjenti di dati unni vidennu lu tempu comu trovu e pruggittatu hè Corsets quandu cù ca la surgenti di dati di a ricerca.

  14. [ fàciule ] In un scrittu pinsirusu, Christian Sandvig e Eszter Hargittai (2015) numaru dui tipi di ricerca, digitale, unni lu sistema digitale è "strumentu" o "uggettu di studiu." Un esempiu di u primu tipu di studiu hè induve Orsay, è attori di (2011) usatu di dati telefuninu di a pista, a migrazione doppu lu tirrimotu in Haiti in u 2010. un esempiu di lu sicunnu tipu eni unni Jensen (2007) studi comu la ntruduzzioni dû cellulari tutta Kerala, India cerumen u funziunamentu di u mercatu di pesci. Aghju trovu sta Corsets parché clarifies ca studia cù fonti di dati digitale, puderete gode di i scopi antìtisi ancu s'è ch'elli adupressinu lu stissu tipu di surghjenti di dati. In modu à clarify prumove sta distinzioni, numaru quattru studii chì vo avete vistu: dui ca ùsanu un sistema di digitale, cum'è un strumentu è dui ca ùsanu un sistema di digitale, comu nu uggettu di studiu. Pudete puru aduprà li siquenti sunnu asempî di 'stu capitulu s'è vo vulete.