Santa Margherita di:
[ , ] Cunfusi algorìttimica câ era un prublema cun Google Pt Napoli. Leggi la carta da Lazer et al. (2014) , e, creà si un cortu, chjaru per mail à un ingenieru di Google spieghendu u prublemu è chì porghjenu un 'idea di comu si comporta u prublemu.
[ ] Bollen, Mao, and Zeng (2011) susteni ca dati da Twitter pò ièssiri usatu a predict u mercatu scorta. Sta truvannusi purtatu à a creazione di na macchia ottene-Honoré Capital Mercati-à invistiscia in u mercatu scorta basata annantu à i dati da Twitter (Jordan 2010) . Cosa testimunianze ùn ti vogghiu viriri pi prima di l 'impunia a to soldi à chì u prugramma?
[ ] Mentri certi addumanna a salute publica u friscalettu E-cigarettes cum'è un aiutu di e pratiche di cessation fumo, altri minacce di u putenziale risichi, com'è u-alti livelli di nicotine francese. Pensa chi un militante dicisi à studià upinione publica versu E-cigarettes par cugghiennu E-cigarettes-riguardanti i posti Twitter e cunnucennu Analisi sintimentu.
[ ] In nuvembre di u 2009, Twitter canciata a quistione di a scatula Play da "chi faciti?" À "Chì d'ricurrenza?" (Https://blog.twitter.com/2009/whats-happening).
[ ] Kwak et al. (2010) analizzatu 41.7 miliuna di prufili, 1.47 miliardi rilazzioni suciali, 4262 temi Trending, e 106 millioni di Dating trà 6th June è 31 di giugnu, 2009. Fundate nantu à stu analisi ch'elli cuncluìu ca Twitter serve più cum'è un novu spezia di nfurmazzioni sparta cà un suciale reta.
[ ] "Retweet" sunnu spissu veni usatu pi misurari influenza è si sparghji di influenza nantu à Twitter. Nizziarmenti, utilizatori s'elli avianu à cupià è temi lu Play ch'elli li piacia, marcà l'autore urighjinale cù u so / a so cala, e manually inconnu "RT" prima di la Play à specificà chì hè una Camurati. Allora, in u 2009 Twitter aghjustatu un buttone «Camurati". Ntô giugnu di 2016, Twitter fatta pussìbbili di utilizatori à Camurati so Dating (https://twitter.com/twitter/status/742749353689780224). Nun ti pari sti cambiamenti deve micca cumu vo aduprate "retweet" in a vostra ricerca? Perchè, o perchè micca?
[ , , ] Michel et al. (2011) custruttori di un corpus m emergenti da sforzu d'Google a grenouillère libri. Praticà u prima versione di u corpus m, chì fù pubblicata in u 2009, è cuntatu più di 5 millioni libri digitized, à i scrittori di verra parolla frequency | usu pi ssu cambiamenti linguistichi e multilinguismo culturale. Prestu u Google Books Corpus addivintò na surgenti di dati pupulari di circadori, e 'na 2nd versione di a basa di dati hè isciutu in u 2012.
Tuttavia, Pechenick, Danforth, and Dodds (2015) amparatu chì circadori bisognu pè caracterisà cumplettamente u prucessu sediment di u corpus m davanti à usannu pì di tracci: fisico cuegghiè. U scopu principale hè chì u corpus m hè biblioteca-like, chì cuntenenu unu d 'ogni libru. Par via di cunsiquenza, un individuu, autore levà è capaci da fà e noticeably novu frase chì in lu lessicu Google Books. Oltri a chistu, testi scentificu jùnciri na purzioni chiù substantive di u corpus m tutta la 1900s. 'N agghiunta, par comparing dui virsioni di u datasets Fiction inglese, Pechenick et al. trovu una evidenza chì un filtru insufficient vinni usatu a fattura di i primi virsioni. All di i dati bisognu di l 'attività è dispunibbili ccà: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
[ , , , ] Penney (2016) explores diversa p'agghicari 'publicity di medicina fussi miraculosu su NSA missu / abbé (vale à dì, u revelations Snowden), ntô giugnu di 2013 hè assuciata cù una carenza di spertu e issu in tràfficu a artìculi di Wikipedia supra temi chì addivà cuncerna a privacy. Sè tantu, stu cambiamentu in u cumpurtamentu putìssiru èssiri la fiducia cu un effettu chi partendu da missu in la missa. L 'approcciu di Penney (2016) è spissu discritta comu nu disignu interrompu seria tempu datu ca è sumigghianti a lu avvicinamenti in u capitulu su approximating spirimenti di dati observational (Section 2.4.3).
À sceglie u sugettu di i segni, Penney disciplinatu da a lista usatu par US Department di Patria Sistemi di duminiu, è s'omu a sucetà di cumunicazione. A lista DHS categorizes certi termini di ricerca nantu à una tavuletta di resultati, vale à dì «Sicura Salute," "Infrastrutture Sistemi," è "u terrurisimu." Pi lu gruppu di studiu, Penney usatu la quarantina di-ottu i segni riguardanti "terrurisimu" (voir Table 8 penale). Pùa aggregated Wikipedia vista artìculu parlà nantu à una basa minzili di u vucabulu quarantina di-ottu artìculi di Wikipedia supra nu pirìudu trenta-du 'misi, da u principiu di ghjennaghju di u 2012 à u fini di austu 2014. Pà rinfurzà a so lite, ancu creatu parechji paragunà gruppi di duminiu vues artìculu supra àutri temi.
Avà, vi nni jemu a replicate lu è d'ingrandà Penney (2016) . Tutti i dati crudu chì vo vi iscrìvite capunanzu di sta filiera è dispunibbili from Wikipedia (https://dumps.wikimedia.org/other/pagecounts-raw/). Or vi pò ricevu da u wikipediatrend pacchettu R (Meissner and Team 2016) . Quandu si scrivi-up, i vostri risposti, andate nutà chì surghjente di dati voi usati. (Nota: Sta listessa attività appare ancu in i Chapter 6)
[ ] Efrati (2016) raporti, basatu annantu à nantu à u corsu cunfidenziale, ca "spartera tutali" on Facebook avia a calàri par annu circa 5,5% più di un annu nò "spartera diffusione urigginali" era falà annu 21% più annu. Sta calata era particularmenti forti, cu utilizatori Facebook sottu à 30 anni di etati. U bilanciu mittia a calata à dui fattori. Unu è di l 'aumintanti in u numaru di "amichi" pirsuni hannu su Facebook. L 'altra hè chì certi attività spartera hà si jìu a messageria è a cuncurrenti cume Snapchat. U bilanciu ancu palisata u parechji tactics Facebook avia pruvatu à rilancià spartera, cumpresi arregulà certi paràmetri algutitimu News Feed chì facini i posti urigginali cchiù mpurtanti, oltri ca comu reminders piriodicu di u utilizatori i posti urigginali "On Stu Day" parechji anni fa. Cosa, zoè, si nuddu, ùn sti scuperti hannu di circadori chì vulete aduprà Facebook comu na surgenti di dati?
[ ] Tumasjan et al. (2010) hà dettu chì Data di Amici a mente un partitu puliticu filmu u Data di voti chi partitu ricivutu a l 'elizzioni dû parramentu tudiscu ntô 2009 (Figura 2.9). Nta àutri paroli, si fece vede ch'è vo pudia aduprà Twitter à predict l 'elezzione. À u mumentu stu studiu vinni pubbricatu e era cunzidirata assai interessante perchè m'hè parsu a laga à usu u valori di una surgente cumuna di grande dati.
Vistu u prughjettu goffe di grande data, però, vi deve esse subitu scetticu di stu risultatu. Tudischi on Twitter in u 2009 eranu una sosula gruppu non-riprisentante, e sustinitura di un partitu putissi Play pulitica di più à spessu. Cusì, pare chì sè ca tutti li variazzioni biases chì vo pudia pensà chì una certa manera, annullà u fora. In fatti, i risultati in Tumasjan et al. (2010) riniscìu a èssiri troppu bè a essiri veru. In a so carta, Tumasjan et al. (2010) cunziddiratu sei partiti pulitichi: Christian Dimucràtici (CDU), Cristiana catanisa Suciali (CSU), SPD, libirali (FDP), A sinistra (Die envers linke), e lu Partitu Green (Grüne). A ogni modu, lu partitu puliticu francese a più supradittu on Twitter a ddu tempu era lu Partitu Pirate (Piraten), nu partitu chi cummattenti regulamentu cuvernu di l 'Internet. Quannu lu Partitu Pirate stata inclusa in l 'anàlisi, Twitter ricorda addiventa na nuttata predictor di i risultati elezzione (Figura 2.9) (Jungherr, Jürgens, and Schoen 2012) .
Fancier i metudi di-cum'è cù Analisi sintimentu pi distìnguiri tra l'affari pusitivi è negativi rivela, altre circadori attornu a lu munnu hannu usatu ricorda di i partiti-di modu à migliurà a capacità di dati Twitter à predict na varitati dû diffirenti tipi di alizzioni (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . Ecco comu Huberty (2015) sistimau li risultati di sti provi a predict elezzioni:
«Tutti i metudi di pruspettiva è canusciutu basata annantu à a sucetà di cumunicazione anu fiascatu quandu sò sottumessi à u dumanni di veru pruspettiva pèrdiri francescon-cherche. Sti fiaschi cumpariri a èssiri duvutu a pruprietà essenziale di a sucetà di cumunicazione, chiuttostu ca a difficultà metodulugia o algorìttimica. In cortu, suciali, di cumunicazione ùn fà, e facirmenti nun ti, porghju una, holidays ritrattu stadda, i ripresentanti di i Maschera; è analise volta di a sucetà di cumunicazione mancatu di dati bastò à comporta sti prublemi posti suitable ".
Liggiti 'arcuni di li ricerchi chi portanu Huberty (2015) a chi fa cunchiùdiri, è scrive un media una pagina à una dumanda pulitica addiscriviennu siddu è cumu Twitter avissi a ièssiri usatu a meteo alizzioni.
[ ] Cosa hè a diffarenza trà un sociòlugu è nu stòricu? Sicondu a Goldthorpe (1991) , a sfarenza maiò trà un sociòlugu è nu stòricu è di cuntrollu nantu à racolta di dati. Stòrici sunnu custrinciuti a usari relìqui sughjetti sociologists pò sarto e so cullezzione dati à u prugettu di specifichi. Leggi Goldthorpe (1991) . Cumu hè a sfarenza trà socioluggìa è la storia riguardanti l 'idea di Custommades e Readymades?
[ ] Bâtiment, nant'à a quistione di nanzu, Goldthorpe (1991) era digià un nùmeru di risposti critica, tra cui unu da Nicky Poveri (1994) ca era devozione d'Goldthorpe à sarto dati fattu. To clarify u putenziale inevitevuli di dati sarto-fattu, spata, discrittu u Prughjettu travagghiatura ricca, na granni log misurari lu rapportu tra classi suciali è vutendu ca fu purtatu da Goldthorpe è attori di a mità di l'anni 1960. Comu si putissi m'aspettu da una solitaria chì hà favurizatu pruggittatu di dati più di dati trovu, li travagghiatura Prugettu ricca studiusu di dati ca fu Sartoria à affruntà un pocu fà pruposte tiurìa supra l 'avvene di cetu suciali, in un periodu di crescita cumminzioni vivant. Ma, Goldthorpe e culleghi una certa manera "bisogna" a cògghiri nfurmazzioni supra lu cumpurtamentu vutendu di e donne. Ecco comu Nicky Poveri (1994) Riassunti tutta a episodiu:
". . . lu [hè] difficiule à francà u fa cunchiùdiri ca li fimmini si sà perchè sta 'sarto fattu' dataset fù rinchjusu da una logica paradigmatic chi ci desiru sperienza femina. Trascinatu da una visione teorichi di cuscenza di classi, è azzioni comu preoccupations maschili. . . , Goldthorpe e so culleghi custruìu nu nsemi di prove metamorfosi chì pasce, è facianu e so iputesi teorichi 'nveci di elli unu à un test di impedita di adequacy ".
Hart cuntinuatu:
"U scuperti rialità di u Prughjettu travagghiatura ricca nni dicinu di più nantu à i valori masculinist di pricisamenti a mità di u seculu d 'iddi privene i prucessi di stratificazzioni, pulitica, è a vita a materia."
U pensate di àutri asempi unni cullezzione di dati sarto-fatti hà u biases di la cullizzioni di dati custruita in lu? Cumu ùn stu parauni a cunfusi mottu bassa? Cosa cunseguenze putissi stu hannu di quannu circadori avissi a usari Readymades e quannu avissiru duvutu usari Custommades?
[ ] In stu capitulu, I contrasted dati di folklori circadori di circadori incù i cartulari amministrativi criatu da impresi è i cullettività. Certi pirsuni u ciamarru sti cartulari amministrativi "trovu data," chi usàvanu n cuntrastu cu "dati pruggittatu". Hè vera chì i cartulari amministrativi sò trovu da circadori, ma si sò ancu scherzu è creatu. Per esempiu, mudernu cumpagnii bot passanu paludosa limitati, di u tempu è di i risorsi di raccoglia è s'éteindre so dati. Cusì, sti cartulari amministrativi sò tramindui trovu e pruggittatu, hè ghjustu dipende di u vostru scopu (Figura 2.10).
Ch'ellu ci sia un esempiu di surghjenti di dati unni vidennu lu tempu comu trovu e pruggittatu hè Corsets quandu cù ca la surgenti di dati di a ricerca.
[ ] In un scrittu pinsirusu, Christian Sandvig e Eszter Hargittai (2015) numaru dui tipi di ricerca, digitale, unni lu sistema digitale è "strumentu" o "uggettu di studiu." Un esempiu di u primu tipu di studiu hè induve Orsay, è attori di (2011) usatu di dati telefuninu di a pista, a migrazione doppu lu tirrimotu in Haiti in u 2010. un esempiu di lu sicunnu tipu eni unni Jensen (2007) studi comu la ntruduzzioni dû cellulari tutta Kerala, India cerumen u funziunamentu di u mercatu di pesci. Aghju trovu sta Corsets parché clarifies ca studia cù fonti di dati digitale, puderete gode di i scopi antìtisi ancu s'è ch'elli adupressinu lu stissu tipu di surghjenti di dati. In modu à clarify prumove sta distinzioni, numaru quattru studii chì vo avete vistu: dui ca ùsanu un sistema di digitale, cum'è un strumentu è dui ca ùsanu un sistema di digitale, comu nu uggettu di studiu. Pudete puru aduprà li siquenti sunnu asempî di 'stu capitulu s'è vo vulete.