Qûfle:
[ , ] Çirr Algorithmic pirsgirêk bi Trends Flu Google bû. Xwendin di rojnameya bi Lazer et al. (2014) , û nivîsandina kurt de, email zelal ji bo muhendis li Google de, bi mijara pirsgirêka û sihik an fikra çawa pirsgirêkê çareser bikî.
[ ] Bollen, Mao, and Zeng (2011) dibêje ku welat ji Twitter dikarin bên bikaranîn ku texmîn di borsayê de. Ev netîce ji bo çêkirina a fona spekulatîf-Derwent Capital Markets-bi razemenî li bazara borsayê de li ser bingeha daneyên ji Twitter birin (Jordan 2010) . Çi delîlên ê ku tu dixwazî pereyan razîne te li ku fona bibînin?
[ ] Gava ku hin parêzvanên tendurustiya gel, zîpik e-cixare wek alîkarî bi bandor ji bo kêşana çixarê, yên din li ser xeterên, wek bilind-astên nîkotîn hişyar bike. Bifikirin ku lêkolîner biryar ji bo lêkolînên raya giştî ber bi e-cixare bi komkirina e-cixare-related posts Twitter û meşandina analîzên hesa.
[ ] Di çiriya paşîn 2009, Twitter, pirsa ku di qutiya tweet ji "Hûn çi dikin?" Guherî "çi diqewime?" (Https://blog.twitter.com/2009/whats-happening).
[ ] Kwak et al. (2010) , analîza 41.7 milyon profiles user, 1.47 milyar, têkiliyên civakî, 4262 mesajên Trending, û 106 milyon dardakirin, di navbera June 6th û 31'ê Hezîranê, 2009. Li ser bingeha vê analîzê ew encamê ku Twitter xizmetê zêdetir wek haletekî nû ya agahî parve ji tora civakî de.
[ ] "Retweets" bi gelek caran ji bo pîvandinê bandora bikaranîn û belav bandora li ser Twitter. Di destpêkê de, bikarhênerên hebû ji bo wê kopî bikî û bi îmêlî vrêkey li tweet wan dixwest, versiyona rast a nivîskar orjînal bi / handle xwe, û bi destan kes: "RT" li ber tweet ji bo nîşan bide ku ev retweet ye. Piştre, di 2009 Twitter added a button "retweet". Di hezîrana 2016, Twitter, mirov ji bo bikarhênerên ji bo retweet dardakirin, xwe bi xwe (https://twitter.com/twitter/status/742749353689780224) çêkirin. Ma hûn guman dikin ku ev guhertin, divê bandorê ku tu çawa bi kar tînin "retweets" Di lêkolîna xwe? Çima an çima ne?
[ , , ] Michel et al. (2011) tên çêkirin, a corpus holê ji hewleke Google ji bo dîjîtalkirina pirtûkan. Bi bikaranîna Versiyon ji bo pêşî ya corpus, ku di sala 2009 de hate weşandin û yên li ser 5 milyon pirtûkên dîjîtal, nivîskarên ji bo lêkolînkirina guherînên zimanî û bêyûm çandî analîz frequency bikaranîna peyva. Di demeke nêzîk de Books Corpus Google çavkaniya welat gel ji bo lêkolînerên bû, û guhertoyeke 2nd ji nav HTMLê da heye di sala 2012 de serbest hat berdan.
Lê belê, Pechenick, Danforth, and Dodds (2015) hişyar kir ku lêkolîner divê ji bo bi temamî ravekirina pêvajoya mînakan ji corpus berî bikaranîna wê ji bo sûdgirtina encamên berfireh. Ser pirsa sereke ev e, ku corpus pirtûkxaneya-like e, dihewînin, yek ji her pirtûkê de. Di encama çalakiyê de, ya ferdî, nivîskar zengîn karibin hev CDROM'ê komepeyvên me yên nû di nav peyvan Google Books e. Herwiha, nivîsên zanistî an para diçe daîmî yên corpus li seranserê 1900s pêk tînin. Li gel vê, di riya danberheva du versions of the datasets Fiction English, Pechenick et al. delîlên dît ku filtering nebes in çêkirin yekem versiyona hat bikaranîn. Hemû daneyên pêwîst ji bo çalakiyên li vir e: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
[ , , , ] Penney (2016) lê dinêre ka xwiyakirina di çapemeniyê de berfireh li ser NSA çavdêriyê / NSA (ango, bi wehîyê Snowden) di hezîrana 2013 de bi kêm tûj û ji nişka ve di trafîkê de ji bo gotarên Wîkîpediya de li ser mijaran e ku zêdekirina fikarên nepeniya têkildarkirin. Heke wisa be, ev guhertina di helwesta wê dê hevgirtî bi bandoreke tirsnak a ku ji çavdêriya girseyî. Nêzîkatiya Penney (2016) e, carna an design series dem qut kir û bi vê helwestên ku di beşa têkildarî approximating tecrûbeyên ji welat observational (Beþ 2.4.3).
Ji bo hilbijartina keywords topic de, Penney ji lîsteya ji aliyê wezareta parastina nîştimanîya Amerîka ji bo êşekê û şopandina di medya civakî de bi kar tê behskirin. Di lîsteya wê grubê nihêrtin search terms hinek nav li ser mijarên cur, ango "metirsî Health", "Ewlekariya binesazî," û "bi terorê re." Ji bo koma xebatê de, Penney bi kar çil û heşt keywords related to "Terorê re" (Table 8 bibînin Revîyê kor). Ew paşê Wikipedia Arabistana view gotara li ser bingeha mehane ji bo bi têkildarî ya çil û heşt gotarên Wîkîpediya de li ser dema sî-du meha -şandîyên, ji destpêkê ve ji rêbendan 2012 de ji bo di dawîya meha Tebaxê 2014. Ji bo xurtkirina argumana xwe, ew bi xwe jî gelek berhevdana tên afirandin komên ji aliyê êşekê views gotara li ser mijarên din.
Niha, tu diçî Eraqê û dirêj Penney (2016) . Hemû daneyên raw ku hûn ê ji bo vê çalakiyê divê available ji Wikipedia (https://dumps.wikimedia.org/other/pagecounts-raw/) e. An jî tu dikarî ji wikipediatrend pakêta R get (Meissner and Team 2016) . Gava ku hun-up bersivên te, ji kerema xwe not bikin ku çavkaniya daneyên we de tê bikaranîn. (Têbinî: Ev çalakî di heman jî li Chapter 6 xuya dike)
[ ] Efrati (2016) rapor, li ser agahîya nehênî, ku "sharing total" on Facebook by ser 5.5% sal li ser salê red kiribû, di dema "sharing weşana original" down% 21 sal li ser salê bû. Ev kêmbûna bi taybetî bi bikarhênerên Facebook di bin temenê 30 salî şûn akût bû. Di raporê de, bitaybet ji bo du vedigere. Yek ku bilindbûna hejmara "dostên" kesên li ser Facebookê ye. Ya din jî ew e ku hin çalakiyên parvekirina hatiye mesajên û ji hevrikên xwe yên wekî Snapchat guhert. Di raporê de çend taktîkên Facebook hewl dabû ji bo zengilê parvekirin, di nav wan de tweaks rêbazeke News Feed ku posts original navdar zêdetir, û herweha ji bîr kovara yên bikarhêneran posts original "Di vê roja" çend sal berê hinartîye. Çi encamên, eger tu, ne ev netîce ji bo lêkolînerên ku dixwazin ji bo bikaranîna Facebook weke çavkaniya welat heye?
[ ] Tumasjan et al. (2010) ragihand, ku rêjeya dardakirin, behsa partiyeke siyasî bi rêk û rêjeya dengên ku partî di hilbijartinên parlemanê de German di sala 2009 de qebûl dike (Şikil 2.9). Bi gotineke din, wisa xuya bû ku, tu dikarî Twitter ku pêşbînî li ser hilbijartinê bi kar tînin. Di dema vê lêkolînê de hate weşandin ew gelek bi heyecan hate hesibandin ji ber ku ew xuya bû pêşniyarekê bikaranîna hêja ji bo çavkaniya hevbeş ên data mezin.
Ji ber taybetmendiyên xerab ên data mezin, lê belê, divê tu di cih de bi gûman ev encam be. Elmanan li ser Twitter di sala 2009 de gelekî koma non-Nûnerê bûn, û alîgirên yek partî bibe li ser siyasetê gelek caran tweet. Bi vî awayî, wisa xuya dike ecêb e ku hemû meylekê mumkin e ku tu bikaribî di xeyala bi awayekî dê betal derket. Di rastiyê de, encamên li Tumasjan et al. (2010) ji bo ku pir baş ji bo rast be. Di rojnameya xwe, Tumasjan et al. (2010) Demokrat (CDU), Christian Sosyal Demokrat (CSU), SPD, Lîberal (FDP), The Çep (Die Linke), û ji Partiya Keskan (Grüne): şeş partiyên siyasî nirxandin. Lê belê, partiya siyasî ya German navborî herî on Twitter di wê demê de Partîya Korsanan (Piraten), partiyeke ku bi Sûriyeya qaîdeyên hikûmetê yên di internêtê de bû. Dema Partîya Korsanan di analîzên di nav de bû, Twitter de behsa nîşaneya xerab ji encamên hilbijartinê dike (Şikil 2.9) dibe (Jungherr, Jürgens, and Schoen 2012) .
Piştre, lêkolînerên din ên li cîhanê bi kar dişopîne rêbazên-wek bikaranîna analysis, hesek ji ciyawaziya di navbera erênî û neyînî behsa yên partiyên-in ji bo baştirkirina a kapasîteya welat Twitter mirov pêşbînî bike, cîhêreng ên ji cureyên cuda yên hilbijartinên (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . Li vir çawa Huberty (2015) ku encam ji van hewldanên ji bo pêşbînî hilbijartinên rêz bike:
"Hemû rêbazên forecasting tê zanîn li ser çapemeniya civakî de bi ser neket dema ji bo daxwazên forecasting rast pêş-digerin di hilbijartinan de kirin. Ev şkestin xuya ye ku ji ber taybetiyên bingehîn ên di medya civakî de, bêtir ji bo zehmetiyên metodolojîk an algorithmic. Bi kurtî, di medya civakî de ne, û dibe qet wê, pêşniyar û mercan de, bêalî, picture nûnerê hilbijardinan; û test rehetîya medya civakî de kêm welat bes ji bo tamîrkirina van pirsgirêkên piştî hoc. "
Read hin ji yên ku lêkolînên ku rê Huberty (2015) ji bo ku encamê de, û nivîsandina memo yek rûpel ji bo namzetê siyasî danasîna ger û çawa Twitter divê werin bikaranîn ji bo Weather hilbijartinên.
[ ] Çi cudahiyê di navbera civaknas û dîrokzan e? Li gor Goldthorpe (1991) , li Cidahiya serekî di navbera civaknas û dîrokzan kontrola li ser berhevkirina daneyên e. Dîroknas bi zorê ji bo bikaranîna wan dikişand, lê belê civaknas dikarin berhevkirina daneyên xwe ji bo armancên taybet pilanekê. Read Goldthorpe (1991) . Çawa Ferqa di navbera sosyolojî û dîroka related heye ku bi fikra ji Custommades û Readymades?
[ ] Avakirina li ser pirsa berê, Goldthorpe (1991) a hejmara bersivên krîtîk de, di nav wan de yek ji Nicky Hart kişand (1994) ku dilsoziya Goldthorpe ya rabûm ji pilanekê Daneyên çêkirin. Ji bo zelalkirina sînorên potansiyel ên data-terzîtî kir, Hart Karkeran Project dewlemend, a lêkolînê mezin ji bo pîvandinê têkiliya di navbera çîna civakî û dengdana ku ji aliyê Goldthorpe û hevalên xwe di nîvê salên 1960î de pêk hat bi nav kirin. Wekî ku yek bibe ji akademîsyenekî ye ku welat li ser daneyên dîtin dîzaynkirin keçika ku hêvî, ji Project Worker dewlemend Daneyên ku ji bo çareserkirina a teoriya pêşniyar di derbarê pêşerojê de ji çîna civakî ya di serdema zêdetir standardên jîyana anegorê hate komkirin. Lê belê, Goldthorpe û hevalên xwe bi awayekî "ji bîr kir" ji bo komkirina agahiyên li ser reftara dengdanê ji jinan. Li vir çawa Nicky Hart (1994) fezleke hemû episode:
". . . zehmet [e] da ku wê encamê ku jinan bi hevre bûn, ji ber vê 'terzîtî kir' dataset bi mantiqa paradigmatic ku hiştin ezmûna jin di çarçeweya bû. Driven destê dîtiniyekê de teorîk de jî ji ber hişmendiya class û çalakiya xwe weke xalan male. . . , Goldthorpe û hevalên wî tên çêkirin a set of belge û îdiayên ku têr û pêşmercên teorîk de xwe bi xwe li şûna ku xelekeke wan ji bo testa derbasdar ya rasteqîniyê xweyîkirin. "
Hart dewam kir:
"Encamên ampîrîk yên Project Worker dewlemend ji me re bêtir li ser nirxên masculinist civaknasî û nîvê sedsala ew ji wan agahdar bike ku pêvajoya asûna, siyaset û jiyana maddî."
Gelo hûn ên wergerandî yên din cihê berhevkirina daneyên-terzîtî kir meylekê ji berhevkarên welat ji ava nav ew difikirin? Çawa ev bimînînim çirr algorithmic nayê? Çi encamên wê bibe, ev ji bo dema ku lêkolînerên divê Readymades bi kar tînin hene û gava ku ew divê Custommades bi kar tînin?
[ ] Di vê beşê de, ez daneyên di destê lêkolîneran ji bo lêkolîneran bi records îdarî tên afirandin ji aliyê şirketên û hikûmetên paralelî. Hinek mirov ji van qeydên îdarî yên ku ew bi berevajî vê "welat, hate dîtin" "welat hatiye dîzaynkirin." Ev rast e ku records îdarî bi destê lêkolîneran dîtin, lê ew jî bi gelekî dîzaynkirin. Ji bo nimûne, kompaniyên teknolojiya modern derbas mîqdarên mezin ya dem û çavkaniyên ji bo komkirin û curate welat xwe. Bi vî awayî, ev qeydên îdarî bi her du dîtin û dîzaynkirin, ew tenê li ser perspektîfa xwe (WÊNE 2.10) girêdayî ye.
Ne nimûneyeke çavkaniya daneya ku ev dît û hem jî wekî dîtin û dîzaynkirin ku bi bikaranîna ku çavkaniya daneyên ji bo lêkolîn alîkar e.
[ ] Di gotareke bi bal, Christian Sandvig û Eszter Hargittai (2015) nasandina du cureyên lêkolîn dîjîtal, ku sîstema digital "instrument" an e "object ya xebatê de." An nimûne yên bi vî yekê yê lêkolîna li cihê ku Bengtsson û hevalên (2011) bi kar welat telefonên mobîl ji bo wan bişopîne koçberiyê piştî erdheja Haiti li 2010. An nimûne ji cureyê duyem jî ew e ku Jensen (2007) xebatên xwe çawa bi cî kirinê yên telefonên mobile li seranserî Kerala, India jiyîn birêveçûna yên bazarê ji bo masî. bibînin ez vî warî de, ji ber ku zelal dike ku lêkolînên bikaranîna çavkaniyên daneyan dîjîtal dikarin armancên pir cuda, heta eger ew bi kar tînin, bi eynî cûreyê çavkaniya daneya hene. Ji bo zelalkirin zêdetir ev cihêtî, salix çar lêkolînên ku te dîtîye: du ku bikaranîna sîstemeka tivilman wekî enstrumanekî û du ku bikaranîna sîstema digital wek object ya xebatê de. Tu dikarî wergerandî ji vê beşa eger tu dixwazî bi kar tînin.