kle:
[ , ] Algoritmik par te yon pwoblèm ak Google Grip Tandans. Li papye a pa Lazer et al. (2014) , epi ekri yon ti bout tan, imel klè nan yon enjenyè nan Google eksplike pwoblèm nan ak ofri yon lide sou ki jan yo ranje pwoblèm nan.
[ ] Bollen, Mao, and Zeng (2011) reklamasyon ke done ki sòti nan Twitter kapab itilize nou ka prevwa mache a machandiz. Jwenn Sa a mennen nan kreyasyon an nan yon lizyè fon-Derwent Capital mache-a envesti nan mache a stock ki baze sou done ranmase nan men Twitter (Jordan 2010) . Ki prèv ou ta vle wè anvan ou mete lajan ou nan ki fon?
[ ] Pandan ke gen kèk moun kap defann sante piblik lagrèl e-sigarèt kòm yon èd efikas pou kite fimen, lòt moun avèti sou risk ki genyen nan potansyèl, tankou kòm yon wo nivo yo-a nikotin. Imajine ke yon chèchè deside etidye opinyon piblik nan direksyon e-sigarèt pa kolekte e-sigarèt ki gen rapò ak posts Twitter ak fè analiz santiman.
[ ] Nan mwa novanm 2009, Twitter chanje kesyon an nan ti bwat la tweet ki soti nan "Ki sa yo ou ap fè?" Nan "Ki sa ki pase?" (Https://blog.twitter.com/2009/whats-happening).
[ ] Kwak et al. (2010) analize 41.7 milyon dola Des itilizatè, 1.47 milya dola relasyon sosyal, 4262 sijè Des, ak 106 milyon dola twi ant mwa jen 6th ak 31 jen, 2009. Baze sou analiz sa a yo konkli ke Twitter sèvi plis kòm yon medyòm nouvo nan pataje enfòmasyon pase yon rezo sosyal.
[ ] "Retweets" yo souvan sèvi ak mezi enfliyans epi gaye nan enfliyans sou Twitter. Okòmansman, itilizatè te gen a kapab bay kopi ak keratin tweet la yo te renmen, tag otè orijinal la avèk / manch li li, ak manyèlman tape "RT" a anvan yo tweet la yo endike ke li nan yon retweet. Lè sa a, an 2009 Twitter te ajoute yon "retweet" bouton. Nan mwa jen 2016, Twitter te fè li posib pou itilizatè yo retweet twi pwòp yo (https://twitter.com/twitter/status/742749353689780224). ou panse chanjman sa yo ta dwe afekte ki jan ou sèvi ak "retweets" nan rechèch ou an? Poukisa oswa poukisa pa?
[ , , ] Michel et al. (2011) konstwi yon corpus émergentes soti nan efò Google a nimerize liv. Lè l sèvi avèk vèsyon an premye nan corpus la, ki te pibliye nan 2009 ak genyen plis pase 5 milyon dola liv nimerik, otè yo analize mo l 'frekans li mennen envestigasyon chanjman lengwistik ak tandans kiltirèl. Byento Google Liv Corpus a te vin yon sous done popilè pou chèchè, e li te yon vèsyon 2nd nan baz done a lage nan 2012.
Sepandan, Pechenick, Danforth, and Dodds (2015) te avèti ke chèchè bezwen bay tout karakterize pwosesis la pran echantiyon nan corpus la anvan lè l sèvi avèk li pou fè desen konklizyon gwo. Pwoblèm nan prensipal la se ke corpus la se bibliyotèk ki tankou, ki gen youn nan chak liv. Kòm yon rezilta, yon moun, prolific otè se kapab notables Insert fraz nouvo nan leksik la Google Liv. Anplis, tèks syantifik konstitye yon pòsyon de pli zan pli solid nan corpus la nan tout kòmansman ane 1900 yo. Anplis de sa, lè w konpare de vèsyon nan ansanbl yo Fiksyon lang angle, Pechenick et al. jwenn prèv ki montre te ensifizan filtraj yo itilize nan pwodwi vèsyon an premye. Tout moun nan done yo ki nesesè pou aktivite sa yo ki disponib isit la: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
[ , , , ] Penney (2016) eksplore si piblisite a toupatou sou NSA / PRISM siveyans (sètadi, revelasyon yo Snowden) nan mwa jen 2013 ki asosye ak yon diminisyon byen file ak toudenkou nan trafik nan Wikipedya atik sou sijè ki ogmante enkyetid sou vi prive. Si se konsa, chanjman sa a nan konpòtman ta dwe konsistan ak yon efè paralizan ki soti nan siveyans mas. Apwòch sa a, nan Penney (2016) se pafwa yo rele yon konsepsyon seri tan koupe epi li se ki gen rapò ak apwòch yo nan chapit la sou apwoksimativman eksperyans nan done obsèvasyon (Seksyon 2.4.3).
Pou chwazi mo kle sa yo sijè, Penney refere yo bay lis la itilize pa US Department of Homeland Security pou swiv ak siveyans medya sosyal. Lis la DHS classe tèm rechèch sèten nan yon ran de pwoblèm, sa vle di "Concern Sante," "Sekirite enfrastrikti," ak "Teworis." Pou gwoup la etid, Penney itilize pran karantwit mo kle sa yo ki gen rapò ak "Teworis" (gade nan tablo 8 Apendis). Apre sa, li agrégées Wikipedya konte atik View sou yon baz chak mwa pou ki koresponn pran karantwit Wikipedya atik yo sou yon peryòd trant-de mwa, depi nan konmansman an nan mwa janvye 2012 nan fen a nan mwa Out 2014. Pou ranfòse agiman l ', li tou te kreye plizyè konparezon gwoup pa swiv opinyon atik sou lòt sijè.
Koulye a, ou yo ale nan replike ak pwolonje Penney (2016) . Tout done la anvan tout koreksyon ke ou ap bezwen pou aktivite sa a ki disponib nan Wikipedya (https://dumps.wikimedia.org/other/pagecounts-raw/). Oswa ou ka jwenn li nan wikipediatrend nan R pake (Meissner and Team 2016) . Lè ou ekri-up repons ou, tanpri sonje ki sous done ou itilize. (Remak: Aktivite sa a menm tou parèt nan chapit 6)
[ ] Efrati (2016) rapò, ki baze sou enfòmasyon konfidansyèl, ki te "pataje total" sou Facebook te refize pa sou 5.5% ane sou ane pandan y ap "orijinal pataje emisyon" te desann 21% ane sou ane. n bès Sa a te patikilyèman serye with Facebook itilizatè anba 30 zan nan laj. Rapò a atribiye n bès nan nan de faktè. Youn nan se kwasans lan nan kantite "zanmi" moun ki gen sou Facebook. Lòt la se ki te kèk aktivite pataje deplase nan messagerie ak ak konpetitè tankou SnapChat. Rapò a tou devwale taktik yo plizyè Facebook te eseye ranfòse pataje, ki gen ladan reglaj algorithm Nouvèl Feed ki fè posts orijinal plis enpòtan, menm jan tou rapèl peryodik nan posts itilizatè yo orijinal "Nan Jou Sa a" plizyè ane de sa. Ki sa ki enplikasyon, si genyen, sa yo jwenn gen pou chèchè yo ki te vle sèvi ak Facebook kòm yon sous done?
[ ] Tumasjan et al. (2010) rapòte ke pwopòsyon nan tweets mansyone yon pati politik matche pwopòsyon de vote ke pati ou te resevwa nan eleksyon an German palmantè nan 2009 (Figi 2.9). Nan lòt mo, li te parèt ke ou ta ka sèvi ak Twitter nou ka prevwa eleksyon an. Nan moman sa a etid sa a te pibliye li te konsidere kòm trè enteresan paske li te sanble ke yo sijere yon itilizasyon enpòtan pou yon sous komen nan done gwo.
Bay karakteristik yo ki move nan done gwo, sepandan, ou ta dwe imedyatman gen ensèten nan rezilta sa a. Alman sou Twitter nan 2009 te byen yon gwoup ki pa reprezantan, ak sipòtè nan yon pati ta ka tweet sou politik pi souvan. Se konsa, li sanble etone ke tout prejije yo posib ke ou ta ka imajine ta yon jan kanmenm annuler. An reyalite, rezilta yo nan Tumasjan et al. (2010) vire soti nan ka twò bon yo dwe vre. Nan papye yo, Tumasjan et al. (2010) konsidere kòm sis pati politik: kretyen Demokrat (CDU), Kretyen Demokrat Sosyal (CSU), pati sosyal Demokratik, Liberal (FDP), Left a (mouri Linke), ak Pati Vèt la (Grüne). Sepandan, pi fò mansyone German pati politik sou Twitter nan tan sa a te Pati a Bato (Pirat), yon pati ki batay règleman gouvènman an nan entènèt la. Lè Pati la Bato te enkli nan analiz la, Twitter mansyone vin tounen yon endikatè terib nan rezilta eleksyon (Figi 2.9) (Jungherr, Jürgens, and Schoen 2012) .
Imedyatman, chèchè lòt atravè mond lan te itilize amateur metòd-tankou lè l sèvi avèk analiz santiman nan distenge pozitif ak negatif mansyone tou de pati yo-yo nan lòd yo amelyore kapasite a nan Twitter done nou ka prevwa yon varyete de diferan kalite eleksyon (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . Men ki jan Huberty (2015) rezime rezilta yo nan sa yo tantativ nou ka prevwa eleksyon:
"Tout metòd prévisions li te ye ki baze sou medya sosyal te echwe lè sibi demand yo nan vre pi devan-kap prévisions elektoral la. echèk sa yo parèt yo dwe akòz pwopriyete fondamantal nan medya sosyal, olye ke nan difikilte metodolojik oswa algoritmik. Nan ti bout tan, medya sosyal pa fè sa, ak pwobableman pa janm ap, ofri yon ki estab, san patipri, foto reprezantan nan elektora a; ak echantiyon konvenyans nan medya sosyal manke done ase yo ranje pwoblèm sa yo afiche sa. "
Li kèk nan rechèch la ki mennen Huberty (2015) ak sa yo ki konklizyon, epi ekri yon memo yon paj nan yon kandida politik dekri si ak ki jan Twitter ta dwe itilize yo pwevwa eleksyon yo.
[ ] Ki diferans ki genyen ant yon sosyològ ak yon istoryen? Dapre Goldthorpe (1991) , diferans lan prensipal ant yon sosyològ ak yon istoryen se kontwòl sou koleksyon done. Istoryen yo fòse yo sèvi ak debri Lè nou konsidere ke sosyolojis kapab tayè koleksyon done yo nan rezon espesifik. Li Goldthorpe (1991) . Ki jan yo diferans ki genyen ant sosyoloji ak istwa ki gen rapò ak lide a nan Custommades ak Readymades?
[ ] Bati sou kesyon an anvan, Goldthorpe (1991) te trase yon kantite repons kritik, ki gen ladan yon sèl soti nan Nicky Hart (1994) ki defye devosyon Goldthorpe nan tayè te fè done. Pou klarifye limit yo potansyèl nan done tayè-te fè, Hart dekri Pwojè a Fortine Travayè, yon gwo sondaj ki mezire relasyon ki genyen ant klas sosyal ak vote ki te fèt pa Goldthorpe ak kòlèg nan mitan ane 1960 yo-. Kòm youn ta ka atann de yon elèv ki te anfavè fèt done sou jwenn done, Pwojè a Fortine Travayè kolekte done ki te pwepare nan adrès yon teyori dènyèman pwopoze sou lavni an nan klas sosyal nan yon epòk pou ogmante estanda k ap viv. Men, Goldthorpe ak kòlèg yon jan kanmenm "bliye" nan kolekte enfòmasyon sou konpòtman an pou vote nan fanm yo. Men ki jan Nicky Hart (1994) rezime Episode nan antye:
". . . li [se] difisil pou fè pou evite konklizyon an ke fanm yo te omisyon paske sa a 'tayè te fè' te dataze nan prizon pa yon lojik paradigm ki eskli eksperyans fi. Kondwi pa yon vizyon teyorik nan konsyans klas-la ak aksyon kòm sousi gason. . . , Goldthorpe ak kòlèg li konstwi yon seri prèv anpirik ki manje ak nouri pwòp sipozisyon teyorik yo olye pou yo ekspoze yo nan yon tès ki valab nan konpetans. "
Hart kontinye:
"Konklizyon yo ki anpirik nan Pwojè a Travayè Fortine di nou plis sou valè yo maskilinis nan sosyoloji mitan-syèk pase yo enfòme pwosesis yo nan stratifikasyon, politik ak lavi materyèl."
Èske ou ka panse a lòt egzanp kote tayè-te fè koleksyon done gen prejije yo nan pèseptè a done bati nan li? Ki jan sa konpare ak algoritmik par? Ki sa ki enplikasyon sa a ka gen pou lè chèchè ta dwe itilize Readymades ak yo lè yo ta dwe itilize Custommades?
[ ] Nan chapit sa a, mwen contrast done yo kolekte pa chèchè pou chèchè ak dosye administratif kreye pa konpayi yo e gouvènman. Gen kèk moun ki rele dosye administratif sa yo "yo te jwenn done," kote yo diferansye ak "ki fèt done." Se vrè ke se dosye administratif yo jwenn pa chèchè, men yo tou trè fèt. Pou egzanp, konpayi teknoloji modèn pase kantite lajan menmen nan tan ak resous kolekte epi vikèr done yo. Se konsa, dosye administratif sa yo yo tou de te jwenn ak ki fèt, li jis depann sou pèspektiv ou (Figi 2.10).
Bay yon egzanp sou sous done ki kote wè li tou de tankou sa yo jwenn ak ki fèt se itil lè w ap itilize ki sous done pou rechèch.
[ ] Nan yon redaksyon reflechi, kretyen Sandvig ak Eszter Hargittai (2015) dekri de kalite rechèch dijital, kote sistèm lan dijital se "enstriman" oswa "objè nan etid." Yon egzanp sou kalite an premye nan etid se kote Bengtsson ak kòlèg (2011) itilize done telefòn mobil yo swiv migrasyon apre tranbleman tè a an Ayiti nan 2010 la Yon egzanp sou kalite a dezyèm se Jensen kote (2007) syans ki jan entwodiksyon an nan telefòn mobil nan tout Kerala, peyi Zend afekte fonksyone nan mache a pou pwason. Mwen jwenn sa a itil paske li klarifye ke syans lè l sèvi avèk sous done dijital ka gen objektif byen diferan menm si yo ap itilize kalite a menm nan sous done. Yo nan lòd yo pi lwen klarifye distenksyon sa a, dekri kat etid ke ou te wè: de ki sèvi ak yon sistèm dijital kòm yon enstriman ak de ki sèvi ak yon sistèm dijital kòm yon objè nan etid. Ou kapab sèvi ak egzanp nan chapit sa a si ou vle.