Eochair:
[ , ] Ba inbhréagnú algorithmic fadhb le Google Fliú Treochtaí. Léigh an páipéar ag Lazer et al. (2014) , agus a scríobh gearr, ríomhphost soiléir innealtóir ag Google míniú an bhfadhb agus a thairiscint smaoineamh ar conas a shocrú ar an bhfadhb.
[ ] Bollen, Mao, and Zeng (2011) éilimh gur féidir sonraí ó Twitter a úsáid a thuar an margadh stoc. An toradh seo mar thoradh ar an cruthú de fál ciste-Derwent Caipitil Margaí-infheistiú i margadh an stoc atá bunaithe ar shonraí arna mbailiú ó Twitter (Jordan 2010) . Cén fhianaise a bheadh gur mhaith leat a fheiceáil roimh a chur do chuid airgid sa chiste?
[ ] Cé hail roinnt abhcóidí sláinte phoiblí r-toitíní mar chabhair éifeachtach do scoir chaite tobac, rabhadh a thabhairt do dhaoine eile mar gheall ar na rioscaí ionchasacha, ar nós an ard-leibhéil Nicitín. Samhlaigh go gcinnfidh taighdeoir tuairim an phobail i dtreo r-toitíní staidéar trí bhailiú phoist Twitter r-toitíní-bhainteach agus anailís sentiment stiúradh.
[ ] I mí na Samhna 2009, d'athraigh Twitter an cheist sa bhosca tweet ó "Cad é atá tú?" A "Cad atá ag tarlú?" (Https://blog.twitter.com/2009/whats-happening).
[ ] Kwak et al. (2010) anailís ar 41,700,000 próifílí úsáideora, 1470000000 caidreamh sóisialta, 4262 topaicí trending, agus 106 milliún tweets idir 6 Meitheamh agus 31 Meitheamh, 2009. Bunaithe ar an anailís chuir siad i gcrích go feidhmíonn Twitter níos mó mar mheán nua faisnéise a roinnt ná líonra sóisialta.
[ ] "Retweets" a úsáidtear go minic tionchar a thomhas agus a scaipeadh tionchair ar Twitter. Ar dtús, bhí úsáideoirí a chóipeáil agus a ghreamú ar an tweet thaitin siad, tag an t-údar bunaidh le aige / aici láimhseáil, agus de láimh cineál "RT" os comhair an tweet chur in iúl go bhfuil sé ar retweet. Ansin, i 2009 Twitter Chuir cnaipe "retweet". I mí an Mheithimh 2016, rinne Twitter gur féidir le húsáideoirí a retweet gcuid tweets féin (https://twitter.com/twitter/status/742749353689780224). Dóigh leat gur cheart na hathruithe difear conas a úsáideann tú "retweets" i do chuid taighde? Cén fáth nó cén fáth nach?
[ , , ] Michel et al. (2011) a tógadh corpas ag teacht chun cinn as an iarracht Google leabhair a dhigitiú. Ag baint úsáide as an chéad leagan den corpus, a foilsíodh sa bhliain 2009 agus atá os cionn 5 milliún leabhar digitithe, anailís ar na húdair mhinicíocht úsáid focal chun athruithe teangeolaíocha agus treochtaí cultúrtha imscrúdú. Go gairid bhí na Leabhair Google Corpus foinse sonraí tóir do thaighdeoirí, agus scaoileadh ar leagan 2 den bhunachar in 2012.
Mar sin féin, Pechenick, Danforth, and Dodds (2015) rabhadh gur gá taighdeoirí chun na hairíonna de go hiomlán leis an bpróiseas samplála an chorpais roimh é a úsáid le haghaidh tarraingt conclúidí leathana. Is í an cheist is mó go bhfuil an corpas leabharlainne-mhaith, ina bhfuil ceann amháin de gach leabhar. Mar thoradh air sin, an duine aonair, tá an t-údar bisiúil ann a chur isteach suntasach frásaí nua isteach sa fhoclóir Google Books. Ina theannta sin, is ionann téacsanna eolaíochta sciar níos substainteach an chorpais fud na 1900í. Lena chois sin, trí chomparáid a dhéanamh dhá leagan de na tacair shonraí Fiction Béarla, Pechenick et al. fianaise le fáil gur úsáideadh leor scagadh in ullmhú na chéad leagan. Tá gach ceann de na sonraí a theastaíonn chun gníomhaíocht ar fáil anseo: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
[ , , , ] Penney (2016) Scrúdaíonn an bhfuil an phoiblíocht fhorleathan faoi NSA faireachas / PRISM (ie, an revelations Snowden) i Meitheamh 2013 a bhaineann le laghdú géar agus go tobann sa trácht chuig an Vicipéid ailt ar ábhair a ardú imní príobháideachta. Más amhlaidh, go mbeadh an t-athrú in iompar a bheith ag teacht le éifeacht fuarú mar thoradh faireachais maise. An cur chuige Penney (2016) go bhfuil ar a dtugtar uaireanta dearadh amshraitheanna isteach agus tá a bhaineann leis na cineálacha cur chuige sa chaibidil faoi thurgnaimh comhfhogasú ar ó shonraí breathnóireachta (Alt 2.4.3).
A roghnú na heochairfhocail ábhar, dá Penney leis an liosta in úsáid ag na Stát Aontaithe Roinn Slándála Dúiche do rianú agus monatóireacht na meáin shóisialta. categorizes an liosta DHS téarmaí cuardaigh áirithe san raon saincheisteanna, ie "Concern Sláinte," "Slándáil Bonneagar," agus "Sceimhlitheoireacht." Maidir leis an grúpa staidéir, a úsáidtear Penney na heochairfhocail daichead is ocht gaolmhara le "Sceimhlitheoireacht" (féach Tábla 8 Aguisín). comhiomlánaithe sé ansin Wikipedia comhaireamh fhonn alt ar bhonn míosúil do na daichead is ocht Earraí Vicipéid comhfhreagrach thar thréimhse tríocha a dó mí, ó thús Eanáir 2012 go dtí deireadh Lúnasa 2014. A neartú a argóint, chruthaigh sé freisin comparáid roinnt grúpaí ag tuairimí airteagal rianú ar ábhair eile.
Anois, tá tú ag dul a mhacasamhlú agus a leathnú Penney (2016) . Is léir na sonraí amh go mbeidh ort don ghníomhaíocht seo ar fáil ó Wikipedia (https://dumps.wikimedia.org/other/pagecounts-raw/). Nó is féidir leat é a fháil as an wikipediatrend R pacáiste (Meissner and Team 2016) . Nuair a scríobhann tú suas do chuid freagraí, tabhair faoi deara a sonraí foinseacha úsáid tú. (Tabhair faoi deara: Is cosúil an ghníomhaíocht chéanna freisin i gCaibidil 6)
[ ] Efrati (2016) tuarascálacha, bunaithe ar fhaisnéis rúnda, go raibh laghdú "roinnt iomlán" ar Facebook réir bliana thart ar 5.5% ar an mbliain cé go raibh "roinnt craoladh bunaidh" síos bhliain 21% ar an mbliain. Bhí an laghdú go háirithe géarmhíochaine le húsáideoirí Facebook faoi 30 bliain d'aois. i leith an tuarascáil an meath ar dhá chúis. Is é ceann an fás i líon na "cairde" Tá daoine ar Facebook. An eile go bhfuil gníomhaíocht éigin a roinnt a aistreofar chuig teachtaireachtaí agus iomaitheoirí ar nós SnapChat. Léirigh an tuarascáil freisin an tactics roinnt go raibh iarracht Facebook a roinnt chun tacú le, lena n-áirítear tweaks algartam Nuacht Feed a dhéanann na poist bunaidh níos suntasaí, chomh maith le meabhrúcháin tréimhsiúla na n-úsáideoirí phoist bunaidh "Ar an Lá" roinnt blianta ó shin. Cad iad na himpleachtaí, más ann dóibh, a dhéanann bhfuil na torthaí do thaighdeoirí atá ag iarraidh úsáid a bhaint Facebook mar fhoinse sonraí?
[ ] Tumasjan et al. (2010) tuairiscíodh go céatadán na tweets go léir ina luaitear páirtí polaitíochta mheaitseáil ar líon na vótaí atá pháirtí a fuarthas sa toghchán parlaiminte na Gearmáine in 2009 (Figiúr 2.9). I bhfocail eile, ba chosúil gur féidir a úsáid Twitter a thuar an toghchán. Ag an am a foilsíodh an staidéar measadh go raibh sé thar a bheith spreagúil mar bhí cuma sé a mholadh le húsáid luachmhar foinse coiteann de shonraí móra.
Mar gheall ar na gnéithe droch sonraí mór, áfach, ba chóir duit a bheith láithreach skeptical an toradh seo. Bhí Gearmánaigh ar Twitter i 2009 go leor grúpa neamh-ionadaí, agus a d'fhéadfadh a lucht tacaíochta páirtí amháin tweet faoi pholaitíocht níos minice. Dá bhrí sin, is cosúil sé iontas go mbeadh na nósanna imeachta chun laofachtaí féidir go bhféadfaí tú a shamhlú ar ceal ar bhealach amach. Go deimhin, na torthaí i Tumasjan et al. (2010) iompaigh amach a bheith ró-mhaith a bheith fíor. I gcuid páipéar, Tumasjan et al. (2010) a mheas sé pháirtí polaitíochta: Na Daonlathaithe Críostaí (CDU), Christian Daonlathach Sóisialta (CSU), SPD, Liobrálaithe (FDP), An Clé (Die Linke), agus an Comhaontas Glas (Grüne). Mar sin féin, ba é an páirtí polaitíochta na Gearmáine is luaite ar Twitter ag an am sin an Páirtí Pirate (Piraten), páirtí a troideanna rialachán rialtais ar an Idirlíon. Nuair a bhí san áireamh an Páirtí Pirate san anailís, luann Twitter thiocfaidh chun bheith ina predictor uafásach torthaí toghcháin (Figiúr 2.9) (Jungherr, Jürgens, and Schoen 2012) .
Ina dhiaidh sin, tá taighdeoirí eile ar fud an domhain a úsáidtear modhanna-cibé fancier is baint úsáide as anailís sentiment idirdhealú a dhéanamh idir dearfacha agus diúltacha luaitear na bpáirtithe-chun feabhas a chur ar chumas na sonraí Twitter a thuar éagsúlacht de chineálacha éagsúla toghcháin (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . Seo an chaoi Huberty (2015) achoimre ar thorthaí na hiarrachtaí chun toghcháin a thuar:
"Tá teipthe ar gach modhanna réamhaisnéise dtugtar bunaithe ar na meáin shóisialta nuair a chur faoi réir na héilimh fíor ag breathnú chun cinn réamhaisnéise toghcháin. Tá na teipeanna dealraitheach a bheith mar gheall ar airíonna bunúsacha na meáin shóisialta, seachas deacrachtaí modheolaíochta nó algorithmic. I mbeagán focal, ní dhéanann na meáin shóisialta, agus is dócha beidh riamh, a thairiscint cobhsaí, neamhchlaonta, pictiúr ionadaíoch de na toghthóirí; agus samplaí áisiúlacht na meáin shóisialta easpa sonraí leordhóthanacha a shocrú leis na fadhbanna bpost hoc. "
Léigh cuid den taighde go dtiocfadh Huberty (2015) ar an gconclúid sin, agus a scríobh meamram leathanach amháin d'iarrthóir polaitiúil cur síos má bhíonn agus conas ba chóir Twitter a úsáid le toghcháin réamhaisnéis.
[ ] Cad é an difríocht idir socheolaí agus staraí? De réir Goldthorpe (1991) , is é an difríocht is mó idir socheolaí agus staraí smacht sonraí a bhailiú. Staraithe tá iallach a iarsmaí a úsáid ach is féidir socheolaithe oiriúint lena mbailiú sonraí maidir le críocha sonracha. Léigh Goldthorpe (1991) . Cén chaoi a bhfuil an difríocht idir socheolaíocht agus stair a bhaineann leis an smaoineamh Custommades agus Readymades?
[ ] Ag tógáil ar an gceist roimhe seo, Goldthorpe (1991) Tharraing roinnt freagraí criticiúla, lena n-áirítear ceann amháin ó Nicky Hart (1994) gur dúshlán deabhóid Goldthorpe ar chur in oiriúint sonraí a rinneadh. Soiléiriú na teorainneacha féideartha sonraí oirfidh, Hart cur síos ar an Tionscadal Oibrí saibhir, suirbhé mór ar an gcaidreamh idir aicme shóisialta agus a vótálfaidh Rinneadh sin ag Goldthorpe agus comhghleacaithe i lár na 1960í a thomhas. Mar a bheifí ag súil ó scoláire a bail ar fónamh orthu sonraí ar shonraí aimsíodh deartha, bhailigh an Tionscadal Oibrí saibhir sonraí a bhí in oiriúint go dul i ngleic le teoiric atá beartaithe le déanaí maidir le todhchaí aicme shóisialta i ré chaighdeáin mhaireachtála ag méadú. Ach, Goldthorpe agus comhghleacaithe ar bhealach "dearmad" faisnéis faoi iompar na mban vótála a bhailiú. Seo an chaoi Nicky Hart (1994) dheanann achoimre an eipeasóid ar fad:
". . . sé [Is] deacair a sheachaint ar an tuairim go bhfágfaí ar lár na mban mar gheall ar 'déanta oiriúint' seo a bhí tacar sonraí teoranta ag loighic paradigmatic a eisiamh taithí mná. Tiomáinte ag fís teoiriciúil de Chonaic ranga agus gníomh mar ábhair mhachnaimh fireann. . . , Goldthorpe agus a chomhghleacaithe tógadh sraith cruthúnais eimpíreach a chothú agus a chothú a gcuid toimhdí teoiriciúil féin in ionad iad a nochtadh do tástáil bailí leordhóthanacht. "
Lean Hart:
"Torthaí eimpíreach den Tionscadal Lucht Oibre saibhir insint dúinn níos mó faoi na luachanna masculinist de socheolaíocht lár an chéid ná mar gcuirfidh siad an próisis srathú, polaitíocht agus an saol ábhartha."
An féidir leat smaoineamh ar shamplaí eile sa chás go bhfuil sonraí a bhailiú oirfidh na nósanna imeachta chun laofachtaí an bailitheoir sonraí tógadh isteach é? Conas a oibríonn seo i gcomparáid le inbhréagnaithe algorithmic? Cad iad na himpleachtaí a d'fhéadfadh sé seo a bheith do cathain ba cheart thaighdeoirí Readymades úsáid agus cathain ba cheart iad a úsáid Custommades?
[ ] Sa chaibidil seo, i gcodarsnacht mé sonraí arna mbailiú ag taighdeoirí do thaighdeoirí a bhfuil taifid riaracháin cruthaithe ag cuideachtaí agus rialtais. glaoch ar roinnt daoine ar na taifid riaracháin a gcodarsnacht siad le "sonraí, fuair" "sonraí a ceapadh." Is fíor go bhfuil taifid riaracháin le fáil ag taighdeoirí, ach tá siad freisin deartha go mór. Mar shampla, caitheann cuideachtaí nua-aimseartha ardteicneolaíochta méideanna ollmhór ama agus acmhainní a bhailiú agus a gcuid sonraí coiméadaíocht. Dá bhrí sin, tá na taifid riaracháin araon le fáil agus a dhearadh, braitheann sé ach ar do dhearcadh (Figiúr 2.10).
Ar fáil sampla de foinse sonraí ina bhfaca sé an dá is fuair agus deartha cabhrach agus iad ag úsáid an fhoinse sonraí le haghaidh taighde.
[ ] I aiste mhachnamhach, Christian Sandvig agus Eszter Hargittai (2015) cur síos ar dhá chineál de thaighde digiteach, i gcás ina bhfuil an córas digiteach "ionstraim" nó "ábhar staidéir." Sampla de na chéad chineál staidéir áit Bengtsson agus comhghleacaithe (2011) a úsáidtear sonraí fón póca imirce a rianú i ndiaidh an crith talún i Háití i 2010. Is sampla de na dara chineál ina Jensen (2007) staidéir ar conas a thabhairt isteach na nguthán póca ar fud Kerala, tionchar India feidhmiú an mhargaidh le haghaidh iasc. Bhfaighidh mé an chabhair toisc soiléiríonn sé gur féidir staidéir baint úsáide as foinsí sonraí digiteacha spriocanna éagsúil fiú má tá siad ag baint úsáide as an cineál céanna foinse sonraí. D'fhonn tuilleadh soiléirithe ar an t-idirdhealú, déan cur síos ceithre staidéar go atá tú ag feiceáil: dhá go n-úsáideann córas digiteach mar ionstraim agus dhá go n-úsáideann córas digiteach mar ábhar staidéir. Is féidir leat samplaí a úsáid ó chaibidil seo más mian leat.