[ , ] Bha duilgheadas algorithmach na dhuilgheadas le Google Flu Trends. Leugh am pàipear le Lazer et al. (2014) , agus sgrìobh post-d goirid, soilleir gu innleadair aig Google a 'mìneachadh an duilgheadais agus a' toirt seachad beachd air mar a chuireas e air dòigh e.
[ ] Tha Bollen, Mao, and Zeng (2011) ag ràdh gum faodar dàta bho Twitter a chleachdadh gus ro-innse a dhèanamh air margaidh stoc. Mar thoradh air an toradh seo chaidh margaidhean calpa maoin-Derwent a chruthachadh - gus tasgadh a dhèanamh ann am margadh stoc stèidhichte air dàta a chaidh a chruinneachadh bho Twitter (Jordan 2010) . Dè an fhianais a bhiodh tu airson fhaicinn mus cuir thu an t-airgead agad sa mhaoin sin?
[ ] Ged a tha cuid de luchd-tagraidh slàinte a 'phobaill a' beachdachadh air e-toitean a tha na chuideachadh èifeachdach airson stad a chur air smocadh, bidh cuid eile a 'toirt rabhadh mu na cunnartan a dh'fhaodadh a bhith ann, mar ìrean àrda de nicotin. Smaoinich gu bheil neach-rannsachaidh a 'co-dhùnadh a bhith a' sgrùdadh beachd a 'phobaill a thaobh e-toitean le bhith a' cruinneachadh dhreuchdan Twitter le e-toitean agus a 'dèanamh anailis mothachail.
[ ] San t-Samhain 2009, dh'atharraich Twitter a 'cheist anns a' bhogsa tweet bho "Dè tha thu a 'dèanamh?" Gu "Dè a tha a' tachairt?" (Https://blog.twitter.com/2009/whats-happening).
[ ] Bidh "Retweets" gu tric air an cleachdadh airson tomhas buaidh agus sgaoileadh buaidh air Twitter. An toiseach, b 'fheudar do luchd-cleachdaidh an tweet a bha iad a' còrdadh riutha a chopaigeadh agus a phutadh, tag an t-ùghdar tùsail leis an làimhseachadh aige, agus làmh-sgrìobhaidh iad "RT" mus tweetadh e gu robh e na retweet. An uairsin, ann an 2009, chuir Twitter "retweet" a-steach. San Ògmhios 2016, rinn Twitter e comasach do luchd-cleachdaidh an tweets aca fhèin (https://twitter.com/twitter/status/742749353689780224) ath-bhualadh a-rithist. A bheil thu a 'smaoineachadh gum bu chòir na h-atharrachaidhean sin buaidh a thoirt air mar a chleachdas tu "retweets" anns an rannsachadh agad? Carson no carson?
[ , , , ] Ann am pàipear a chaidh a dheasbad gu farsaing, rinn Michel agus co-obraichean (2011) mion-sgrùdadh air susbaint còrr is còig millean leabhraichean didseatach ann an oidhirp gus gluasadan cultarach fad-ùine a chomharrachadh. Tha an dàta a chleachd iad a-nis air a leigeil ma sgaoil mar làrach-lìn Google NGrams, agus mar sin is urrainn dhuinn an dàta a chleachdadh gus cuid den obair aca a riochdachadh agus a leudachadh.
Ann an aon de na h-iomadh toradh anns a 'phàipear, mhol Michel agus co-obraichean gu bheil sinn a' dìochuimhneachadh nas luaithe agus nas luaithe. Airson bliadhna sònraichte, abair "1883," rinn iad cunntas air a 'chuibhreann de 1-gram a chaidh fhoillseachadh anns gach bliadhna eadar 1875 agus 1975 a bha "1883". Rinn iad reusanachadh gu bheil a 'chuibhreann seo na tomhas den ùidh ann an tachartasan a thachair anns a' bhliadhna sin. Anns an fhigear 3a aca, rinn iad dealbh de na h-innealan-fuirich airson trì bliadhna: 1883, 1910, agus 1950. Tha na trì bliadhnaichean seo a 'roinn pàtran cumanta: glè bheag de chleachdadh ron bhliadhna sin, an uair sin spike, an uairsin a' crìonadh. An ath rud, gus tomhas a dhèanamh air an ìre lùghdachaidh airson gach bliadhna, mheall Michel agus co-obraichean "leth-bheatha" gach bliadhna airson na bliadhnaichean eadar 1875 agus 1975. Anns an fhigear 3a (suaicheantas), sheall iad gu robh leth-beatha gach bliadhna a 'sìor dhol sìos, agus rinn iad argamaid gu bheil seo a' ciallachadh gu bheil sinn a 'dìochuimhneachadh na h-ùine a chaidh seachad nas luaithe agus nas luaithe. Chleachd iad Tionndadh 1 de chorpas Beurla, ach às deidh sin tha Google air dàrna dreach den chorp a leigeil a-mach. Leugh gach pàirt den cheist mus tòisich thu còdadh.
Bheir an gnìomh seo dhut còd sgrìobhadh ath-nuadhachail, eadar-mhìneachadh toraidhean, agus luachadh dàta (leithid obrachadh le faidhlichean meallta agus làimhseachadh dàta a tha a dhìth). Cuidichidh an gnìomhachd seo thu cuideachd a 'faighinn suas agus a' ruith le stòras fiosrachaidh beairteach agus inntinneach.
Faigh am fiosrachadh amh bho làrach-lìn Google Books NGram Viewer. Gu h-àraid, bu chòir dhut dreach 2 den chorpas cànain Beurla a chleachdadh, a chaidh a leigeil a-mach air 1 Iuchar 2012. Neo-chonnspaideach, is e seo 1.4GB.
Ath-chruthaich am prìomh phàirt de fhigear 3a de Michel et al. (2011) . Gus am figear seo ath-chruthachadh, bidh feum agad air dà fhaidhle: an tè a dh 'luchdaich thu sìos ann am pàirt (a) agus am faidhle "cunntasan iomlan", a dh'fhaodas tu a chleachdadh gus na cunntasan amh a thionndadh gu co-roinn. Thoir fa-near gu bheil structar aig an fhaidhle cunntadh iomlan a dh 'fhaodadh a dhèanamh duilich a leughadh. An toir tionndadh 2 de dhhathan NGram toraidhean coltach ris na tha air an taisbeanadh ann am Michel et al. (2011) , a tha stèidhichte air dàta dreach 1?
A-nis dèan sgrùdadh air do ghraf an graf a chruthaich an NGram Viewer.
Ath-nuadhaich figear 3a (prìomh fhigear), ach atharraich an \(y\) -axis gu bhith na iomradh luaidh amh (chan e an ìre de iomradh).
A bheil an eadar-dhealachadh eadar (b) agus (d) gad thoirt gu ath-mheasadh sam bith de na toraidhean aig Michel et al. (2011). Carson no carson?
A-nis, a 'cleachdadh a' cho-roinn de bhriathranan, a 'riochdachadh suaicheantas figear 3a. Is e sin, airson gach bliadhna eadar 1875 agus 1975, cunntas a dhèanamh air leth-beatha na bliadhna sin. Tha an leth-bheatha air a mhìneachadh mar an àireamh de bhliadhnaichean a tha a 'dol seachad mus bi a' chuibhreann de dhaoine a 'toirt a-steach a' ruighinn leth an ìre as àirde. Thoir fa-near gu bheil Michel et al. (2011) dèanamh rudeigin nas iom-fhillte gus tuairmse a dhèanamh air leth-beatha earrann III.6 den Taic Taic air-loidhne - ach tha iad ag ràdh gu bheil an dà dhòigh-obrach a' toirt toraidhean co-ionann. A bheil dreach 2 de dhàta NGram a 'toirt toraidhean co-ionann ris na tha air an taisbeanadh ann am Michel et al. (2011) , a tha stèidhichte air dàta dreach 1? (Leig: Na iongnadh mura h-eil.)
An robh bliadhnachan sam bith ann a bha a-muigh mar bhliadhnachan a chaidh a dhìochuimhneachadh gu h-àraidh gu luath no gu h-àraidh mall? Thoir cunntas goirid air adhbharan a dh'fhaodadh a bhith ann airson a 'phàtrain sin agus mìnich mar a dh'ainmich thu na h-iomallaichean.
A-nis a 'nochdadh an toradh seo airson dreach 2 de dhàta NGram ann an Sìonais, Fraingis, Gearmailtis, Eabhra, Eadailtis, Ruiseanach agus Spàinntis.
A 'dèanamh coimeas eadar a h-uile cànan, an robh bliadhnachan sam bith a bh' ann a-muigh, leithid bliadhnachan a chaidh a dhìochuimhneachadh gu h-àraid gu luath no gu h-àraidh mall? Thoir cunntas goirid air adhbharan a dh'fhaodadh a bhith ann airson a 'phàtrain sin.
[ , , , ] Rinn Penney (2016) sgrùdadh air co-dhiù an robh an t-sanasachd farsaing mu sgrùdadh NSA / PRISM (ie, na nochdasan Snowden) san Ògmhios 2013 co-cheangailte ri lùghdachadh geur agus gu h-obann ann an trafaig gu artaigilean Wikipedia mu chuspairean a tha a 'togail uallaichean prìobhaideachd. Ma tha, bhiodh an t-atharrachadh seo ann an giùlan co-chòrdail ri droch bhuaidh a thig bho sgrùdadh mòr. Uaireannan canar an dòigh-obrach aig Penney (2016) air dealbhadh sreathan ùine a tha air a bhriseadh , agus tha e co-cheangailte ris na dòighean-obrach a tha air am mìneachadh ann an earrann 2.4.3.
Gus na faclan-luirg cuspair a thaghadh, thug Penney iomradh air an liosta a chleachd Roinn Tèarainteachd Dachaigh na SA airson sùil a chumail air agus a 'cumail sùil air na meadhanan sòisealta. Tha an liosta DHS a 'toirt a-steach teirmean rannsachaidh sònraichte gu raon de chùisean, me, "Health Concern," "Tèarainteachd Bun-structair," agus "Terrorism." Airson a' bhuidhinn sgrùdaidh, chleachd Penney na 48 faclan-luirg co-cheangailte ri "Terrorism" (faic clàr an ath-taic 8 ). An uairsin bidh e a 'cunntadh sealladh artaigil iomlan de Uicipeid gach mìos airson na 48 artaigil Uicipeid co-ionann thar ùine 32-mìosan, bho thoiseach an Fhaoillich 2012 gu deireadh Lùnastal 2014. Gus an argamaid aige a neartachadh, chruthaich e grunn bhuidhnean coimeas cuideachd le bhith a' cumail sùil air beachdan artaigil air cuspairean eile.
A-nis, bidh thu a 'dol a riochdachadh agus a' leudachadh Penney (2016) . Gheibhear an dàta amh a dh'fheumas tu airson na gnìomhachd seo bho Wikipedia. No faodaidh tu fhaighinn bhon R-package wikipediatrend (Meissner and R Core Team 2016) . Nuair a bhios tu a 'sgrìobhadh suas na freagairtean agad, innis dè an stòr dàta a chleachd thu. (Thoir fa-near gu bheil an aon ghnìomh seo cuideachd a 'nochdadh ann an caibideil 6.) Bheir an gnìomhachd seo seachad dhut a bhith a' cleachdadh dàta agus a 'smaoineachadh mu dheuchainnean nàdarra ann an stòran dàta mòr. Gheibh e cuideachd suas e agus ruith e le stòr dàta a dh'fhaodadh a bhith inntinneach airson pròiseactan san àm ri teachd.
[ ] Thug Efrati (2016) aithris, stèidhichte air fiosrachadh dìomhair, gun robh "roinn iomlan" air Facebook air a dhol sìos timcheall air 5.5% bliadhna thar na bliadhna fhad 'sa bha "roinn craolaidh tùsail" sìos 21% bliadhna thar na bliadhna. Bha an crìonadh seo gu h-àraid le luchd-cleachdaidh Facebook fo aois 30 bliadhna. Thug an aithisg buaidh air an dà chrìonadh gu dà adhbhar. Is e aon dhiubh an fhàs anns an àireamh de dhaoine "caraidean" air Facebook. Is e an tè eile gu bheil cuid de ghnìomhachd co-roinnte air gluasad gu teachdaireachd agus gu farpaisich leithid Snapchat. Nochd an aithisg cuideachd na diofar dhòighean a rinn Facebook air taic a bhrosnachadh, a 'gabhail a-steach algorithm Newsweeds a tha a' dèanamh dreuchdan tùsail nas follaisiche, a bharrachd air cuimhneachain bho àm gu àm nan dreuchdan tùsail leis an fheart "Air an Là". Dè na buaidhean, ma tha, a bheil na toraidhean sin do luchd-rannsachaidh a tha airson Facebook a chleachdadh mar stòr dàta?
[ ] Dè an diofar a tha eadar eòlaiche-eòlais agus neach-eachdraidh? A rèir Goldthorpe (1991) , is e am prìomh eadar-dhealachadh smachd air cruinneachadh dàta. Feumaidh luchd-eachdraidh ìomhaighean a chleachdadh, ach faodaidh sòiseo-eòlaichean an cruinneachadh dàta aca a chomharrachadh gu adhbharan sònraichte. Leugh Goldthorpe (1991) . Ciamar a tha an t-eadar-theangachadh agus eachdraidh a 'buntainn ris a' bheachd air gnàthasan-cainnt agus a bhith a 'leughadh?
[ ] Tha seo a 'togail air a' cheasnachadh roimhe. Tharraing Goldthorpe (1991) grunn fhreagairtean breithneachail, a 'gabhail a-steach fear bho Nicky Hart (1994) a thug dùbhlan do dhìlseachd Goldthorpe gu dàta air a dhèanamh freagarrach. Gus soilleireachadh a dhèanamh air na cuingealachaidhean a dh'fhaodadh a bhith ann de dhàta air a dhèanamh freagarrach, mhìnich Hart am Pròiseact Luchd-obrach Fiang, sgrùdadh mòr airson an dàimh eadar clas sòisealta agus bhòtadh a chaidh a dhèanamh le Goldthorpe agus co-oibrichean ann am meadhan nan 1960an. Mar a dh'fhaodadh dùil a bhith aig sgoilear a bha a 'còrdadh ri dàta a chaidh a dhealbh thairis air dàta a chaidh a lorg, chruinnich am Pròiseact Luchd-obrach Fiang dàta a chaidh a dhealbh gus aghaidh a chur ri teòiridh a chaidh a mholadh o chionn ghoirid mu àm ri teachd clas sòisealta ann an àm a bhith a' meudachadh inbhean beò. Ach, rinn Goldthorpe agus co-obraichean "dearmad" air fiosrachadh a chruinneachadh mu ghiùlan bhòtaidh boireannaich. Seo mar a thug Nicky Hart (1994) geàrr-chunntas air a 'phrògram gu lèir:
"... tha e duilich an co-dhùnadh a sheachnadh nach deach boireannaich fhàgail seach gun robh an rèiteachadh 'tàillear seo' air a chuingealachadh le rèiteachadh paradigmatach a chuir bacadh air eòlas bhoireannach. Air a stiùireadh le lèirsinn teòiridh air mothachadh agus gnìomh clas mar chùraman fireann ..., chruthaich Goldthorpe agus a cho-obraichean seata de dhearbhaidhean empirical a bha a 'biathadh agus a' beathachadh na barailean teòiridh aca fhèin an àite an toirt a-steach gu deuchainn dhligheach de fhreagarrachd. "
Chùm Hart air adhart:
"Tha toraidhean empirigeach a 'Phròiseict Luchd-obrach Ruigsinneach ag innse dhuinn barrachd mu luachan fìrinneach socheòlas meadhan na linn na tha iad a' toirt fiosrachadh do phròiseasan stratachaidh, poilitigs agus beatha stuthan."
An smaoinich thu air eisimpleirean eile far a bheil co-dhùnaidhean an cruinneachaidh dàta air a thogail ann an cruinneachadh dàta air a dheagh dhèanamh? Ciamar a tha seo a 'coimeas ri bhith a' toirt buaidh air a 'chlach-sgrìobhaidh? Dè na buaidhean a dh'fhaodadh a bhith aig seo nuair a bu chòir do luchd-rannsachaidh a bhith a 'cleachdadh rudan a chaidh a leughadh agus cuin a bu chòir dhaibh cleachdaidhean àbhaisteach a chleachdadh?
[ ] Anns a 'chaibideil seo, tha mi air casg a chur air dàta a chruinnich luchd-rannsachaidh airson luchd-rannsachaidh le clàran rianachd air an cruthachadh le companaidhean agus riaghaltasan. Bidh cuid de na clàran rianachd sin "a 'lorg dàta," a tha iad a' dol an coimeas ri "dàta dealbhaichte." Tha e fìor gu bheil clàran rianachd air an lorg le luchd-rannsachaidh, ach tha iad cuideachd air an dealbhadh gu mòr. Mar eisimpleir, tha companaidhean teicneòlas ùr ag obair gu cruaidh gus an dàta aca a chruinneachadh agus a leigheas. Mar sin, tha na clàran rianachd seo air an lorg agus air an dealbhadh, tha e dìreach an urra ri do shealladh (figear 2.12).
Thoir seachad eisimpleir de thobar dàta far a bheil e ga fhaicinn an dà chuid mar a chaidh a lorg agus a dhealbh na chuideachadh nuair a bhios tu a 'cleachdadh an stòr dàta sin airson rannsachadh.
[ ] Ann an aiste smaoineachail, roinn Christian Sandvig agus Eszter Hargittai (2015) rannsachadh didseatach a-steach air dà roinn fharsaing a rèir an e an siostam didseatach "ionnsramaid" no "cuspair sgrùdaidh." Eisimpleir den chiad sheòrsa-far a bheil an siostam ionnstramaid-an rannsachadh le Bengtsson agus co-oibrichean (2011) air a bhith a 'cleachdadh dàta fòn-làimhe gus sùil a chumail air imrich às deidh an crith-thalmhainn ann an Haiti ann an 2010. Eisimpleir den dàrna seòrsa-far a bheil an siostam na nì sgrùdadh - tha rannsachadh le Jensen (2007) air mar a thug toirt a-steach fònaichean-làimhe air feadh Kerala, na h-Innseachan buaidh air mar a dh 'obraich a' mhargaid airson iasg. Tha mi a 'faighinn a' chliù seo mar chuideachadh oir tha e a 'soilleireachadh gum faod sgrùdaidhean a' cleachdadh stòran dàta didseatach amasan a bhith gu math eadar-dhealaichte eadhon ged a tha iad a 'cleachdadh an aon seòrsa stòr dàta. Gus soilleireachadh a dhèanamh air an eadar-dhealachadh seo, mìnich ceithir ceumannan a chunnaic thu: dà a bhios a 'cleachdadh siostam didseatach mar inneal agus dà a bhios a' cleachdadh siostam didseatach mar nì ionnsachaidh. Faodaidh tu eisimpleirean a chleachdadh bhon chaibideil seo ma tha thu ag iarraidh.