eme

  • Ụdị nsogbu: dị mfe mfe , ọkara ọkara , siri ike siri ike , siri ike siri ike
  • chọrọ mgbakọ na mwepụ ( chọrọ mgbakọ na mwepụ )
  • chọrọ ederede ( achọrọ nzuzo )
  • nchịkọta data ( nchịkọta data )
  • ndị ọkacha mmasị m ( ọkacha mmasị m )
  1. [ ọkara , ọkacha mmasị m ] Nkọwa nke algorithmic bụ nsogbu na Google Flu Trends. Na-agụ akwụkwọ site na Lazer et al. (2014) , ma dee onye na-enyocha engine na Google na-akọwa nsogbu ahụ na inye echiche banyere otu esi edozi ya.

  2. [ ọkara ] Bollen, Mao, and Zeng (2011) azọrọ na a pụrụ iji data si Twitter mee ka ịkọ ahịa ahịa. Nchọpụta a mere ka e nwee ụlọ nchekwa - Derwent Capital Markets-itinye ego na ahịa ahịa dabara na data anakọtara na Twitter (Jordan 2010) . Kedu ihe ị ga-achọ ịhụ tupu ị tinye ego gị na ego ahụ?

  3. [ mfe ] Ọ bụ ezie na ụfọdụ ndị na-akwado ahụ ike ọha na eze na-atụle ka sịga na-enyere aka n'ịṅụ sịga, ndị ọzọ na-adọ aka ná ntị banyere ihe ize ndụ ndị nwere, dị ka nnukwu nicotine. Were ya na onye na-eme nnyocha kpebiri ịmụ echiche ọha na eze banyere e-siga site n'ịchịkọta ihe ndị Twitter na-ese siga na-eduzi mmetụta nke mmetụta uche.

    1. Kedu ihe atọ i nwere ike ime nke kachasị echegbu gị gbasara ọmụmụ ihe a?
    2. Clark et al. (2016) agba ọsọ dị nnọọ otu ọmụmụ. Nke mbụ, ha chịkọtara 850,000 tweets bụ ndị ji okwu metụtara ịṅụ sịga si na Jenụwarị 2012 ruo n'ọnwa Disemba 2014. Mgbe ha nyochara nyocha, ha ghọtara na ọtụtụ n'ime tweet ndị a na-emepụta (ya bụ, ọ bụghị ụmụ mmadụ) na ọtụtụ n'ime tweets ndị a na-akpaghị aka bụ n'ezie azụmahịa. Ha mepụtara ihe nlekota mmadu algorithm iji kewaputa tweets akuku site na tweets. Site n'iji nchọpụta mmadụ a chọpụta algorithm, ha chọpụtara na 80% nke tweets na-akpaghị aka. Ihe a na-achọta mgbanwe gị na akụkụ (a)?
    3. Mgbe ha jiri echiche tụnyere tweets na organic na ngwa ngwa, ha chọpụtara na tweets akpaghị aka dị mma karịa tweet (6.17 na 5.84). Ihe a na-achọta ị gbanwee azịza gị (b)?
  4. [ mfe ] Na November 2009, Twitter gbanwere ajụjụ ahụ n'igbe tweet si "Gịnị ka ị na-eme?" Na "Gịnị na - eme?" (Https://blog.twitter.com/2009/whats-happening).

    1. Kedu ka i chere mgbanwe nke ihe ga-emetụta onye tweets na / ma ọ bụ ihe ha tweet?
    2. Kpọọ otu oru nyocha nke ị ga-ahọrọ ngwa ngwa "Gịnị ka ị na-eme?" Kọwaa ihe kpatara ya.
    3. Kpọọ otu oru nyocha nke ị ga - ahọrọ ngwa ngwa "Gịnị na - eme?" Kọwaa ihe kpatara ya.
  5. [ mfe A na - ejikarị "Retweets" eme ihe iji chọpụta mmetụta na mgbasa ozi na Twitter. Na mbụ, ndị ọrụ ga-ehichapụ ma tichaa tweet ha chọrọ, kọwaa onye edemede mbụ na ya, ma jiri aka tinye "RT" n'ihu tweet iji gosi na ọ bụ nzaghachi. Mgbe ahụ, na 2009, Twitter tinyere bọtịnụ "retweet". Na June 2016, Twitter mere ka o kwe omume na ndị ọrụ na-egosiputa tweet ha (https://twitter.com/twitter/status/742749353689780224). Ị chere mgbanwe ndị a kwesịrị imetụta otú i si eji "retweets" eme ihe nyocha gị? Ntak-a ma ọ bụ ihe kpatara ya?

  6. [ siri ike , nchịkọta data , achọrọ nzuzo , ọkacha mmasị m ] N'akwụkwọ a tụlere ọtụtụ ugboro, Michel na ndị ọrụ (2011) nyochaa ọdịnaya nke ihe karịrị nde akwụkwọ ndeba aha iji chọpụta omenala omenala. Enwerela data ha ji eme ihe ugbu a dị ka data Google NGrams dataset, ya mere anyị nwere ike iji data iji dozie ma gbasaa ụfọdụ ọrụ ha.

    Na otu n'ime ọtụtụ ihe dị na akwụkwọ ahụ, Michel na ndị ọrụ ibe kwurịtara na anyị na-echefu ngwa ngwa na ngwa ngwa. Maka otu afọ, kwuo "1883," ha gbakọrọ nkezi nke 1-grams nke e bipụtara n'afọ ọ bụla n'agbata 1875 na 1975 ndị ​​"1883". Ha chere na nke a bụ ihe na-amasị mmasị n'ihe ndị mere n'afọ ahụ. N'elu nke ha 3a, ha na-akpa atụmatụ maka ụzọ atọ eji eme ihe maka afọ atọ: 1883, 1910, na 1950. Afọ atọ a na-ekere òkè otu: obere ihe tupu afọ ahụ, mgbe ahụ ọkpụkpụ, mgbe ahụ na-emebi. Ọzọ, iji tụọ ọnụego nke ire ere maka afọ ọ bụla, Michel na ndị ọrụ ibe ya gbakọrọ "ọkara ndụ" nke afọ ọ bụla n'afọ 1875 na 1975. N'ọnọdụ ha 3a (inset), ha gosiri na ọkara nke ọ bụla afọ na-arịwanye elu, ha kwukwara na nke a pụtara na anyị na-echefu oge gara aga ngwa ngwa na ngwa ngwa. Ha jiri nsụgharị nke English nke corpus na-asụ Bekee, ma Google mechara wepụta nke abụọ nke corpus. Biko gụọ akụkụ niile nke ajụjụ ahụ tupu ịmalite ịhazi.

    Ọrụ a ga-enye gị ide ederede reusable, ịkọwapụta nsonaazụ, na wrangling data (dịka ịrụ ọrụ na faịlụ ọjọọ na njikwa data efu). Ọrụ a ga-enyekwara gị aka ịmalite ma na-agba ọsọ na dataset bara ọgaranya ma na-adọrọ mmasị.

    1. Nweta ngwa data sitere na ebe nrụọrụ weebụ Google NGram Viewer. Karịsịa, ị ga-eji mbipute nke 2 nke corpus English, nke a tọhapụrụ na July 1, 2012. Na-enweghị nkwenye, faịlụ a bụ 1.4GB.

    2. Rụgharịa akụkụ nke isi nke 3a nke Michel et al. (2011) . Iji chegharịa ọnụ ọgụgụ a, ị ga-achọ faịlụ abụọ: nke ị na-ebudata na mpaghara (a) na "ngụkọta ọnụ ọgụgụ", nke ị nwere ike iji gbanwee ntụrụndụ dị ka ụda. Rịba ama na faịlụ nwere mkpokọta nwere usoro nke nwere ike ime ka ọ bụrụ ihe siri ike ịgụ na ya. Nkebi nke 2 nke data NGram na-emepụta ihe yiri nke ahụ na ndị dị na Michel et al. (2011) , nke dabeere na data nke 1?

    3. Ugbu a, lelee eserese gị megide eserese nke NGram Viewer.

    4. Debee nọmba 3a (isi ihe), ma gbanwee \(y\) -axis iji dee ọnụ (ọ bụghị ọnụego aha).

    5. Ihe dị iche n'agbata (b) na (d) na - eduga gị iji nyochaa ihe ọ bụla nke nsonaazụ nke Michel et al. (2011). Ntak-a ma ọ bụ ihe kpatara ya?

    6. Ugbu a, na-eji nha nke okwu, mee ihe ntinye nke nọmba 3a. Nke ahụ bụ, maka afọ ọ bụla n'agbata 1875 na 1975, gbakọọ ọkara ndụ nke afọ ahụ. Ọkara ndụ a kọwara dị ka ọnụ ọgụgụ nke afọ na-agafe tupu ọnụ ọgụgụ nke okwu ruru ọkara ọnụ ọgụgụ kasị elu ya. Rịba ama na Michel et al. (2011) mee ihe ọzọ dị mgbagwoju anya ịkọwa akụkụ nkebi nke ndụ nke III.6 nke Ozi Nkwado Ntanetị-ma ha na-ekwu na ha abụọ na-abịanụ na-emepụta ihe yiri ya. Nkebi nke 2 nke data NGram na - emepụta ihe yiri nke ahụ na ndị e gosipụtara na Michel et al. (2011) , nke dabeere na data nke 1? (Ntuche: Ya ejula gị anya ma ọ bụrụ na ọ gaghị.)

    7. Ọ dị afọ ole na ole bụ ndị na-apụ apụ dị ka afọ ndị echefuru ngwa ngwa ngwa ngwa ma ọ bụ jiri nwayọ nwayọọ nwayọọ? Kọwaa nkenke banyere ihe ndị nwere ike ime maka ụdị ahụ ma kọwaa otu ị si akọwa ndị outliers.

    8. Ugbu a, mechie nsonaazụ a maka mbipute 2 nke NGrams data na Chinese, French, German, Hebrew, Italian, Russian and Spanish.

    9. N'iji ya tụnyere asụsụ niile, ọ dị afọ ole na ole bụ ndị dịpụrụ adịpụ, dị ka afọ ndị echefuru ngwa ngwa ngwa ngwa ma ọ bụ karịsịa nwayọọ nwayọọ? Kọwaa nkenke banyere ihe ndị kpatara ya maka ụkpụrụ ahụ.

  7. [ siri ike , nchịkọta data , achọrọ nzuzo , ọkacha mmasị m ] Penney (2016) nyochaa ma ọkwa zuru oke banyere NSA / PRISM onyunyo (ya bụ, mmemme Snowden) na June 2013 nwere njikọ dị egwu ma na mberede na njem na Wikipedia Wikipedia na isiokwu ndị na-ebute nchegbu nzuzo. Ọ bụrụ otú ahụ, mgbanwe a na-agbanwe agbanwe ga-adabere na mmetụta dị nro na-esi na nlele nyocha. The obibia nke Penney (2016) na-akpọ mgbe ụfọdụ ihe kwụsị oge usoro imewe, na ọ na-metụtara na-eru nso kọwara na ngalaba 2.4.3.

    Iji họrọ isiokwu isiokwu, Penney na-ezo aka na ndepụta nke US Department of Homeland Security maka nsuso na nyochaa mgbasa ozi ọha na eze. DHS ndepụta depụtara ụfọdụ okwu ọchụchọ n'ọtụtụ nsogbu, ntụgharị, "Nchedo Ahụike," "Nchebe Akụrụngwa," na "Iyi ọha egwu." Maka òtù ọmụmụ ahụ, Penney ji okwu iri anọ na anọ metụtara "Iyi ọha egwu" (lee ihe odide ntụkwasị 8 ). Mgbe ahụ, ọ chịkọtara ihe dị iche iche Wikipedia na-atụle kwa ọnwa maka ndepụta 48 Wikipedia maka ihe karịrị ọnwa 32, site na mmalite nke ọnwa 2012 ruo na njedebe nke August 2014. Iji mee ka arụmụka ya sie ike, o mekwara ka ọtụtụ ndị dị iche iche tụnyere nsuso ederede na isiokwu ndị ọzọ.

    Ugbu a, ị ga-emegharị ma gbasaa Penney (2016) . All data raw data ị ga-achọ maka ọrụ a dị na Wikipedia. Ma ọ bụ i nwere ike inweta ya site na R-ngwugwu wikipediatrend (Meissner and R Core Team 2016) . Mgbe idere nzaghachi gị, biko mara ebe isi data ị na-eji. (Rịba ama na otu ọrụ ahụ gosipụtara na isi nke 6.) Ọrụ a ga-enye gị aka na nkata data na iche echiche banyere ihe ndị e kere eke na nnukwu ihe ọmụma data. Ọ ga-ebute gị ma jiri ọsọ nwere ike ịchọta data maka ọrụ n'ọdịnihu.

    1. Gụọ Penney (2016) ma gbanwee ọnụ ọgụgụ ya nke 2 nke na-egosi na peeji nke maka "Iyi ọha egwu" -azụ akwụkwọ dị iche iche n'ihu na mgbe nkuzi Snowden gasịrị. Kọwaa nchoputa ya.
    2. Nke ọzọ, nọmba nke anọ 4A, nke na-atụle otu ọmụmụ ihe ("Iyi ọha egwu" - isiokwu ndị dị nkenke) na otu ndị na-emekọ ọnụ na-eji okwu ndị e depụtara n'okpuru "DHS & Other Agencies" site na ndepụta DHS (lee ihe odide okpukpu 10 na ihe odide ala ala 139). Kọwaa nchoputa ya.
    3. N'akụkụ (b) i jiri ya tụnyere ìgwè ọmụmụ ihe otu otu. A na-atụle Penney na ndị ọzọ dị iche iche kọmpụta: "Isiokwu Nchebe nke Akụrụngwa" (ihe ndepụta okpokoro 11) na akwụkwọ Wikipedia ndị dị na ya (ihe ndepụta okpokoro 12). Bịa na onye ọzọ na-atụle otu, ma nwalee ma nchọpụta site na akụkụ (b) nwere nlezianya na nhọrọ nke kọmpat na-ahọrọ gị. Kedu nhọrọ nke na-eme ka ọgụgụ isi? Ntak-a?
    4. Penney kwuru na e jiri isiokwu ndị metụtara "Iyi ọha egwu" mee ihe iji họrọ isiokwu Wikipedia n'ihi na gọọmentị United States kwuru na iyi ọha egwu dịka ntụrụndụ dị mkpa maka usoro nyochaa n'ịntanetị. Dịka nlele nke "Iyi ọha egwu" 48 a, Penney (2016) mekwara nnyocha na MTurk, na-arịọ ndị na-aza ajụjụ iji chọpụta ọnụọgụ abụọ ọ bụla na nchịkwa nke Nsogbu Gọọmenti, Nzuzo-Nzuzo, na Ichere (ihe odide ntụkwasị 7 na nke 8 ). Mee nyochaa na MTurk ma tụnyere nchọta gị.
    5. Dabere na nsonaazụ na akụkụ (d) na ịgụpụta isiokwu gị, ị kwenyere na nhọrọ nke Penney nke isiokwu ndị dị na ngalaba ọmụmụ ahụ? Ntak-a ma ọ bụ ihe kpatara ya? Ọ bụrụ na ọ bụghị, gịnị ka ị ga-atụ aro kama?
  8. [ mfe ] Efrati (2016) kọrọ, dabere na ozi nzuzo, na "mkpesa zuru oke" na Facebook ajụla ihe dịka 5.5% n'afọ n'afọ ọ bụla "mgbasa ozi mgbasa ozi mbụ" dị ala 21% n'afọ. Ọdịda a dị nnọọ ukwuu na ndị ọrụ Facebook n'oge afọ 30. Akụkọ ahụ kwuru na ọ bụ ihe abụọ kpatara ya. Otu bụ uto na ọnụ ọgụgụ ndị "enyi" ndị mmadụ nwere na Facebook. Nke ọzọ bụ na ụfọdụ ọrụ mmekọrịta gbanwere ka ị na-eziga ozi na ndị na-asọ mpi dị ka Snapchat. Akuko ahụ gosipụtara ụzọ dị iche iche Facebook si gbalịrị ịkwalite òkè, tinyere Ntanetị algorithm tweaks nke na-eme ka posts ndị a ma ama karị, yana ncheta oge nke ihe ndị mbụ ahụ na njirimara "On This Day". Kedu ihe ọ pụtara, ma ọ bụrụ na ọ bụla, mere nchọpụta ndị a maka ndị na-eme nchọpụta bụ ndị chọrọ iji Facebook dịka isi iyi data?

  9. [ ọkara Gịnị bụ ọdịiche dị n'etiti onye ọkà mmụta mmekọrịta ọha na eze na onye ọkọ akụkọ ihe mere eme? Dị ka Goldthorpe (1991) , ọdịiche dị ukwuu na-achịkwa nchịkọta data. A na-amanye ndị ọkọ akụkọ ihe mere eme ka ha jiri relics rụọ ọrụ, ebe ndị ọkà mmụta mmekọrịta ọha na eze nwere ike ịkwado nchịkọta data ha na ebumnuche ụfọdụ. Gụọ Goldthorpe (1991) . Kedu ka ọdịiche dị n'agbata mmekọrịta ọha na eze na akụkọ ihe mere eme si emetụta echiche nke custommades na njikeremades?

  10. [ siri ike ] Nke a na-ewuli na ajụjụ mbụ. Goldthorpe (1991) wetara ọtụtụ nzaghachi dị egwu, gụnyere otu sitere na Nicky Hart (1994) nke na-ama aka edozi Goldthorpe maka ntinye aka ya. Iji kọwaa njedebe ndị nwere ike ịmepụta data, Hart kọwapụtara Ụlọ Ọrụ Mgbasa Ozi, nnukwu nnyocha iji chọpụta mmekọrịta dị n'etiti òtù mmadụ na ịme ntuli aka nke Goldthorpe na ndị ọrụ ya mere n'etiti afọ 1960. Dika mmadu nwere ike icho anya site n'aka onye okachamara nke kwadoro ideputa data n'elu ihe omuma ya, onye oru ndi oru ndi mmadu choputara ihe omuma nke edeputara iji kwuputa ihe omuma banyere ihe ndi ozo nke oge ndi mmadu na-acho. Ma, Goldthorpe na ndị ọrụ ibe "echefuru" iji nweta ihe ọmụma banyere ụdị ntuli aka nke ụmụ nwanyị. Lee otú Nicky Hart (1994) chịkọtara ihe niile merenụ:

    "... ọ siri ike izere nkwubi okwu ahụ bụ na e wepụrụ ụmụ nwanyị n'ihi na 'onye na-arụ ọrụ' a na-ejikọta ya na usoro ihe omimi nke na-ewepụ ahụmahụ ụmụ nwanyị. N'ịbụ onye ọhụụ dị iche iche nke ịmara ọkwa na omume dị ka ọrụ ndị nwoke na-agba ..., Goldthorpe na ndị ọrụ ibe ya wuru ihe ngosipụta nke ọmịiko nke na-enye nri ma na-azụlite echiche onwe ha n'echiche kama itinye ha n'ule dị irè nke erughị eru. "

    Hart gara n'ihu:

    "Ihe nchọpụta dị omimi nke Onye Ọrụ Ọhụụ na-agwa anyị ihe ndị ọzọ banyere ụkpụrụ ndị nwoke na ụmụ nwanyị na narị afọ nke narị afọ karịa ka ha na-agwa usoro nhazi, ndọrọ ndọrọ ọchịchị na ndụ ndụ."

    Ị nwere ike iche banyere ihe atụ ndị ọzọ ebe nchịkọta data mere nke nwere nchịkọta nwere nchịkọta nke onye nchịkọta data ahụ wuru n'ime ya? Kedu ka nke a si tụnyere algorithmic mgbagwoju anya? Kedu ihe nke a nwere ike ime mgbe ndị na-eme nchọpụta kwesịrị iji readymades na mgbe ha kwesịrị iji omenala?

  11. [ ọkara ] N'isiokwu a, egosiri m iche data ndị na-eme nchọpụta gbasara ndị na-eme nchọpụta na ndekọ ndekọ nchịkọta nke ụlọ ọrụ na ndị gọọmentị na-eme. Ụfọdụ ndị na-akpọ ndị ndekọ akụkọ nlekọta ndị a "chọtara data," nke ha na-atụle na "e mepụtara data." Ọ bụ eziokwu na ndị nchọpụta chọtara ndekọ akụkọ nlekọta, ma a na-ewu ha. Dịka ọmụmaatụ, ndị ọrụ ụlọ ọrụ nke oge a na-arụsi ọrụ ike nakọta ma chebe data ha. Ya mere, a na-achọta ma hazie ihe ndekọ akụkọ nlekọta a, ọ dabere n'ọnọdụ gị (nọmba 2.12).

    Onyonyo 2.12: Foto a bụ ọbọgwụ na oke bekee; ihe ị na-ahụ dabere n'ọnọdụ gị. Echọtara ma mepụta nnukwu data data; ọzọ, ihe ị na-ahụ na-adabere n'ọnọdụ gị. Dịka ọmụmaatụ, ihe ndekọ data oku nke anakọtara site na ụlọ ọrụ ekwentị mkpanaaka na-achọta data sitere n'aka onye nchọpụta. Ma, a na-edepụta ihe ndekọ ndị a kpọmkwem site n'aka onye na-arụ ọrụ na ngalaba ịgba ụgwọ nke ụlọ ọrụ ekwentị. Isi Iyi: Sayensi Sayensị Dị Mma (1899) / Wikimedia Commons.

    Onyonyo 2.12: Foto a bụ ọbọgwụ na oke bekee; ihe ị na-ahụ dabere n'ọnọdụ gị. Echọtara ma mepụta nnukwu data data; ọzọ, ihe ị na-ahụ na-adabere n'ọnọdụ gị. Dịka ọmụmaatụ, ihe ndekọ data oku nke anakọtara site na ụlọ ọrụ ekwentị mkpanaaka na-achọta data sitere n'aka onye nchọpụta. Ma, a na-edepụta ihe ndekọ ndị a kpọmkwem site na onye na-arụ ọrụ na ngalaba ịgba ụgwọ nke ụlọ ọrụ ekwentị. Isi Iyi: Sayensi Sayensị Dị Mma (1899) / Wikimedia Commons .

    Nye ihe atụ nke isi iyi data ebe ị na-ahụ ya ma dị ka achọtara ya ma nyere ya aka mgbe ị na-eji isi iyi data ahụ maka nchọpụta.

  12. [ mfe Na edemede edemede, Christian Sandvig na Eszter Hargittai (2015) kewaa nyocha dijitalụ n'ime ụzọ abụọ buru ibu na-adabere ma usoro dijitalụ bụ "ngwá" ma ọ bụ "ihe ọmụmụ." Otu ihe atụ nke ụdị mbụ-ebe usoro ahụ dị ngwá ọrụ-bụ nchọpụta nke Bengtsson na ndị ọrụ (2011) na iji ekwentị mkpanaka na-aga na mwepụ mgbe ala ọma jijiji gasịrị na Haiti na 2010. Ihe atụ nke ụdị nke abụọ-ebe usoro a bụ ihe ọmụmụ-bụ Jensen (2007) banyere otu esi ewebata ekwentị mkpanaaka na Kerala, India metụtara ọrụ nke ahịa maka azụ. Achọpụtara m na nke a dị iche iche na-enye aka n'ihi na ọ na-akọwa na ọmụmụ ihe site na iji data data dijital nwere ike inwe ihe mgbaru ọsọ dị iche iche ma ọ bụrụ na ha na-eji ụdị ụdị data ahụ. Iji mee ka nkọwa a dokwuo anya, kọwaa ihe ọmụmụ anọ ị hụrụla: abụọ na-eji usoro dijitalụ arụ ọrụ na abụọ na-eji usoro dijitalụ eme ihe dị ka ihe ọmụmụ. Ị nwere ike iji ihe atụ si n'isi nke a ma ọ bụrụ na ịchọrọ.