Çalakî

  • astengiya zehmet: hêsan sivik , navîn medya , dijwar hişk , pir zehmet zehmet e
  • hewceyê math ( hewceyê hewce dike )
  • hewceyê kodê ( pêdivî ye )
  • daneyên daneyên ( daneyên mobîl )
  • min ( xewna min )
  1. [ medya De, xewna min ] Pirsgirêka Algorîtmîk pirsgirêkek Google Flu Trends bû. Lazer et al. (2014) , û e-nameya kurt, eşkere ya e-nameyê li ser Google binivîse pirsgirêka xweş bike û pêşniyar dike ku çawa çawa çareser bike.

  2. [ medya ] Bollen, Mao, and Zeng (2011) dibêjin ku daneyên Twitter ji bo pêşbigereya bazarê ve tê bikaranîn. Di vê yekê de dît ku ji bo çêkirina bazarên kapîtal a hedge-Derwent-karsazên kapîtalê-ji bo bazara firotanê li ser daneyên Twitter ji (Jordan 2010) li ser bingeha veberhênanê. Ma kîjan belgeyên ku hûn li ber vê fînansê de pereyê xwe bişînin ku bibînin?

  3. [ sivik Dema ku hin parêzvanên tendurustî yên gelemperî e-cigarettes alîkariyek ji bo kişandina kişandina cixarikê, hinek li ser rîskên potansiyonê wekî hişyariya nîkotînan hişyar dikin. Bifikirin ku lêkolînerê biryarê dide ku nêrînên gelemperî yên bi e-cigarettes-related-related-related-collection-analysis-analysis-analysis-oriented-on-a-a-cigarettes-ê-lêkolînan bixwînin.

    1. Di çarçoveya vê lêkolînê de sê tedbîrên ku hûn pir tirs in?
    2. Clark et al. (2016) tenê lêkolînek çûn. Yekem, wan 850,000 tweetên ku e-cigarette-related keywords ji kanûna January 2012-ê çileya pêşîna 2014ê de bikar anîn. Di nav çavdêriya nêzîk de, ew fêm kir ku ev tweetên otomatîkî were (xweya mirovan ji hêla hilberînîn) bû û gelek ji van tîmên xweser bazirganî Wan ji algorithmê vekirineke mirovî veşartin ku ji hêla otomîkên xweser ên xweser vekirî vekin. Bikaranînê ev mirov bi karanîna algorithm digot ku ew% 80 tweetên otomatîk hatin kirin. Ma ev dîtina bersîva we bersîva beşek (a) biguherînin?
    3. Dema ku ew hestyariya di nav organîk û otomatîk de didin, wan dît ku ji hêla otomên otomatî yên ji hêla tîmên organîk ve zêde bûne (6.17 versus versus 5.84). Ma ev dîtina bersiva we biguherîne (b)?
  4. [ sivik ] Di çiriya paşîna 2009ê de, Twitter ji bo "Tiştê çi dikî?" Ji bo "What's happening?" (Https://blog.twitter.com/2009/whats-happening) di nav boxê de gotûbêja pirsîn.

    1. Hûn çawa difikirin ku guhertina pêşniyar dê bandora kîjan tîran û / an jî ew çi tweetî bandor dike?
    2. Navê projekek lêkolînek ji bo ku hûn ê bikişînin "Tu çi dikî?" Bêje ka çima.
    3. Navê projeya yek lêkolînê ji bo ku hûn ê bikişînin "What's happening?" Bêje ka çima.
  5. [ sivik ] "Retweets" têne bikaranîn ku ji bandor û bandorkirina belavkirina ser Twitter-ê. Di destpêkê de, bikarhêneran bikar anîn ku tweet û kopî bikin û ew hez dikir, nivîskarê rastîn bi destê xwe binivîsin, û bixweberî "RT" bixweberî berî tweetê binivîse ku ew nîşan dide ku ew qeyd kir. Hingê, di 2009-ê de, Twitter bişkojka "retweet" re got. Di hezîran 2016 de, Twitter ji bo bikarhênerên xwe ji bo tweetên xwe vebirin (https://twitter.com/twitter/status/742749353689780224) çêkir. Ma hûn difikirin ku ev guhertin divê bandor bikin ku hûn çawa di lêkolînê de "çîrok" bikar bînin? Çima an na çima?

  6. [ zehmet e De, daneyên mobîl De, pêdivî ye De, xewna min ] Di kaxezek pirfireh de, Michel û hevalên (2011) ji naveroka pênc mîlyonan re pirtûkan digotin ku hewldanên ku ji bo hewlên çandî yên dirêj ên dirêj tê nas kirin. Daneyên ku ew karanîna karanîna niha datasetên Google NGrams serbest hatin serbest kirin, û ji ber ku em dikarin daneyên bikar bînin ku hin karên xwe veguherînin û dirêj bikin.

    Di yek de gelek encamên li kaxezê, Michel û hevalên xwe re got ku em bi bilez û zûtir bihêle. Ji bo salekek taybetî, dibêjin "1883", hejmara nimûneya 1-gram di navbera her du 1875 û 1975-ê de "1883" hat çap kirin. Wan ragehand ku ev nimûnek pîvana qezencên ku di vê salê de pêk hat e. Di nirxa 3a xwe de, wan sê salan ji bo sê salan: 1883, 1910, û 1950, bi karanîna karanîna pîşesaziyê plankirin. Ev sê salan nimûne hevpar. Piştre, ji bo her sal ji bo hejmarê biryara hejmarê, Michel û hevalên xwe di her salan di navbera salên 1875 û 1975-ê de, her sal salî "nîv-jiyan" de hesibandin. Li gorî nirxa 3a (inset) di wan de, ew nîşanî ku nîv-jiyanê her her sal kêm dibe, û wan argûmet kir ku ev wateya ku em ji borî û zûtirîn bihêle bihêle. Wan versiyona 1 ya Korpuska Zimanê Îngilîzî bikar tîne, lê paşê Google ji nûçeyê duyemîn derxistiye. Ji kerema xwe ji hemî beşên pirsa xwendina kodê dest pê bixwînin.

    Ev çalakiyê dê weşandina kodê reaksiyonê bixebite, encama encamên şîrovekirina, û daneyên wergirtinê (wekî pelên bi bi pelên awkward û danûstandinên wendayî). Ev çalakiyê dê alîkariyê bi we re dataset û bi datasetek dewlemendî û balkêş be.

    1. Malpera ji rawestiya malpera Google Books NGram Viewer bibînin. Bi taybetî, divê hûn 2 - 2 - ya corpusê zimanê zimanî ya ku di 1ê Tîrmeha 2012ê de serbest hat berdan, bikar bînin. Daxistin, ev pelê 1.4 GB ye.

    2. Partiya sereke ya 3a ya Michel et al. (2011) . Ji bo vê hejmarê veşartin, hûn ê du pelan hewce ne: yek ku hûn di beşê (a) û pelê "tevahiya hesab" de tête daxistin, ku hûn bikaribin bikarhênerên hilanîna rêjeyan bigire. Têbînî ku pelê tevahiya pelê pêdivî ye ku pêdivî ye ku ew bixebitin ku di xwendinê de bixwînin. Hêviya 2 ya Daneyên Daneyên NGram di heman demê de encamên ku di Michel et al. (2011) , ku li ser pirtûka 1ê de ye?

    3. Now grafika xwe ya li dijî Grafê ji aliyê NGram Viewer ve hat afirandin.

    4. Pirtûka 3a (nirxa bingehîn), lê \(y\) -xis-ê biguherînin ku hejmareke nirxê rawest be (ne rêjeya rêjîmê).

    5. Ma cûdahî di navbera (b) û (d) de rêve dibe ku hûn ji ber encamên Michel û El. (2011). Çima an na çima?

    6. Niha, bi rêjeya ramanên bikar bînin, inset a figure 3a. Ew e, ji bo her sal di nav 1875 û 1975-ê de, nîv-jiyanê ya îsal tê hesibandin. Nîv-jiyan ji bo hejmara salan tête diyarkirin ku ji ber ku rêjeya rêjeyên nîvê nirxê xwe ya nîv-ê de derbas dibe. Têbînî ku Michel et al. (2011) tiştek din zehmet e ku ji bo nirxên nîv-jiyan-beşa agahdariya Online Online-Support-lêgerîna nirxê-nirxandinê-lê belê ew dibêjin ku herdu rêbazan encamên heman rengî hilberînin. Maveroka 2 ji daneyên NGram re encam dide ku li Michel et al. (2011) , ku li ser pirtûka 1ê de ye? (Hint: Heke nayê şaş kirin nenasin.)

    7. Hûn salan ku dereng bûne wek salan ku bi lez zûtir an bi taybetî bi hucreyî bihîstin? Dibe ku ji ber vê sedemên mimkunî vebawer bikin û diyar dikin ku hûn çiqas xerîb nas dikin.

    8. Niha encama vê versiyonê ya 2-yê ya daneyên NGrams di Chinese, Fransî, Elmanî, Îbranî, Îtalî, Rûsya û Spanî de.

    9. Li gorî hemî zimanên dahatir, hebû çend salan ku derveyî bûn, wekî salan ku bi taybetî zû zû û bi taybetî hêdî digerin? Dibe ku sedema sedemên mimkin ji bo vê rengê.

  7. [ zehmet e De, daneyên mobîl De, pêdivî ye De, xewna min Penney (2016) lêkolîn kir ku gelo belavbûna belavkirina NSA / çavkaniya PRISM ya di hezîrana 2013'an de di jimara 2013'an de heb da ku di astengiya nîjer û gengaz de li ser gotarên di Wîkîpediya de mijarên ku pirsgirêkên hûrgelan zêde bibin. Ger heke, ev guhertin di rewşê de dê bandoreke çavdêriya girseyî bi bandorkirina pêkanîna hevgirtî pêk be. Vê nêzîkî Penney (2016) , carna carinan carinan bi navê sêwirînek rêzikêşî ve tê gotin, û ev nêzîkên ku di beşa 2.4.3 de hate diyarkirin.

    Ji bo hilbijartinên mijara mijarê hilbijêre, Penney ji lîsteya Ewlekariya Dewleta Dewleta Dewleta Dewletê ya ji bo medyaya civakî ya veguhestin û çavdêriyê tê bikaranîn. Lîsteya DHS di hin mijarên lêgerînê de cûda dike, wekî "Têkiliya tendurustî," "Bêhêriya Bastavê," û "Tîrîzmê." Ji bo grûpa lêkolînê, Penney 48 related keywords related to "Terorîzmê" (binêre. ). Ew paşê gotara gotarên di nav çarçoveya mehekê de 48 hejmara hejmara 48-an-ê di gotara 32-ê meha de, ji destpêka çileya paşîna 2012ê heta dawiya Tebaxê 2014ê. nêrînên nîqaş li ser mijarên din.

    Niha, hûn ê ji bo Penney (2016) veguherînin û dirêj dikin. Hemî daneyên raweyên ku hûn hewce ne ji bo vê çalakiyê ji Wiktionary de heye. An jî hûn dikarin ji R-package wikipediatrend (Meissner and R Core Team 2016) . Dema ku hûn bersivên xwe bigirin, ji kerema xwe ku kîjan çavkaniya çavkaniya we bikar anîn. (Têbînî ku ev heman çalakiyê jî di beşa 6ê de tê nîşandan). Ev çalakiya we di danûstendina danûstandinên xwezayî de li ser ezmûnên mezin ên çavkaniyên mezin. Ew ê ji bo projeyên pêşerojê ji bo çavkaniya danûstendantirîn balkêş bi we re bimeşîne û rêve dibe.

    1. Read Penney (2016) û pirtûka wî ya 2-ê ku ji berî û paşê veguhestina Snowden rûpelên "Terorîzmê" -ên vekirî tê dîtin nîşan dide. Pirtûka danûstandinan binivîse.
    2. Bêguman, 4A-ê, ya ku ji hêla "DHS & Niştecîhên" de ji hêla DHS ve tête kategoriya bikaranîna grûpê (grûpa "terorîzmê" -nalet kirin) tête peyda kirin. Pirtûka danûstandinan binivîse.
    3. Di beşek (b) tu komên xwendinê bi hev re hevalek hevpeymanî digirin. Penney jî ji du komên mêjûyên din ên bihevhatî: "Ewlekariya Infrastructural" re gotarên têkildarî (pirtûkek 11-ê) û pirtûkên wêjeyî yên populer (12-tarîxa). Bi hev re hevpeymanek alternatorê bistînin, û tehlîm bikin ka ka peyda ji part (b) hestiyariya we ya bijartina hevpeymanê we ne. Kîjan kîjan hilbijêre pir têgihîştî dike? Çima?
    4. Penney diyar kir ku gotinên "Têkoşîna terorîzmê" ji bo bikaranîna nivîsarên Wikipedia-ji bo hilbijartin ji bo bikaranîna terorîstan ji ber ku terorîzmê terorîzmê wekî rastdariya sereke ya ji bo pratîkên xwe yên lênêrîna xwe ya vekirî tê bikaranîn. Wekî nuha kontrola van 48-terorîzmê "terorîzmê", Penney (2016) jî li lêkolînek li MTurkê lêkolîn kir, lêpirsînvanan jê pirsîn ku ji bo her kirdarên kirdarî yên di bin mercên Dewleta Dewletê, Siyaset-Sensitive, û Zerar de (ji xala 7 û 8 ). Li ser MTurkê vekolînan bikin û encamên we yên xwe digirin.
    5. Li ser encama encamên beşdarî (d) û xwendina we got, hûn bi bijartina mijarên sereke yên pirtûka di Penneyê lêkolînê de hevkar dikin? Çima an na çima? Heke ne, bila hûn çi pêşniyar bikin?
  8. [ sivik Efrati (2016) ragihand, li gor agahdariya sosyalî, ku "tevahî parvekirina" li Facebook bi salê 5.5% salî kêm kiribû, dema "sala parvekirina rastîn" di sala sala 21% de bû. Ev kêmkirina bi bikarhênerên Facebookê bi 30 salî di bin temenê de dijwar bû. Di raporê de kêmkirina du faktoran. Yek di nav hejmara "hevalên" de li ser Facebookê ye. Yekî din e ku çalakiya hin çalakiyên xwe ji bo peyam û şermezarên mîna Snapchat veguherandin. Di raporê de gelek taktîkan jî got ku Facebook hewl da ku parvekirina hevkariyê bikin, herwiha tîmên Nûçeyan algorithm ên ku di mijarên "Di Roja Roja" de bi navnîşên rastîn ên din ên sereke yên girîng ên navîn, û hemî demên berbiçav veşartînin. Çi encamên ku hebe, ev peyda didin ji bo lêkolînerên ku ji bo çavkaniya daneyên danezana Facebookê bikar bînin hene?

  9. [ medya ] Di navbera sociologist û dîrokarek çi ye? Li gorî Goldthorpe (1991) , cûdahiya sereke di serhevkirina daneyên dane de ye. Dîrokzan bi zorê têne bikaranîn, hinek civaknas dikarin dikarin daneyên daneyên xwe bidin armancên taybetî. Goldthorpe (1991) bixwîne. Çiqas cihek û civakê li ser fikrên karmendî û xwendevaniyê çawa cûdahî ye?

  10. [ hişk ] Ev li ser quesiton berê dike. Goldthorpe (1991) bersivên hûrgelan ên ku ji yek ji Nicky Hart (1994) ku dîktatoriya daneyên danûstandinên Goldthorpe bi zehmet kir. Ji bo danûstandinên derfetên dakêşkirî yên Heya-Hart, Projeya projeya Karûbarê Karûbarê Karûbarê Bexdayê behsa navnîşan kir, ji bo pêwendiya civakî û dengdana ku ji aliyê Goldthorpe û hevalên xwe di di salên 1960-an de pêk hat pêk tê. Wekî ku dikare hêvîdarek ji pisporek ku hêvîkirina daneyên daneyên dahatkirî dane, projeya Karûbarê Karûbarê Karûbarê Karûbarê Karûbarê damezirandiye ku dahatiyek pêşniyarê pêşniyarên pêşniyara derbarê pêşerojiya civakî ya di demekê de hilberên standardên jiyanê pêk tê. Lê, Goldthorpe û hevpeymanên ku hinek ji "jibîr kirin" ji bo agahdariya tevgerên jinê yên jinan derxistin. Li vir çawa Nicky Hart (1994) , tevahiya episodeê kurt kir:

    "... ev zehmet e ku ji ber vê encama ku ji jinan ve hatibû veşartin ji ber ku dataset hatiye çêkirin, bi riya paradigmaticî ya ku ezmûna jinan derxistî tengahî bû. Bi dîtina vîzyona aoretîkî ya hişmendî û çalakiya wekî wek pêşniyazên mêr, mêr, Goldthorpe û hevalbendên xwe çêbikin ku nîşanên hestyar ên ku ji wan re fikrên teorîk aktorîkî hatine derxistin damezrandin.

    Hart berdewam kir:

    "Pêşniyarên derûnî yên Projeya Karûbarê Karûbarê Karûbarê Karûbarê me di derbarê nirxên masculînîst ên ji sosolojiya sedsala sedsala sedsaliyê de ji wan re behsa pêvajoyên stratification, siyaset û jiyanê materyal agahdar dikin."

    Gelo hûn difikirin ku ji wan re nimûneyên din ên ku di daneyên daneyên danûstandinan de bi awayekî danûstendinê ve girêdayî ye. Ev çiqas lihevhatina algorithmîk çawa ye? Çi encamên ku ev lêkolîner divê bixwînin û çaxê wan bikarhênerên kelemkirî bikar bînin?

  11. [ medya Di vê beşê de, ez ji hêla lêkolînerên ji bo lêkolînên îdarî yên vekolînerên veberhênanê û hikûmetên ku têne damezirandin dane berhev kirin. Hinek kes ji van reklamên "rêveberiya damezirandin," digel wan digel "daneyên sêwirandin." Vê rast e ku qeydên rêveberî ji hêla lêkolîner ve têne dîtin, lê ew jî gelemperî têne çêkirin. Ji bo nimûne, şîrketên teknolojî pir zehmet dixebitin ku daneyên daneyên xwe bigirin û şewitandin. Ji ber vê yekê, belgeyên rêveberiyê herdu dîtin û pêşniyaz kirin, ew tenê li ser perspektîfê (2.

    Wêne 2.12: Wêne du hemb û rabûye ye; ku hûn dibînin li ser perspektîfê girêdayî ye. Çavkaniyên daneyên mezin yên duşem têne dîtin û damezrandin; dîsa, hûn çi dibînin li ser perspektîfê girêdayî ye. Ji bo nimûne, belgeyên daneyên komê ji hêla kompaniya telefonê ya mobîl ve têne daneyên datasiyê ji hêla lêkolînerek ve têne dîtin. Lê belê, ev heman qeydên danûstandinên daneyên ji aliyê perspektîfek sêwirandin di karmendê belgeya şirketa telefonê de dixebite. Çavkaniya: Sersala Popular Science (1899) / Wikimedia Commons.

    Wêne 2.12: Wêne du hemb û rabûye ye; ku hûn dibînin li ser perspektîfê girêdayî ye. Çavkaniyên daneyên mezin yên duşem têne dîtin û damezrandin; dîsa, hûn çi dibînin li ser perspektîfê girêdayî ye. Ji bo nimûne, belgeyên daneyên komê ji hêla kompaniya telefonê ya mobîl ve têne daneyên datasiyê ji hêla lêkolînerek ve têne dîtin. Lê belê, ev heman qeydên danûstandinên daneyên ji aliyê perspektîfek sêwirandin di karmendê belgeya şirketa telefonê de dixebite. Çavkaniya: Sersala Popular Science (1899) / Wikimedia Commons .

    Wek mînakek çavkaniya çavkaniyê binêrin ku herdu wekî dît û nîzîkî dît ku dema çavkaniya daneyên çavkaniyê ji bo lêgerîna karanîn e.

  12. [ sivik Di nivîskî nivîskî de, Kristi Sandvig û Eszter Hargittai (2015) lêkolînek dîjîtal dabeş li du kategoran parçe dike ku pergala dîjîtal an "instrument" an "objection of study." Nimûne yekem-ê ku sîstem e an instrument-lêkolînek ji aliyê Bengtsson û hevalbendan (2011) ve di daneyên mobîl-mobîl de bi kar tîne ku piştî ku erdhej li Haiti-2010-ê di 2010'an de veguhestin. Lêkolînek duyemîn-kîjan pergala xebata lêkolînê ye-ji aliyê Jensen ve (2007) li seranserê seranserî kelala mobîl li Kerala, Hindistanê li ser karûbarên bazarê ji masî re bandor kir. Ez ji vê cûda cûda bibînim ji ber ku ev lêkolînên ku çavkaniyên daneyên daneyên danûstandina karanîna bikaranîna armancên dîjîtal bikar anî hebe heger heya heman çavkaniya çavkaniya danûstandinan bikar tînin. Ji ber vê yekê ji bo cudahiyê ev zelal bike, çar lêkolînên ku we dîtî ye: Duyem ku pergala dîjîtal wekî wekî amûr û du du karanîna pergala dîjîtal wekî wekî tiştek xwendinê tê bikaranîn. Heke hûn bixwazin hûn ji vê beşê nimûneyên mînakan bikar bînin.