түлхүүр:
[ , ] Алгоритмын confounding Google Ханиад чиг хандлага нь асуудал байсан юм. Гэхэд цаас уншина уу Lazer et al. (2014) болон асуудлыг тайлбарлаж, асуудлыг хэрхэн засах тухай санааг санал Google-д инженерээр нь богино, тодорхой захиа бичиж байна.
[ ] Bollen, Mao, and Zeng (2011) Twitter-аас мэдээлэл хөрөнгийн зах зээлийг урьдчилан таамаглахад ашиглаж болно гэж үзэж байна. Энэ дүгнэлт нь дундын сангийн Derwent Капитал Twitter цуглуулсан мэдээлэлд үндэслэн үнэт цаасны зах зээлд хөрөнгө оруулалт Markets-тулд бий болгоход хүргэсэн (Jordan 2010) . Та ямар нотолгоо гэж санд таны мөнгийг өмнө нь харахыг хүсэж байна вэ?
[ ] Зарим нь нийгмийн эрүүл мэндийн өмгөөлөгч тамхинаас татгалзах нь үр дүнтэй тусламж болгон и-тамхи мөндөр боловч, зарим нь тухайлбал никотин өндөр түвшин зэрэг болзошгүй эрсдэл,-ий тухай анхааруулж байна. судлаач и-тамхи холбоотой Twitter бичлэгүүдийг цуглуулж, мэдрэхүй шинжилгээ хийх аас е-тамхи руу олон нийтийн санаа бодлыг судлах шийдвэрлэсэн гэж төсөөлөөд үз дээ.
[ ] 2009 оны арваннэгдүгээр сард, Twitter асуултанд твит хайрцагт нь "Та юу хийж байгаа юм бэ?" Болж өөрчлөгдсөн "Юу болж байна?" (Https://blog.twitter.com/2009/whats-happening).
[ ] Kwak et al. (2010) Энэ шинжилгээ нь тэд Twitter нь илүү хуваалцах мэдээллийн шинэ дунд зэрэг илүү юм гэсэн дүгнэлт дээр үндэслэн 41.7 сая хэрэглэгчийн профайл, 1.47 тэрбум нийгмийн харилцаа, 4262 хойш чиглэсэн сэдэв болон зургадугаар сарын 6-ны зургадугаар сар сарын 31-ний хооронд 106 сая жиргээ, 2009 оны дүн шинжилгээ олон нийтийн сүлжээ.
[ ] "Retweets" нь ихэвчлэн нөлөөг хэмжихэд ашиглаж, Twitter дээр нөлөөллийн тархсан байна. Эхлээд хэрэглэгчид хуулах, тэд дуртай Tweet оо, өөрийн / түүний бариултай эх зохиогч хаяг болон гараар энэ нь retweet шүү гэдгийг харуулж байна гэж жиргээний өмнө "RT" бичиж байсан юм. Дараа нь 2009 онд Twitter нь "retweet" товчийг нэмж хэлэв. Оны зургадугаар 2016 онд Twitter Энэ хэрэглэгч нь өөрийн жиргээг retweet нь (https://twitter.com/twitter/status/742749353689780224) боломжтой болгосон юм. Хэрэв та эдгээр өөрчлөлтүүдийг хэрхэн Таны судалгааны ажилд "retweets" ашиглах нөлөөлөх ёстой гэж бодож байна уу? Яагаад, яагаад үгүй гэж?
[ , , ] Michel et al. (2011) ном нь тоон системд нь Google-ийн хүчин чармайлт гарч ирсэн корпус байгуулсан. корпус, 2009 онд хэвлэгдсэн бөгөөд 5 сая дижитал хэлбэрээр хадгалагдсан ном гаруй агуулагдаж байсан анхны хувилбарыг ашиглах, зохиогчид хэл өөрчлөлт, соёлын чиг хандлагыг судлах гэдэг үгийг хэрэглэх давтамжийг дүн шинжилгээ хийж. Удалгүй Google Books корпус судлаачдын хувьд алдартай мэдээллийн эх үүсвэр болж, мэдээллийн сан нь 2-р хувилбар нь 2012 онд гарсан.
Гэсэн хэдий ч, Pechenick, Danforth, and Dodds (2015) судлаачид өргөн дүгнэлт үүнийг хэрэглэхийн өмнө корпус нь дээж авах үйл явцыг бүрэн тодорхойлох хэрэгтэй гэдгийг анхааруулж байна. гол асуудал корпус ном тус бүрийн нэг агуулсан, номын сан шиг байгаа юм. Үүний үр, хувь хүний хувьд олон бүтээл туурвисан зохиогч мэдэгдэхүйц Google Books lexicon болгон шинэ үг хэллэгийг оруулах боломжтой юм. Түүнээс гадна, шинжлэх ухааны хэлээр үйлдсэн эх бичвэрүүд 1900 оны туршид корпус нь улам бодит хэсгийг эзэлж байна. Үүнээс гадна, англи-ны сэдэвт мэдээллийн сан, Pechenick нар хоёр хувилбартай харьцуулах замаар. хангалтгүй шүүлт анхны хувилбарыг үйлдвэрлэх чиглэлээр ашиглаж байсан нь тогтоогджээ нотлох баримт. үйл ажиллагаанд шаардлагатай мэдээллийг тухай мэдээлэл энд байдаг: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
[ , , , ] Penney (2016) 2013 оны зургадугаар сард NSA / Prism тандалт (өөрөөр хэлбэл, Сноуден илчлэлтүүд) тухай өргөн тархсан сурталчилгааны нэг хурц, гэнэтийн нууцлалын асуудлыг өсөлт сэдвээр Wikipedia нийтлэл хөдөлгөөнд буурсан холбоотой эсэхийг тодруулсан. Хэрэв тийм бол, зан энэ өөрчлөлт нь олон нийтийн хяналт үр дүнд нь хөргөх нөлөө нийцэж байх юм. -Ийн хандлага Penney (2016) заримдаа тасалдсан олон удаагийн загвар гэж нэрлэдэг бөгөөд ажиглалтын мэдээ (Хэсэг 2.4.3) -аас туршилт ойролцоогоор тухай бүлэгт арга холбоотой юм.
сэдэв түлхүүр сонгох, Пенни дагаж, нийгмийн хэвлэл мэдээллийн хяналт тавих Homeland Security АНУ-ын хэлтсийн ашиглаж жагсаалтад заасан. Харуулдан тандалтын жагсаалт асуудал, өөрөөр хэлбэл, "Эрүүл мэндийн концерн", "Дэд бүтцийн аюулгүй байдлын" болон "Терроризмын. Нь төрөл бүрийн дотор зарим хайлтын нэр томъёо ангилсан Терроризмын" (Хүснэгт 8-г үзнэ үү "судалгааны бүлгийн хувьд Пенни дөчин найман түлхүүр холбоотой ашиглаж" Хавсралт). Дараа нь наймдугаар 2014 оны эцэс 2012 оны нэгдүгээр сарын эхнээс Wikipedia нийтлэл харах тооллого нь гучин хоёр сарын хугацаанд харгалзах дөчин найман Wikipedia нийтлэл нь сар бүр дээр нэгтгэн түүний аргументыг бэхжүүлэх, тэр ч бас хэд хэдэн харьцуулалт бий бусад сэдвээр нийтлэл үзэл бодлыг дагаж өөр бүлэг.
Одоо та хуулбарлах болон сунгах гэж байгаа Penney (2016) . Хэрэв та энэ үйл ажиллагаанд шаардлагатай бүх түүхий өгөгдлийн Википедиа (https://dumps.wikimedia.org/other/pagecounts-raw/) авах боломжтой юм. Эсвэл та R багц wikipediatrend-ээс авч болно (Meissner and Team 2016) . Та бичих дээш үед таны хариултыг та ашиглаж буй мэдээллийн эх сурвалж анхаарна уу. (Тайлбар: Энэ нь ижил үйл ажиллагаа нь 6-р бүлэг гарч)
[ ] Efrati (2016) тайлан, нууц мэдээлэл дээр үндэслэн, харин "анхны цацах хуваах" доош жилийн хугацаанд 21% жил байлаа Facebook дээр "нийт хуваах" нэг жилийн хугацаанд ойролцоогоор 5.5% жил буурсан гэж. Энэ бууралт нь нас 30-аас доош насны Facebook хэрэглэгчид ялангуяа цочмог байсан юм. тайлан нь хоёр хүчин буурч холбоотой. Нэг нь "найз нөхөд" хүн Facebook дээр байгаа тоо өсөлт юм. бусад зарим хуваах үйл ажиллагаа мессенжер болон SnapChat зэрэг өрсөлдөгчид шилжсэн явдал юм. тайланд эх бичлэгүүд илүү алдартай болгох Мэдээ Feed алгоритм тохируулгаар нэмэх, түүнчлэн хэдэн жилийн өмнө "энэ өдөр" анхны бичлэг хэрэглэгчдэд тогтмол санаж, түүний дотор Facebook хуваалцах нэмэгдүүлэх гэж оролдож байсан хэд хэдэн тактик, илэрсэн байна. Эдгээр үр дүн нь Facebook-өгөгдлийн эх үүсвэр болгон ашиглахыг хүсэж судлаачид ямар үр дагавар нь ямар ч яг тохирч байвал вэ?
[ ] Tumasjan et al. (2010) Улс төрийн нам дурьдахад твиттэрийн гэсэн хувь нь нам 2009 онд Германы парламентын сонгуульд авсан саналын байна (Зураг 2.9) эзлэх хувийг таарч байна. Өөрөөр хэлбэл, энэ нь та нар сонгуульд урьдчилан Twitter ашиглаж болох гэж гарч ирэв. цаг хугацаа энэ судалгаа хэвлэгдэн гарсан үед энэ нь том тоо нь нийтлэг эх үүсвэр нь үнэтэй ашиглахыг санал болгох бололтой, учир нь маш сонирхолтой гэж үзэж байна.
том мэдээллийн муу онцлогийг харгалзан Гэхдээ та нэн даруй энэ үр дүнгийн эргэлзэж байх ёстой. 2009 онд Twitter дээр Германчууд маш бус төлөөлөгч бүлэг байсан бөгөөд нэг талын дэмжигчид илүү ихэвчлэн улс төр-ий тухай жиргэдэггүй болох юм. Тиймээс та төсөөлж чадах бүхий л гарч болзошгүй алдааг ямар нэг байдлаар гарч цуцлах гэж гайхмаар байна. Үнэн хэрэгтээ үр дүнд Tumasjan et al. (2010) үнэн байх нь маш сайн байх болсон. Тэдний цаас онд Tumasjan et al. (2010) Христийн Ардчилсан (ХАХ), Кристиан Нийгмийн Ардчилсан (CSU), SPD либералууд (FDP), зүүн (Linke Die), болон Ногоон Нам (Grüne): улс төрийн зургаан нам гэж үздэг. Гэсэн хэдий ч, тэр үед Twitter дээр хамгийн их дурдагддаг Германы улс төрийн намын дээрэмчин нам (Piraten), Интернет Засгийн газар зохицуулах тэмцэгч нам байсан юм. Дээрэмчин нам шинжилгээнд орсон үед Twitter сонгуулийн үр дүн (Зураг 2.9) нь аймшигтай тодорхойлогч болдог дурдсан (Jungherr, Jürgens, and Schoen 2012) .
Дараа нь дэлхийн бусад судлаачид хэрэглэж байсан fancier аргууд, тухайлбал эерэг ба сөрөг хооронд нь ялгахад мэдрэхүй шинжилгээг ашиглан сонгуулийн янз бүрийн төрөл бүрийн урьдчилан Twitter мэдээ чадварыг сайжруулахын тулд намуудын-ийн дурджээ (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . Энд ямар байна Huberty (2015) сонгууль таамаглахад эдгээр оролдлого үр дүнг нэгтгэн:
үнэн ирээдүйтэй сонгуулийн урьдчилан эрэлт хэрэгцээнд захирагдсан үед "нийгмийн хэвлэл мэдээллийн хэрэгсэл дээр суурилсан мэдээлэл мэдэх урьдчилсан арга чадаагүй байна. Эдгээр нь алдаа биш харин арга зүйн болон алгоритмын бэрхшээл илүү олон нийтийн мэдээллийн үндсэн шинж чанар, холбоотой байх нь харагдаж байна. Товчоор хэлбэл, нийгмийн хэвлэл мэдээллийн байхгүй бол, магадгүй хэзээ ч, тогтвортой, шударга, төлөөлөх сонгогчдын зургийг санал болгож болно; , нийгмийн хэвлэл мэдээллийн тухтай дээж эдгээр асуудлууд нь зуурын бичлэг засах хангалттай мэдээлэл дутмаг байдаг. "
Хүргэж судалгааны зарим уншиж Huberty (2015) гэсэн дүгнэлтэд болон Twitter сонгууль таамаглаж ашиглах ёстой бол, хэрхэн тодорхойлсон улс төрийн нэр дэвшигчийг нэг хуудас хуудсыг бичиж байна.
[ ] Нь социологчийн болон түүхч хооронд ямар ялгаа байна вэ? Goldthorpe дагуу (1991) нь социологчийн болон түүхч гол ялгаа нь мэдээлэл цуглуулах хяналт тавих юм. Түүхчид социологич тодорхой зорилгоор тэдний мэдээлэл цуглуулах тохируулан өөрчилж болно, харин шүтээн ашиглах албадан байна. Унших Goldthorpe (1991) . социологи, түүх хоёрын ялгаа Custommades болон Readymades санааг хэрхэн холбогдож байна вэ?
[ ] Өмнөх асуудлаар байгуулах, Goldthorpe (1991) Ники Харт-аас нэг зэрэг чухал хариу хэд хэдэн зурсан (1994) хийсэн мэдээллийг тохируулан хийх Goldthorpe-ын чин бишрэл бэрхшээлтэй. захиалга хийсэн мэдээллийг боломжит хязгаарыг тодорхой болгох, Харт баян Ажилчдын төсөл,-1960-аад оны дундуур Goldthorpe болон хамт явуулсан нийгмийн анги, санал хураалтын хоорондын харилцааг хэмжих том судалгааг тайлбарласан. нэг зорилготой олсон мэдээлэл өгөгдлийг тааламжтай нэгэн эрдэмтэн нь хүлээж байж болох юм шиг, баян Ажилчдын Төслийн амьжиргааны түвшинг дээшлүүлэх нь эрин үед нийгмийн анги ирээдүйн тухай саяхан санал онолыг шийдвэрлэхийн тулд тохирсон байсан мэдээллийг цуглуулсан. Харин Goldthorpe болон хамт ажиллагсад нь ямар нэгэн байдлаар эмэгтэй саналын зан талаар мэдээлэл цуглуулах нь "мартсан". Энд Ники Харт хэрхэн шүү дээ (1994) бүхэл бүтэн түүхийг хураангуй:
". . . Энэ олонлогийн эмэгтэй туршлага хассан нь paradigmatic логик хамт хоригдож байсан "захиалга хийсэн" Учир нь эмэгтэйчүүд орхигдсон дүгнэлт сэргийлэхийн тулд хүнд хэцүү [байна]. зэрэг ухамсар ба үйл ажиллагааны эрэгтэй preoccupations зэрэг нь онолын үзэгдэл үүдэлтэй. . . , Goldthorpe болон түүний хамт хооллож мөн зохистой зөв туршилтын тэднийг илчлэх оронд өөрийн гэсэн онолын таамаглал тэжээгдэж эмпирик чадамжийг илтгэсэн багц байгуулсан. "
Харт цааш нь:
"Чинээлэг Ажилчдын төслийн эмпирик үр дүнг нь ангилал, улс төр, материаллаг амьдралын үйл явцыг мэдээлэх илүү бидэнд дунд зууны үеийн социологи нь masculinist утгын тухай дэлгэрэнгүй хэлж байна."
Та захиалга хийсэн мэдээлэл цуглуулах Хэрэв болгон барьсан мэдээлэл коллекторын алдааг байна бусад жишээ гэж бодож байна вэ? Яаж энэ алгоритмын confounding харьцуулахад вэ? Ямар үр дагавар энэ бөгөөд тэд Custommades ашиглах хэрэгтэй үед судлаачид Readymades ашиглах хэрэгтэй үед нь байж болох вэ?
[ ] Энэ бүлэгт би компаниуд, засгийн газрууд бий захиргааны бүртгэл судлаачдын судлаачдын цуглуулсан мэдээллийг ялгаатай. Зарим хүмүүс гэж нэрлэдэг эдгээр засаг захиргааны бүртгэл тэд ялгарах "мэдээллийг олж" "зохион мэдээ." Энэ нь үнэн юм захиргааны бүртгэл судлаачид олж байгаа, гэхдээ тэд ч мөн адил өндөр зорилготой юм. Жишээ нь, орчин үеийн технологийн компаниуд цуглуулж, тэдний мэдээллийг curate цаг нь асар их хэмжээний, нөөцийг зарцуулж байна. Тиймээс эдгээр засаг захиргааны бүртгэл аль аль нь олж бүтээгдсэн байдаг, энэ нь зөвхөн таны талаас (Зураг 2.10) хамаарна.
судалгааны мэдээлэл эх сурвалжийг гэдгийг хэрэглэж байгаа үед олж, зохион тустай аль аль нь үүнийг хараад хаана өгөгдлийн эх жишээг хангана.
[ ] Нь ухаалаг эссэний онд христийн Sandvig болон Eszter Hargittai (2015) тоон судалгаа, тоон систем "хэрэгсэл" буюу байдаг хоёр төрлийн судалгааны эхний төрлийн нэг жишээг тайлбарлах "судалгааны объект." Хаана Bengtsson болон түүний хамтрагчид (2011) 2010 онд Гайти-д болсон газар хөдлөлтийн дараа шилжилт хөдөлгөөнийг хянах гар утасны мэдээллийг ашигласан хоёр дахь төрлийн нэг жишээ нь хаана Jensen (2007) Керала даяар гар утас нь танилцуулга, Энэтхэг загасны зах зээлийн үйл ажиллагааг нөлөөлсөн хэрхэн судалгаа. Энэ тоон өгөгдлийн эх үүсвэрийг ашиглан судалгаа нь өгөгдлийн эх нь ижил төрлийн ашиглаж байгаа ч гэсэн огт өөр зорилго байж болно гэдгийг тодруулж, учир нь би энэ тустай олж болно. Хоёр хэрэгсэл болгон тоон мэдээллийн системийг ашиглах, судалгааны обьект болгон тоон мэдээллийн системийг ашиглах нь хоёр: Цаашид энэ ялгааг тодруулах тулд, та нар харсан дөрвөн судалгаа тайлбарлах болно. Хэрэв та хүсэж байгаа бол та энэ бүлэгт авч жишээг ашиглаж болно.