Key:
[ , ] Algoritmlash karıştırıcı Google Gripp yo'nalishlari bilan bog'liq bir muammo edi. Tomonidan qog'oz o'qing Lazer et al. (2014) , va Google da muhandis muammoni tushuntirib va muammoni hal qilish uchun qanday bir fikr taklif qisqa, aniq elektron pochta yozish.
[ ] Bollen, Mao, and Zeng (2011) Twitter ma'lumotlar fond bozorini oldindan uchun foydalanish mumkin, deb da'vo qiladi. Ushbu topilma to'siq fondi-Derwent Capital Twitter to'plangan ma'lumotlarga asoslangan fond bozorida investitsiya bozorlar-bir yaratishga olib keldi (Jordan 2010) . Nima dalil bu fondi pulingni qo'yib oldin ko'rishni istayman?
[ Ba'zi sog'liqni saqlash himoyachilari Chekishni tashlashda uchun samarali yordam sifatida e-sigaret do'l da], boshqalar kabi nikotin yuqori darajadagi sifatida potensial xavf haqida ogohlantirish. a tadqiqotchisi e-sigaret bilan bog'liq Twitter xabarlar yig'ish his-tuyg'u va tahlil o'tkazish orqali e-sigaretalar tomon jamoatchilik fikrini o'rganish uchun qaror qabul qiladi, deb tasavvur qiling.
[ ] 2009 yilning noyabr oyida Twitter "nima qilyapsan?" Dan Dushanba qutisiga savol o'zgardi "nima sodir bo'lyapdi?» (Https://blog.twitter.com/2009/whats-happening).
[ ] Kwak et al. (2010) , ular Twitter bir qaraganda almashish axborot, yangi o'rta sifatida ko'proq xizmat qiladi, degan xulosaga bu tahlil asosida 41,7 million foydalanuvchi rejimlarni, 1,47 milliard ijtimoiy munosabatlarni, 4262 trend mavzular va 6 iyun va iyun 31 orasida 106 million tvitlar, 2009 tahlil ijtimoiy tarmoq.
[ ] "Retweets" tez-tez ta'sir o'lchash uchun ishlatiladigan va Twitter ta'siri tarqaladi. Dastlab, foydalanuvchilar nusxa va ular yoqdi tvit joylashtirish, uning / uning dastasi bilan original muallifni yorliqlarini va qo'lda u hiling ekanini ko'rsatish uchun tvit oldin "RT" yozing kerak edi. So'ngra, 2009-yilda Twitter bir "hiling" tugmasini qo'shilgan. Iyun 2016 yilda Twitter imkon foydalanuvchilar (https://twitter.com/twitter/status/742749353689780224) o'z tvitlar hiling uchun qildi. Agar bu o'zgarishlar siz tadqiqotlar "retweets" qanday foydalanishi ta'sir kerak deb o'ylaysiz? Nima uchun yoki nima uchun?
[ , , ] Michel et al. (2011) kitoblarini dijitalize uchun Google harakat chiqqan bir corpus qurildi. 2009 yilda chop etilgan va 5 million raqamlashtirilgan kitoblar orqali mavjud edi korpus, birinchi versiyasini foydalanish, mualliflar lingvistik o'zgarishlar va madaniy yo'nalishlarini o'rganish uchun so'z foydalanish chastotasini tahlil qilindi. Tez orada Google Books Korpus tadqiqotchilar uchun mashhur ma'lumotlar manbai bo'ldi va ma'lumotlar bazasidan 2 versiyasi 2012-yilda chop etildi.
Biroq, Pechenick, Danforth, and Dodds (2015) tadqiqotchilar to'liq keng xulosa uchun ishlatishdan oldin korpus namunalarini jarayonini tavsiflovchi kerak, deb ogohlantirdi. asosiy masala korpus har kitobning biri o'z ichiga olgan,-kutubxona o'xshaydi, deb. Natijada, shaxs sifatida, samarali muallifi sezilarli Google Books lug'atga yangi iboralarni joylashtiring ega. Bundan tashqari, ilmiy matnlari 1900 bo'ylab korpus tobora mustaqil qismini tashkil etadi. Bundan tashqari, tomonidan ingliz Badiiy ma'lumotlar, Pechenick boshq ikki versiyalarini solishtirish. kam filtrlash birinchi versiyasini ishlab chiqarish ishlatilgan, deb topildi dalil. faoliyati uchun zarur bo'lgan barcha ma'lumotlar shu yerda mavjud: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
[ , , , ] Penney (2016) 2013 yilning iyun oyida NSA / PRISM kuzatuv (ya'ni, Snouden oyatlarini) haqida keng tarqalgan reklama Maxfiylik xavotirlarini mavzularda Vikipediya maqolalari uchun trafik keskin va to'satdan kamayishi bilan bog'liq bo'lsin tekshirmoqda. Agar shunday bo'lsa, xatti bu o'zgarish ommaviy kuzatuv natijasida salbiy ta'sir bilan izchil bo'ladi. Munosabati Penney (2016) , ba'zan uzilishidan doim ketma-ket dizayn deb ataladi va kuzatish ma'lumotlari (qism 2.4.3) dan tajribalar yaqin haqida bobda yondashuvlar bilan bog'liq.
mavzu kalit so'zlarni tanlash uchun, Penney kuzatish va ijtimoiy ommaviy axborot vositalarini nazorat uchun Ichki xavfsizlik departamenti tomonidan ishlatiladigan ro'yxatiga ataladi. DHS ro'yxati masalalar, ya'ni "Salomatlik konserni," "Infrastructure Xavfsizlik," va "Terrorizm. Bir qator ichiga muayyan qidiruv shartlarini tasniflanadi Terrorizm" (8-jadval ko'rish »o'quv guruhi uchun, Penney qirq sakkiz kalit so'zlar bilan bog'liq ishlatiladigan" ilova). U keyin so'zlashdan mustahkamlash uchun avgust 2014 oxirigacha yanvar 2012 boshidan, bir o'ttiz-ikki oy mobaynida mos qirq sakkiz Vikipediya maqolalari uchun har oyda Vikipediya maqola view soni birlashtiriladi, u ham bir necha taqqoslash yaratilgan boshqa mavzularda maqola fikr kuzatish orqali guruhlari.
Endi, siz ko'paytirish va kengaytirish uchun boryapmiz Penney (2016) . Agar bu faoliyat uchun zarur bo'lgan barcha xom ma'lumotlar Vikipediya (https://dumps.wikimedia.org/other/pagecounts-raw/) dan foydalanish mumkin. Yoki R paketi wikipediatrend uni olishingiz mumkin (Meissner and Team 2016) . Agar yozish-up qachon javob, siz ishlatiladigan qaysi ma'lumotlar manbai e'tibor bering. (Eslatma: Ushbu Shu faoliyati, shuningdek, 6-bobda ham paydo)
[ ] Efrati (2016) , "original efir almashish" pastga yil davomida 21% yil esa Facebook "umumiy almashish" yil davomida qariyb 5,5% yilga kamayib qilgan maxfiy ma'lumotlar asosida hisobotlarni,. Bu pasayishi yoshi 30 yoshgacha Facebook foydalanuvchilari bilan ayniqsa o'tkir edi. Hisobot ikki omillarga pasayishiga tegishli. One "Do'stlar" odamlar Facebookda ega soni o'sishi hisoblanadi. Boshqa ba'zi almashish faoliyati xabar va bunday Snapchat kabi raqobatchilar bilan banddir, deb hisoblanadi. Xabarda shuningdek, Yangiliklar Feed algoritm original xabarlar ko'proq ko'zga ko'ringan qilish tweaks, shuningdek, bir necha yil oldin "Bu kuni" original xabarlar foydalanuvchilar davriy eslatmalari, shu jumladan, Facebook almashish oshirish uchun harakat qilgan bir necha taktikasini, nozil. Bu topilmalar ma'lumotlar manbai sifatida Facebook foydalanmoqchi bo'lgan tadqiqotchilar uchun nima ahamiyati, har qanday bo'lsa, bor?
[ ] Tumasjan et al. (2010) siyosiy partiya zikr tweets deb ulushi partiya 2009 yilda nemis parlament saylovlarida olingan ovoz (rasm 2.9) ulushini mos xabar. Boshqa so'zlar bilan aytganda, Agar saylovda bashorat qilish foydalanishlari mumkin, deb paydo bo'ldi. katta ma'lumotlar umumiy manbai uchun qimmatli foydalanishni taklif tuyulardi, chunki bu ish chop etilgan paytda juda qiziqarli ko'rib chiqildi.
katta ma'lumotlar yomon xususiyatlarini hisobga olib, Biroq, siz darhol bu natija shubha bo'lishi kerak. 2009 yilda Twitter nemislar juda non-vakillik guruhi edi, va bir partiya tarafdorlari ko'pincha siyosat Dushanba mumkin. Shunday qilib, u siz tasavvur mumkin, mumkin bo'lgan barcha bichib negadir tashqariga bekor deb hayron ko'rinadi. Aslida, olib Tumasjan et al. (2010) , haqiqiy bo'lishi uchun juda yaxshi bo'lib chiqdi. Ularning qog'oz, Tumasjan et al. (2010) xristian demokratlar (CDU), nasroniy Ijtimoiy demokratlar (CSU), SPD, liberallar (FDP), chap (Link Die), va Yashillar partiyasi (Grüne): olti siyosiy partiyalarga ko'rib chiqildi. Shu bilan birga, o'sha paytda Twitter eng eslatilgan nemis siyosiy partiya Pirate partiyasi (Piraten), Internet davlatning jang bir partiya edi. Pirate partiyasi tahlil kiritilgan bo'lsa, Twitter saylov natijalari (rasm 2.9) bir dahshatli tushuncha bo'lib zikr (Jungherr, Jürgens, and Schoen 2012) .
Keyinchalik, butun dunyo bo'ylab boshqa tadqiqotchilar foydalangan bilag'on usullari falon ijobiy va salbiy hissiyot farqlay tahlil yordamida sifatida saylovlarda turli turli bashorat qilish Twitter ma'lumotlar qobiliyatini oshirish maqsadida partiyalar-bir zikr (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . Bu yerda qilib Huberty (2015) saylovlar bashorat qilish bu urinishlar natijalarini sarhisob:
haqiqiy progressiv saylov prognozlash talablariga duch kelgan bo'lsa "ijtimoiy media asoslangan barcha ma'lum prognozlash usullari muvaffaqiyatsiz tugadi. Bu nosozliklar, balki metodologik yoki algoritmik qiyinchiliklar ko'ra ijtimoiy ommaviy axborot vositalari asosiy xususiyatlari, tufayli bo'lishi ko'rinadi. Qisqasi, ijtimoiy media yo'q, va, ehtimol, saylovchilar bilan barqaror, xolis, vakillik rasm taklif etadi hech qachon; va ijtimoiy ommaviy axborot vositalari qulaylik namunalari bu muammolar maxsus post tuzatish uchun etarli ma'lumotlar yetishmaydi. "
Olib tadqiqotlar ayrim o'qing Huberty (2015) degan xulosaga va Twitter saylovlar bashorat qilish uchun foydalanish lozim bo'lsa va qanday tasvirlab siyosiy nomzodga bir sahifa eslatma yozish.
[ ] Sotsiolog va tarixchisi o'rtasida qanday farq bor? Goldthorpe ko'ra (1991) , sotsiolog va tarixchisi o'rtasidagi asosiy farq ma'lumotlarni yig'ish ustidan nazorat hisoblanadi. Tarixchilarning sotsiologlar muayyan maqsadlar uchun o'z ma'lumotlar yig'ish Tikuvchi mumkin esa qoldiqlar foydalanishga majbur qilinadi. O'qing Goldthorpe (1991) . Qanday sotsiologiya va tarix o'rtasidagi farq Custommades va Readymades g'oyasi bilan bog'liq?
[ ] Oldingi savolga asosida, Goldthorpe (1991) Nicky Xart dan biri, shu jumladan, tanqidiy javob bir qator, qaratdi (1994) qilgan ma'lumotlarni Tikuvchi Goldthorpe ning sadoqatini shubha ostiga. Tikuvchi-yasalgan ma'lumotlar salohiyati chegaralarini ochib berish uchun, Hart mablag'larni arbobi loyihasi, 1960 yillarning o'rtalarida Goldthorpe va hamkasblari tomonidan o'tkazilgan ijtimoiy sinf va ovoz berish o'rtasidagi munosabatlarni o'lchash uchun katta so'rovnoma tasvirlangan. Bir topildi ma'lumotlar orqali ma'lumotlarni mo'ljallangan qo'ygan olimdan kutish mumkin, mablag'larni arbobi Project hayot darajasini oshirishning davrida ijtimoiy sinf kelajagi haqida yaqinda taklif nazariyasi murojaat rohatlariga ma'lumotlarni to'plagan. Lekin, Goldthorpe va hamkasblari negadir ayollar ovoz berish xatti haqida ma'lumot to'plash "unutib". Bu yerda Nicky Hart qilib (1994) , butun qismni bir nutqlarni:
". . . Bu ma'lumotlar to'plami ayol tajriba istisno bir paradigmatik mantiq tomonidan cheklangan edi "Tikuvchi qildi, chunki ayollar o'qimagan edi xulosa oldini olish qiyin [bo'ladi]. erkak tasavvurlariga sifatida sinf anglash va harakat bir nazariy faoliyati bilan harakat. . . , Goldthorpe va uning hamkasblari oziqlangan va etarlilik bir amal sinov ularni fosh o'rniga o'z nazariy taxminlar yetishtirildi empirik dalillar majmuini barpo. "
Hart davom etdi:
"Ular tabakalaşma, siyosat va moddiy hayot jarayonlari xabardor ortiq mablag'larni arbobi loyihasi empirik topilmalar bizga asr o'rtalariga Sotsiologiya erkak tarafdori qadriyatlar haqida ko'proq ayting."
Agar individual ma'lumotlar yig'ish unga qurilgan ma'lumotlar kollektor tamoyillar ustida ega boshqa misollar olasizmi? Bu qanday algoritmik karıştırıcı omil nisbatan anglatadi? Ular Custommades foydalanish kerak, bu qanday ta'sir tadqiqotchilar Readymades foydalanish kerak bo'lsa uchun bor va mumkin?
[ ] Ushbu bobda, men kompaniyalar va hukumatlar tomonidan yaratilgan ma'muriy qaydlar bilan tadqiqotchilar uchun tadqiqotchilari tomonidan to'plangan ma'lumotlarni qarama-qarshi. Ba'zi odamlar Bu ma'muriy yozuvlar tadqiqotchilar tomonidan topilgan bu haqdir ". Mo'ljallangan ma'lumotlar" bu ma'muriy yozuvlar ular bilan farq "ma'lumotlarni, topilgan" call, lekin ular ham juda mo'ljallangan. Masalan, zamonaviy texnologiyalar kompaniyalari to'plash va ularning ma'lumotlarni pop yordamchisi uchun ulkan vaqt miqdorda va resurslarini sarflash. Shunday qilib, bu ma'muriy yozuvlar topdilar va mo'ljallangan, u faqat sizning nuqtai (rasm 2.10) bog'liq.
tadqiqotlar uchun ma'lumotlar manbai foydalanganda topildi va mo'ljallangan foydali ham, uni ko'rib qaerda ma'lumotlar manbai misol beradi.
[ ] Bir o'ylab esse-yilda, nasroniy Sandvig va Eszter Hargittai (2015) raqamli tizimi "vositasi» yoki raqamli tadqiqot, ikki xil tasvirlab "o'rganish ob'ekti." O'rganish birinchi turdagi misol qaerda Bengtsson va hamkasblari (2011) , ikkinchi turdagi bir misol 2010 yilda Gaitida zilzila so'ng ko'chishi ta'qib qilish uchun mobil telefon ma'lumotlarni ishlatilgan qaerda Jensen (2007) Kerala davomida mobil telefonlar joriy etish, Hindiston baliq bozori faoliyatini ta'sir qanday tadqiqotlar. Bu raqamli ma'lumotlarni manbalaridan foydalanish tadqiqotlar ular ma'lumotlar manbai bir xil turdagi foydalanayotgan bo'lsa ham, juda turli maqsadlarga ega bo'lishi mumkin, deb bayon chunki men bu foydali topish. vositasi sifatida raqamli tizimini ishlatish, ikki va o'rganish ob'ekti sifatida raqamli tizimi foydalanish ikki: bu farqni aniqlik kiritish uchun, siz ko'rgan ayting to'rt o'qishni tasvirlab. Xohlasangiz, bu bobda kelgan misollar foydalanishingiz mumkin.