Tədqiqatçılar senzura öyrənmək üçün Çin sosial media sites həkk. Onlar gizli-xislət nəticəçıxarma ilə natamamlıq ilə məşğul olmuşdur.
Gözəl Gary King, Jennifer Pan və Molly Roberts tərəfindən təsvir edildiyi kimi əvvəlki iki nümunələri istifadə böyük data ilə yanaşı, tədqiqatçılar da, öz müşahidə məlumatları toplamaq olar (2013) Çin hökuməti tərəfindən senzura tədqiqat.
Çin Sosial media ismarıc on minlərlə daxil düşünülür böyük dövlət aparatı tərəfindən senzura olunur. Tədqiqatçılar və vətəndaşlar, lakin bu senzorları content sosial media silindi olmalıdır nəyin necə az hissi var. Çin Alimlər həqiqətən ismarıc növ silindi almaq üçün ən çox ehtimal olan haqqında ziddiyyətli gözləmələri var. Bəzi senzorları başqaları belə etiraz kimi kollektiv davranış təşviq ismarıc, diqqət edirəm isə dövlət tənqidi ismarışları diqqət edirəm. bu təmənna düzgün olan həyata figuring tədqiqatçılar Çin və senzura ilə məşğul digər avtoritar hökumətlər anlamaq necə təsir göstərir. Buna görə də, King və həmkarları nəşr və sonradan nəşr və heç silindi vəzifələrinə silindi ismarışları müqayisə etmək istədi.
bu mesajları Toplanması müxtəlif səhifə müvafiq ismarışları layouts tapmaq və sonra sonra silinmiş olan görmək üçün bu mesajları Alpdakının ilə 1000-dən çox Çin sosial media web-hər tarama gözəl engineering feat iştirak edib. geniş miqyaslı web-tarama ilə bağlı normal mühəndislik problemləri ilə yanaşı, bu layihə çox senzura posts az 24 saat aşağı alınır, çünki bu, çox sürətli olmaq lazım əlavə problem idi. Başqa sözlə, bir yavaş Skaner senzura edilmişdir xəbərlərin çox miss olardı. Bundan əlavə, robotlarının sosial media saytları araşdırmaya cavab öz siyasətini dəyişmək başqa çıxış qarşısını almaq və ya deyə aşkar yayınma isə bütün bu məlumatların toplanması idi.
bu kütləvi mühəndis vəzifəsi başa sonra, King və həmkarları pre-müəyyən həssaslıq onların gözlənilir səviyyəsinə əsaslanır idi 85 müxtəlif mövzular üzrə 11 milyon ismarışları əldə etmişdi. Məsələn, yüksək həssaslıq bir mövzu Ai Weiwei, dissident rəssam; orta həssaslıq mövzusu təqdir və Çin valyuta devalvasiya və aşağı həssaslıq mövzusu Dünya Kuboku var. Bu 11 milyon xəbərlərin təxminən 2 milyon senzura edilmişdir, lakin yüksək həssas mövzularda ismarıc orta və aşağı həssaslıq mövzularda xəbərlərin daha az daha tez-tez senzuraya məruz qaldı. Başqa sözlə, Çin senzorları Dünya Kuboku qeyd bir post kimi Ai Weiwei qeyd bir yazı senzura haqqında ehtimal olunur. Bu tapıntılar hökumət həssas mövzularda bütün ismarıclarını senzorları ki sadə fikir uyğun gəlmədi.
Mövzu ilə senzura dərəcəsi Bu sadə hesablanması, lakin yanlış ola bilər. Məsələn, hökumət Ai Weiwei dəstək, lakin onu tənqid edən ismarışları tərk ismarışları senzura bilər. Daha diqqətlə ismarıc ayırmaq üçün, tədqiqatçılar hər yazının əhval-ruhiyyəni ölçmək lazımdır. Belə ki, bu barədə düşünmək üçün bir yoldur hər post mühüm gizli xüsusiyyət hər post hiss edir. Təəssüf ki, çox iş olmasına baxmayaraq, pre-mövcud lüğətlər istifadə hiss aşkar tam avtomatlaşdırılmış üsulları (Bölmə 2.3.2.6-dan 11 sentyabr 2001-ci il emosional qrafiki yaradılması problemlərinə geri edirəm) hələ də bir çox hallarda çox yaxşı deyil. Buna görə də, King və həmkarları onlar) 1 dövlət tənqidi olub-olmadığını öz 11 milyon sosial media ismarıclarını etiket üçün bir yol lazımdır, 2) dövlət və ya hadisələr haqqında 3) yersiz və ya faktiki hesabat dəstək. Bu böyük bir iş kimi səslənir, lakin onlar güclü oyun istifadə edərək həll; data elm ümumi, lakin sosial elm hazırda nisbətən nadir bir.
Birincisi, bir addım adətən pre-emal adlı tədqiqatçılar hər sənəd üçün bir sıra və post müəyyən bir söz olan olub qeydə bir sütun var idi bir sənəd müddətli matrix, sosial media ismarışlarını çevrilir (məsələn, etiraz, yol, və s.) Next, araşdırma vəzifəlisi bir qrup post bir nümunə hiss əl-etiketli. Sonra King və həmkarları onun xüsusiyyətləri əsasında post hiss çıxarmaq bilər ki, bir maşın təlim model qiymətləndirmək üçün bu əl-etiketli data istifadə olunur. Nəhayət, onlar bütün 11 milyon ismarıc hiss qiymətləndirmək üçün bu maşın öyrənmə model istifadə. Belə ki, əl oxu və etiketleme 11 milyon mesajlar (maddi qeyri-mümkün olacaq) daha çox, onlar əl ismarışları kiçik bir etiketli və sonra elm bütün ismarışları kateqoriyalar qiymətləndirmək üçün nəzarət öyrənmək zəng nə data istifadə olunur. bu analiz etdikdən sonra, King və həmkarları bir qədər təəccüblü bir yazı ehtimalı dövlətin tənqidi və ya dövlət dəstək olub olmayan idi silindi ki bağlamağa müvəffəq olduq.
Sonda, King və həmkarları ismarıc yalnız üç növ müntəzəm senzura ki, aşkar: pornoqrafiya, senzorları tənqid və kollektiv fəaliyyət potensiala malik ki, o (yəni, geniş miqyaslı etirazlara aparıcı imkanı). silinmiş deyil silinmiş və ismarıc edildi ismarıc bir çox müşahidə edərək, King və həmkarları senzorları izləmək və sayılması ilə yalnız iş necə bacardıq. Sonrakı tədqiqat, onlar həqiqətən birbaşa senzura almaq sistematik müxtəlif məzmun və ölçü ilə ismarışları yaratmaqla Çin sosial media ekosistemi daxil müdaxilə (King, Pan, and Roberts 2014) . Biz kitab ərzində baş verəcək bir mövzu foreshadowing Əlavə 4-cü fəsildə eksperimental yanaşmalardan haqqında daha çox öyrənəcəklər, bu gizli-atributu nəticəçıxarma problemlər bəzən ilə həll edilə bilər nəzarət təlim-növbəsində sosial tədqiqat çox ümumi ola digital yaş. Siz (kütləvi əməkdaşlıq yaratmaq) Fəsillər 3 (sualların) və 5 2.3 Şəkil şəkillər çox oxşar görəcəksiniz; Bir çox fəsildən görünür bir neçə fikir biridir.
Bu misallar-New York taksi sürücüləri şagirdlər tərəfindən dostluq formalaşdırılması və müşahidə məlumatların nisbətən sadə hesablanması nəzəri proqnozlar test tədqiqatçılar təmin edə bilərsiniz Çin hökuməti-şou sosial media senzura davranış iş davranış üç. Bəzi hallarda, böyük data (New York Taksi olduğu kimi) nisbətən birbaşa hesablanması imkan verir. Digər hallarda, tədqiqatçılar (Çin senzura olduğu kimi) öz müşahidə məlumatları toplamaq lazımdır; (Şəbəkə təkamül olduğu kimi) birlikdə data birləşməsi ilə natamamlıq ilə məşğul; və ya (Çin senzura olduğu kimi) gizli-xislət nəticəçıxarma müəyyən formada həyata. Ümid edirəm kimi bu nümunələr maraqlı sual edə bilərlər tədqiqatçılar üçün, böyük böyük ümid vəd göstərir.