2.4.1.3 చైనీస్ ప్రభుత్వం సామాజిక మీడియా సెన్సార్షిప్

పరిశోధకులు సెన్సార్షిప్ అధ్యయనం చైనీస్ సామాజిక మీడియా సైట్లు చెక్కి. వారు గుప్త-విశిష్ట లక్షణం ఆకళింపు తో అసంపూర్ణ నిర్వహించాయి.

రెండు మునుపటి ఉదాహరణలు ఉపయోగిస్తారు పెద్ద డేటా పాటు, పరిశోధకులు కూడా వారి సొంత పరిశీలన డేటా, అద్భుతంగా గారీ కింగ్, జెన్నిఫర్ పాన్ మరియు మోలే రాబర్ట్స్ చిత్రాలతో గా తీసుకోవచ్చు (2013) చైనీస్ ప్రభుత్వం సెన్సార్షిప్ మీద పరిశోధన.

చైనా లో సోషల్ మీడియా పోస్ట్లు ప్రజల వేలాది ఉన్నాయి భావించబడే అపరిమితమైన రాష్ట్ర ఉపకరణం సెన్సార్ ఉంటాయి. పరిశోధకులు మరియు పౌరులు, అయితే, ఈ సెన్సార్ కంటెంట్ సామాజిక మీడియా నుండి తొలగించబడుతుంది ఏ నిర్ణయించలేదు ఎంత తక్కువ జ్ఞానం కలిగి. చైనా పండితులు నిజానికి విరుద్ధమైన అంచనాలను పోస్ట్లు రకాల తొలగించబడుతుంది ఎక్కువగా ఇవి గురించి. కొన్ని సెన్సార్ ఇతరులు వారు వంటి నిరసనలు సామూహిక ప్రవర్తనను ప్రోత్సహించాలి పోస్ట్లు దృష్టి అనుకుంటున్నాను అయితే రాష్ట్ర కీలకమైన పోస్ట్లు దృష్టి అని అనుకుంటున్నాను. ఇందుకు ఈ అంచనాలు సరైన ఇది పరిశోధకులు చైనా మరియు సెన్సార్షిప్ లో నిమగ్నం ఇతర నిరంకుశ ప్రభుత్వాలు అర్థం ఎలా చిక్కులను కలిగి ఉంది. అందువలన, రాజు మరియు సహచరులు ప్రచురించారు మరియు తరువాత ప్రచురించబడింది మరియు ఎప్పుడూ తొలగించబడ్డాయి పోస్ట్లు తొలగించబడ్డాయి పోస్ట్లు సరిపోల్చండి కోరుకున్నాడు.

ఈ పోస్టులకు సేకరణ వివిధ పేజీ ఇదే తరువాత తొలగించబడ్డాయి చూడండి ఈ పోస్ట్ మళ్లీ సంబంధిత పోస్ట్ లు వెల్లడించే, ఆపై కంటే ఎక్కువ 1,000 చైనీస్ సామాజిక మీడియా వెబ్సైట్లలో-ప్రతి క్రాల్ యొక్క అద్భుతమైన ఇంజనీరింగ్ ఫీట్ పాల్గొన్నారు. పెద్ద ఎత్తున వెబ్ లో ప్రాకటం సంబంధం సాధారణ ఇంజనీరింగ్ సమస్యలకు అదనంగా, ఈ ప్రాజెక్టు చాలా వేగంగా ఉండాలి అనేక సెన్సార్ పోస్ట్లు కంటే తక్కువ 24 గంటల్లో తీసివేయబడతాయి ఎందుకంటే ఆ సవాళ్ళతో కలిగి. ఇతర మాటలలో, నెమ్మదిగా క్రాలర్ సెన్సార్ చేశారు పోస్ట్లు మా కోల్పోతామని. ఇంకా, క్రాలర్ సామాజిక మీడియా వెబ్సైట్లలో ప్రాప్తిని నిరోధిస్తుంది లేదా లేకపోతే అధ్యయనం తమ విధానాలను మార్చుకోవాలని భయంవలన గుర్తింపును తిరస్కరించినందుకు అయితే అన్ని ఈ డేటా సేకరణ వచ్చింది.

ఈ భారీ ఇంజనీరింగ్ పని పూర్తి అయిన తర్వాత, రాజు మరియు సహచరుల ముందు పేర్కొన్న సున్నితత్వం వారి అంచనా స్థాయి ఆధారంగా అని 85 వివిధ అంశాలపై సుమారు 11 మిలియన్ పోస్ట్లు పొందిన చేసింది. ఉదాహరణకు, అధిక సున్నితత్వం యొక్క అంశం హాయి Weiwei, దీనిని అసంతృప్త కళాకారిణి; మధ్య సున్నితత్వం యొక్క అంశం ప్రశంసలు మరియు చైనీస్ కరెన్సీ విలువ ఉంది, మరియు తక్కువ సున్నితత్వం యొక్క అంశం ప్రపంచ కప్ ఉంది. ఈ 11 మిలియన్ పోస్ట్ సుమారు 2 మిలియన్ సెన్సార్ జరిగింది, అయితే అత్యంత సున్నితమైన అంశాలపై పోస్ట్లు మధ్య మరియు తక్కువ సున్నితత్వం అంశాలపై పోస్ట్లు కంటే కొద్దిగా ఎక్కువ తరచుగా మాత్రమే సెన్సార్ చేశారు. ఇతర మాటలలో, చైనీస్ సెన్సార్ ప్రపంచ కప్ ప్రస్తావించే ఒక పోస్ట్ గా హాయి Weiwei పేర్కొంటాడు పోస్ట్ తొలగించవలసిందిగా గురించి అవకాశం ఉంది. ఈ పరిశోధనలను ప్రభుత్వం సున్నితమైన అంశాలపై అన్ని పోస్ట్లను సెన్సార్ చేసే సాధారణ ఆలోచన సరిపోవడం లేదు.

అంశం ద్వారా సెన్సార్షిప్ రేటు ఈ సాధారణ లెక్కింపు అయితే, తప్పుదారి కావచ్చు. ఉదాహరణకు, ప్రభుత్వం హాయి Weiwei మద్దతు అని, కానీ అతనికి విమర్శిస్తూ ఉంటాయి పోస్ట్లు వదిలి పోస్ట్లు సెన్సార్ ఉండవచ్చు. మరింత జాగ్రత్తగా పోస్ట్ మధ్య భేదాన్ని చూపేందుకు, పరిశోధకులు ప్రతి పోస్ట్ సెంటిమెంట్ కొలిచేందుకు అవసరం. అందువలన, దాని గురించి ఆలోచించడం ఒక మార్గం ప్రతి పోస్ట్ ఒక ముఖ్యమైన గుప్త ఫీచర్ ప్రతి పోస్ట్ సెంటిమెంట్. దురదృష్టవశాత్తు, చాలా పని ఉన్నప్పటికీ, ముందుగా ఉన్న నిఘంటువులు ఉపయోగించి సెంటిమెంట్ గుర్తింపును పూర్తిగా ఆటోమేటెడ్ పద్ధతులు ఇప్పటికీ అనేక సందర్భాల్లో చాలా బాగున్నాయి (విభాగం 2.3.2.6 నుండి సెప్టెంబర్ 11, 2001 ఒక భావోద్వేగ కాలక్రమం సృష్టించడం సమస్యలు తిరిగి అనుకుంటున్నాను). అందువలన, రాజు మరియు సహచరులు వారు 1 కాదా) రాష్ట్ర విమర్శిస్తూ వంటి వారి 11 మిలియన్ సామాజిక మీడియా పోస్ట్లు లేబుల్ ఒక మార్గం అవసరమైన, 2) రాష్ట్ర, లేదా 3) ఈవెంట్స్ గురించి సంబంధంలేని లేదా వాస్తవ నివేదికలు మద్దతుగా. ఈ ఒక భారీ ఉద్యోగం లాగా ఉంటుంది, కానీ వారు ఒక శక్తివంతమైన ట్రిక్ ఉపయోగించి పరిష్కరించవచ్చు; డేటా సైన్స్లో సాధారణ కానీ సాంఘిక శాస్త్రంలో ప్రస్తుతం సాపేక్షంగా అరుదుగా ఆ ఒకటి.

మొదటి, ఒక దశలో సాధారణంగా ముందు ప్రాసెసింగ్ అనే, పరిశోధకులు ఒక పత్రం-కాల మాతృక, ప్రతి పత్రానికి ఒక అడ్డు వరుస మరియు పోస్ట్ ఒక నిర్దిష్ట పదం ఉంది లేదో నమోదుచేసిన ఒక కాలమ్ అక్కడ సామాజిక మీడియా పోస్ట్లు మార్చబడింది (ఉదా, నిరసనలు, ట్రాఫిక్, మొదలైనవి). తదుపరి, పరిశోధన సహాయకుల జాబులు ఒక నమూనా సెంటిమెంట్ చేతితో లేబుల్. అప్పుడు, రాజు మరియు సహచరుల దాని లక్షణాలు ఆధారంగా ఒక పోస్ట్ సెంటిమెంట్ ప్రతిపాదించే అని ఒక యంత్ర అభ్యాస మోడల్ అంచనా వేయడానికి ఈ చేతి లేబుల్ డేటా ఉపయోగిస్తారు. చివరిగా, వారు అన్ని 11 మిలియన్ పోస్ట్ సెంటిమెంట్ అంచనా వేయడానికి ఈ యంత్ర అభ్యాస నమూనాను ఉపయోగించాడు. అందువలన, మానవీయంగా చదవడం మరియు లేబులింగ్ 11 మిలియన్ పోస్ట్ (logistically అసాధ్యం అవుతుంది) కాకుండా, వారు మానవీయంగా పోస్ట్స్ యొక్క చిన్న సంఖ్య లేబుల్ మరియు అప్పుడు శాస్త్రవేత్తలు అన్ని పోస్ట్లు కేతగిరీలు అంచనా పర్యవేక్షణలో అభ్యాసం అంటారని ఏమి డేటా ఉపయోగిస్తారు. ఈ విశ్లేషణ పూర్తయిన తర్వాత, రాజు మరియు సహచరుల కొంతవరకు ఆశ్చర్యకరంగా, ఒక పోస్ట్ సంభావ్యత తొలగిస్తున్న అది లేదా రాష్ట్ర కీలకమైన రాష్ట్ర మద్దతుగా లేదో సంబంధం నిర్ధారించారు పోయారు.

మూర్తి 2.3: లో కింగ్, పాన్ ఉపయోగిస్తారు విధానం కోసం తాలుకు విశదీకరించబడిన అండ్ రాబర్ట్స్ (2013) 11 మిలియన్ చైనీస్ సామాజిక మీడియా పోస్ట్లు సెంటిమెంట్ అంచనా ఎలా. మొదటి, ఒక దశలో సాధారణంగా ముందు ప్రాసెసింగ్ అనే, పరిశోధకులు ఒక పత్రం-కాల మాతృకలో సామాజిక మీడియా పోస్ట్లు మార్చబడింది (మరింత సమాచారం కోసం grimmer మరియు స్టెవార్ట్ (2013) చూడండి). రెండవది, పరిశోధకులు పోస్ట్స్ యొక్క చిన్న నమూనా సెంటిమెంట్ చేతి కోడ్. మూడవది, పరిశోధకులు పోస్ట్లు సెంటిమెంట్ వర్గీకరించడానికి ఒక పర్యవేక్షక అభ్యాసంలో మోడల్ శిక్షణ. నాలుగో, పరిశోధకులు అన్ని పోస్ట్స్ సెంటిమెంట్ అంచనా పర్యవేక్షణలో అభ్యాసం నమూనాను ఉపయోగించాడు. కింగ్, పాన్, మరియు రాబర్ట్స్ (2013), అపెండిక్స్ బి చూడండి మరింత వివరంగా వివరణ కోసం.

మూర్తి 2.3: ఉపయోగించిన విధానం కోసం తాలుకు విశదీకరించబడిన King, Pan, and Roberts (2013) 11 మిలియన్ చైనీస్ సామాజిక మీడియా పోస్ట్లు సెంటిమెంట్ అంచనా ఎలా. మొదటి, ఒక దశలో సాధారణంగా ముందు ప్రాసెసింగ్ అనే, పరిశోధకులు ఒక పత్రం-కాల మాతృకలో సామాజిక మీడియా పోస్ట్లు మార్చబడింది (చూడండి Grimmer and Stewart (2013) మరింత సమాచారం కోసం). రెండవది, పరిశోధకులు పోస్ట్స్ యొక్క చిన్న నమూనా సెంటిమెంట్ చేతి కోడ్. మూడవది, పరిశోధకులు పోస్ట్లు సెంటిమెంట్ వర్గీకరించడానికి ఒక పర్యవేక్షక అభ్యాసంలో మోడల్ శిక్షణ. నాలుగో, పరిశోధకులు అన్ని పోస్ట్స్ సెంటిమెంట్ అంచనా పర్యవేక్షణలో అభ్యాసం నమూనాను ఉపయోగించాడు. చూడండి King, Pan, and Roberts (2013) , అపెండిక్స్ బి మరింత వివరంగా వివరణ కోసం.

సెన్సార్ యొక్క విమర్శ అశ్లీల, మరియు సామూహిక చర్య సామర్ధ్యం ఉందని వారికి (అంటే, పెద్ద ఎత్తున నిరసనలు దారితీసింది అవకాశం): ముగింపు లో, కింగ్ మరియు సహచరులు పోస్ట్లు కేవలం మూడు రకాల క్రమం తప్పకుండా సెన్సార్ చేశారు కనుగొన్నారు. తొలగించలేదని చేశారు తొలగించారు మరియు పోస్ట్స్ చేసిన పోస్ట్లు ఒక భారీ సంఖ్యలో పరిశీలించటం ద్వారా, రాజు మరియు సహచరుల సెన్సార్ చూడటం మరియు లెక్కింపు ద్వారా కేవలం పని ఎలా తెలుసుకోవడానికి పోయారు. తదనంతర పరిశోధన, వారు నిజానికి నేరుగా చైనీస్ సామాజిక మీడియా పర్యావరణ వ్యవస్థను సెన్సార్ చేసుకోగా ఇది క్రమపద్ధతిలో వివిధ కంటెంట్ మరియు కొలిచే పోస్ట్లు సృష్టించడం ద్వారా జోక్యం (King, Pan, and Roberts 2014) . మేము పుస్తకం అంతటా చోటుచేసుకునే ఒక థీమ్ సూచనకు, చాప్టర్ 4. మరింత ప్రయోగాత్మక పద్ధతులు గురించి మరింత తెలుసుకోవడానికి చేస్తుంది, ఈ గుప్త-లక్షణం ఆకళింపు సమస్యలు-కొన్నిసార్లు పరిష్కరించవచ్చు పర్యవేక్షక అభ్యాసంలో-చెయ్యి లో సామాజిక పరిశోధన చాలా సాధారణమని బయటకు డిజిటల్ యుగం. మీరు చిత్రాలు పోలి అధ్యాయాలు 3 (ప్రశ్నలు అడుగుతూ) మరియు 5 2.3 మూర్తి చూస్తారు (ద్రవ్యరాశి సహకారంతో సృష్టిస్తోంది); పలు అధ్యాయాలు కనిపించే కొన్ని ఆలోచనలు ఒకటి.

ఈ ఉదాహరణలు న్యూ యార్క్ లో టాక్సీ డ్రైవర్లు, విద్యార్థులు స్నేహం ఏర్పాటు, మరియు పరిశీలన డేటా సాపేక్షంగా సులభం లెక్కింపు సైద్ధాంతిక అంచనాలు పరీక్షించడానికి పరిశోధకులు ఎనేబుల్ చేసే చైనీస్ ప్రభుత్వం షో సోషల్ మీడియా సెన్సార్షిప్ ప్రవర్తన యొక్క పని ప్రవర్తన యొక్క అన్ని మూడు. కొన్ని సందర్భాల్లో, పెద్ద డేటా మీరు సాపేక్షంగా నేరుగా ఈ లెక్కింపు చేయాలని (న్యూ యార్క్ టాక్సీలు సందర్భంలో వలె) అనుమతిస్తుంది. ఇతర సందర్భాల్లో, పరిశోధకులు తమ సొంత పరిశీలన డేటా సేకరించడానికి (చైనీస్ సెన్సార్షిప్ సందర్భంలో వలె) అవసరం; (నెట్వర్క్ పరిణామ సందర్భంలో వలె) కలిసి డేటా విలీనం ద్వారా అసంపూర్ణ ఒప్పందం; లేదా (చైనీస్ సెన్సార్షిప్ సందర్భంలో వలె) గుప్త-విశిష్ట లక్షణం అనుమితి యొక్క కొన్ని రూపం ప్రదర్శన. నేను ఆశిస్తున్నాము గా ఈ ఉదాహరణలు ఆసక్తికరమైన ప్రశ్నలు అడగండి గలిగిన పరిశోధకులకు, పెద్ద గొప్ప వాగ్దానం కలిగి, చూపించు.