Жакшы маалыматтар менен жакшы суроо комбайн болсо, жөнөкөй эсептөө кызыктуу болушу мүмкүн.
бул татаал көркөм тил менен жазылса да, коомдук изилдөөлөр көп чынында эле санап нерселерди жатат. чоң маалыматтарды доордо, изилдөөчүлөр көрбөгөндөй санап чыга алат, бирок бул жөн гана туш келди санап баштоо керек дегенди билдирбейт. Анын ордуна, окумуштуулар төмөнкү суроолорду берип көрүшүбүз керек: санап арзырлык эмне? Бул толугу менен бизге тиешелүү маселе сыяктуу сезилиши мүмкүн, бирок кээ бир жалпы мыйзам ченемдүүлүктөрү бар.
Көп шакирттери менен эсептөө изилдөө түрткү: Мен эч ким түбөлүккө чейин санап койгон нерсени санап жатам. Мисалы, бир окуучу көптөр мигранттар изилдеген деп көп адамдар эгиз изилдеген болушу мүмкүн, бирок, аны эч ким мигрант эгиз окуган. Менин тажрыйбасы, мен жок тарабынан түрткү чакырып бул стратегия, адатта, жакшы жок изилдөөлөрдү талап кылган эмес. жоктугуна ниет менен кандай ашуун жерде тешик бар деп айтууга болот, мен аны толтуруу үчүн абдан катуу иштеп жатам. Бирок, албетте, ар бир тешик толтурулушу керек.
Анын ордуна жоктугуна түрткү, мен жакшы стратегия маанилүү же кызыктуу (же идеалдуу эки) болуп саналат изилдөө суроолорго издеп турат деп ойлойм. аныктоо үчүн бул эки катуу бир аз, бирок, бир маанилүү изилдөө кээ бир өлчөмдө таасир же саясат алуучу тарабынан маанилүү чечим туруу бул жөнүндө ойлонуп. Мисалы, жумушсуздук ылдамдыгын өлчөө, бул саясий чечимдерди кабыл айдап экономиканын көрсөткүчү болуп саналат, анткени, маанилүү болуп саналат. Негизи, изилдөөчүлөр маанилүү нерсени абдан жакшы сезим бар деп ойлойм. Ошондуктан, ушул бөлүмдүн калган, мен эсептөө кызыктуу деп ойлойм, эки мисал берип жатам. Ар бир учурда, изилдөөчүлөр ээнбаш санап жок; тескерисинче, алар кандай системалардын иштөө жөнүндө жалпы ой салып маанилүү түшүнүк ачып абдан өзгөчө орнотуулар эсептөө болду. Башка сөз менен айтканда, бул өзгөчө эсептөө көнүгүүлөр кызыктуу кылат бир топ өзү маалыматтар эмес, бул жалпы ой келет.
Бир эсептөөнүн жөнөкөй бийликтин үлгүсү Генри FARBER анын келип чыккан (2015) New York City такси айдоочулардын жүрүм-изилдөө. Бул топ чындыгында кызыктуу үн жок болсо да, бул эмгек экономика боюнча эки атаандаш теорияларды сыноо үчүн стратегиялык изилдөө-сайт. FARBER анын изилдөө максаттары үчүн такси айдоочулардын иш айлана-чөйрөгө байланыштуу эки маанилүү өзгөчөлүктөрү бар: (1) Саатка жараша акы төлөө аба сыяктуу себептерден улам жарым-жартылай негизделген, күн сайын белгиленет, жана (2) сааттарынын саны, алар иш алар тарабынан кабыл алынган чечимдердин негизинде күн сайын өзгөрүп турат. Бул өзгөчөлүктөр иштеген сааттык эмгек акы менен саат ортосундагы мамиле тууралуу кызыктуу суроо алып келет. Неоклассикалык экономика моделдер такси айдоочулар, алар жогорку сааттык эмгек акы бар жерде күндөрү дагы иштей берет деген пикирде. Же болбосо, жүрүм-турумдук экономика тартып моделдер так карама-каршы пикирде. айдоочулар бир киреше Эгерде ошол максаттуу жолугушту чейин 100 күнүнө жана жумуш $ бута-деп, андан кийин айдоочулар алар таап жаткан күндөрү аз саат иштеп аяктайт. Мисалы, кайсы бир максаттуу тапчу болсо, сиз жакшы күнү төрт саат бою иштеп, акыры (саатына 25 $) жана жаман күнү беш саатка мүмкүн (бир саатына 20 $). Ошондуктан, айдоочулар жогору сааттык эмгек акы менен күндөрү көп саат бою иштейт (неоклассикалык моделдердин болжолдошууда) төмөн сааттык эмгек акы менен күн же бир нече сааттан (жүрүш-экономикалык моделдерди болжолдошууда)?
Бул суроого жооп алыш үчүн Farber 2009-жылдан 2013-жылга чейин New York City карета тарабынан кабыл алынган ар бир такси сапары жөнүндө маалыматтарды алган, азыр жалпыга жеткиликтүү маалыматтар. Бул маалымат-шаар электрондук метр тарабынан чогултулган үчүн такси талап кылат, ар бир сапары тууралуу маалыматты пайдалануу төмөнкүлөрдү камтыйт: баштоо убакыты жайгашкан, аяктоо убактысын, акыры жайгашкан, жол киресин жана пул баштайт (башындагылар кредиттик карта менен төлөнгөн болсо) . Бул такси метр маалыматтарды колдонуу менен, Farber көпчүлүк айдоочулар эмгек акысы жогору, ырааттуу неоклассикалык теория менен жүргөндө күн боюнча дагы көбүрөөк иштеш деп табылган.
Бул негизги табылгага тышкары, Farber кошкондукту жана динамикасын жакшыраак түшүнүү үчүн маалыматтардын көлөмүн колдоно албай калды. Ал убакыттын өтүшү менен, деп таап, башка айдоочулар акырындык менен жогорку акы күндөрү көп саат иштөөгө үйрөнө (мисалы, алар неоклассикалык модель алдын ала эле өзүн туура алып жүрүүгө үйрөнүүгө). Ал эми максаттуу жашаган сыяктуу кыймылдайт жаңы айдоочулар болуп такси айдоочуларды токтотуп калышы толук мүмкүн. Учурдагы айдоочулар байкалат жүрүм-турумун түшүнүүгө жардам берет Бул тымызын жыйынтыгы, эки, анткени танышуусуна өлчөмүн гана мүмкүн болду. Алар бир аз убакыт мурда такси айдоочулардын аз санынын кагаз на барактарды колдонуп изилдөө аныктоо мүмкүн эмес эле (Camerer et al. 1997) .
Farber белем, бул шаар менен чогултулган маалыматтар маалыматтар абдан жакын, анткени FARBER окуу ири маалымат булагы аркылуу изилдөө үчүн дурус жагдайда жакын (бир айырмасы Farber жалпы тууралуу каалаган маалымат бар деп эсептелет акы-улам начарлап плюс-ыкмалары, бирок кредиттик карта аркылуу төлөнгөн гана киргизилген көрүүгү шаардык маалыматтар). Бирок, маалымат өзү жалгыз жетиштүү эмес. FARBER изилдөөсүнө негизги маалыматтары кызыктуу суроо, бул белгилүү бир жагдайда тышкары ири мааниге ээ суроо жүрдүм.
Экинчи Гари Падыша, Атайга Pan жана Molly Робертс менен изилдөө келген нерселерди санап мисалы (2013) кытай өкмөтүнүн онлайн текшерүү боюнча. Бул учурда, бирок, изилдөөчүлөр өз чоң маалыматтарды чогултуу керек болгон жана алардын маалыматтар толук эмес экендигин менен иш кылышы керек болчу.
Падыша жана кесиптештер Кытайдын коомдук медиа билдирүүлөр адамдар он миндеген киргизүү эсептелет ири мамлекеттик аппарат менен сигналы бар экендиги түрткү болду. Изилдөөчүлөр жана жарандар, бирок, бул, кино- мазмун жок болушу керек деген чечим кабыл кандай мааниси бар. Кытай Окумуштуулар чынында билдирүүлөр түрлөрү тууралуу карама-каршы күткөн да жок кетиши толук ыктымал. Кээ бир, кино-, башкалары, мисалы, нааразылык катары жамааттык жүрүм түрткү билдирүүлөр тууралуу көбүрөөк деп ойлойм, ал эми мамлекеттин маанилүү билдирүүлөр басым деп ойлойм. Бул күтүүлөр туура болгон үйрөнгөнүм изилдөөчүлөр Кытай жана текшерүү жүргүзүү башка бийлик өкмөттөрдү түшүнүү кандай таасирин тийгизет. Ошондуктан, падыша жана кесиптештер жарыяланган жана андан кийин жарыяланат жана эч качан жок кылынды билдирүүлөр менен жок кылынды билдирүүлөрүн салыштырып келген.
Бул билдирүүлөрүн чогултуу кийин жок болгон үчүн кереметтүү инженердик 1000 Кытайдын коомдук медиа сайттарын-ар башка барак тиешелүү билдирүүлөрүн схемалары-табуу менен караганда колундагы и, анан бул билдирүүлөрүн кайра тартылган. ири масштабдуу интернет-жөрмөлөп менен байланышкан кадимки инженердик маселелерден тышкары, бул долбоор көп жашырылган билдирүүлөр аз 24 саат ичинде кабыл алынат, анткени ал өтө тез болушу үчүн зарыл болгон кошумча кыйынчылык болгон. Башкача айтканда, бир жай каз жашырылган алынган билдирүүлөр көп жоктойт. Андан ары, коомдук медиа сайттары кирүүгө же башка жол менен изилдөө үчүн жооп өз саясатын өзгөртпөсө, болбосо суутпай багуудан эми Crawlers бул маалымат чогултууга керек болгон.
Бул массалык инженердик тапшырма аяктады келген убакта, падыша жана кесиптештери 85 ар кандай prespecified темалар боюнча 11 миллион билдирүүлөрүн алынган болчу, аяр бир болжолдонгон денгээлде ар бир. Мисалы, өтө сезгичтиги, бир тема Ай Каш эмес, диссидент сүрөтчүсү; орто ийкемдүүлүгүнө темасы өсүшү жана Кытай акчасынын девальвация болуп саналат, ошондой эле төмөн ийкемдүүлүгүнө темасы World Cup болуп саналат. Бул 11 млн билдирүүлөр, 2 миллионго жакын көздөсө болчу. Бир аз калгандыктан, падыша жана кесиптештер орто жана төмөн-сезимталдыгы темалар боюнча билдирүүлөр караганда өтө кылдат темалар боюнча билдирүүлөр гана бир аз көбүрөөк көздөсө деп табылган. Башка сөз менен айтканда, Кытай, кино- тууралуу дүйнөлүк кубок үчүн сөз бир бекети Ai Каш сөз постту көзөмөлдөп мүмкүн. Бул жыйынтыктар өкмөт кылдат темалар боюнча баардык билдирүүлөрүн киноиндустрия деген ойду колдобойт.
Тема боюнча цензура курсунун Бул жөнөкөй эсептөө Бирок, адаштыруучу болушу мүмкүн. Мисалы, өкмөт Ай Каш колдоо болуп саналат, бирок аны сындап жатканыбызды билдирүү таштап билдирүүлөрүн көзөмөлдөп мүмкүн. Жакшылап билдирүүлөр айырмалай үчүн, изилдөөчүлөр ар бир почта таамай аныктоо үчүн керек. Тилекке каршы, көп иштер, мурда бар болгон сөздүктөрдү колдонуу менен маанай аныктоо толугу менен дардын ыкмалары дагы көптөгөн жагдайларда да абдан жакшы эмес, (кайра-жылдын 11-сентябрындагы сезимдерибизди хронологиясын түзүү көйгөйлөргө, менимче, 2001-2.3.9 бөлүмдө сүрөттөлгөн) карабай. Ошондуктан, падыша жана кесиптештери дешип, алардын 11 млн коомдук медиа билдирүүлөрүн белгилөө жолун керек (1) мамлекеттин оор, (2) мамлекеттик колдоо, же (3) окуялар жөнүндө кандай тиешеси жок же айкын билдирди. Бул массалык жумуштан угулат, бирок ал маалымат, илим, ал эми коомдук илим салыштырмалуу сейрек кездешет күчтүү амалды колдонуп, аны чечүү: окутуунун көзөмөлү; 2.5-сүрөт карагыла.
Биринчиден, бир кадам адатта кайыш деп аталган, изилдөөчүлөр коомдук медиа билдирүүлөрүн бир документ мөөнөттүү булагына, ар бир документ бир тилке ээрчүү жокпу, жазылган бир сап бар, ошол эле учурда белгилүү бир сөздү (мисалы, митинг же жол) камтылган айландырылат . Кийинки изилдөө жардамчылары бир топ кызмат орундарына тандоону жакташкан колу-деп аташкан. Андан кийин, алар анын мүнөздөмөлөрүнүн негизинде ээлеген сезимдерин ‰ йр н машина окуу моделин түзүү үчүн ушул колу-белгиленген маалыматтарды пайдалануу. Акыр-аягы, алар бардык 11 миллион билдирүүлөр таамай аныктоо бул моделди колдонгон.
Ошентип, тескерисинче, техникалык жактан эле кол менен окуп жана этикеткалоочу 11 млн билдирүүлөрүн-болбой мүмкүн Падыша жана кесиптештери кол менен, андан кийин билдирүүлөр кичинекей бир катар белгиленген бардык билдирүүлөр таамай баа үйрөнүү көзөмөлү астында. Бул анализ аяктагандан кийин, алар деген жыйынтыкка алдык, бир аз калгандыктан, бир Жарыкка чыккан ыктымалдыгы жок кылынып, ал мамлекетке же мамлекеттик колдоо жөнүндө сын же жокпу, тиешеси жок болчу.
Акыр-аягы, падыша жана кесиптештери билдирүүлөр гана үч түрлөрү дайыма көздөсө деп табылган: порнография, кино- жана жамааттык иш-аракеттер мүмкүнчүлүктөрүн болгон адамдардын сын (б.а., ири масштабдуу нааразылык алып баруучу мүмкүнчүлүгү). жок жок жок жок жана билдирүүлөр алынган билдирүүлөр жөнүндө көп сандаган иш-аракеттерине байкоо салуу менен, падыша жана кесиптештер, кино- көрүп жана эсептөө жолу менен гана иш экенин биле алышкан. Андан тышкары, бул китеп боюнча боло турган бир тема бүтүшүнөн, санариптик кылымдын коомдук изилдөөлөр абдан жөнөкөй болуп көзөмөлдөнгөн окутуу, алар кээ бир натыйжаларын жана анда-эс тартса белгилөө үчүн Машина үйрөнүү моделин куруу-колу-жайнап колдонгон ыкмасы . Сиз картинки бөлүмдөрдө 2,5 канча абдан окшош болот (3 суроо) жана 5 (массалык кызматташтыкты түзүү); Бул бир нече бөлүмдөрдө пайда нече идеялардын бири болуп саналат.
Бул мисалдар-иш-Йорктогу такси айдоочулардын жүрүм-туруму жана ири маалымат булактарын Кытай өкмөтү-шоу салыштырмалуу жөнөкөй эсептөө коомдук медиа цензура жүрүм-турум, кээ бир учурларда, кызыктуу жана маанилүү изилдөөлөрдү алып келиши мүмкүн. Бирок эки учурда, изилдөөчүлөр чоң маалымат булагы кызыктуу суроолор алып барууга аргасыз болгон; өзү маалымат жетиштүү болгон жок.