Big маалымат булактары бардык жерде, ал эми коомдук изилдөө үчүн, аларды колдонуу менен татаал болушу мүмкүн. өзүмдүн тажрыйбамдан улам, маалыматтар боюнча, "эч кандай акысыз түшкү тамак" эреже сыяктуу бир нерсе бар: сен аны чогултуу иши көп, койгон эмес, балким, иш-чабыт менен ал жөнүндө ойлонууга жана жашап жаткан болсо, аны талдоо.
чоң маалымат учурда жана, кыязы, эртең-10 өзгөчөлүккө ээ жакын булактары. Бул үч жалпы болуп саналат (бирок дайыма эле андай эмес) изилдөө үчүн пайдалуу: чоң, ар дайым, жана nonreactive. Жети жалпысынан (бирок дайыма эле андай эмес) изилдөө үчүн көйгөйлүү болуп саналат: толук, жеткиликтүү, nonrepresentative, сулуу кыз, алгоритмдик, маскара болушат, кир жана сезимтал. Бул көп мүнөздөмөлөрү акыры чоң маалымат булактары коомдук изилдөө максатында түзүлгөн эмес, улам туулат.
Бул бөлүмдө ой боюнча, мен коомдук изилдөөлөр үчүн абдан баалуу болгон чоң маалымат булактары үч негизги жолдору болуп калат деп ойлойм. Биринчиден, алар атаандаш теориялык божомолдору ортосундагы көйгөйдү чече ала мүмкүндүк берет. Иштин ушул түрүн мисалдары Farber (2015) (New York Такси айдоочулар) жана King, Pan, and Roberts (2013) (Кытайдагы цензура). Экинчиден, чоң маалымат булактары nowcasting аркылуу саясатты жакшыртуу өлчөө иштете аласыз. Бул ишке бир мисалы болуп саналат Ginsberg et al. (2009) (Google тумоосу айлары). Акыр-аягы, чоң маалымат булактары изилдөөчүлөр эксперименттер чуркап эле себептик баа жардам бере аласыз. Иштин ушул түрүн мисалдар Mas and Moretti (2009) (өндүрүмдүүлүккө курдаштарынын таасири) жана Einav et al. (2015) (Окшош тооруктарды боюнча баштапкы баанын таасири). Бул ыкмалардын ар бири, бирок, ушундай атаандашкан алдын ала бир санын аныктоо же эки теориялар маанилүү аныктоо маалымат көп, алып изилдөөчүлөр талап кылат. Ошентип, алар кызыктуу жана маанилүү суроолорду берсек болот изилдөөчүлөр жардам берет деп эмне ири маалымат булактары эмне кыла алат жөнүндө ойлонууга мыкты жолу деп ойлойм.
Аягында, мен бул чоң маалымат булактары маалыматтарды жана теориясы менен болгон мамилеси тууралуу маанилүү таасир тийгизиши мүмкүн экендигин эске алуу менен артык эч нерсе жок деп ойлойм. Азырынча, бул бөлүмдө теориясы-кууп эмпирикалык изилдөөлөрдүн мамилени кабыл алды. Ал эми чоң маалымат булактары да эмпирикалык кууп Theorizing кылууга мүмкүндүк. Башкача айтканда, эмпирикалык маалыматтар, түрүнө жана баш катырма кылдат топтоо аркылуу, изилдөөчүлөр жаңы теорияларды кура албайт. Бул атаандаш, теориясы, маалыматтарды биринчи мамиле жаңы эмес, анткени ал абдан күч Барни Глейсер жана Anselm Стросс тарабынан бекитилген (1967) негизделген теория боюнча, алардын үнү менен. Бул маалыматтар биринчи ыкма Бирок, "теориясынын аягы" билдирет жаштагы изилдөө тегерегинде журналистиканын айрым доомат койгон эле эмес, (Anderson 2008) . Тескерисинче, маалымат чөйрөсү өзгөрүүлөр болуп, биз маалыматтарды жана теориянын ортосундагы мамиледе бурулууну күтүшүбүз керек. маалыматтарды чогултуу кымбат бир дүйнөгө келип калгандай эле, бул теориялар абдан пайдалуу болот сунуш гана маалыматтарды чогултуу үчүн зор мааниге ээ. Бирок, бекер маалыматтардын кереметтүү көп өлчөмдө мурунтан эле бар дүйнөдө, ошондой эле маалыматтарды биринчи ыкма ойлоп мааниси (Goldberg 2015) .
Мен бул бөлүмдө көрүнүп тургандай, изилдөөчүлөр байкоо менен көп нерсеге үйрөнө алышат. Кийинки үч бөлүмдөн, мен биз маалымат адамдар менен чогултуу жана өз ара дагы түздөн-түз аларга суроо берип менен кийим болсо, дагы башка нерселерди (3-бөлүм) үйрөнө аларыбызды айтып берейин, чуркап эксперименттер (4), ал тургай, алар менен изилдөөнүн жүрүшүндө түздөн-түз (5-бөлүм).