2.4.1 loendamine asju

Loendamine võib olla huvitav, kui sa ühendada hea küsimus häid andmeid.

Kuigi see on sõnastatud kogenud kõlaga keel, palju sotsiaalsed uuringud on tõesti ainult lugedes asju. Ajastul suur andmeid, teadlased loota rohkem kui kunagi varem, kuid see ei tähenda automaatselt, et teadus peaks keskenduma lugedes rohkem ja rohkem asju. Selle asemel, kui me teeme head uurimist suur andmeid, peame küsima: mis asjad on väärt lugedes? See võib tunduda täiesti subjektiivne, kuid seal on mõned üldised mustrid.

Sageli õpilased motiveerida lugedes teadus, öeldes: Ma lähen lugema midagi, et keegi on kunagi loetud enne. Näiteks õpilane võib öelda, paljud inimesed on õppinud sisserändajate ning paljud inimesed on õppinud kaksikud, kuid keegi on õppinud sisserännanud kaksikud. Motivatsiooni puudumine ei vii tavaliselt head uurimist. Muidugi, seal võib olla põhjust uurida sisserännanud kaksikud, kuid asjaolu, et nad ei ole uuritud enne ei tähenda, et nad tuleks uurida nüüd. Keegi ei ole kunagi loendasid teemasid vaibal oma kabinetis, kuid see ei tähenda automaatselt, et see oleks hea uurimisprojekti. Motivatsiooni puudumine on selline nagu öeldes: otsida, seal on auk seal, ja ma lähen väga kõvasti tööd, et täita see kuni. Kuid mitte iga auk tuleb täita.

Selle asemel, et motiveeriv poolt puudumisel, ma arvan, et lugedes viib hea teadus kahel juhul, kui teadus on huvitav või oluline (või ideaalis mõlemad). Näiteks mõõtes töötuse määr on oluline, sest see on indikaator majanduse, mis ajab poliitilisi otsuseid. Üldiselt, inimesed on päris hea tunne, mis on oluline. Niisiis, ülejäänud osas, ma lähen anda kolm näidet, kus lugedes on huvitav. Igal juhul on teadlased olid arvestamata juhuslikult, vaid nad lootsid väga erilist seaded, mis näitas olulisi andmeid üldisemaid ideid, kuidas sotsiaalse süsteemi tööd. Teisisõnu palju mis teeb need eriti loendamise harjutusi huvitav ei ole andmed ise, see pärineb nende üldisemat ideed.

Allpool ma esitada kolm näidet: 1) töö käitumist taksojuhid New York (§ 2.4.1.1), 2) sõprus moodustumise üliõpilased (§ 2.4.1.2) ja 3) sotsiaalne meedia tsensuuri käitumist Hiina valitsus (§ 2.4.1.3). Mis need näited jagada on, et nad näitavad kõik loendamise suur andmeid võib kasutada testimiseks prognoose. Mõnel juhul suur andmeallikate võimaldab teil seda teha lugedes suhteliselt otse (nagu näiteks New York Taksod). Muudel juhtudel teadlased peavad tegelema puudulikkus, ühendades andmed kokku ja operatiivsemaks teoreetilisi konstruktsioone (nagu näiteks sõpruse teket); ja mõnel juhul uurijad on vaja koguda oma vaatlusandmeid (nagu näiteks sotsiaalse meedia tsensuur). Nagu ma loodan, et need näited näitavad, teadlastele, kes on võimelised küsida huvitavaid küsimusi, suured andmete väga paljutõotav.