2.4.1 Counting asiat

Yksinkertainen laskenta voi olla mielenkiintoista jos yhdistää hyvä kysymys hyvä data.

Vaikka se on muotoiltu hienostunut kuulostava kieli, paljon sosiaalista tutkimuksen oikeastaan ​​vain laskee asioita. Kun ikä iso tietojen tutkijat voivat luottaa enemmän kuin koskaan, mutta se ei automaattisesti tarkoita, että tutkimus olisi keskittynyt laskee enemmän ja enemmän tavaraa. Sen sijaan, jos aiomme tehdä hyvää tutkimusta iso data, meidän on kysyttävä: mitä asioita kannattaa laskenta? Tämä voi tuntua täysin subjektiivinen asia, mutta joitakin yleisiä malleja.

Usein opiskelijat motivoi laskenta tutkimuksen sanomalla: Aion laskea jotain, kukaan ei ole koskaan lasketa ennen. Esimerkiksi opiskelija voisi sanoa, monet ihmiset ovat tutkineet siirtolaisten ja monet ihmiset ovat tutkineet kaksoset, mutta kukaan ei ole tutkinut siirtotyöläisten kaksoset. Motivaatiota puuttuminen ei yleensä johda hyvään tutkimukseen. Tietenkin saattaa olla hyviä syitä tutkia siirtotyöläisten kaksoset, mutta se, että niitä ei ole tutkittu aikaisemmin, ei tarkoita, että ne olisi tutkittava nyt. Kukaan ei ole koskaan laskenut säikeiden määrä matolle työhuoneessani, mutta se ei automaattisesti tarkoita, että tämä olisi hyvä tutkimushanke. Motivaatiota poissaolo on ikään kuin sanoen: katso, siellä on reikä siellä, ja aion työskennellä kovasti täyttää se. Mutta ei jokainen reikä on korjattava.

Sen sijaan, että motivoiva puuttumisena, uskon, että laskenta johtaa hyvää tutkimusta kahdessa tilanteessa, kun tutkimus on mielenkiintoinen tai tärkeä (tai mieluiten molempia). Esimerkiksi mittaamalla työttömyysaste on tärkeää, koska se on osoitus talouden, joka ajaa poliittisia päätöksiä. Yleensä ihmiset ovat melko hyvä tunne, mikä on tärkeää. Joten, muualla tässä jaksossa, aion antaa kolme esimerkkiä, joissa laskenta on mielenkiintoista. Kussakin tapauksessa, tutkijat eivät lasketa sattumanvaraisesti, vaan ne olivat laskenta hyvin erityisesti asetuksia, jotka paljastivat tärkeitä oivalluksia yleisempää ideoita siitä, miten sosiaali- järjestelmät toimivat. Toisin sanoen, paljon, mikä tekee näistä erityisesti laskenta harjoituksia mielenkiintoinen ei itse tietoja, se tulee näistä yleisempiä ajatuksia.

Alla esitän kolme esimerkkejä: 1) työ käyttäytymistä taksinkuljettajien New York (kohta 2.4.1.1), 2) ystävyys muodostumista opiskelijoiden (kohta 2.4.1.2) ja 3) sosiaalisen median sensuuri käyttäytymistä Kiinan hallitus (jakso 2.4.1.3). Mitä nämä esimerkit jakaa on, että ne kaikki osoittavat, että laskenta suuri tietoja voidaan käyttää testaamaan teoreettisten ennusteiden. Joissakin tapauksissa suuret tietolähteitä avulla voit tehdä tämän laskennan suhteellisen suoraan (kuten tapauksessa New Yorkin taksit). Muissa tapauksissa, tutkijat täytyy käsitellä epätäydellisyydestä yhdistämällä tiedot yhteen ja käyttökelpoisiksi teoreettinen konstruktioita (kuten tapauksessa ystävyyden muodostuminen); ja joissakin tapauksissa tutkijat täytyy kerätä omia havaintoaineistoa (kuten tapauksessa sosiaalisen median sensuuri). Kuten toivon nämä esimerkit osoittavat, tutkijoille, jotka pystyvät kysyä mielenkiintoisia kysymyksiä, iso data erittäin lupaava.