2.4.1 Räkna saker

Enkel räkning kan vara intressant om du kombinerar en bra fråga med bra data.

Även om det är formulerad i sofistikerad klingande språk, massor av social forskning egentligen bara räkna saker. I en ålder av stora data kan forskarna räkna mer än någonsin, men det betyder inte automatiskt innebära att forskningen bör inriktas på att räkna mer och mer saker. Istället, om vi kommer att göra bra forskning med stora datamängder, måste vi fråga: vad saker är värda att räkna? Detta kan tyckas vara en helt subjektiv fråga, men det finns några generella mönster.

Ofta eleverna motivera sin räkning forskning genom att säga: Jag ska räkna något som ingen någonsin har räknat tidigare. Till exempel kan en elev kan säga, har många människor studerat invandrare och många människor har studerat tvillingar, men ingen har studerat invandrar tvillingar. Motivation genom frånvaron vanligtvis inte leder till god forskning. Naturligtvis kan det finnas goda skäl att studera invandrar tvillingar, men det faktum att de inte har studerats tidigare betyder inte att de bör studeras nu. Ingen har någonsin räknade antalet trådar på mattan i mitt kontor, men det betyder inte automatiskt innebära att detta skulle vara ett bra forskningsprojekt. Motivation genom frånvaron är ungefär som att säga: titta, det finns ett hål där borta, och jag kommer att arbeta mycket hårt för att fylla upp den. Men inte varje hål behöver fyllas.

I stället för att motivera av frånvaro, jag tror att räkna leder till god forskning i två situationer, när forskningen är intressant eller viktigt (eller helst båda). Till exempel är det viktigt att mäta graden av arbetslöshet eftersom det är i indikator av ekonomin som driver politiska beslut. Generellt människor har en ganska bra känsla för vad som är viktigt. Så, i resten av detta avsnitt kommer jag att ge tre exempel där räkning är intressant. I varje fall var forskarna inte räknar måfå, snarare de räknade i mycket speciella inställningar som avslöjade viktiga insikter mer allmänna idéer om hur sociala system fungerar. Med andra ord är en hel del av det som gör dessa speciella räkna övningar intressant inte i själva uppgifterna, kommer det från dessa mer allmänna idéer.

Nedan kommer jag presentera tre exempel på: 1) arbetsbeteende taxichaufförer i New York (avsnitt 2.4.1.1), 2) vänskap bildning av studenter (avsnitt 2.4.1.2) och 3) sociala medier censur beteende den kinesiska regeringen (avsnitt 2.4.1.3). Vad dessa exempel delar är att de alla visar att räkna stora data kan användas för att testa teoretiska förutsägelser. I vissa fall, stora datakällor kan du göra detta räknar relativt direkt (som i fallet med New York Taxi). I andra fall kommer forskarna måste ta itu med ofullständiga genom att slå samman uppgifter tillsammans och operation teoretiska konstruktioner (som i fallet med vänskap bildning); och i vissa fall forskare måste hämta sina egna observationsdata (som i fallet med sociala medier censur). Som jag hoppas att dessa exempel visar, för forskare som har möjlighet att ställa intressanta frågor, har stora uppgifter stort löfte.