2.4.1 Telle ting

Enkel telling kan være interessant hvis du kombinerer et godt spørsmål med gode data.

Selv om det er couched i sofistikerte klingende språk, er mange samfunnsforskning egentlig bare å telle ting. I en alder av store data, kan forskerne telle mer enn noensinne, men det betyr ikke automatisk at forskning bør være fokusert på å telle mer og mer ting. I stedet, hvis vi kommer til å gjøre god forskning med stor data, må vi spørre: hva ting er verdt å telle? Dette kan virke som en helt subjektiv sak, men det er noen generelle mønstre.

Ofte studenter motivere sine telling forskning ved å si: Jeg kommer til å telle noe som ingen har regnet før. For eksempel, en student kan si, mange mennesker har studert innvandrere og mange mennesker har studert tvillinger, men ingen har studert innvandrere tvillinger. Motivasjon ved fravær vanligvis ikke fører til god forskning. Selvfølgelig kan det være gode grunner til å studere innvandrere tvillinger, men det faktum at de ikke har blitt studert før betyr ikke at de bør studeres nå. Ingen har noensinne telles antall tråder på teppet på kontoret mitt, men det betyr ikke automatisk at dette ville være en god forskningsprosjekt. Motivasjon ved fravær er litt som å si: se, det er et hull der borte, og jeg kommer til å jobbe veldig hardt for å fylle den opp. Men ikke alle hull må fylles.

I stedet for motiverende ved fravær, tror jeg at telling fører til god forskning i to situasjoner, når forskningen er interessant eller viktig (eller ideelt begge). For eksempel å måle arbeidsledigheten er viktig fordi det er i indikator på økonomien som driver politiske beslutninger. Vanligvis folk har en ganske god følelse av hva som er viktig. Så, i resten av dette avsnittet, kommer jeg til å gi tre eksempler der telling er interessant. I hvert tilfelle ble forskerne ikke telle på måfå, heller de var teller i svært spesielle innstillinger som avslørte viktig innsikt i mer generelle ideer om hvordan sosiale systemer fungerer. Med andre ord, er mye av det som gjør disse spesielle telle øvelsene interessant ikke i selve dataene, det kommer fra disse mer generelle ideer.

Jeg vil presentere tre eksempler på nedenfor: 1) arbeids oppførselen til taxisjåfører i New York (punkt 2.4.1.1), 2) dannelse vennskap med studenter (§ 2.4.1.2) og 3) sosial mediesensur oppførsel av den kinesiske regjeringen (avsnitt 2.4.1.3). Hva disse eksemplene dele er at de alle viser at telling store data kan brukes til å teste teoretiske forutsigelser. I noen tilfeller, store datakilder gjør deg i stand til å gjøre dette telling relativt direkte (som i tilfelle av New York Taxi). I andre tilfeller vil forskere må forholde seg til ufullstendighet ved å flette dataene sammen og operasjonalisere teoretiske utlegninger (som i tilfellet av vennskap dannelse); og i noen tilfeller forskere må hente sine egne observasjonsdata (som i tilfellet av sosiale medier sensur). Som jeg håper disse eksemplene viser, for forskere som er i stand til å stille interessante spørsmål, har store data store løftet.