2.4.1 Optælling ting

Simpel optælling kan være interessant, hvis du kombinerer et godt spørgsmål med gode data.

Selvom det er affattet i sofistikeret klingende sprog, er masser af social forskning virkelig bare tælle ting. I en alder af store data, kan forskerne tælle mere end nogensinde, men det betyder ikke automatisk, at forskning bør fokusere på at tælle mere og flere ting. I stedet hvis vi vil gøre god forskning med big data, er vi nødt til at spørge: hvad tingene er værd at tælle? Det kan synes som en helt subjektiv sag, men der er nogle generelle mønstre.

Ofte studerende motivere deres optælling forskning ved at sige: Jeg har tænkt mig at tælle noget, som ingen nogensinde har talt før. For eksempel, en studerende kan sige, har mange mennesker studeret indvandrere og mange mennesker har studeret tvillinger, men ingen har studeret vandrende tvillinger. Motivation af fravær normalt ikke fører til god forskning. Selvfølgelig kan der være gode grunde til at studere vandrende tvillinger, men det faktum, at de ikke er blevet undersøgt før betyder ikke, at de bør undersøges nu. Ingen har nogensinde talt antallet af tråde på gulvtæppet på mit kontor, men det betyder ikke automatisk, at dette ville være et godt forskningsprojekt. Motivation af fravær er lidt ligesom at sige: Se, der er et hul derovre, og jeg har tænkt mig at arbejde meget hårdt for at fylde det op. Men, ikke hvert hul skal udfyldes.

I stedet for at motivere ved fravær, jeg tror, ​​at tælle fører til god forskning i to situationer, hvor forskningen er interessant eller vigtigt (eller ideelt begge). For eksempel måling arbejdsløsheden er vigtigt, fordi det er i indikator for økonomien, der driver politiske beslutninger. Generelt folk har en temmelig god fornemmelse af, hvad der er vigtigt. Så i resten af ​​dette afsnit, vil jeg give tre eksempler, hvor optællingen er interessant. I hvert tilfælde blev forskerne ikke tælle på bedste beskub, snarere de optælling i meget særlige miljøer, der afslørede et vigtigt indblik i mere generelle ideer om, hvordan sociale systemer arbejde. Med andre ord, en masse af hvad der gør disse særlige optælling øvelser interessant er ikke i selve data, det kommer fra disse mere generelle ideer.

Nedenfor vil jeg præsentere tre eksempler på: 1) arbejdstid adfærd taxachauffører i New York (afsnit 2.4.1.1), 2) venskab dannelse af studerende (punkt 2.4.1.2) og 3) sociale medier censur adfærd den kinesiske regering (afsnit 2.4.1.3). Hvad disse eksempler deler, er, at de alle viser, at tælle store data kan anvendes til at teste de teoretiske forudsigelser. I nogle tilfælde store datakilder giver dig mulighed for at gøre dette tælle relativt direkte (som i tilfældet med New York taxier). I andre tilfælde vil forskerne nødt til at beskæftige sig med ufuldstændige ved at flette data sammen og operationalisere teoretiske konstruktioner (som i tilfældet med dannelse venskab); og i nogle tilfælde forskere bliver nødt til at hente deres egne observationsdata (som i tilfældet med sociale medier censur). Som jeg håber, at disse eksempler viser, for forskere, der er i stand til at stille interessante spørgsmål, big data lover godt.