Forord

Denne boken begynte i 2005 i en kjeller på Columbia University. På den tiden var jeg en utdannet student, og jeg kjørte et online-eksperiment som til slutt ble avhandling. Jeg skal fortelle deg alt om de vitenskapelige delene av eksperimentet i kapittel 4, men nå skal jeg fortelle deg om noe som ikke er i min avhandling eller i noen av mine papirer. Og det er noe som fundamentalt forandret hvordan jeg tenker på forskning. En morgen, da jeg kom inn på kjellerkontoret mitt, oppdaget jeg at over natten hadde rundt 100 personer fra Brasil deltatt i eksperimentet mitt. Denne enkle opplevelsen hadde en dyp effekt på meg. På den tiden hadde jeg venner som kjørte tradisjonelle laboratorieforsøk, og jeg visste hvor hardt de måtte jobbe for å rekruttere, overvåke og betale folk for å delta i disse forsøkene; hvis de kunne kjøre 10 personer på en enkelt dag, var det gode fremskritt. Men med mitt online-eksperiment deltok 100 personer mens jeg sov . Å gjøre undersøkelsen mens du sover, kan høres for godt til å være sant, men det er det ikke. Endringer i teknologi - spesielt overgangen fra den analoge alderen til den digitale tidsalderen - betyr at vi nå kan samle og analysere sosiale data på nye måter. Denne boken handler om å gjøre samfunnsforskning på disse nye måtene.

Denne boken er for sosialforskere som ønsker å gjøre mer datavitenskap, datavitenskapere som ønsker å gjøre mer samfunnsfag, og alle som er interessert i hybrid av disse to feltene. Gitt hvem denne boken er for, bør det uten å si at det ikke bare er for studenter og professorer. Selv om jeg for tiden jobber på et universitet (Princeton), har jeg også jobbet i regjeringen (ved US Census Bureau) og i teknologiindustrien (ved Microsoft Research) så jeg vet at det er mye spennende forskning som skjer utenfor universiteter. Hvis du tenker på hva du gjør som sosial forskning, så er denne boken for deg, uansett hvor du jobber eller hva slags teknikker du bruker for øyeblikket.

Som du kanskje har lagt merke til, er tonen i denne boken litt annerledes enn mange andre akademiske bøker. Det er forsettlig. Denne boken kom fra et uteksaminert seminar om beregningsmessig samfunnsvitenskap som jeg har lært på Princeton i Sosiologisk institutt siden 2007, og jeg vil gjerne få det til å fange opp noe av energien og spenningen fra det seminaret. Spesielt vil jeg at denne boken skal ha tre egenskaper: Jeg vil at den skal være nyttig, fremtidsrettet og optimistisk.

Nyttig : Mitt mål er å skrive en bok som er nyttig for deg. Derfor skal jeg skrive i en åpen, uformell og eksempeldrevet stil. Det er fordi den viktigste tingen jeg vil formidle er en bestemt måte å tenke på sosial forskning. Og min erfaring tyder på at den beste måten å formidle denne tankegangen er informelt og med mange eksempler. I slutten av hvert kapittel har jeg også en seksjon som heter "Hva skal du lese neste" som vil hjelpe deg med overgang til mer detaljerte og tekniske avlesninger på mange av de emnene jeg presenterer. Til slutt håper jeg at denne boken vil hjelpe deg med å gjøre både forskning og evaluere andres forskning.

Fremtidsrettet : Denne boken vil hjelpe deg med å gjøre samfunnsforskning ved hjelp av de digitale systemene som eksisterer i dag og de som vil bli opprettet i fremtiden. Jeg begynte å gjøre denne typen forskning i 2004, og siden da har jeg sett mange endringer, og jeg er sikker på at du i løpet av din karriere vil se mange endringer også. Trikset for å være relevant i forhold til endringen er abstraksjon . For eksempel, dette kommer ikke til å være en bok som lærer deg nøyaktig hvordan du bruker Twitter API som den eksisterer i dag; I stedet skal den lære deg hvordan du lærer fra store datakilder (kapittel 2). Dette kommer ikke til å være en bok som gir deg trinnvise instruksjoner for å kjøre eksperimenter på Amazon Mechanical Turk; I stedet skal den lære deg å designe og tolke eksperimenter som er avhengige av digital alder infrastruktur (kapittel 4). Gjennom bruken av abstraksjon håper jeg dette vil være en tidløs bok om et aktuelt tema.

Optimistisk : De to samfunnene som denne boken engasjerer - sosialforskere og datavitenskapere - har svært forskjellige bakgrunner og interesser. I tillegg til disse vitenskapsrelaterte forskjellene, som jeg snakker om i boken, har jeg også lagt merke til at disse to samfunnene har forskjellige stilarter. Dataforskere er generelt opptatt; De pleier å se glasset som halvt full. Sosialforskere, derimot, er generelt mer kritiske; De pleier å se glasset som halvtomt. I denne boken skal jeg vedta en datavitenskapers optimistiske tone. Så når jeg presenterer eksempler, skal jeg fortelle deg hva jeg elsker om disse eksemplene. Og når jeg peker på problemer med eksemplene - og det vil jeg gjøre fordi ingen forskning er perfekt - jeg skal prøve å peke på disse problemene på en positiv og optimistisk måte. Jeg skal ikke være kritisk for å være kritisk, jeg skal være kritisk, slik at jeg kan hjelpe deg med å skape bedre forskning.

Vi er fortsatt i de tidlige dagene av samfunnsforskning i den digitale tidsalderen, men jeg har sett noen misforståelser som er så vanlige at det er fornuftig for meg å adressere dem her, i forordet. Fra dataforskere har jeg sett to vanlige misforståelser. Den første tenker at flere data automatisk løser problemer. Men for sosial forskning har det ikke vært min erfaring. Faktisk, for samfunnsforskning, synes bedre data - i motsetning til flere data - å være mer nyttig. Den andre misforståelsen som jeg har sett fra datavitenskapsmenn tror at samfunnsvitenskap er bare en haug med fancy snakk innpakket rundt sunn fornuft. Selvfølgelig, som sosialforsker - mer spesifikt som sosiolog - er jeg ikke enig med det. Smarte mennesker har jobbet hardt for å forstå menneskelig atferd i lang tid, og det virker uklokt å ignorere visdommen som har akkumulert fra denne innsatsen. Mitt håp er at denne boken vil gi deg noe av den visdommen på en måte som er lett å forstå.

Fra sosialforskere har jeg også sett to vanlige misforståelser. For det første har jeg sett noen mennesker skrive av hele ideen om sosial forskning ved hjelp av verktøyene i den digitale tidsalderen på grunn av noen dårlige papirer. Hvis du leser denne boken, har du sikkert allerede lest en mengde papirer som bruker sosiale medier data på måter som er banale eller feil (eller begge). Jeg har også. Det ville imidlertid være en alvorlig feil å konkludere fra disse eksemplene at all digital-age sosial forskning er dårlig. Faktisk har du sikkert også lest en haug med papirer som bruker undersøkelsesdata på måter som er banale eller feil, men du avskriver ikke all forskning ved hjelp av undersøkelser. Det er fordi du vet at det er stor forskning gjort med undersøkelsesdata, og i denne boken skal jeg vise deg at det også er stor forskning gjort med verktøyene i den digitale tidsalderen.

Den andre vanlige misforståelsen som jeg har sett fra samfunnsvitenskapsmenn, er å forvirre nåtiden med fremtiden. Når vi vurderer samfunnsforskning i den digitale tidsalderen - forskningen som jeg skal beskrive - er det viktig at vi stiller to forskjellige spørsmål: "Hvor bra fungerer denne forskningsmiljøet akkurat nå?" Og "Hvor bra vil denne stilen til forskerarbeid i fremtiden? "Forskere er opplært til å svare på det første spørsmålet, men for denne boken tror jeg det andre spørsmålet er viktigere. Det er, selv om samfunnsforskning i den digitale tidsalderen ennå ikke har produsert massive, paradigmeskiftende intellektuelle bidrag, er forbedringsgraden av digitalalderforskning utrolig rask. Det er denne endringsgraden mer enn det nåværende nivået som gjør digital aldersforskning så spennende for meg.

Selv om det siste avsnittet kanskje ser ut til å gi deg potensielle rikdommer på en ubestemt tid i fremtiden, er målet mitt ikke å selge deg på en bestemt type forskning. Jeg eier ikke egne aksjer i Twitter, Facebook, Google, Microsoft, Apple eller andre teknologibedrifter (selv om jeg, for å få fullstendig avsløring, bør nevne at jeg har jobbet på eller mottatt forskningsfinansiering fra Microsoft, Google og Facebook). Gjennom boken er derfor mitt mål å forbli en troverdig forteller, som forteller deg om alle spennende nye ting som er mulig, mens du leder deg bort fra noen få feller som jeg har sett andre faller inn i (og noen ganger falt i meg selv) .

Krysset mellom samfunnsvitenskap og datavitenskap kalles noen ganger beregningsvitenskapelig samfunnsvitenskap. Noen anser dette for å være et teknisk felt, men dette vil ikke være en teknisk bok i tradisjonell forstand. For eksempel er det ingen ligninger i hovedteksten. Jeg valgte å skrive boken på denne måten fordi jeg ønsket å gi et helhetlig syn på sosial forskning i den digitale tidsalderen, inkludert store datakilder, undersøkelser, eksperimenter, massesamarbeid og etikk. Det viste seg å være umulig å dekke alle disse emnene og gi tekniske detaljer om hver enkelt. I stedet blir pekere til mer teknisk materiale gitt i avsnittet "Hva du skal lese neste" på slutten av hvert kapittel. Med andre ord, denne boken er ikke laget for å lære deg hvordan du gjør noen spesifikk beregning; heller, det er designet for å endre måten du tenker på sosial forskning.

Slik bruker du denne boken i et kurs

Som jeg sa tidligere, kom denne boken delvis ut av et uteksaminert seminar om beregningsfaglig samfunnsvitenskap som jeg har lært siden 2007 i Princeton. Siden du kanskje tenker på å bruke denne boken for å undervise i et kurs, trodde jeg at det kunne være nyttig for meg å forklare hvordan det vokste ut av kurset mitt og hvordan jeg tenker at det blir brukt i andre kurs.

I flere år lærte jeg kurset mitt uten en bok; Jeg vil bare tilordne en samling artikler. Mens elevene var i stand til å lære av disse artiklene, ledte artiklene ikke alene til de konceptuelle endringene jeg håpet å skape. Så jeg ville tilbringe mesteparten av tiden i klassen, og gi perspektiv, kontekst og råd for å hjelpe elevene til å se det store bildet. Denne boken er mitt forsøk på å skrive ned alt det perspektivet, konteksten og rådene på en måte som ikke har noen forutsetninger - i form av samfunnsvitenskap eller datavitenskap.

I et semesterlang kurs vil jeg anbefale å parre denne boken med en rekke tilleggsavlesninger. For eksempel kan et slikt kurs tilbringe to uker på eksperimenter, og du kan koble kapittel 4 med avlesninger om emner som forbehandlingens rolle i utformingen og analysen av eksperimenter. statistiske og beregningsmessige problemstillinger opptatt av store A / B-tester hos bedrifter; utforming av eksperimenter som er spesielt fokusert på mekanismer; og praktiske, vitenskapelige og etiske problemstillinger knyttet til bruk av deltakere fra nettbaserte arbeidsmarkeder, for eksempel Amazon Mechanical Turk. Det kan også sammenkobles med avlesninger og aktiviteter knyttet til programmering. Det riktige valget mellom disse mange mulige sammenhengene avhenger av studentene i kurset ditt (f.eks. Bachelor, mastergrad eller PhD), deres bakgrunn og mål.

Et semesterlengde kurs kan også inkludere ukentlige problemstillinger. Hvert kapittel har en rekke aktiviteter som er merket etter vanskelighetsgrad: lett ( lett ), medium ( medium ), hardt ( hard ), og veldig hardt ( veldig vanskelig ). Også, jeg har merket hvert problem av de ferdighetene som det krever: matte ( krever matte ), koding ( krever koding ), og datainnsamling ( datainnsamling ). Til slutt har jeg merket noen av aktivitetene som er mine personlige favoritter ( favoritten min ). Jeg håper at innenfor denne mangfoldige samlingen av aktiviteter finner du noe som passer for studentene dine.

For å hjelpe folk som bruker denne boken i kurs, har jeg startet en samling av undervisningsmaterialer som læreplaner, lysbilder, anbefalte sammenkoblinger for hvert kapittel og løsninger på enkelte aktiviteter. Du kan finne disse materialene - og bidra til dem - på http://www.bitbybitbook.com.