Förord

Boken började 2005 i en källare vid Columbia University. Vid den tiden var jag en doktorand, och jag körde ett online-experiment som så småningom skulle bli min avhandling. Jag ska berätta allt om de vetenskapliga delarna av det experimentet i kapitel 4, men nu ska jag berätta om något som inte finns i min avhandling eller i någon av mina papper. Och det är något som i grunden förändrat hur jag tänker på forskning. En morgon när jag kom in i mitt källarkontor upptäckte jag att över 100 personer från Brasilien hade deltagit i mitt experiment. Denna enkla upplevelse hade en djupgående effekt på mig. Vid den tiden hade jag vänner som körde traditionella laboratorieexperiment, och jag visste hur svårt de var att arbeta för att rekrytera, övervaka och betala människor att delta i dessa experiment. om de kunde köra 10 personer på en enda dag var det bra framsteg. Men med mitt onlineexperiment deltog 100 personer medan jag sov . Att göra din forskning medan du sover kanske låter för bra för att vara sant, men det är det inte. Tekniska förändringar, särskilt övergången från den analoga åldern till den digitala tiden, innebär att vi nu kan samla in och analysera sociala data på nya sätt. Denna bok handlar om att göra social forskning på dessa nya sätt.

Denna bok är för samhällsvetenskapliga forskare som vill göra mer datavetenskap, datavetenskapare som vill göra mer samhällsvetenskap och alla som är intresserade av hybridet av dessa två fält. Med tanke på vem den här boken är för, borde det säga att det inte bara är för studenter och professorer. Trots att jag för närvarande arbetar på ett universitet (Princeton), har jag också arbetat i regeringen (vid US Census Bureau) och inom teknikindustrin (vid Microsoft Research) så jag vet att det finns mycket spännande forskning som sker utanför universitet. Om du tänker på vad du gör som social forskning, så är den här boken för dig, oavsett var du arbetar eller vilken typ av teknik du för närvarande använder.

Som du kanske har märkt redan, är tonen i den här boken lite annorlunda än många andra akademiska böcker. Det är avsiktligt. Den här boken kom fram från ett examensseminarium om beräkningssamhällsvetenskap som jag har läst vid Princeton i Sociologiska institutionen sedan 2007, och jag skulle vilja att det skulle fånga lite energi och spänning från seminariet. I synnerhet vill jag ha den här boken med tre egenskaper: Jag vill att den ska vara till nytta, framtidsinriktad och optimistisk.

Hjälpsamt : Mitt mål är att skriva en bok som är till hjälp för dig. Därför ska jag skriva i en öppen, informell och exempeldriven stil. Det beror på att det viktigaste jag vill förmedla är ett visst sätt att tänka på social forskning. Och min erfarenhet antyder att det bästa sättet att förmedla detta sätt att tänka är informellt och med många exempel. I slutet av varje kapitel har jag också en sektion som heter "Vad du ska läsa nästa" som hjälper dig att övergå till mer detaljerade och tekniska avläsningar om många av de ämnen jag presenterar. Till slut hoppas jag att den här boken hjälper dig att göra både forskning och utvärdera andras forskning.

Framtidsorienterad : Den här boken hjälper dig att göra social forskning med hjälp av de digitala system som finns idag och de som kommer att skapas i framtiden. Jag började göra denna typ av forskning 2004, och sedan dess har jag sett många förändringar, och jag är säker på att du under många år kommer att se många förändringar. Tricket att hålla sig relevant inför förändringen är abstraktion . Detta kommer till exempel inte att vara en bok som lär dig exakt hur du använder Twitter API som det existerar idag. I stället ska du lära dig hur du lär dig från stora datakällor (kapitel 2). Detta kommer inte att vara en bok som ger dig steg för steg instruktioner för att köra experiment på Amazon Mechanical Turk; I stället ska du lära dig hur man utformar och tolkar experiment som bygger på digital ålders infrastruktur (kapitel 4). Genom att använda abstraktion hoppas jag att detta kommer att bli en tidlös bok om ett aktuellt ämne.

Optimistisk : De två samhällen som den här boken engagerar, socialforskare och datavetenskapare, har mycket olika bakgrunder och intressen. Förutom dessa vetenskapsrelaterade skillnader, som jag talar om i boken, har jag också märkt att dessa två samhällen har olika stilar. Datavetenskapare är allmänt upphetsade; De brukar se glaset som halvfullt. Socialforskare är däremot i allmänhet mer kritiska. De brukar se glaset som halvtomt. I den här boken ska jag anta en datateknikers optimistiska ton. Så när jag presenterar exempel kommer jag att berätta vad jag älskar om dessa exempel. Och när jag pekar på problem med exemplen - och det kommer jag att göra eftersom ingen forskning är perfekt - jag kommer att försöka peka på dessa problem på ett positivt och optimistiskt sätt. Jag kommer inte att vara kritisk för att vara kritisk - jag kommer att bli kritisk så att jag kan hjälpa dig att skapa bättre forskning.

Vi är fortfarande i de tidiga dagarna av social forskning i den digitala tidsåldern, men jag har sett några missförstånd som är så vanliga att det är vettigt för mig att ta itu med dem här, i förordet. Från datavetenskapare har jag sett två vanliga missförstånd. Den första tänker att mer data automatiskt löser problem. Men för social forskning har det inte varit min erfarenhet. Faktum är att för social forskning är bättre data - i motsats till mer data - mer användbar. Det andra missförståndet som jag har sett från datavetenskapare tänker på att samhällsvetenskap bara är en massa snygga pratningar insvept i sunt förnuft. Naturligtvis, som socialvetenskapsman - mer specifikt som sociologist - håller jag inte med det. Smarta människor har arbetat hårt för att förstå mänskligt beteende länge, och det verkar oklokt att ignorera den visdom som har ackumulerats från denna ansträngning. Mitt hopp är att den här boken ger dig lite av den visdomen på ett sätt som är lätt att förstå.

Från socialforskare har jag också sett två vanliga missförstånd. Först har jag sett några människor skrivit av hela idén om social forskning med hjälp av verktyg i den digitala tiden på grund av några dåliga papper. Om du läser den här boken har du förmodligen redan läst en massa papper som använder sociala medier på sätt som är banala eller felaktiga (eller båda). Jag måste. Det skulle emellertid vara ett allvarligt misstag att på grundval av dessa exempel dra slutsatsen att all socialtidsforskning är dålig. Du har faktiskt också läst en massa papper som använder undersökningsdata på sätt som är banala eller felaktiga, men du skriver inte bort all forskning med enkäter. Det beror på att du vet att det finns stor forskning gjord med undersökningsdata, och i den här boken kommer jag att visa dig att det också finns stor forskning gjord med verktyg i den digitala tiden.

Det andra vanliga missförståndet som jag sett från socialforskare är att förvirra nutiden med framtiden. När vi bedömer social forskning i den digitala tidsåldern - den forskning som jag kommer att beskriva - det är viktigt att vi frågar två olika frågor: "Hur bra fungerar den här forskarstilen just nu?" Och "Hur bra kommer denna stil av forskningsarbete i framtiden? "Forskare är utbildade för att svara på den första frågan, men för den här boken tycker jag att den andra frågan är viktigare. Det vill säga, även om den sociala forskningen i den digitala tidsåldern ännu inte har producerat massiva, paradigmföränderliga intellektuella bidrag, är förbättringsgraden av digital-åldersforskning oerhört snabb. Det är den här förändringsgraden-mer än den nuvarande nivån-som gör digital-åldersforskningen så spännande för mig.

Även om det sista stycket kan tyckas erbjuda dig potentiella rikedomar vid någon ospecificerad tid i framtiden, är mitt mål inte att sälja dig på någon viss typ av forskning. Jag äger inte personligen aktier i Twitter, Facebook, Google, Microsoft, Apple eller något annat tekniskt företag (även om jag, för fullständigt upplysningar, borde nämna att jag har arbetat med eller fått forskningsfinansiering från Microsoft, Google och Facebook). Genom hela boken är mitt mål att vara en trovärdig berättare och berätta om alla spännande nya saker som är möjliga, samtidigt som du leder dig bort från några få fällor som jag har sett andra faller in i (och ibland fallit in i mig själv) .

Korsningen mellan samhällsvetenskap och datavetenskap kallas ibland beräkningsvetenskaplig samhällsvetenskap. Vissa anser att detta är ett tekniskt fält, men det här kommer inte att vara en teknisk bok i traditionell mening. Det finns till exempel inga ekvationer i huvudtexten. Jag valde att skriva boken på det här sättet för att jag ville ge en övergripande bild av social forskning i den digitala tidsåldern, inklusive stora datakällor, undersökningar, experiment, masssamarbete och etik. Det visade sig vara omöjligt att täcka alla dessa ämnen och ge tekniska detaljer om var och en. I stället anges pekare till mer tekniskt material i avsnittet "Vad att läsa nästa" i slutet av varje kapitel. Med andra ord är den här boken inte avsedd att lära dig hur man gör någon specifik beräkning; Det är snarare utformat för att förändra det sätt du tycker om social forskning.

Hur man använder den här boken i en kurs

Som jag sa tidigare kom denna bok delvis fram av ett examensseminarium om beräkningssamhällsvetenskap som jag har undervisat sedan 2007 i Princeton. Eftersom du kanske tänker på att använda den här boken för att lära en kurs, trodde jag att det skulle vara till hjälp för mig att förklara hur det växte ut ur min kurs och hur jag föreställer mig att den används i andra kurser.

I flera år har jag läst min kurs utan en bok; Jag skulle bara tilldela en samling artiklar. Medan eleverna kunde lära av dessa artiklar ledde artiklarna inte ens i de konceptuella förändringarna som jag hoppades skapa. Så jag skulle tillbringa det mesta i klassen och ge perspektiv, sammanhang och råd för att hjälpa eleverna att se den stora bilden. Den här boken är mitt försök att skriva ner allt perspektiv, sammanhang och rådgivning på ett sätt som inte har några förutsättningar - vad gäller socialvetenskap eller datavetenskap.

På en semester-lång kurs rekommenderar jag att du kopplar ihop den här boken med en mängd olika läsningar. En sådan kurs kan till exempel tillbringa två veckor på experiment, och du kan koppla ihop kapitel 4 med läsningar om ämnen som rollen förbehandlingens information i utformningen och analysen av experimenten. statistiska och beräkningsfrågor som uppkommer vid stora A / B-test vid företag Utformning av experiment som är specifikt inriktade på mekanismer och praktiska, vetenskapliga och etiska frågor relaterade till att använda deltagare från online-arbetsmarknader, som Amazon Mechanical Turk. Det kan också kombineras med läsningar och aktiviteter relaterade till programmering. Det lämpliga valet mellan dessa många möjliga parningar beror på studenterna i din kurs (t.ex. grundutbildning, masters eller doktorand), deras bakgrund och mål.

En semesterlängdskurs kan också omfatta veckoproblem. Varje kapitel har en mängd aktiviteter som är märkta med svårighetsgrad: lätt ( lätt ), medium ( medium ), hård ( hård ), och mycket svårt ( väldigt hårt ). Jag har också märkt varje problem med de färdigheter som det kräver: matematik ( kräver matte ), kodning ( kräver kodning ) och datainsamling ( datainsamling ). Slutligen har jag märkt några av de aktiviteter som är mina personliga favoriter ( min favorit ). Jag hoppas att inom denna mångsidiga samling av aktiviteter hittar du några som passar dina elever.

För att hjälpa personer som använder den här boken i kurser har jag startat en samling av läromedel som kursplaner, diabilder, rekommenderade parningar för varje kapitel och lösningar på vissa aktiviteter. Du kan hitta dessa material - och bidra till dem - på http://www.bitbybitbook.com.