Ova knjiga počela je 2005. godine u podrumu na Univerzitetu Columbia. U to vrijeme sam bio diplomirani student, i vodio sam online eksperiment koji bi na kraju postao moja disertacija. Reći ću vam sve o naučnim delovima tog eksperimenta u poglavlju 4, ali sada ću vam reći nešto o nečemu što nije u mojoj disertaciji ili u nekom od mojih dokumenata. I to je nešto što se fundamentalno promenilo kako mislim na istraživanje. Jednog jutra, kada sam ušao u svoju podrumsku kancelariju, otkrio sam da je preko noći oko 100 ljudi iz Brazila učestvovalo u mom eksperimentu. Ovo jednostavno iskustvo imalo je dubok uticaj na mene. U to doba imala sam prijatelje koji su vodili tradicionalne laboratorijske eksperimente, i znala sam koliko su teško raditi na angažovanju, nadziranju i plaćanju ljudi da učestvuju u ovim eksperimentima; ako bi mogli da pokrivaju 10 ljudi u jednom danu, to je bio dobar napredak. Međutim, sa mojim online eksperimentom učestvovalo je 100 ljudi dok sam spavala . Istraživanje dok spavate možda zvuči previše dobro da bi bilo istinito, ali nije. Promene u tehnologiji - posebno tranzicija iz analognog doba u digitalno doba - znače da sada možemo sakupljati i analizirati društvene podatke na nove načine. Ova knjiga je o socijalnim istraživanjima na ovim novim načinima.
Ova knjiga je namenjena društvenim naučnicima koji žele više naučiti nauku podataka, naučnicima podataka koji žele više društvenih nauka i svima koji su zainteresovani za hibrid ove dve oblasti. Uzevši u obzir za koga se ova knjiga nalazi, trebalo bi da se kaže da to nije samo za studente i profesore. Iako trenutno radim na univerzitetu (Princeton), takođe sam radio u vladi (u Birou za popis stanovništva SAD) i u tehnološkoj industriji (u Microsoft Research-u), tako da znam da se odvija mnogo uzbudljivih istraživanja izvan univerziteti. Ako razmišljate o tome šta radite kao društveno istraživanje, onda je ova knjiga za vas, bez obzira na to gde radite ili koje vrste tehnike trenutno koristite.
Kao što ste možda već primetili, ton ove knjige je malo drugačiji od onog u mnogim drugim akademskim knjigama. To je namerno. Ova knjiga je nastala na diplomskom seminaru o računarskim društvenim naukama koje sam predavao u Prinstonu u Odsjeku za sociologiju od 2007. godine, a ja bih voleo da uhvati dio energije i uzbuđenja sa tog seminara. Konkretno, želim da ova knjiga ima tri karakteristike: želim da bude korisna, orijentirana ka budućnosti i optimistična.
Korisno : Moj cilj je napisati knjigu koja vam je od pomoći. Zato ću pisati otvorenim, neformalnim i primjerenim stilom. To je zato što najvažnija stvar koju želim da prenesem je određeni način razmišljanja o društvenim istraživanjima. I, moje iskustvo sugeriše da je najbolji način prenošenja ovog načina razmišljanja neformalno i sa puno primjera. Takođe, na kraju svakog poglavlja, imam odeljak pod nazivom "Šta čitati dalje", koji će vam pomoći da prelazite na detaljnija i tehnička čitanja o mnogim temama koje predstavljam. Na kraju, nadam se da će vam ova knjiga pomoći da istražite i procenite istraživanje drugih.
Orijentisan za budućnost : Ova knjiga će vam pomoći da izvršite društvena istraživanja koristeći digitalne sisteme koji postoje danas i one koje će biti kreirane u budućnosti. Počeo sam da radim ovakvo istraživanje 2004. godine, a od tada sam vidio mnoge promene i siguran sam da ćete u toku svoje karijere videti i mnoge promjene. Trik da ostane relevantan u suočavanju s promjenama je apstrakcija . Na primer, ovo neće biti knjiga koja vas upravo upozna kako koristiti Twitter API kakav postoji danas; Umjesto toga, on će vas naučiti kako naučiti iz velikih izvora podataka (poglavlje 2). Ovo neće biti knjiga koja vam daje korak po korak instrukcije za pokretanje eksperimenata na Amazon Mechanical Turk; Umjesto toga, on će vas naučiti kako dizajnirati i interpretirati eksperimente koji se oslanjaju na infrastrukturu digitalne dobi (poglavlje 4). Koristeći apstrakciju, nadam se da će ovo biti bezvremena knjiga na blagovremenoj temi.
Optimisti : dve zajednice u kojima se ova knjiga angažuje - naučnici i naučnici podataka - imaju veoma različite pozadine i interese. Pored ovih razlika vezanih za nauku, o kojima pričam u knjizi, takođe sam primetio da ove dve zajednice imaju različite stilove. Naučnici podataka su uglavnom uzbuđeni; oni imaju tendenciju da vide staklo kao pola. S druge strane, društveni naučnici su uglavnom kritičniji; oni imaju tendenciju da vide staklo kao polu prazno. U ovoj knjizi, usvojim optimistički ton naučnika podataka. Dakle, kada predstavim primere, reći ću vam šta volim u vezi sa ovim primerima. I, kada ističem probleme sa primjerima - a ja ću to učiniti jer ne istraživanje nije savršeno - pokušat ću da istaknem ove probleme na način koji je pozitivan i optimističan. Neću biti kritičan da budem kritičan - ja ću biti kritičan, tako da vam mogu pomoći da stvorite bolje istraživanje.
Još smo u prvim danima društvenih istraživanja u digitalnom dobu, ali sam video neke nesuglasice koje su tako uobičajene da imam smisla da se ovde obratim u predgovoru. Od naučnika podataka, video sam dva uobičajena nesporazuma. Prvi misli da više podataka automatski rešava probleme. Međutim, za društvena istraživanja to nije bilo moje iskustvo. Zapravo, za socijalna istraživanja, bolji podaci - za razliku od više podataka - izgleda da su korisniji. Drugi nesporazum koji sam vidio od naučnika na podacima smatra da su društvene nauke samo gomila fensi govora zamotane oko zdravog razumevanja. Naravno, kao socijalni naučnik - konkretnije kao sociolog - ne slažem se s tim. Pametni ljudi naporno rade na razumevanju ljudskog ponašanja dugo vremena, i čini se nesmotrenim da ignorišu mudrost koja se nagomilala ovim naporom. Nadam se da će vam ova knjiga ponuditi neku od te mudrosti na način koji je lako razumjeti.
Od društvenih naučnika, takođe sam vidio dva uobičajena nesporazuma. Prvo, video sam neke ljude da pišu celu ideju društvenih istraživanja koristeći alate digitalnog doba zbog nekoliko loših papira. Ako čitate ovu knjigu, verovatno ste već čitali gomilu dokumenata koji koriste podatke društvenih medija na načine koji su banalni ili pogrešni (ili oboje). I ja imam. Međutim, bilo bi ozbiljno pogrešno zaključiti iz ovih primjera da su sva društvena istraživanja digitalnog doba loša. Zapravo, verovatno ste i čitali gomilu dokumenata koji koriste podatke istraživanja na načine koji su banalni ili pogrešni, ali ne ispuštate sva istraživanja koristeći ankete. To je zato što znate da se radi o istraživanjima sa velikim istraživanjem, au ovoj knjizi ću vam pokazati da se radi o velikim istraživanjima sa alatima digitalnog doba.
Drugi uobičajeni nesporazum koji sam vidio od sociologa jeste da zbunjujem sadašnjost sa budućnošću. Kada procjenimo socijalna istraživanja u digitalnom dobu - istraživanje koje ću opisati - važno je postaviti dva različita pitanja: "Koliko dobro ovaj stih istraživanja trenutno radi?" I "Koliko će ovaj stil istraživački rad u budućnosti? "Istraživači su obučeni da odgovore na prvo pitanje, ali za ovu knjigu mislim da je drugo pitanje važnije. To jest, iako socijalno istraživanje u digitalnom dobu još uvek nije dovelo do velikih, intelektualnih doprinosa koje menjaju paradigme, stopa poboljšanja istraživanja digitalnog doba je nevjerovatno brza. To je stopa promene - više od trenutnog nivoa - što istraživanje digitalnog doba čini toliko uzbudljivim za mene.
Čak iako taj poslednji paragraf možda izgleda da vam nudi potencijalno bogatstvo u nekom određenom vremenu u budućnosti, moj cilj nije da vas proda na nekom određenom tipu istraživanja. Ja lično ne posedujem akcije na Twitter-u, Facebook-u, Google-u, Microsoft-u, Apple-u ili bilo kojoj drugoj tehnološkoj kompaniji (iako bi, radi punog objelodanjivanja, trebao napomenuti da sam radio ili finansirao Microsoft, Google i Facebook). U celoj knjizi, stoga, moj cilj je da ostanem verodostojni narator, govoreći o svim uzbudljivim novim stvarima što je moguće, dok vas vodim daleko od nekoliko zamki koje sam video drugima (i povremeno sam pao u sebe) .
Presek društvenih nauka i nauke o podacima se ponekad nazivaju računarske društvene nauke. Neki smatraju da je ovo tehničko polje, ali to neće biti tehnička knjiga u tradicionalnom smislu. Na primjer, u glavnom tekstu nema jednačina. Odlučio sam da napišem knjigu na ovaj način jer sam želeo da pružim sveobuhvatan pregled društvenih istraživanja u digitalnom dobu, uključujući velike izvore podataka, ankete, eksperimente, masovnu saradnju i etiku. Ispostavilo se da je nemoguće pokriti sve ove teme i pružiti tehničke detalje o svakom od njih. Umesto toga, pokazivači više tehničkog materijala su navedeni u odeljku "Šta čitati sledeće" na kraju svakog poglavlja. Drugim rečima, ova knjiga nije dizajnirana da vas nauči kako da uradite bilo kakvu specifičnu obračun; već je dizajniran da promeni način na koji razmišljate o društvenim istraživanjima.
Kako koristiti ovu knjigu na kursu
Kao što sam ranije rekao, ova knjiga se dijelom pojavila na diplomskom seminaru o računarskim društvenim naukama koje predavam od 2007. godine u Princetonu. Budući da možda razmišljate o korišćenju ove knjige za učenje kursa, pomislio sam da bi moglo biti korisno da objasnim kako je nastalo iz mog kursa i kako zamišljam da se koristi u drugim predmetima.
Nekoliko godina sam naučio svoj kurs bez knjige; Samo bih dodijelio kolekciju članaka. Iako su studenti mogli da uče od ovih članaka, sami članci nisu doveli do konceptualnih promjena koje sam nadala stvarati. Zato ću najviše vremena provesti u razredu, pružajući perspektivu, kontekst i savjete kako bih pomogao studentima da vide veliku sliku. Ova knjiga je moj pokušaj da upišem svu tu perspektivu, kontekst i savjete na način koji nema preduslova - u smislu društvenih nauka ili nauke o podacima.
Na semestarskom kursu, preporučio bih uparivanje ove knjige različitim dodatnim očitavanjem. Na primer, takav kurs bi mogao provesti dvije sedmice na eksperimentima i mogli biste upariti poglavlje 4 sa čitanjima o temama kao što su uloga informacija o predtretmanu u dizajnu i analizi eksperimenata; statistička i računska pitanja koja su pokrivena velikim A / B testovima u kompanijama; dizajn eksperimenata koji su posebno fokusirani na mehanizme; i praktična, naučna i etička pitanja vezana za korišćenje učesnika sa tržišta rada na mreži, kao što je Amazon Mechanical Turk. Takođe se može upariti sa čitanjima i aktivnostima vezanim za programiranje. Odgovarajući izbor između ovih mnogih mogućih uparivanja zavisi od studenata u vašem predmetu (npr. Dodiplomske studije, master ili doktorat), njihove pozadine i njihove ciljeve.
Trajanje semestra bi takođe moglo uključiti nedeljne skupove problema. Svako poglavlje ima niz aktivnosti koje su označene stepenom teškoća: lako ( ), srednje ( ), tvrdi ), i vrlo teško ( ). Takođe, svakim problemom sam obeležio vještine koje zahtijeva: matematika ( ), kodiranje ( ) i prikupljanje podataka ( ). Na kraju, označio sam neke od aktivnosti koje su mi omiljene ( ). Nadam se da ćete u okviru ove raznolike kolekcije aktivnosti naći neke od njih koje su prikladne za vaše studente.
Da bih pomogao ljudima koji koriste ovu knjigu na kursevima, pokrenuo sam kolekciju nastavnih materijala kao što su programi, slajdovi, preporučena uparivanja za svako poglavlje i rešenja za neke aktivnosti. Ove materijale možete naći i doprinijeti njima - na http://www.bitbybitbook.com.