priekšvārds

Šī grāmata sākās 2005. gadā Columbia universitātes pagrabā. Tajā laikā es biju absolvents, un man bija tiešsaistes eksperiments, kas galu galā kļuva par manu disertāciju. Es pastāstīšu visu par šī eksperimenta zinātniskajām daļām 4. nodaļā, bet tagad es tev pastāstīšu par kaut ko tādu, kas nav manā disertācijā vai kādā no maniem dokumentiem. Un tas ir kaut kas, kas fundamentāli mainījies, kā es domāju par pētniecību. Kādu rītu, kad es atnācu manā pagrabstāvā, atklāju, ka manā eksperimentā piedalījās aptuveni 100 cilvēki no Brazīlijas nakti. Šī vienkāršā pieredze man ļoti ietekmēja. Tajā laikā man bija draugi, kuri izmantoja tradicionālos laboratorijas eksperimentus, un es zināju, cik grūti viņiem bija jāstrādā, lai pieņemtu darbā, uzraudzītu un maksātu cilvēkiem piedalīties šajos eksperimentos; ja viņi vienā dienā varētu palaist 10 cilvēkus, tas bija labs progress. Tomēr, pateicoties manam tiešsaistes eksperimentam, miega laikā piedalījās 100 cilvēki. Veikt pētījumus, kamēr jūs guļat, var likties pārāk labi, lai būtu patiesība, bet tā nav. Tehnoloģiju izmaiņas, proti, pāreja no analogās laikmeta uz digitālo laikmetu, nozīmē, ka tagad mēs varam apkopot un analizēt sociālos datus jaunos veidos. Šī grāmata ir par sociālo pētījumu veikšanu šajos jaunajos veidos.

Šī grāmata ir paredzēta sociālajiem zinātniekiem, kuri vēlas veikt vairāk datu zinātnes, datu zinātnieki, kuri vēlas veikt vairāk sociālo zinātņu, un ikviens, kas interesējas par šo divu jomu hibrīdu. Ņemot vērā, kam šī grāmata ir paredzēta, vajadzētu teikt, ka tas nav tikai studentiem un profesoriem. Lai gan es šobrīd strādā universitātē (Princeton), esmu strādājis arī valdībā (ASV Census Bureau) un tehnoloģiju nozarē (Microsoft Research), tāpēc es zinu, ka ir daudz aizraujošu pētījumu, kas notiek ārpus universitātes. Ja jūs domājat par to, ko jūs veicat kā sociālu pētījumu, šī grāmata ir jums, neatkarīgi no tā, kur jūs strādājat vai kādas metodes jūs pašlaik izmantojat.

Kā jau jūs jau esat pamanījuši, šīs grāmatas tonis nedaudz atšķiras no daudzu citu akadēmisko grāmatu grāmatas. Tas ir apzināts. Šī grāmata parādījās pēc absolventu semināra par skaitliskām sociālajām zinātnēm, kuras es kopš 2007. gada esmu mācījis Princetonā Socioloģijas departamentā, un es gribētu, lai no šī semināra tiktu uztverta kāda enerģija un satraukums. Jo īpaši es vēlos, lai šai grāmatai būtu trīs īpašības: es vēlos, lai tā būtu lietderīga, orientēta uz nākotni un būtu optimistiska.

Noderīgi : Mans mērķis ir uzrakstīt jums noderīgu grāmatu. Tāpēc es gatavos rakstīt atklātā, neoficiālā un uz paraugu orientētā stilā. Tas ir tāpēc, ka vissvarīgākais, ko es gribu izteikt, ir zināms domāšanas veids par sociālo pētniecību. Mana pieredze liecina, ka labākais veids, kā izpaust šo domāšanas veidu, ir neoficiāls un ar daudziem piemēriem. Arī katras nodaļas beigās man ir sadaļa ar nosaukumu "Ko lasīt tālāk", kas palīdzēs jums pāriet uz detalizētākiem un tehniskiem lasījumiem daudzās tēmās, kuras es ievieš. Galu galā es ceru, ka šī grāmata palīdzēs jums gan veikt pētījumus, gan novērtēt citu pētījumus.

Uz nākotni vērsta pieeja : šī grāmata palīdzēs jums veikt sociālos pētījumus, izmantojot mūsdienu digitālās sistēmas un tās, kas tiks izveidotas nākotnē. Es sāku veikt šāda veida pētījumus 2004. gadā, un kopš tā laika esmu redzējis daudzas izmaiņas, un esmu pārliecināts, ka savas karjeras laikā jūs redzēsiet arī daudzas izmaiņas. Apgrūtinājums saglabāt atbilstību izmaiņām ir abstrakcija . Piemēram, tā nebūs grāmata, kas tev precīzi mācīs, kā lietot čivināt API, kā tas ir šodien; Tā vietā tā iemācīs, kā mācīties no lieliem datu avotiem (2. nodaļa). Šī nebūs grāmata, kas sniegs jums soli pa solim instrukcijas eksperimentu veikšanai Amazon Mechanical Turk; Tā vietā tā iemācīs, kā izstrādāt un interpretēt eksperimentus, kas balstās uz digitālās vecuma infrastruktūru (4. nodaļa). Izmantojot abstrakciju, es ceru, ka tas būs mūžīgas grāmatas par savlaicīgu tēmu.

Optimistisks : abas kopienas, kurām šajā grāmatā ir iesaistīti sociologi un datu zinātnieki, ir ļoti atšķirīgi. Papildus šīm ar zinātni saistītajām atšķirībām, par kurām es runāju par grāmatu, esmu arī pamanījis, ka šīm divām kopienām ir dažādi stili. Datu zinātnieki parasti ir satraukti; viņi mēdz redzēt stiklu kā pusi pilnas. No otras puses, sociālie zinātnieki parasti ir kritiskāki; viņi mēdz redzēt stiklu kā pusi tukšu. Šajā grāmatā es gatavojas pieņemt datu zinātnieka optimistisku toni. Tātad, kad es uzrādīšu piemērus, es tev pastāstīšu, ko es mīlu par šiem piemēriem. Un, kad es uzsvēru problēmas ar piemēriem - un es to darīšu, jo neviens pētījums nav perfekts - es centīšos norādīt uz šīm problēmām pozitīvi un optimistiski. Es nedomāju, ka esmu kritisks, lai esmu kritisks - es būšu kritisks, lai es varētu jums palīdzēt radīt labāku izpēti.

Mēs joprojām esam sociālās pētniecības sākumposmos digitālajā laikmetā, bet esmu redzējis dažus pārpratumus, kas ir tik plaši, ka man ir jēga tos uzdot šeit priekšvārdā. No datu zinātniekiem esmu redzējis divus bieži sastopamos pārpratumus. Pirmais domā, ka vairāk datu automātiski atrisina problēmas. Tomēr sociālajiem pētījumiem tas nav mana pieredze. Faktiski sociālajiem pētījumiem labāki dati, nevis vairāk datu, šķiet, ir vairāk noderīgi. Otrais pārpratums, ko esmu redzējis no datu zinātniekiem, domā, ka sociālās zinātnes ir tikai daudzi izdomāti runas, kas aptver veselo saprātu. Protams, kā sociālistu - konkrētāk kā sociologs - es nepiekrītu tam. Viedie cilvēki ir smagi strādā, lai ilgu laiku izprastu cilvēka uzvedību, un šķiet neiedomājami ignorēt gudrību, kas ir uzkrāta no šiem centieniem. Es ceru, ka šī grāmata jums piedāvās daļu no šīs gudrības tādā veidā, kas ir viegli saprotams.

No sociālajiem zinātniekiem esmu arī redzējis divus bieži sastopamos pārpratumus. Pirmkārt, esmu redzējis, ka daži cilvēki noliedz visu ideju par sociālo izpēti, izmantojot digitālā laikmeta rīkus, pateicoties dažiem sliktiem dokumentiem. Ja jūs lasāt šo grāmatu, jūs, iespējams, jau esat izlasījis daudzus dokumentus, kas izmanto sociālo mediju datus tādos veidos, kas ir banāli vai nepareizi (vai abi). Man arī ir. Tomēr no šiem piemēriem būtu nopietna kļūda, ka visi digitālā vecuma sociālie pētījumi ir slikti. Patiesībā jūs, iespējams, esat izlasījis arī virkni dokumentu, kas aptaujas datus izmanto tā, ka tie ir banāli vai nepareizi, taču jūs neizslēdzat visus pētījumus, izmantojot aptaujas. Tas ir tāpēc, ka jūs zināt, ka ar aptauju datiem tiek veikts lielisks pētījums, un šajā grāmatā es parādīšu, ka digitālais laikmets ir veikts ar lielu izpēti.

Otrais bieži sastopamais pārpratums, ko esmu saskatījis sociālajos zinātniekos, ir sajukums ar nākotni. Kad mēs novērtējam sociālos pētījumus digitālajā laikmetā - pētījumus, kurus es raksturos, ir svarīgi, lai mēs uzdodam divus atšķirīgus jautājumus: "Cik labi šis pētniecības stils šobrīd darbojas?" Un "Cik labi šis stila veids pētniecisko darbu nākotnē? "Pētnieki ir apmācīti atbildēt uz pirmo jautājumu, bet par šo grāmatu es domāju, ka otrais jautājums ir daudz svarīgāks. Tas ir, lai gan sociālie pētījumi digitālajā laikmetā vēl nav izveidojuši milzīgu, paradigmu mainīgu intelektuālo ieguldījumu, digitālā vecuma pētījumu uzlabošanas temps ir neticami ātrs. Tas ir tāds pārmaiņu ātrums, kas pārsniedz pašreizējo līmeni, kas digitālo laikmeta pētījumu padara man tik aizraujošu.

Kaut arī pēdējā rindkopa, iespējams, nākotnē piedāvās jums potenciālos bagātības kādā nenoteiktā laikā, mans mērķis nav pārdot jūs uz kādu konkrētu pētījumu veidu. Man personīgi nav akciju čivināt, Facebook, Google, Microsoft, Apple vai jebkuru citu tehnoloģiju uzņēmumu (lai gan, lai pilnībā atklātu informāciju, man vajadzētu minēt, ka esmu strādājis Microsoft vai saņēmu pētījumu finansējumu no Microsoft, Google un Facebook). Tādēļ visā grāmatā mans mērķis ir palikt uzticams stāstītājs, stāsta jums par visām iespējamām jaunajām iespējām, vienlaikus vadot tevi no dažiem slazdiem, par kuriem esmu redzējis, ka citi nonāk (un reizēm nokļūst manī) .

Sociālo zinātņu un datu zinātnes krustpunktu dažreiz sauc par skaitlisku sociālo zinātni. Daži uzskata, ka tas ir tehnisks joma, taču tā nebūs tehniska grāmata tradicionālajā izpratnē. Piemēram, galvenajā tekstā nav vienādojumu. Es izvēlējos rakstīt grāmatu šādā veidā, jo es gribēju sniegt visaptverošu priekšstatu par sociālajiem pētījumiem digitālajā laikmetā, tostarp par lieliem datu avotiem, apsekojumiem, eksperimentiem, masveida sadarbību un ētiku. Izrādījās, ka nav iespējams aptvert visas šīs tēmas un sniegt tehnisko informāciju par katru no tām. Tā vietā norādes uz tehniskiem materiāliem ir sniegtas sadaļā "Kas tālāk lasīt" katras nodaļas beigās. Citiem vārdiem sakot, šī grāmata nav paredzēta, lai iemācītu jums veikt konkrētus aprēķinus; Drīzāk tas ir paredzēts, lai mainītu veidu, kā domājat par sociālo pētniecību.

Kā izmantot šo grāmatu kursā

Kā jau teicu iepriekš, šī grāmata daļēji parādījās pēc absolventu semināra par skaitļošanas sociālo zinātni, kuru esmu mācījusi kopš 2007. gada Princetonā. Tā kā jūs, iespējams, domājat par šīs grāmatas izmantošanu, lai mācītu kursu, es domāju, ka varētu būt noderīgi, lai es varētu izskaidrot, kā tā izauga no mana kursa un kā es domāju, ka to izmanto citos kursos.

Vairākus gadus es iemācīju kursu bez grāmatas; Es tikai piešķirtu rakstu kopu. Lai gan skolēni varēja mācīties no šiem pantiem, tikai raksti nemaina konceptuālās izmaiņas, kuras es cerēju radīt. Tāpēc es galvenokārt pavadīju klasē, nodrošinot perspektīvu, kontekstu un padomu, lai palīdzētu studentiem redzēt lielu ainu. Šī grāmata ir mans mēģinājums pierakstīt visu šo perspektīvu, kontekstu un padomu veidā, kam nav priekšnoteikumu - sociālās zinātnes vai datu zinātnes ziņā.

Semestra gaitā es ieteiktu pārveidot šo grāmatu ar dažādiem papildu lasījumiem. Piemēram, šāds kurss eksperimentu laikā var pavadīt divas nedēļas, un eksperimentu plānošanā un analīzē jūs varētu pārveidot 4. nodaļu ar rādījumiem par tādām tēmām kā, piemēram, informācijas par pirmapstrādi nozīme; statistikas un skaitļošanas jautājumi, ko rada liela mēroga A / B testi uzņēmumos; eksperimentu dizains, kas īpaši pievēršas mehānismiem; kā arī praktiskie, zinātniskie un ētiskie jautājumi saistībā ar dalībnieku izmantošanu no tiešsaistes darba tirgiem, piemēram, Amazon Mechanical Turk. To var arī savienot ar nolasījumiem un programmēšanas darbībām. Attiecīgā izvēle starp šiem iespējamiem pāriem ir atkarīga no jūsu kursa studentiem (piemēram, bakalaura, maģistra vai doktora grāda), viņu pieredzes un mērķu.

Semestra garuma kurss var ietvert arī nedēļas problēmu komplektus. Katrā nodaļā ir dažādas darbības, kuras apzīmē grūtības pakāpe: viegli ( viegli ), vidēja ( vidēja ), smagi ( grūti ) un ļoti grūti ( ļoti grūti ) Arī es katru problēmu esmu apzīmējis ar prasmēm, kas tai vajadzīgas: matemātikā ( prasa matemātiku ), kodēšana ( nepieciešama kodēšana ) un datu vākšana ( datu vākšana ) Visbeidzot, esmu minējis dažas no darbībām, kas ir manas personīgās izlases ( Mans mīļākais ) Es ceru, ka šajā daudzveidīgajā pasākumu kolekcijā jūs atradīsit dažus, kas ir piemēroti jūsu skolēniem.

Lai palīdzētu cilvēkiem, kuri izmanto šo grāmatu kursos, esmu sākusi mācību materiālu kolekciju, piemēram, mācību programmas, slaidus, ieteiktos pārus par katru nodaļu un dažu darbību risinājumiem. Jūs varat atrast šos materiālus un piedalīties šajos materiālos - http://www.bitbybitbook.com.