Questo libro è iniziato nel 2005 in un seminterrato della Columbia University. All'epoca ero uno studente laureato e stavo facendo un esperimento online che sarebbe poi diventato la mia tesi. Ti dirò tutto sulle parti scientifiche di quell'esperimento nel capitolo 4, ma ora ti parlerò di qualcosa che non è nella mia tesi di laurea o in nessuno dei miei lavori. Ed è qualcosa che ha cambiato radicalmente il modo in cui penso alla ricerca. Una mattina, quando sono entrato nel mio ufficio nel seminterrato, ho scoperto che durante la notte circa 100 persone dal Brasile avevano partecipato al mio esperimento. Questa semplice esperienza ha avuto un profondo effetto su di me. A quel tempo avevo amici che eseguivano esperimenti di laboratorio tradizionali e sapevo quanto dovevano lavorare sodo per reclutare, supervisionare e pagare le persone per partecipare a questi esperimenti; se potessero eseguire 10 persone in un solo giorno, questo era un buon progresso. Tuttavia, con il mio esperimento online, 100 persone hanno partecipato mentre stavo dormendo . Fare la tua ricerca mentre stai dormendo potrebbe sembrare troppo bello per essere vero, ma non lo è. I cambiamenti tecnologici, in particolare il passaggio dall'era analogica a quella digitale, significano che ora possiamo raccogliere e analizzare i dati sociali in modi nuovi. Questo libro parla di fare ricerca sociale in questi nuovi modi.
Questo libro è per gli scienziati sociali che vogliono fare più scienza dei dati, scienziati dei dati che vogliono fare più scienze sociali e chiunque sia interessato all'ibrido di questi due campi. Dato a chi è destinato questo libro, dovrebbe essere ovvio che non è solo per studenti e professori. Anche se attualmente lavoro in un'università (Princeton), ho anche lavorato al governo (presso l'US Census Bureau) e nel settore tecnologico (presso Microsoft Research), quindi so che ci sono molte ricerche interessanti che avvengono al di fuori di università. Se pensi a quello che stai facendo come ricerca sociale, allora questo libro è per te, non importa dove lavori o che tipo di tecniche usi attualmente.
Come avrai già notato, il tono di questo libro è un po 'diverso da quello di molti altri libri accademici. È intenzionale. Questo libro è emerso da un seminario universitario sulle scienze sociali computazionali che ho insegnato a Princeton nel Dipartimento di Sociologia dal 2007, e mi piacerebbe che catturasse parte dell'energia e dell'entusiasmo di quel seminario. In particolare, voglio che questo libro abbia tre caratteristiche: voglio che sia utile, orientato al futuro e ottimista.
Utile : il mio obiettivo è scrivere un libro che sia utile per te. Pertanto, scriverò in uno stile aperto, informale e guidato da un esempio. Questo perché la cosa più importante che voglio trasmettere è un certo modo di pensare alla ricerca sociale. E, la mia esperienza suggerisce che il modo migliore per trasmettere questo modo di pensare è informalmente e con molti esempi. Inoltre, alla fine di ogni capitolo, ho una sezione chiamata "Cosa leggere dopo" che ti aiuterà a passare a letture più dettagliate e tecniche su molti degli argomenti che presento. Alla fine, spero che questo libro ti aiuti a fare ricerca e valutare la ricerca degli altri.
Orientato al futuro : questo libro ti aiuterà a fare ricerche sociali usando i sistemi digitali che esistono oggi e quelli che verranno creati in futuro. Ho iniziato a fare questo tipo di ricerca nel 2004 e da allora ho visto molti cambiamenti, e sono sicuro che nel corso della tua carriera vedrai anche molti cambiamenti. Il trucco per rimanere pertinenti di fronte al cambiamento è l' astrazione . Ad esempio, questo non sarà un libro che ti insegna esattamente come usare l'API di Twitter così com'è oggi; invece, ti insegnerà come imparare dalle grandi fonti di dati (capitolo 2). Questo non sarà un libro che ti fornisce istruzioni dettagliate per l'esecuzione di esperimenti su Amazon Mechanical Turk; invece, ti insegnerà come progettare e interpretare esperimenti che fanno affidamento sull'infrastruttura digitale (capitolo 4). Attraverso l'uso dell'astrazione, spero che questo sarà un libro senza tempo su un tema attuale.
Ottimista : le due comunità coinvolte da questo libro, sociologi e scienziati, hanno background e interessi molto diversi. Oltre a queste differenze legate alla scienza, di cui parlo nel libro, ho anche notato che queste due comunità hanno stili diversi. Gli scienziati dei dati sono generalmente eccitati; tendono a vedere il bicchiere mezzo pieno. Gli scienziati sociali, d'altra parte, sono generalmente più critici; tendono a vedere il bicchiere mezzo vuoto. In questo libro, ho intenzione di adottare il tono ottimista di uno scienziato dei dati. Quindi, quando presento degli esempi, ho intenzione di dirti cosa amo di questi esempi. E, quando faccio notare problemi con gli esempi - e lo farò perché nessuna ricerca è perfetta - cercherò di evidenziare questi problemi in modo positivo e ottimista. Non sarò critico per il gusto di essere critico, sarò critico per aiutarti a creare una ricerca migliore.
Siamo ancora agli albori della ricerca sociale nell'era digitale, ma ho visto alcuni equivoci che sono così comuni che ha senso per me indirizzarli qui, nella prefazione. Da scienziati dei dati, ho visto due comuni equivoci. Il primo è pensare che più dati risolvono automaticamente i problemi. Tuttavia, per la ricerca sociale, questa non è stata la mia esperienza. In effetti, per la ricerca sociale, i dati migliori, in contrapposizione a più dati, sembrano essere più utili. Il secondo fraintendimento che ho visto dagli scienziati di dati sta pensando che la scienza sociale è solo un mucchio di discorsi elaborati avvolti intorno al buon senso. Certo, come scienziato sociale, più specificamente come sociologo, non sono d'accordo. Le persone intelligenti hanno lavorato duramente per comprendere il comportamento umano per lungo tempo, e non sembra saggio ignorare la saggezza accumulata da questo sforzo. La mia speranza è che questo libro ti offra un po 'di quella saggezza in un modo che sia facile da capire.
Da parte degli scienziati sociali, ho anche visto due comuni equivoci. In primo luogo, ho visto alcune persone cancellare l'intera idea della ricerca sociale usando gli strumenti dell'era digitale a causa di alcune cattive pubblicazioni. Se stai leggendo questo libro, probabilmente hai già letto un sacco di articoli che usano i dati dei social media in modi banali o sbagliati (o entrambi). Anch'io. Tuttavia, sarebbe un grave errore concludere da questi esempi che tutta la ricerca sociale sull'era digitale è cattiva. In effetti, probabilmente hai anche letto un sacco di articoli che usano i dati del sondaggio in modi banali o sbagliati, ma non cancelli tutte le ricerche usando i sondaggi. Questo perché sai che c'è una grande ricerca fatta con i dati del sondaggio, e in questo libro ti mostrerò che c'è anche una grande ricerca fatta con gli strumenti dell'era digitale.
Il secondo fraintendimento comune che ho visto dagli scienziati sociali è quello di confondere il presente con il futuro. Quando valutiamo la ricerca sociale nell'era digitale, la ricerca che descriverò, è importante porre due domande distinte: "Quanto bene funziona questo stile di ricerca in questo momento?" E "Quanto bene questo stile di lavoro di ricerca in futuro? "I ricercatori sono addestrati a rispondere alla prima domanda, ma per questo libro penso che la seconda domanda sia più importante. Cioè, anche se la ricerca sociale nell'era digitale non ha ancora prodotto enormi contributi intellettuali che cambiano il paradigma, il tasso di miglioramento della ricerca sull'era digitale è incredibilmente rapido. È questo tasso di cambiamento, più del livello attuale, che rende la ricerca sull'era digitale così entusiasmante per me.
Anche se quell'ultimo paragrafo potrebbe sembrare offrirti ricchezze potenziali in un momento imprecisato in futuro, il mio obiettivo non è di venderti su un particolare tipo di ricerca. Personalmente non posseggo quote di Twitter, Facebook, Google, Microsoft, Apple o qualsiasi altra società tecnologica (anche se, a fini di completa divulgazione, dovrei menzionare che ho lavorato o ricevuto finanziamenti per la ricerca da Microsoft, Google e Facebook). In tutto il libro, quindi, il mio obiettivo è quello di rimanere un narratore credibile, che ti racconti di tutte le novità eccitanti che è possibile, mentre ti guida lontano da alcune trappole in cui ho visto cadere gli altri (e occasionalmente caduto in me stesso) .
L'intersezione tra scienze sociali e scienze dei dati è talvolta chiamata scienza sociale computazionale. Alcuni considerano questo un campo tecnico, ma questo non sarà un libro tecnico nel senso tradizionale. Ad esempio, non ci sono equazioni nel testo principale. Ho scelto di scrivere il libro in questo modo perché volevo fornire una visione completa della ricerca sociale nell'era digitale, incluse le grandi fonti di dati, sondaggi, esperimenti, collaborazione di massa ed etica. È risultato impossibile coprire tutti questi argomenti e fornire dettagli tecnici su ciascuno di essi. Invece, i puntatori a materiale più tecnico sono forniti nella sezione "Cosa leggere dopo" alla fine di ogni capitolo. In altre parole, questo libro non è progettato per insegnarti come eseguire un calcolo specifico; piuttosto, è progettato per cambiare il modo in cui pensi alla ricerca sociale.
Come usare questo libro in un corso
Come ho detto prima, questo libro è emerso in parte da un seminario sulla scienza sociale computazionale che ho insegnato dal 2007 a Princeton. Dato che potresti pensare di usare questo libro per insegnare un corso, ho pensato che potrebbe essere utile per me spiegare come è nato dal mio corso e come immagino venga usato in altri corsi.
Per diversi anni ho insegnato il mio corso senza un libro; Assegnerei solo una collezione di articoli. Mentre gli studenti erano in grado di imparare da questi articoli, gli articoli da soli non stavano portando ai cambiamenti concettuali che speravo di creare. Quindi passerei la maggior parte del tempo in classe fornendo prospettiva, contesto e consigli per aiutare gli studenti a vedere il quadro generale. Questo libro è il mio tentativo di annotare tutta la prospettiva, il contesto e i consigli in un modo che non ha prerequisiti: in termini di scienze sociali o di scienze dei dati.
In un corso semestrale, consiglierei di abbinare questo libro a una serie di letture aggiuntive. Ad esempio, un corso del genere potrebbe impiegare due settimane di sperimentazione e si potrebbe accoppiare il capitolo 4 con letture su argomenti come il ruolo delle informazioni di pretrattamento nella progettazione e nell'analisi degli esperimenti; questioni statistiche e computazionali sollevate da test A / B su larga scala presso le aziende; progettazione di esperimenti specificamente focalizzati sui meccanismi; e questioni pratiche, scientifiche ed etiche relative all'uso dei partecipanti dai mercati del lavoro online, come Amazon Mechanical Turk. Potrebbe anche essere associato a letture e attività legate alla programmazione. La scelta appropriata tra questi molti possibili accoppiamenti dipende dagli studenti del tuo corso (ad esempio, laurea, master o dottorato di ricerca), dai loro background e dai loro obiettivi.
Un corso di un semestre può anche includere serie di problemi settimanali. Ogni capitolo ha una varietà di attività etichettate dal grado di difficoltà: facile ( ), medio ( ), difficile ( ), e molto difficile ( ). Inoltre, ho etichettato ogni problema con le competenze che richiede: matematica ( ), codifica ( ) e raccolta dei dati ( ). Infine, ho etichettato alcune delle attività che sono le mie preferite personali ( ). Spero che all'interno di questa raccolta diversificata di attività, troverai alcuni che sono appropriati per i tuoi studenti.
Per aiutare le persone a usare questo libro nei corsi, ho iniziato una raccolta di materiali didattici come i programmi di studio, le diapositive, gli accoppiamenti consigliati per ogni capitolo e le soluzioni ad alcune attività. Puoi trovare questi materiali, e contribuire a loro, su http://www.bitbybitbook.com.