prefaci

Aquest llibre va començar el 2005 en un soterrani a la Universitat de Columbia. En aquella època, jo era un estudiant de postgrau i jo estava realitzant un experiment en línia que eventualment es convertiria en la meva dissertació. Us explicaré sobre les parts científiques d'aquest experiment al capítol 4, però ara et diré sobre alguna cosa que no està en la meva tesi o en cap dels meus articles. I és quelcom que va canviar fonamentalment com penso en la recerca. Un matí, quan vaig entrar a la meva oficina del soterrani, vaig descobrir que al matí unes 100 persones de Brasil havien participat en el meu experiment. Aquesta senzilla experiència va tenir un efecte profund sobre mi. En aquell moment, tenia amics que feien experiments de laboratori tradicionals i vaig saber el dur que havien de treballar per reclutar, supervisar i pagar a la gent per participar en aquests experiments; si podien córrer 10 persones en un sol dia, això era un bon progrés. No obstant això, amb el meu experiment en línia, 100 persones van participar mentre dormia . Fer la vostra investigació mentre dormeu podria semblar massa bo per ser veritat, però no ho és. Els canvis en la tecnologia -especialment la transició de l'edat analògica a l'era digital- fan que ara puguem recopilar i analitzar les dades socials de noves maneres. Aquest llibre tracta de fer recerca social d'aquestes noves formes.

Aquest llibre és per a científics socials que volen fer més ciències de la informació, científics de dades que vulguin fer més ciències socials i qualsevol persona interessada en l'híbrid d'aquests dos camps. Davant d'aquest llibre, no cal dir que no és només per a estudiants i professors. Encara que actualment treballo en una universitat (Princeton), també he treballat al govern (a l'Oficina del Cens dels EUA) i a la indústria de la tecnologia (a Microsoft Research), així que sé que hi ha una gran quantitat d'investigacions emocionants que succeeixen fora de universitats. Si penses en el que estàs fent com a recerca social, aquest llibre és per a tu, independentment del lloc on treballes o del tipus de tècniques que utilitzes actualment.

Com ja s'haurà adonat, el to d'aquest llibre és una mica diferent al de molts altres llibres acadèmics. Això és intencional. Aquest llibre va sorgir d'un seminari de postgrau sobre ciències socials computacionals que he impartit a Princeton al Departament de Sociologia des de 2007 i m'agradaria que capturés part de l'energia i l'emoció d'aquest seminari. En particular, vull que aquest llibre tingui tres característiques: vull que sigui útil, orientat al futur i optimista.

Útil : el meu objectiu és escriure un llibre que us sigui útil. Per tant, vaig a escriure en un estil obert, informal i orientat a l'exemple. Això és perquè el més important que vull transmetre és una determinada forma de pensar sobre la recerca social. I, la meva experiència suggereix que la millor manera de transmetre aquesta manera de pensar és informal i amb molts exemples. A més, al final de cada capítol, tinc una secció anomenada "Què llegir més endavant" que us ajudarà a transitar-se a lectures més detallades i tècniques sobre molts dels temes que introdueixo. Al final, espero que aquest llibre us ajudi tant a investigar com a avaluar la recerca dels altres.

Orientat al futur : aquest llibre us ajudarà a fer una recerca social utilitzant els sistemes digitals que existeixen actualment i els que es crearan en el futur. Vaig començar a fer aquest tipus de recerca el 2004, i des de llavors he vist molts canvis, i estic segur que al llarg de la vostra carrera també veureu molts canvis. El truc per mantenir-se rellevant davant el canvi és l' abstracció . Per exemple, aquest no serà un llibre que us ensenyi exactament com utilitzar l'API de Twitter tal com existeix avui; en canvi, us ensenyarà a aprendre de grans fonts de dades (capítol 2). Aquest no serà un llibre que us proporcioni instruccions pas a pas per executar experiments en Amazon Mechanical Turk; en canvi, us ensenyarà a dissenyar i interpretar experiments que es basen en la infraestructura d'edat digital (capítol 4). A través de l'ús de l'abstracció, espero que aquest sigui un llibre atemporal sobre un tema oportú.

Optimista : les dues comunitats que aquest llibre incorpora: científics socials i científics de dades, tenen antecedents i interessos molt diferents. A més d'aquestes diferències relacionades amb la ciència, que parlo al llibre, també he notat que aquestes dues comunitats tenen estils diferents. Els científics de les dades generalment estan entusiasmats; tendeixen a veure el got com a mig ple. Els científics socials, en canvi, són generalment més crítics; tendeixen a veure el got com a mig buit. En aquest llibre, vaig a adoptar el to optimista d'un científic de dades. Així doncs, quan presento exemples, us explicaré el que m'agrada d'aquests exemples. I, quan assenyalés els problemes amb els exemples, i ho faré perquè cap investigació és perfecta, intentaré assenyalar aquests problemes d'una manera positiva i optimista. No vaig a ser crític per ser crítics: vaig a ser crític perquè puc ajudar-te a crear una millor recerca.

Encara estem en els primers temps de la investigació social en l'era digital, però he vist alguns malentesos que són tan comuns que té sentit per a mi abordar-los aquí, en el prefaci. A partir de científics de dades, he vist dos malentesos comuns. El primer és pensar que més dades resolen problemes automàticament. No obstant això, per a la investigació social, aquesta no ha estat la meva experiència. De fet, per a la investigació social, les millors dades, a diferència de més dades, semblen més útils. El segon malentès que he vist dels científics de la informació està pensant que la ciència social és només un munt de xerrades extravagants embolicades al voltant del sentit comú. Per descomptat, com a científic social, més concretament com a sociòleg, no estic d'acord amb això. Les persones intel·ligents han estat treballant dur per entendre el comportament humà durant molt de temps, i sembla imprudent ignorar la saviesa acumulada a partir d'aquest esforç. La meva esperança és que aquest llibre us ofereix una mica d'aquesta saviesa d'una manera fàcil d'entendre.

Des dels científics socials, també he vist dos malentesos comuns. En primer lloc, he vist que algunes persones escriuen tota la idea de la investigació social utilitzant les eines de l'era digital a causa d'uns pocs papers dolents. Si esteu llegint aquest llibre, probablement ja hàgiu llegit un munt de documents que utilitzen les dades de les xarxes socials de manera banal o incorrecta (o ambdós). Jo també tinc. Tanmateix, seria un greu error concloure a partir d'aquests exemples que tota la investigació social en edat digital és dolenta. De fet, probablement també haureu llegit un munt de documents que utilitzen dades de l'enquesta de manera banal o incorrecta, però no s'esborra tota la investigació mitjançant enquestes. Això és perquè sabeu que hi ha una gran investigació feta amb dades d'enquestes i, en aquest llibre, us mostraré que també hi ha una gran investigació feta amb les eines de l'era digital.

El segon malentès comú que he vist dels científics socials és confondre el present amb el futur. Quan avaluem la investigació social en l'era digital -la investigació que vaig a descriure-, és important que ens plantegem dues preguntes diferents: "Què tan bé funciona aquest tipus d'investigació en aquest moment?" I "Com serà aquest estil de treballs de recerca en el futur? ". Els investigadors estan capacitats per respondre la primera pregunta, però per a aquest llibre crec que la segona pregunta és més important. És a dir, tot i que la investigació social en l'era digital encara no ha produït aportacions intel·lectuals massives i canviants de paradigmes, la taxa de millora de la recerca en edat digital és increïblement ràpida. És aquesta taxa de canvi, més que el nivell actual, que fa que la investigació en edat digital sigui tan emocionant per a mi.

Tot i que aquest darrer paràgraf pot semblar oferir-vos riqueses potencials en algun moment no especificat en el futur, el meu objectiu no és vendre'l en cap tipus de recerca particular. Personalment, no tinc accions a Twitter, a Facebook, a Google, a Microsoft, a Apple ni a cap altra empresa tecnològica (tot i que, per a la seva total divulgació, he de dir que he treballat o he rebut finançament d'investigació de Microsoft, Google i Facebook). Al llarg del llibre, per tant, el meu objectiu és seguir sent un narrador creïble, explicant-vos totes les novetats emocionants que us sigui possible, mentre us guiat des d'uns quants paranys que he vist que altres cauen (i de tant en tant cauen a mi mateix) .

La intersecció de les ciències socials i les ciències de la informació es denomina de vegades "ciències socials computacionals". Alguns consideren que aquest és un camp tècnic, però aquest no serà un llibre tècnic en sentit tradicional. Per exemple, no hi ha equacions en el text principal. Vaig triar escriure el llibre d'aquesta manera perquè volia proporcionar una visió integral de la investigació social en l'era digital, incloent grans fonts de dades, enquestes, experiments, col · laboració massiva i ètica. Va resultar impossible cobrir tots aquests temes i proporcionar detalls tècnics sobre cadascun d'ells. En canvi, els indicadors de més material tècnic es donen a la secció "Què es llegeix a continuació" al final de cada capítol. En altres paraules, aquest llibre no està dissenyat per ensenyar-vos com fer un càlcul específic; més aviat, està dissenyat per canviar la forma en què penses sobre la investigació social.

Com utilitzar aquest llibre en un curs

Com he dit abans, aquest llibre va sorgir en part d'un seminari de postgrau sobre ciències socials computacionals que he estat ensenyant des de 2007 a Princeton. Com que podria estar pensant en utilitzar aquest llibre per ensenyar un curs, vaig pensar que podria ser útil per a mi explicar com va sortir del meu curs i com imagino que s'utilitzava en altres cursos.

Durant diversos anys, vaig ensenyar el meu curs sense un llibre; Acabo d'assignar una col·lecció d'articles. Tot i que els estudiants van poder aprendre d'aquests articles, els articles sols no van conduir als canvis conceptuals que esperava crear. Per tant, passaria la major part del temps a classe proporcionant perspectiva, context i consells per ajudar els estudiants a veure el panorama general. Aquest llibre és el meu intent d'anotar tota aquesta perspectiva, context i consell d'una manera que no té prerequisits, ja sigui en ciències socials o en ciències de la informació.

En un curs de sis mesos, us recomanaria que es combinin aquest llibre amb diverses lectures addicionals. Per exemple, aquest tipus de curs pot passar dues setmanes en experiments i es pot comparar el capítol 4 amb lectures sobre temes com el paper de la informació de pretractament en el disseny i l'anàlisi d'experiments; qüestions estadístiques i informàtiques plantejades per proves a gran escala A / B a les empreses; disseny d'experiments específicament centrats en els mecanismes; i qüestions pràctiques, científiques i ètiques relacionades amb l'ús de participants en mercats laborals en línia, com Amazon Mechanical Turk. També es pot combinar amb lectures i activitats relacionades amb la programació. L'elecció apropiada entre aquests molts possibles emparejaments depèn dels estudiants del vostre curs (per exemple, llicenciatura, màster o doctorat), els seus antecedents i els seus objectius.

Un curs de semestre també podria incloure conjunts setmanals de problemes. Cada capítol té una varietat d'activitats etiquetades per un grau de dificultat: fàcil ( fàcil ), mitjà ( mitjà ), dur ( dur ), i molt dur ( molt dur ). A més, he etiquetat cada problema amb les habilitats que requereix: matemàtiques ( requereix matemàtiques ), codificació ( requereix codificació ), i la recopilació de dades ( recopilació de dades ). Finalment, he etiquetat algunes de les activitats que són les meves preferències personals ( el meu preferit ). Espero que dins d'aquesta diversa col·lecció d'activitats, trobareu algunes que siguin adequades per als vostres estudiants.

Per ajudar a persones que utilitzen aquest llibre en cursos, he començat una col·lecció de materials didàctics com ara programes, diapositives, combinacions recomanades per a cada capítol i solucions a algunes activitats. Podeu trobar aquests materials i contribuir-hi a http://www.bitbybitbook.com.