Előszó

Ez a könyv 2005-ben kezdődött egy pincében a Columbia Egyetemen. Abban az időben végzős hallgató voltam, és egy online kísérletet futtattam, amely végül a disszertációm lett. Mindent elmondok a kísérlet 4. részének tudományos részéről, de most elmondom neked valamit, ami nem szerepel a disszertációmban, sem az egyik papíron. És ez valami alapvetően megváltoztatta, hogyan gondolkodom a kutatásról. Egy reggel, amikor beérkeztem az alvóhelyembe, felfedeztem, hogy egy nap folyamán mintegy 100 brazil ember vett részt a kísérletemben. Ez az egyszerű tapasztalat mélyreható hatással volt rám. Abban az időben barátaim voltak, akik hagyományos laboratóriumi kísérleteket folytattak, és tudtam, milyen nehéz munkát vállalni, hogy felügyelni és fizetni az embereket, hogy vegyenek részt ezeken a kísérleteken; ha egy nap alatt 10 embert tudnának elindítani, ez jó előrelépés volt. Azonban online kísérletemmel 100 ember vett részt alvás közben . Az alvás közben végzett kutatások túl jónak tűnhetnek ahhoz, hogy igaz legyen, de ez nem így van. A technológiai változások - konkrétan az analóg korról a digitális korra való áttérés - azt jelentik, hogy most új adatokat gyűjthetünk és elemezhetünk a társadalmi adatokról. Ez a könyv arról szól, hogy a társadalomkutatást ezen új módokon végezzük.

Ez a könyv azoknak a társadalomtudósoknak szól, akik több adatkutatást akarnak, olyan tudósokat, akik több társadalmi tudást akarnak, és bárki, aki érdeklődik e két mező hibridje iránt. Tekintve, kinek van ez a könyve, magától értetődik, hogy ez nem csak a diákok és a tanárok számára. Bár jelenleg egy egyetemen dolgozom (Princeton), én is dolgoztam a kormányban (az Egyesült Államok Népszámlálási Hivatalában) és a tech-iparban (a Microsoft Research-ben), így tudom, hogy sok izgalmas kutatás folyik kívülről egyetemeken. Ha úgy gondolja, hogy mit csinálsz, mint társadalmi kutatás, akkor ez a könyv az Ön számára, függetlenül attól, hol dolgozik, vagy milyen technikákat használ.

Amint azt már észrevetted, a könyv hangja egy kicsit más, mint sok más akadémiai könyv. Ez szándékos. Ez a könyv egy számítástechnikai társadalomtudományi posztgraduális szemináriumon merült fel, amelyet 2007-ben a Princeton-ban tanítottak a Szociológiai Tanszéken, és szeretném megragadni az energiáról és az izgalomról szóló szemináriumot. Különösen azt szeretném, ha a könyvnek három jellemzője lenne: szeretnék hasznosnak, jövőorientáltnak és optimistanak lenni.

Hasznos : Célom egy olyan könyv megírása, amely hasznos az Ön számára. Ezért nyílt, informális és példamutató stílusban fogok írni. Ez azért van, mert a legfontosabb dolog, amit közölni szeretnék, egyfajta gondolkodás a társadalmi kutatásra. És tapasztalatom azt sugallja, hogy a gondolkodás legjobb módja az informális és sok példa. Továbbá, minden egyes fejezet végén egy "Mi olvasható legközelebb" című fejezetet találsz, amely segít a részletesebb és technikai olvasmányok átgondolásában sok olyan témában, amelyet bevezettek. Végül remélem, hogy ez a könyv segít Önnek mind a kutatásban, mind a mások kutatásának értékelésében.

Jövőorientált : Ez a könyv segít a társadalomkutatásban a ma létező digitális rendszerek és a jövőben létrehozandó digitális rendszerek felhasználásával. 2004-ben elkezdtem ezt a fajta kutatást elvégezni, és azóta sok változást láttam, és biztos vagyok benne, hogy a karriered során sok változást is láthatsz. A trükk, hogy a változtatások szempontjából releváns maradjon, az absztrakció . Például ez nem lesz olyan könyv, amely pontosan megtanítja, hogyan kell használni a Twitter API-t, ahogy ma létezik; ehelyett meg fogja tanítani, hogyan lehet megtanulni a nagy adatforrásokból (2. fejezet). Ez nem lesz olyan könyv, amely lépésről lépésre útmutatást ad az Amazon Mechanical Turk kísérletezéséhez; hanem azt fogja megtanítani, hogyan tervezzen és interpretálhasson olyan kísérleteket, amelyek a digitális kor infrastruktúrájára támaszkodnak (4. fejezet). Az absztrakció használatával remélem, hogy ez egy időszerű könyv egy időszerű téma.

Optimista : A két közösség, amelyre ez a könyv foglalkozik - a társadalomtudósok és az adatkutatók - nagyon eltérő hátteret és érdekeket képviselnek. A tudományhoz kapcsolódó különbségek mellett, amelyekről a könyvben beszélek, azt is észrevettem, hogy ez a két közösség különböző stílusokkal rendelkezik. Az adatok tudósai általában izgatottak; általában félig telt az üveg. A társadalomtudósok viszont általában kritikusabbak; az üvegt félig üresen látják. Ebben a könyvben egy adatkutató optimista hangját fogom elfogadni. Tehát, amikor példákat mutatok be, elmondom neked, hogy mit szeretek ezekről a példákról. És amikor rámutatok a példákkal kapcsolatos problémákra - és ezt megteszem, mert egyetlen kutatás sem tökéletes - igyekszem pozitívan és optimistán megmutatni ezeket a problémákat. Nem leszek létfontosságú a kritika szempontjából - kritikus leszek, hogy segítsek neked jobb kutatásokat létrehozni.

Még mindig a digitális korszak társadalomkutatásának korai napjaiban vagyunk, de láttam olyan félreértéseket, amelyek annyira gyakoriak, hogy számomra itt érdemes foglalkozni velük az előszóban. Az adatok tudósairól két gyakori félreértést láttam. Az első azt gondolja, hogy több adat automatikusan megoldja a problémákat. Azonban a társadalmi kutatások esetében ez nem volt tapasztalatom. Tény, hogy a társadalomkutatás számára a jobb adatok - ellentétben az adatokkal - sokkal hasznosabbnak tűnnek. A második félreértés, amit az adatgyűjtőktől láttam, azt gondolja, hogy a társadalomtudomány csak egy csomó fantáziadús beszéd a józan ész köré. Természetesen, mint társadalomtudós, pontosabban szociológusként, ezzel nem értek egyet. Az okos emberek keményen dolgoztak, hogy hosszú ideig megértsék az emberi viselkedést, és bölcs dolog figyelmen kívül hagyni ezt az erőfeszítésből felhalmozott bölcsességet. Remélem, hogy ez a könyv olyan bölcsességet kínál, amely könnyen érthető.

A társadalomtudósok közül két gyakori félreértést is láttam. Először is láttam, hogy néhány ember leírja a társadalomkutatás teljes elképzelését a digitális korszak eszközeivel, néhány rossz cikk miatt. Ha elolvassa ezt a könyvet, akkor valószínűleg már elolvasta egy csomó papírt, amelyek a banki vagy rossz (vagy mindkettő) módon használják a közösségi médiaadatokat. Nekem is van. Ugyanakkor komoly hiba lenne ebből a példából arra következtetni, hogy a digitális korosztályú társadalmi kutatások rosszak. Tény, hogy valószínűleg olvastam egy csomó papírt, amely felmérési adatokat használ banálisan vagy rosszul, de nem ír le minden kutatásról felmérések alapján. Ez azért van, mert tudjátok, hogy nagyszerű kutatást végeznek a felmérési adatokkal, és ebben a könyvben meg fogom mutatni neked, hogy a digitális korszak eszközeivel is nagyszerű kutatást végeztek.

A második közös félreértés, amelyet a társadalomtudósoktól láttam, összekeverni a jelenet a jövővel. Amikor a digitális korszak társadalmi kutatását értékeljük - az a kutatás, amelyet leírni fogok - fontos, hogy két különböző kérdést tegyünk fel: "Mennyire jól működik ez a kutatási stílus jelenleg?" És "Mennyire jó lesz ez a stílus kutatómunkát a jövőben? "A kutatók felkészültek az első kérdés megválaszolására, de erre a könyvre azt hiszem, a második kérdés sokkal fontosabb. Vagyis annak ellenére, hogy a digitális korszak társadalmi kutatása még nem hozott létre hatalmas, paradigmaváltó szellemi hozzájárulásokat, a digitális korhatár-kutatás javulásának sebessége hihetetlenül gyors. Ez a változás mértéke - több, mint a jelenlegi szint - ez teszi a digitális korhatárkutatást ilyen izgalmasnak számomra.

Annak ellenére, hogy ez az utolsó bekezdés valószínűleg potenciális gazdagságot kínál a jövőben bizonyos meghatározatlan időre, a célom nem az, hogy Ön eladja Önt egy adott típusú kutatásban. Nem személyesen vannak saját részvényei a Twitteren, a Facebookon, a Google-on, a Microsoftban, az Apple-nél vagy bármely más tech cégnél (bár a teljes nyilvánosságra hozatal érdekében meg kell említenem, hogy a Microsoft, Google és Facebook). A könyveimben tehát a célom, hogy hiteles narrátor maradjon, elmondjam neked az összes izgalmas új dolgot, ami lehetséges, miközben elvezem néhány apró csapdát, hogy láttam, hogy mások (esetenként magamba esnek) .

A társadalomtudomány és az adatkutatás kereszteződését néha számítási társadalomtudománynak nevezik. Néhányan ezt technikai területnek tartják, de ez nem lesz hagyományos értelemben vett technikai könyv. Például a fő szövegben nincsenek egyenletek. Úgy döntöttem, hogy így írom a könyvet, mert átfogó képet akartam nyújtani a digitális korszakban a társadalomkutatásról, beleértve a nagy adatforrásokat, felméréseket, kísérleteket, tömeges együttműködést és etikát. Kiderült, hogy lehetetlen ezeket a témákat lefedni és technikai részleteket szolgáltatni mindegyikről. Ehelyett a több technikai anyagra mutató hivatkozásokat az egyes fejezetek végén a "Mi a következő olvasás" szakasz tartalmazza. Más szavakkal, ez a könyv nem arra szolgál, hogy megtanítsa, hogyan kell elvégeznie a konkrét számításokat; inkább úgy tervezték, hogy megváltoztassa azt a módot, ahogyan a társadalmi kutatásra gondol.

Hogyan használhatom ezt a könyvet egy tanfolyamon?

Mint korábban említettem, ez a könyv részben egy számítástechnikai társadalomtudományi posztgraduális szemináriumon merült fel, amelyet 2007 óta Princetonnál tanítok. Mivel gondolhatsz arra, hogy ezt a könyvet tanítani tanítasz, azt gondoltam, hogy segíthet nekem, hogy elmagyarázzam, hogyan fejlődött ki az én pályámból, és hogyan képzelem, hogy más kurzusokban is használják.

Több évet tanítottam a könyvem nélkül; Csak egy cikkgyűjteményt rendelnék hozzá. Miközben a diákok képesek voltak tanulni ezekről a cikkekről, a cikkek önmagukban nem vezetett a fogalmi változásokhoz, amelyeket reménykedtem. Ezért a legtöbb időt az osztályban töltöm, amely perspektívát, kontextust és tanácsokat nyújt, hogy segítsen a diákoknak látni a nagy képet. Ez a könyv az a törekvésem, hogy minden olyan perspektívát, összefüggést és tanácsot leírjam, amelyre nincsenek előfeltevések - akár a társadalomtudomány, akár az adat tudomány tekintetében.

Egy féléves tanfolyamon azt javasolnám, hogy párosítsa ezt a könyvet számos további olvasással. Például egy ilyen tanfolyam kéthetes időt vehet igénybe a kísérletek során, és a 4. fejezetet összeolvashatja olyan témákkal, mint például az előkezelés információinak szerepe a kísérletek tervezésében és elemzésében; a nagyméretű A / B tesztek által a vállalatoknál felmerülő statisztikai és számítástechnikai kérdések; a mechanizmusokra összpontosító kísérletek megtervezése; valamint gyakorlati, tudományos és etikai kérdéseket az online munkaerőpiac résztvevőinek, például az Amazon Mechanical Turk-nak. Ez is párosítható a leolvasásokkal és a programozással kapcsolatos tevékenységekkel. A megfelelő választás e sok lehetséges párosítás között a tanuló hallgatóitól függ (pl. Egyetemi, mester vagy PhD), hátterét és céljait.

A féléves tanfolyam tartalmazhat heti problémás készleteket is. Minden fejezetnek számos tevékenysége van, amelyeket nehézséggel jelöltek meg: könnyű ( könnyen ), közepes ( közepes ), kemény ( kemény ), és nagyon nehéz ( nagyon nehéz ). Továbbá minden problémát a szükséges készségekkel jelöltem: matematika ( matematikai követelményt igényel ), kódolás ( kódolást igényel ) és adatgyűjtés ( adatgyűjtés ). Végül néhány olyan tevékenységet is megjelöltem, amelyek az én személyes kedvenceim ( a kedvencem ). Remélem, hogy ebben a sokszínű tevékenységek gyűjteményében megtalálja azokat, amelyek megfelelnek a hallgatóknak.

Annak érdekében, hogy segítséget nyújthassak a kurzusokat használó embereknek, elkezdtem egy olyan tananyagok anyagcserét, mint a tantervek, a diák, az egyes fejezetek ajánlott párosítása és néhány tevékenység megoldása. Ezek az anyagok találhatók - és hozzájárulhatnak hozzájuk - a http://www.bitbybitbook.com címen.