lagyan ng paunang salita

Ang aklat na ito ay nagsimula noong 2005 sa isang basement sa Columbia University. Noong panahong iyon, ako ay nagtapos na estudyante, at nagpapatakbo ako ng online na eksperimento na sa kalaunan ay magiging aking disertasyon. Sasabihin ko sa iyo ang lahat tungkol sa mga siyentipikong bahagi ng eksperimento sa kabanata 4, ngunit ngayon sasabihin ko sa iyo ang tungkol sa isang bagay na wala sa aking disertasyon o sa alinman sa aking mga papel. At ito ay isang bagay na sa panimula nagbago kung paano sa tingin ko tungkol sa pananaliksik. Isang umaga, nang pumasok ako sa opisina ng basement ko, natuklasan ko na sa loob ng isang gabi ang tungkol sa 100 katao mula sa Brazil ay lumahok sa aking eksperimento. Ang simpleng karanasan na ito ay may malaking epekto sa akin. Sa oras na iyon, nagkaroon ako ng mga kaibigan na nagpapatakbo ng mga tradisyunal na mga eksperimento sa lab, at alam ko kung gaano kahirap na magtrabaho silang mag-recruit, mag-supervise, at magbayad ng mga tao upang lumahok sa mga eksperimentong ito; kung maaari silang magpatakbo ng 10 mga tao sa isang araw, ito ay mahusay na pag-unlad. Gayunpaman, sa aking online na eksperimento, 100 ang lumahok habang natutulog ako . Ang pagsasagawa ng iyong pananaliksik habang ikaw ay natutulog ay maaaring magaling na mabuti upang maging totoo, ngunit hindi. Ang mga pagbabago sa teknolohiya-partikular na ang paglipat mula sa analog na edad hanggang sa digital age-ay nangangahulugan na maaari na nating kolektahin at pag-aralan ang social data sa mga bagong paraan. Ang aklat na ito ay tungkol sa paggawa ng panlipunang pananaliksik sa mga bagong paraan.

Ang aklat na ito ay para sa mga sosyal na siyentipiko na gustong gumawa ng higit pang agham sa data, siyentipiko ng data na gustong gumawa ng higit pang agham sa lipunan, at sinumang interesado sa hybrid ng dalawang larangan na ito. Dahil kung sino ang libro na ito ay para sa, dapat itong pumunta nang walang sinasabi na ito ay hindi lamang para sa mga mag-aaral at mga propesor. Kahit na, kasalukuyan akong nagtatrabaho sa isang unibersidad (Princeton), nagtrabaho din ako sa gobyerno (sa US Census Bureau) at sa industriya ng tech (sa Microsoft Research) kaya alam ko na may napakaraming nakakaganyak na pananaliksik na nangyayari sa labas ng unibersidad. Kung sa tingin mo kung ano ang iyong ginagawa bilang panlipunan pananaliksik, pagkatapos ay ang aklat na ito ay para sa iyo, kahit na kung saan ka nagtatrabaho o kung anong uri ng mga diskarte na kasalukuyang ginagamit mo.

Tulad ng maaaring napansin mo na, ang tono ng aklat na ito ay medyo naiiba mula sa maraming iba pang mga akademikong aklat. Iyon ang intensyonal. Ang aklat na ito ay lumitaw mula sa isang graduate seminar tungkol sa computational social science na itinuro ko sa Princeton sa Kagawaran ng Sosyolohiya mula noong 2007, at gusto ko ito upang makuha ang ilan sa enerhiya at kaguluhan mula sa seminar na iyon. Sa partikular, gusto kong magkaroon ng tatlong mga katangian ang aklat na ito: Nais kong maging kapaki-pakinabang, pang-hinaharap, at maasahan.

Nakatutulong : Ang aking layunin ay sumulat ng isang aklat na makatutulong para sa iyo. Samakatuwid, isusulat ko sa isang bukas, impormal, at halimbawa-driven na estilo. Iyan ay dahil ang pinakamahalagang bagay na nais kong ihatid ay isang tiyak na paraan ng pag-iisip tungkol sa panlipunang pananaliksik. At, ang aking karanasan ay nagpapahiwatig na ang pinakamahusay na paraan upang maipahatid ang ganitong paraan ng pag-iisip ay impormal at may maraming mga halimbawa. Gayundin, sa dulo ng bawat kabanata, mayroon akong isang seksyon na tinatawag na "Ano ang babasahin sa susunod" na makakatulong sa iyong paglipat sa mas detalyado at teknikal na pagbabasa sa maraming mga paksa na aking ipakilala. Sa huli, inaasahan kong ang aklat na ito ay tutulong sa iyo na gawin ang pananaliksik at suriin ang pananaliksik ng iba.

Hinaharap-oriented : Ang aklat na ito ay tutulong sa iyo na gumawa ng panlipunang pananaliksik gamit ang mga digital na sistema na umiiral ngayon at ang mga gagawin sa hinaharap. Nagsimula ako sa paggawa ng ganitong uri ng pananaliksik noong 2004, at mula noon nakita ko ang maraming pagbabago, at sigurado ako na sa buong kurso ng iyong karera ay makikita mo rin ang maraming mga pagbabago. Ang lansihin upang manatiling may kaugnayan sa mukha ng pagbabago ay abstraction . Halimbawa, hindi ito magiging isang libro na nagtuturo sa iyo nang eksakto kung paano gamitin ang Twitter API bilang umiiral na ngayon; sa halip, ito ay magtuturo sa iyo kung paano matutunan mula sa mga malalaking pinagmumulan ng data (kabanata 2). Hindi ito magiging isang libro na nagbibigay sa iyo ng sunud-sunod na mga tagubilin para sa pagpapatakbo ng mga eksperimento sa Amazon Mechanical Turk; sa halip, ito ay magtuturo sa iyo kung paano mag-disenyo at magpakahulugan ng mga eksperimento na umaasa sa imprastraktura ng digital age (kabanata 4). Sa pamamagitan ng paggamit ng abstraction, Umaasa ako na ito ay magiging walang hanggang aklat sa isang napapanahong paksa.

Optimista : Ang dalawang komunidad na isinagawa ng aklat na ito-mga social scientist at siyentipiko ng data-ay may iba't ibang mga pinagmulan at interes. Bilang karagdagan sa mga agham na may kinalaman sa pagkakaiba, na aking pinag-uusapan sa aklat, napansin ko rin na ang dalawang komunidad na ito ay may iba't ibang mga estilo. Ang mga siyentipiko ng data sa pangkalahatan ay nasasabik; malamang na makita nila ang salamin bilang kalahati na puno. Ang mga sosyal na siyentipiko, sa kabilang banda, sa pangkalahatan ay mas kritikal; malamang na makita nila ang salamin bilang kalahating walang laman. Sa aklat na ito, tatanggapin ko ang tono ng optimistiko ng siyentipikong datos. Kaya, kapag nagpapakita ako ng mga halimbawa, sasabihin ko sa iyo kung ano ang iniibig ko tungkol sa mga halimbawang ito. At, kapag itinuturo ko ang mga problema sa mga halimbawa-at gagawin ko iyan dahil walang perpektong pananaliksik-sisikapin kong ituro ang mga problemang ito sa isang paraan na positibo at may pag-asa. Hindi ako magiging kritikal para sa pagiging kritikal-ako'y magiging kritikal upang matulungan kita na lumikha ng mas mahusay na pananaliksik.

Kami pa rin sa mga unang araw ng panlipunang pananaliksik sa digital age, ngunit nakita ko ang ilang mga hindi pagkakaunawaan na karaniwan na makatwiran para sa akin na matugunan ang mga ito dito, sa paunang salita. Mula sa mga siyentipiko ng data, nakita ko ang dalawang karaniwang hindi pagkakaunawaan. Ang una ay nag-iisip na ang mas maraming data ay awtomatikong malulutas ang mga problema. Gayunpaman, para sa panlipunan pananaliksik, na hindi pa ang aking karanasan. Sa katunayan, para sa panlipunang pagsasaliksik, ang mas mahusay na data-na taliwas sa mas maraming data-ay tila mas nakatutulong. Ang pangalawang hindi pagkakaunawaan na nakita ko mula sa data ng mga siyentipiko ay nag-iisip na ang agham panlipunan ay lamang ng isang bungkos ng magarbong talk balot sa paligid ng sentido komun. Siyempre, bilang isang social scientist-mas partikular na sociologist-hindi ako sang-ayon dito. Ang mga taong matalino ay nagsisikap na maunawaan ang pag-uugali ng tao sa loob ng mahabang panahon, at tila hindi maalam na huwag pansinin ang karunungan na naipon mula sa pagsisikap na ito. Ang aking pag-asa ay ang aklat na ito ay mag-aalok sa iyo ng ilan sa karunungan na iyon sa isang paraan na madaling maunawaan.

Mula sa mga social scientist, nakikita ko rin ang dalawang karaniwang hindi pagkakaunawaan. Una, nakita ko ang ilang mga tao na isulat ang buong ideya ng panlipunang pananaliksik gamit ang mga tool ng digital age dahil sa ilang mga masamang papel. Kung binabasa mo ang aklat na ito, malamang na nabasa mo ang isang pangkat ng mga papel na gumagamit ng data ng social media sa mga paraan na banal o mali (o pareho). Mayroon din ako. Gayunpaman, ito ay isang malubhang pagkakamali upang tapusin mula sa mga halimbawang ito na ang lahat ng digital-age social research ay masama. Sa katunayan, malamang na basahin mo rin ang isang pangkat ng mga papel na gumagamit ng data ng survey sa mga paraan na banal o mali, ngunit hindi mo isinusulat ang lahat ng pananaliksik gamit ang mga survey. Iyon ay dahil alam mo na may mahusay na pananaliksik na ginawa sa data ng survey, at sa aklat na ito ipapakita ko sa iyo na mayroon ding mahusay na pananaliksik na ginawa sa mga tool ng digital na edad.

Ang ikalawang karaniwang hindi pagkakaunawaan na nakita ko mula sa mga sosyal na siyentipiko ay upang lituhin ang kasalukuyan sa hinaharap. Kapag tinitingnan natin ang panlipunang pananaliksik sa digital age-ang pananaliksik na ilalarawan ko-mahalaga na magtanong tayo ng dalawang magkakaibang tanong: "Gaano kahusay ang estilo ng pananaliksik na ito sa ngayon?" At "Kung gaano kahusay ang estilo ng pananaliksik sa hinaharap? "Ang mga mananaliksik ay sinanay upang sagutin ang unang tanong, ngunit para sa aklat na ito sa tingin ko ang pangalawang tanong ay mas mahalaga. Iyon ay, bagaman ang panlipunan na pananaliksik sa digital na edad ay hindi pa nagagawa ng napakalaking, ang mga pagbabago sa intelektwal na pagbabago ng paradigma, ang rate ng pagpapabuti ng digital-age na pananaliksik ay napakabilis na mabilis. Ito ang rate ng pagbabago-higit pa sa kasalukuyang antas-na nagpapalaki ng pananaliksik sa digital na edad na napakasaya sa akin.

Kahit na ang huling talata ay maaaring tila nag-aalok sa iyo ng potensyal na kayamanan sa ilang mga hindi natukoy na oras sa hinaharap, ang aking layunin ay hindi magbenta sa iyo sa anumang partikular na uri ng pananaliksik. Hindi ko personal na namamahagi sa Twitter, Facebook, Google, Microsoft, Apple, o anumang iba pang mga kumpanya ng tech (bagaman, alang-alang sa buong pagsisiwalat, dapat kong banggitin na ako ay nagtrabaho sa, o nakatanggap ng pananaliksik na pagpopondo mula sa, Microsoft, Google, at Facebook). Sa kabuuan ng libro, samakatuwid, ang aking layunin ay upang manatiling isang kapani-paniwala na tagapagsalaysay, na nagsasabi sa iyo tungkol sa lahat ng mga kapana-panabik na bagong bagay na posible, habang pinatnubayan ka mula sa ilang mga bitag na nakita kong nahuhulog sa iba (at paminsan-minsan ay nahulog sa sarili ko) .

Ang intersection ng agham panlipunan at agham ng data ay minsan tinatawag na computational social science. Iniisip ng ilan na ito ay isang teknikal na larangan, ngunit hindi ito isang teknikal na aklat sa tradisyonal na kahulugan. Halimbawa, walang mga equation sa pangunahing teksto. Pinili kong isulat ang libro sa ganitong paraan dahil nais kong magbigay ng komprehensibong pagtingin sa panlipunang pananaliksik sa digital age, kabilang ang malalaking data source, survey, eksperimento, pakikipagtulungan ng masa, at etika. Ito ay naging imposible upang masakop ang lahat ng mga paksang ito at magbigay ng mga teknikal na detalye tungkol sa bawat isa. Sa halip, ang mga payo sa higit pang teknikal na materyal ay ibinibigay sa seksyon na "Ano ang babasahin sa susunod" sa dulo ng bawat kabanata. Sa ibang salita, ang aklat na ito ay hindi idinisenyo upang magturo sa iyo kung paano gumawa ng anumang partikular na pagkalkula; sa halip, ito ay dinisenyo upang baguhin ang paraan na iniisip mo tungkol sa panlipunang pananaliksik.

Paano gamitin ang aklat na ito sa isang kurso

Tulad ng sinabi ko mas maaga, ang aklat na ito ay lumabas sa bahagi mula sa isang graduate seminar tungkol sa computational social science na nagtuturo ko mula noong 2007 sa Princeton. Sapagkat maaari kang mag-isip tungkol sa paggamit ng aklat na ito upang magturo ng isang kurso, naisip ko na maaaring makatulong sa akin na ipaliwanag kung paano ito lumago mula sa aking kurso at kung paano ko isipin na ginagamit ito sa iba pang mga kurso.

Sa loob ng maraming taon, itinuro ko ang aking kurso nang walang libro; Gusto ko lamang magtalaga ng isang koleksyon ng mga artikulo. Habang natututo ang mga mag-aaral mula sa mga artikulong ito, ang mga artikulo ay nag-iisa ay hindi humahantong sa mga haka-haka na mga pagbabago na umaasa sa akin upang lumikha. Kaya gugugulin ko ang karamihan ng oras sa klase na nagbibigay ng pananaw, konteksto, at payo upang matulungan ang mga mag-aaral na makita ang malaking larawan. Ang aklat na ito ang aking pagtatangka na isulat ang lahat ng pananaw, konteksto, at payo sa isang paraan na walang mga kinakailangan - sa mga tuntunin ng alinman sa social science o data science.

Sa isang semestre-long course, Gusto ko inirerekumenda pagpapares sa aklat na ito na may iba't ibang mga karagdagang pagbabasa. Halimbawa, maaaring tumagal ang naturang kurso ng dalawang linggo sa mga eksperimento, at maaari mong ipares ang kabanata 4 sa mga pagbabasa sa mga paksa tulad ng papel na ginagampanan ng impormasyon sa pag-aalaga sa disenyo at pagtatasa ng mga eksperimento; istatistika at computational mga isyu na nakataas sa pamamagitan ng malakihang A / B na mga pagsusulit sa mga kumpanya; disenyo ng mga eksperimento partikular na nakatuon sa mga mekanismo; at praktikal, pang-agham, at etikal na mga isyu na may kaugnayan sa paggamit ng mga kalahok mula sa mga online na labor market, tulad ng Amazon Mechanical Turk. Maaari rin itong ipares sa pagbabasa at mga aktibidad na may kaugnayan sa programming. Ang naaangkop na pagpipilian sa pagitan ng maraming posibleng pairings ay depende sa mga mag-aaral sa iyong kurso (halimbawa, undergraduate, master's, o PhD), ang kanilang mga pinagmulan, at ang kanilang mga layunin.

Ang isang semestre-length course ay maaari ring isama ang lingguhang problema set. Ang bawat kabanata ay may iba't ibang mga gawain na may label na antas ng kahirapan: madali ( madali ), daluyan ( daluyan ), mahirap ( mahirap ), at napakahirap ( napakahirap ). Gayundin, binanggit ko ang bawat problema sa pamamagitan ng mga kasanayan na kinakailangan nito: math ( nangangailangan ng matematika ), coding ( nangangailangan ng coding ), at pagkolekta ng data ( pagkolekta ng data ). Sa wakas, na-label ko ang ilan sa mga aktibidad na aking mga personal na paborito ( Paborito ko ). Umaasa ako na sa loob ng magkakaibang koleksyon ng mga aktibidad, makikita mo ang ilan na angkop para sa iyong mga mag-aaral.

Upang matulungan ang mga tao na gumamit ng aklat na ito sa mga kurso, nagsimula ako ng isang koleksyon ng mga materyales sa pagtuturo tulad ng mga syllabus, mga slide, mga pinapayong mga pairing para sa bawat kabanata, at mga solusyon sa ilang mga gawain. Makakahanap ka ng mga materyales na ito-at mag-ambag sa kanila-sa http://www.bitbybitbook.com.