Гэтая кніга пачалася ў 2005 годзе ў падвале ў Калумбійскім універсітэце. У той час я быў аспірантам, і я быў запушчаны онлайн-эксперымент, які ў канчатковым рахунку стане дысертацыяй. Я раскажу вам усё пра навуковыя частках гэтага эксперыменту ў частцы 4, але цяпер я хачу расказаць вам пра што-то, што не ў маёй дысертацыі або ў якім-небудзь з маіх работ. І гэта тое, што ў корані змянілася, як я думаю аб даследаванні. Аднойчы раніцай, калі я прыйшоў у мой офіс у склепе, я выявіў, што на ноч каля 100 людзей з Бразіліі прынялі ўдзел у маім эксперыменце. Гэты просты вопыт аказаў глыбокае ўплыў на мяне. У той час у мяне былі сябры, якія былі пад кіраваннем традыцыйных эксперыментаў лабараторыі, і я ведаў, як цяжка ім даводзілася працаваць на працу, кантраляваць і плаціць людзям, каб удзельнічаць у гэтых эксперыментах; калі б яны маглі працаваць 10 чалавек у адзін дзень, гэта быў добры прагрэс. Аднак, з майго інтэрнэт - эксперыменце, 100 чалавек удзельнічалі ў той час як я спаў. Робячы сваё даследаванне падчас сну можа здацца занадта добра, каб быць праўдай, але гэта не так. Змены ў тэхналогіі спецыфічны пераходзе ад аналагавага ўзросту да лічбавага ўзроставага азначае, што зараз мы можам збіраць і аналізаваць сацыяльныя дадзеныя па-новаму. Гэтая кніга пра выкананне сацыяльных даследаванняў у гэтых новых адносінах.
Гэтая кніга прызначана для сацыёлагаў, якія хочуць зрабіць больш навуковыя дадзеныя, дадзеныя навукоўцаў, якія хочуць зрабіць больш сацыяльную навуку, і ўсе, хто зацікаўлены ў гібрыд гэтых двух палёў. Улічваючы, хто гэтая кніга для, яно павінна пайсці, не кажучы, што гэта не толькі для студэнтаў і выкладчыкаў. Хоць я ў цяперашні час працую ва ўніверсітэце (Princeton), я таксама працаваў ва ўрадзе (у Бюро перапісу насельніцтва ЗША) і ў індустрыі высокіх тэхналогій (у Microsoft Research), так што я ведаю, што ёсць шмат захапляльных даследаванні адбываюцца за межы універсітэты. Калі вы думаеце пра тое, што вы робіце, як сацыяльныя даследаванні, то гэтая кніга для вас, незалежна ад таго, дзе вы працуеце ці якія метады вы карыстаецеся ў цяперашні час.
Як вы, магчыма, ужо заўважылі, тон гэтай кнігі трохі адрозніваецца ад многіх іншых навуковых кніг. Гэта наўмысна. Гэтая кніга паўстала з выпускнога семінара па вылічальным грамадазнаўстве, што я выкладаў у Прынстане ў дэпартаменце сацыялогіі з 2007 года, і я хацеў бы, каб захапіць частку энергіі і рызыкі ад гэтага семінара. У прыватнасці, я хачу, каб гэтая кніга мае тры характарыстыкі: Я хачу, каб гэта было карысна, арыентаваным на будучыню, і аптымізмам.
Карысна: Мая мэта складаецца ў тым, каб напісаць кнігу, якая карысная для Вас. Таму я збіраюся напісаць у адкрытай, нефармальнай, і, напрыклад, кіраваны стыль. Гэта таму, што самае галоўнае, што я хачу перадаць гэта пэўны спосаб мыслення аб сацыяльных даследаванняў. І мой вопыт падказвае, што лепшы спосаб перадаць гэта спосаб мыслення нефармальна і з вялікай колькасцю прыкладаў. Акрамя таго, у канцы кожнай кіраўніка, у мяне ёсць раздзел пад назвай «Што чытаць далей», які дапаможа вам перайсці на больш падрабязныя і тэхнічныя паказанні па многіх тэмах, якія я прадстаўлю. У рэшце рэшт, я спадзяюся, што гэтая кніга дапаможа вам як зрабіць даследаванне і ацаніць даследаванне іншых.
Арыентаваная на будучыню: Гэтая кніга дапаможа вам зрабіць сацыяльныя даследаванні з выкарыстаннем лічбавых сістэм , якія існуюць сёння , і тыя , якія будуць створаны ў будучыні. Я пачаў рабіць такога роду даследавання ў 2004 годзе, і з таго часу я бачыў шмат змен, і я ўпэўнены, што на працягу сваёй кар'еры вы ўбачыце шмат змен таксама. Хітрасць , каб заставацца актуальнымі ва ўмовах змены з'яўляецца абстракцыяй. Напрыклад, гэта не будзе кніга, якая вучыць вас, як менавіта выкарыстоўваць API шчабятаць, як яна існуе сёння; замест гэтага, ён будзе вучыць вас, як атрымаць з вялікіх крыніц дадзеных (кіраўнік 2). Гэта не збіраецца быць кніга, якая дае вам крок за крокам інструкцыі для правядзення эксперыментаў на Amazon Mechanical Turk; замест гэтага, ён будзе вучыць вас, як праектаваць і інтэрпрэтаваць эксперыменты, якія належаць на лічбавы узроставай інфраструктуры (кіраўнік 4). Дзякуючы выкарыстанню абстракцыі, я спадзяюся, што гэта будзе бясконцая кніга па актуальнай тэме.
Аптымістычны: Дзве абшчыны , што гэтая кніга зачэпліваецца-грамадазнаўцы і дадзеныя навукоўцаў-вельмі розных слаёў і інтарэсаў. У дадатак да гэтых звязаных з навукай адрозненняў, пра якія я кажу ў кнізе, я таксама заўважыў, што гэтыя дзве абшчыны маюць розныя стылі. Навукоўцы дадзеных, як правіла, узбуджаюцца; яны схільныя бачыць шклянку напалову поўная. Сацыёлагі, з другога боку, як правіла, больш крытычныя; яны схільныя бачыць шклянку напалову пусты. У гэтай кнізе я збіраюся прыняць аптымістычны тон навукоўцаў дадзеных. Так што, калі я ўяўляю прыклады, я збіраюся расказаць вам, што я люблю аб гэтых прыкладах. І, калі я паказваюць на праблемы з прыкладамі, і я зраблю гэта, таму што ні адно даследаванне не з'яўляецца дасканалым, я збіраюся паспрабаваць ўказаць на гэтыя праблемы, такім чынам, што з'яўляецца станоўчым і аптымістычным. Я не буду крытыкаваць дзеля таго, каб быць крытычна-я будзе мець вырашальнае значэнне, так што я магу дапамагчы вам стварыць лепшую даследаванне.
Мы ўсё яшчэ ў першыя дні сацыяльных даследаванняў у эпоху лічбавых тэхналогій, але я бачыў некаторыя непаразуменні, якія настолькі часта, што гэта мае сэнс для мяне, каб звярнуцца да іх тут, у прадмове. Ад вучоных дадзеных, я бачыў два агульных непаразуменні. Першы думае, што больш дадзеных аўтаматычна вырашае праблемы. Тым не менш, для сацыяльных даследаванняў, які не быў мой вопыт. На самай справе, для сацыяльных даследаванняў, больш дакладныя дадзеныя, у адрозненне ад больш дадзеных, як уяўляецца, больш карысным. Другое непаразуменне, што я бачыў з навукоўцаў дадзеных думае, што сацыяльная навука проста куча фантазіі казаць абгорнутым вакол здаровага сэнсу. Вядома, як сацыяльны вучоны-больш канкрэтна, як сацыёлага-я не згодны з гэтым. Разумныя людзі ўпарта працавалі, каб зразумець паводзіны чалавека на працягу доўгага часу, і, здаецца, неразумна ігнараваць мудрасць, назапашаная ад гэтых намаганняў. Мая надзея складаецца ў тым, што гэтая кніга прапануе вам некаторыя з той мудрасці, такім чынам, што лёгка зразумець.
Ад грамадазнаўцаў, я таксама бачыў два агульных непаразуменні. Па-першае, я бачыў, што некаторыя людзі спісваюць ўсю ідэю сацыяльнага даследавання з дапамогай інструментаў лічбавага стагоддзя з-за некалькіх дрэнных работ. Калі вы чытаеце гэтую кнігу, вы, верагодна, ужо прачыталі кучу дакументаў, якія выкарыстоўваюць дадзеныя сацыяльную медыя спосабаў, якія з'яўляюцца банальнымі або няправільна (або абодва). Я таксама. Тым не менш, было б сур'ёзнай памылкай заключыць з гэтых прыкладаў, што ўсе лічбавыя ўзросту сацыяльныя даследаванні з'яўляецца дрэнным. На самай справе, вы, верагодна, таксама прачытаў кучу артыкулаў, якія выкарыстоўваюць дадзеныя абследаванняў спосабамі, якія з'яўляюцца банальным ці няправільна, але вы не спісваюць усё даследаванні з дапамогай апытанняў. Гэта таму, што вы ведаеце, што ёсць вялікае даследаванне, праведзенае з дадзенымі абследавання, і ў гэтай кнізе я збіраюся паказаць вам, што ёсць таксама вялікае даследаванне, праведзенае з інструментамі лічбавай эпохі.
Другое распаўсюджанае зман, што я бачыў з сацыяльных навукоўцаў блытаць сучаснае з будучым. Калі мы ацэньваем сацыяльныя даследаванні ў лічбавым узроставым даследаванні, якія я збіраюся апісаць, вельмі важна, што мы задаем два розных пытанні: "Як добра робіць гэты стыль даследчай працы прама цяпер» і «Як добра гэта будзе стыль навукова-даследчая праца ў будучыні? »Даследнікі навучаны, каб адказаць на першае пытанне, але для гэтай кнігі я думаю, што другое пытанне з'яўляецца больш важным. Гэта значыць, нават калі сацыяльныя даследаванні ў эпоху лічбавых тэхналогій яшчэ не вырабіў масіўнае, парадыгма якія змяняюць інтэлектуальны ўклад, тэмпы паляпшэння лічбавых ўзросту даследаванняў неверагодна хутка. Менавіта гэтая хуткасць змены-больш, чым бягучы ўзровень-што робіць лічбавыя ўзроставае даследаванне настолькі захапляльнае для мяне.
Нягледзячы на тое, што апошні пункт можа здацца, каб прапанаваць вам патэнцыйныя багацця ў нейкі няпэўны час у будучыні, мая мэта не прадаць вам на любым канкрэтным тыпе даследаванняў. Я асабіста не ўласныя акцыі ў Twitter, Facebook, Google, Microsoft, Apple або любой іншай тэхнічнай кампаніі (хоць, дзеля поўнага раскрыцця інфармацыі, я павінен адзначыць, што я працаваў, або атрымаў фінансаванне даследаванняў ад, Microsoft, Google і Facebook). На працягу ўсёй кнігі, таму мая мэта складаецца ў тым, каб заставацца надзейным апавядальнік, распавядаючы вам пра ўсіх захапляльных новых рэчах, якія можна, у той час як накіроўваючы вас ад некалькіх пастак, якія я бачыў, іншыя трапіць у (а часам і ўпала ў сябе) ,
Скрыжаванне сацыяльнай навукі і навукі дадзеных часам называюць вылічальнай грамадазнаўства. Некаторыя лічаць, што гэта тэхнічнае поле, але гэта не будзе тэхнічная кніга ў традыцыйным сэнсе гэтага слова. Напрыклад, няма ніякіх раўнанняў у асноўным тэксце. Я вырашыў напісаць кнігу так, таму што я хацеў, каб забяспечыць поўнае ўяўленне аб сацыяльных даследаванняў у эпоху лічбавых тэхналогій, у тым ліку буйных крыніц дадзеных, апытанні, эксперыменты, масавага супрацоўніцтва і этыкі. Аказалася, што немагчыма ахапіць усе гэтыя тэмы і даць тэхнічныя дадзеныя аб кожным з іх. Замест гэтага, паказальнікі на больш тэхнічныя матэрыялы прыведзены ў «Што чытаць далей» раздзел у канцы кожнай кіраўніка. Іншымі словамі, гэтая кніга не прызначана, каб навучыць вас, як рабіць якія-небудзь канкрэтныя разлікі; хутчэй, ён прызначаны, каб змяніць спосаб, што вы думаеце пра сацыяльныя даследаваннях.
Як выкарыстоўваць гэтую кнігу ў курсе
Як я ўжо казаў раней, гэта кніга паўстала часткова з выпускнога семінара па вылічальным грамадазнаўстве, што я выкладаю з 2007 года ў Прынстане. Так як вы можаце падумаць аб выкарыстанні гэтай кнігі, каб выкладаць курс, я падумаў, што гэта можа быць карысна для мяне, каб растлумачыць, як ён вырас з майго курсу і, як я мяркую, што гэта выкарыстоўваецца ў іншых курсах.
На працягу некалькіх гадоў я выкладала свой курс без кнігі; Я б проста прысвоіць зборнік артыкулаў. У той час як студэнты змаглі даведацца з гэтых артыкулаў, адны артыкулы не прыводзяць да канцэптуальным зменам, якія я ў надзеі стварыць. Таму я хацеў бы праводзіць вялікую частку часу ў класе забеспячэння пункту гледжання, кантэкст і парады для таго, каб дапамагчы студэнтам убачыць вялікую карціну. Гэтая кніга мая спроба запісаць усё, што ў перспектыве, кантэкст, і рада такім чынам, што не мае ніякіх перадумоў-з пункту гледжання любой сацыяльнай навукі або навукі дадзеных.
У семестравых доўга, вядома, я б рэкамендаваў гэтую кнігу спалучэнне з розным дадатковымі сведчаннямі. Напрыклад, такі курс можа правесці два тыдні на эксперыментах, і вы маглі б пару кіраўніка 4 з паказаннямі на такія тэмы, як роля інфармацыі для папярэдняй апрацоўкі ў распрацоўцы і аналізе эксперыментаў; статыстычныя і разліковыя пытанні, узнятыя буйнамаштабных выпрабаванняў A / B на прадпрыемствах; дызайн эксперыментаў, спецыяльна арыентаваных на механізмы; і практычныя, навуковыя і этычныя праблемы, звязаныя з выкарыстаннем удзельнікаў з анлайнавых рынкаў працы, такія як Amazon Mechanical Turk. Ён таксама можа працаваць у пары з паказаннямі і мерапрыемстваў, звязаных з праграмаваннем. Адпаведны выбар паміж гэтымі многімі магчымымі спарвання залежыць ад студэнтаў курса (напрыклад, студэнты, магістра або PhD), іх паходжання, і іх мэта.
Семестр даўжыня курс можа таксама ўключаць у сябе штотыднёвыя праблемныя наборы. Кожная кіраўнік мае цэлы шэраг мерапрыемстваў, якія пазначаныя па ступені складанасці: лёгкі ( ), Сярэдні ( ), Жорсткая ( ), І вельмі цяжка ( ). Акрамя таго, я пазначаны кожная праблему, навыкі, якія неабходныя: матэматыка ( ), Кадаванне ( ), І збор дадзеных ( ). Нарэшце, я маркіраваны некаторыя з мерапрыемстваў, якія з'яўляюцца маімі асабістымі фаварытамі ( ). Я спадзяюся, што ў рамках гэтай разнастайнай калекцыі дзейнасці, вы знойдзеце тыя, якія падыходзяць для вашых студэнтаў.
Для таго, каб дапамагчы людзям, якія выкарыстоўваюць гэтую кнігу на курсах, я пачаў набор вучэбна-метадычных матэрыялаў, такіх як навучальныя праграмы, слайды, рэкамендаваныя спарвання для кожнай кіраўніка, а таксама рашэнні некаторых відаў дзейнасці. Вы можаце знайсці гэтыя матэрыялы, і спрыяць іх-на http://www.bitbybitbook.com.