Ця книга почалася в 2005 році в підвалі Колумбійського університету. У той час я був аспірантом, і я проводив он-лайновий експеримент, який згодом став моєю дисертацією. Я розповім вам про наукові частини цього експерименту в розділі 4, але зараз я збираюся розповісти вам про те, що не в моїй дисертації чи в будь-якому з моїх документів. І це щось, що принципово змінилося, як я думаю про дослідження. Одного ранку, коли я прийшов у підвал, я виявив, що вночі близько 100 чоловік з Бразилії брали участь у моєму експерименті. Цей простий досвід справді вразив мене. У той час у мене були друзі, які проводили традиційні лабораторні експерименти, і я знав, як важко їм працювати, щоб набирати, контролювати і платити людям участь у цих експериментах; якщо вони можуть запустити 10 чоловік за один день, це був хороший прогрес. Проте в ході мого онлайн-експерименту, коли я сплю, брали участь 100 чоловік. Дослідження, які ви проводите під час сну, може здатися надто добре, щоб бути правдивим, але це не так. Зміни в технології, зокрема перехід від аналогового віку до цифрового віку, означають, що тепер ми можемо збирати та аналізувати соціальні дані новими способами. Ця книга полягає у проведенні соціальних досліджень новими способами.
Ця книга є для соціологів, які хочуть робити більше інформатики, вчених даних, які хочуть робити більше соціальних наук, і кожен, хто цікавиться гібридом цих двох областей. Враховуючи, для кого є ця книга, слід сказати, що це стосується не лише студентів та викладачів. Хоча в даний час я працюю в університеті (Принстон), я також працював у уряді (у Бюро перепису США) та в технологічній індустрії (в Microsoft Research), тому я знаю, що існує безліч цікавих досліджень, що відбуваються поза межами університети Якщо ви думаєте, що ви робите, як соціальні дослідження, то ця книга для вас, незалежно від того, де ви працюєте, чи які методи, які ви зараз використовуєте.
Як ви вже помітили, тональність цієї книги дещо відрізняється від тону багатьох інших академічних книг. Це навмисно. Ця книга вийшла з випускного семінару з обчислювальної соціальної науки, який я навчав у Принстоні в кафедрі соціології з 2007 року, і я хотів би, щоб він захопив частину енергії та хвилювання від цього семінару. Зокрема, я хочу, щоб ця книга мала три характеристики: я хочу, щоб вона була корисною, орієнтованою на майбутнє та оптимістичною.
Помічник . Моя мета - написати книгу, яка є корисною для вас. Тому я збираюся писати в відкритому, неформальному та прикладі керованому стилі. Це тому, що найголовніше, що я хочу передати, - це певний спосіб думати про соціальні дослідження. І мій досвід показує, що найкращий спосіб передати цей спосіб мислення неформально та з великою кількістю прикладів. Крім того, в кінці кожного розділу, у мене є розділ під назвою "Що слід читати далі", який допоможе вам перейти на більш детальні та технічні читання з багатьох тем, які я представляю. Зрештою, я сподіваюсь, ця книга допоможе вам обидва досліджувати та оцінювати дослідження інших людей.
Орієнтований на майбутнє : ця книга допоможе вам провести соціальні дослідження, використовуючи сучасні цифрові системи та ті, які будуть створені в майбутньому. Я почав займатися подібним дослідженням у 2004 році, і з тих пір я бачив багато змін, і я впевнений, що протягом курсу ви також побачите багато змін. Хитрість, що залишається актуальною перед обличчям змін, - абстракція . Наприклад, це не буде книгою, яка вчить точно, як використовувати Twitter API, як він існує сьогодні; Навпаки, він навчить вас, як навчитися з великих джерел даних (глава 2). Це не буде книгою, яка дає вам покрокові інструкції для проведення експериментів на Amazon Mechanical Turk; Навпаки, він навчить вас, як спроектувати та інтерпретувати експерименти, які покладаються на цифрову вікову інфраструктуру (глава 4). Завдяки використанню абстракції я сподіваюсь, що це буде позачасова книга про своєчасну тему.
Оптимістичний : дві спільноти, до яких залучені ця книга, - соціальні вчені та вчені-дані - мають дуже різний рівень та інтереси. Окрім цих наукових розбіжностей, про які я й говорю в книзі, я також помітив, що ці дві громади мають різні стилі. Дані вчених, як правило, схвильовані; вони схильні бачити склянку наполовину. З іншого боку, соціологи, як правило, більш критичні; вони схильні бачити склянку наполовину порожньою. У цій книзі я буду приймати оптимістичний тон вченого даних. Тому, коли я приведу приклади, я збираюся розповісти вам, що я люблю про ці приклади. І коли я вказую на проблеми з прикладами, і я це буду робити, тому що жодних досліджень не є досконалим, я намагаюся вказати на ці проблеми позитивно і оптимістично. Я не збираюся бути критичним для того, щоб бути критичним. Я буду критично, щоб я міг допомогти вам створити краще дослідження.
Ми все ще в перші дні соціальних досліджень у цифрову епоху, але я бачив деякі непорозуміння, які настільки поширені, що для мене це має сенс розглядати їх тут, в передмові. З вчених даних я бачив два поширені непорозуміння. Перша думає, що більше даних автоматично вирішує проблеми. Однак для соціальних досліджень це не було моє переживання. Фактично, для соціальних досліджень кращі дані, на відміну від більшої кількості даних, здаються більш корисними. Друге нерозуміння, яке я бачив у вчених-даних, вважає, що соціальна наука - це всього лише купа безглуздих розмов, обернутих здоровим глуздом. Звичайно, як соціолог, точніше як соціолог, я з цим не згоден. Розумні люди багато працюють над розумінням поведінки людей протягом тривалого часу, і здається нерозумним ігнорувати мудрість, накопичену в результаті цих зусиль. Я сподіваюсь, що ця книга запропонує вам таку мудрість так, як це легко зрозуміти.
Від соціальних вчених я також бачив два поширені непорозуміння. По-перше, я бачив, що деякі люди списують ідею соціальних досліджень із використанням інструментів цифрового віку через кілька поганих документів. Якщо ви читаєте цю книгу, ви, напевно, вже прочитали цілу пачку документів, які використовують дані соціальних мереж банальними або неправильними способами (або обома). Я теж Однак було б серйозною помилкою зробити висновок з цих прикладів, що всі соціальні дослідження цифрового віку є поганими. Фактично, ви, мабуть, також читали цілий ряд документів, які використовують дані опитування у банальних або неправильних способах, але ви не спите з усіх досліджень, використовуючи опитування. Це тому, що ви знаєте, що є великі дослідження з даних опитування, і в цій книзі я збираюся показати вам, що також проводяться чудові дослідження з інструментами цифрового віку.
Друге загальне непорозуміння, яке я бачив у соціологів, полягає в тому, щоб заплутати справу з майбутнім. Коли ми оцінюємо соціальні дослідження в цифрову епоху - це дослідження, яке я хочу описати, - це важливо, що ми задаємо два окремих питання: "Наскільки добре цей стиль досліджень працює зараз?" Та "Наскільки добре цей стиль дослідницька робота в майбутньому? "Дослідники навчаються відповідати на перше запитання, але для цієї книги я думаю, що друге питання важливіше. Тобто, хоча соціальні дослідження в цифрову епоху ще не сформували масштабних інтелектуальних внесків, що змінюють парадигми, швидкість вдосконалення досліджень цифрового віку неймовірно швидка. Саме така швидкість змін - більше, ніж нинішній рівень - це робить дослідження настільного віку настільки захопливим для мене.
Навіть незважаючи на те, що останній абзац може принести вам потенційне багатство в певний невизначений час у майбутньому, моя мета полягає не в тому, щоб продавати вам будь-який конкретний вид досліджень. Я особисто не володію акціями Twitter, Facebook, Google, Microsoft, Apple або будь-якою іншою технічною компанією (хоча для повного розкриття інформації я маю на увазі, що я працював або отримав фінансування досліджень від Microsoft Google і Facebook). Тому в моїй книзі моя мета полягає в тому, щоб залишатися надійним оповідачем, розповідаючи вам про всі нові цікаві речі, які є можливими, спрямовуючи вас далеко від кількох пасток, які я бачив, як інші потрапляють (і іноді впали в себе) .
Перетин соціальної науки та науки з інформацією іноді називають обчислювальною суспільною наукою. Деякі вважають, що це технічна галузь, але це не буде технічною книгою в традиційному сенсі. Наприклад, в основному тексті немає рівнянь. Я вирішив написати книгу таким чином, тому що я хотів представити всебічний погляд на соціальні дослідження в цифрову епоху, включаючи великі джерела даних, опитування, експерименти, масове співробітництво та етика. Виявилося, що неможливо охопити всі ці теми та надавати технічні подробиці щодо кожного. Замість цього посилання на більш технічний матеріал наведено в розділі "Що слід читати далі" в кінці кожного розділу. Іншими словами, ця книга не призначена для того, щоб навчити вас робити будь-який конкретний розрахунок; навпаки, він покликаний змінити спосіб, який ви думаєте про соціальні дослідження.
Як використовувати цю книгу в курсі
Як я вже сказав, ця книга вийшла частково з випускного семінару з обчислювальної соціальної науки, який я викладав з 2007 року в Прінстоні. Оскільки ви можете подумати про використання цієї книги для навчання курсу, я думав, що мені може бути корисно пояснити, як це виросло з мого курсу, і яким чином я думаю, що це використовується в інших курсах.
Протягом декількох років я навчав свій курс без книги; Я б просто призначив колекцію статей. Хоча студенти змогли вчитися з цих статей, самі статті не призвели до концептуальних змін, які я сподівався створити. Тому я провожу більшу частину часу в класі, надаючи перспективи, контекст та поради, щоб допомогти студентам побачити загальну картину. Ця книга - це моя спроба записати всю цю перспективу, контекст та поради таким чином, що не має ніяких передумов - з точки зору соціальних наук чи науки даних.
Протягом півріччя я рекомендував би зв'язати цю книгу з різними додатковими читаннями. Наприклад, такий курс може проводити два тижні на експериментах, і ви можете поєднати розділ 4 з читаннями з таких тем, як роль інформацій попереднього лікування при розробці та аналізі експериментів; статистичні та обчислювальні питання, викликані великими тестами A / B на підприємствах; дизайн експериментів, орієнтований на механізми; і практичні, наукові та етичні питання, пов'язані з використанням учасників з онлайнових ринків праці, таких як Amazon Mechanical Turk. Це також може бути пов'язане з читаннями та діями, пов'язаними з програмуванням. Відповідний вибір між цими багатьма можливими паруваннями залежить від студентів у вашому курсі (наприклад, бакалаврів, магістрів або докторів наук), їхнього фону та цілей.
Курс семестрового курсу також може включати щотижневі набори завдань. У кожному розділі ви знайдете різноманітні заходи, які містять ступінь складності: легко ( ), середній ( ), важко ( ), і дуже важко ( ) Крім того, я позначив кожну проблему навичками, які йому потрібні: математика ( ), кодування ( ), а також збір даних ( ) Нарешті, я позначив деякі дії, які є моїми особистими обраними ( ) Я сподіваюсь, що в рамках цього різноманітного набору заходів ви знайдете те, що підходять для ваших учнів.
Щоб допомогти людям використовувати цю книгу на курсах, я розпочав збірку навчальних матеріалів, таких як програми, слайди, рекомендовані пари для кожного розділу та рішення деяких заходів. Ви можете ознайомитись з цими матеріалами та внести до них допомогу - http://www.bitbybitbook.com.