Предисловие

Эта книга началась в 2005 году в подвале Колумбийского университета. В то время я был аспирантом, и я проводил онлайн-эксперимент, который в конечном итоге станет моей диссертацией. Я расскажу вам все о научных частях этого эксперимента в главе 4, но теперь я расскажу вам о чем-то, чего нет в моей диссертации или ни в одном из моих документов. И это то, что коренным образом изменило мои взгляды на исследования. Однажды утром, когда я вошел в свой офис в подвале, я обнаружил, что на ночь в моем эксперименте участвовало около 100 человек из Бразилии. Этот простой опыт оказал на меня глубокое влияние. В то время у меня были друзья, которые проводили традиционные лабораторные эксперименты, и я знал, как им тяжело работать, чтобы набирать, контролировать и оплачивать людей для участия в этих экспериментах; если бы они могли запустить 10 человек за один день, это был хороший прогресс. Тем не менее, с моим онлайн-экспериментом, 100 человек участвовали во время сна . Выполнение ваших исследований во время сна может показаться слишком хорошим, чтобы быть правдой, но это не так. Изменения в технологии, в частности переход от аналогового возраста к цифровому эпохе, означают, что теперь мы можем собирать и анализировать социальные данные по-новому. Эта книга посвящена проведению социальных исследований этими новыми способами.

Эта книга предназначена для ученых-социологов, которые хотят делать больше науки о данных, ученых-данных, которые хотят делать больше социальных наук, и всех, кто интересуется гибридом этих двух полей. Учитывая, для кого предназначена эта книга, само собой разумеется, что речь идет не только о студентах и ​​преподавателях. Хотя я в настоящее время работаю в университете (Принстон), я также работал в правительстве (в Бюро переписи населения США) и в технической индустрии (в Microsoft Research), поэтому я знаю, что существует много интересных исследований, происходящих вне университеты. Если вы думаете о том, что вы делаете как социальное исследование, то эта книга для вас, независимо от того, где вы работаете или какие методы вы используете в настоящее время.

Как вы уже заметили, тон этой книги немного отличается от тональности многих других академических книг. Это намеренно. Эта книга появилась на выпускном семинаре по вычислительной социальной науке, который я преподавал в Принстоне в отделе социологии с 2007 года, и я хотел бы, чтобы он захватил часть энергии и волнения на этом семинаре. В частности, я хочу, чтобы эта книга имела три характеристики: я хочу, чтобы она была полезной, ориентированной на будущее и оптимистичной.

Полезно : Моя цель - написать книгу, которая вам полезна. Поэтому я собираюсь писать в открытом, неформальном и примерном стиле. Это потому, что самое важное, что я хочу передать, - это определенный образ мышления о социальных исследованиях. И мой опыт показывает, что лучший способ передать этот способ мышления неформально и с большим количеством примеров. Кроме того, в конце каждой главы у меня есть раздел «Что читать дальше», который поможет вам перейти на более подробные и технические чтения по многим из тем, которые я представляю. В конце концов, я надеюсь, что эта книга поможет вам как исследовать, так и оценивать исследования других.

Будущее : эта книга поможет вам провести социальные исследования с использованием существующих цифровых систем и тех, которые будут созданы в будущем. Я начал заниматься такими исследованиями в 2004 году, и с тех пор я видел много изменений, и я уверен, что в течение вашей карьеры вы также увидите много изменений. Уловкой оставаться актуальной перед лицом изменений является абстракция . Например, это не будет книга, в которой рассказывается о том, как использовать API Twitter, как он существует сегодня; вместо этого он научит вас изучать большие источники данных (глава 2). Это не будет книга, которая даст вам пошаговые инструкции для запуска экспериментов на Amazon Mechanical Turk; вместо этого он научит вас проектировать и интерпретировать эксперименты, основанные на цифровой возрастной инфраструктуре (глава 4). Благодаря использованию абстракции, я надеюсь, что это будет вневременная книга по актуальной теме.

Оптимистично : две общины, к которым эта книга обращается - социологи и ученые-данные, - имеют совершенно разные фоны и интересы. В дополнение к этим связанным с наукой различиям, о которых я рассказываю в книге, я также заметил, что эти две общины имеют разные стили. Ученые-исследователи обычно возбуждаются; они склонны видеть стекло наполовину полным. С другой стороны, социологи вообще более критичны; они склонны видеть стекло наполовину пустым. В этой книге я собираюсь принять оптимистический тон ученого-данных. Поэтому, когда я представляю примеры, я расскажу вам, что мне нравится в этих примерах. И когда я укажу на проблемы с примерами, и я сделаю это, потому что исследования не идеальны, я попытаюсь указать на эти проблемы таким образом, чтобы это было позитивно и оптимистично. Я не буду критично для того, чтобы быть критическим - я буду критичным, чтобы я мог помочь вам в создании лучшего исследования.

Мы все еще находимся в первые дни социальных исследований в эпоху цифровых технологий, но я видел некоторые недоразумения, которые настолько распространены, что для меня имеет смысл обратиться к ним здесь, в предисловии. От ученых-исследователей я видел два распространенных недоразумения. Первое - это то, что больше данных автоматически решает проблемы. Однако для социальных исследований это не было моим опытом. Фактически, для социальных исследований лучшие данные - в отличие от большего количества данных - кажутся более полезными. Второе недоразумение, которое я видел у ученых-данных, состоит в том, что социальная наука - это всего лишь куча причудливых разговоров, обернутых вокруг здравого смысла. Конечно, как социолог, в частности, как социолог, я не согласен с этим. Умные люди упорно работали, чтобы понять поведение человека в течение длительного времени, и, кажется, неразумно игнорировать мудрость, накопленная от этих усилий. Я надеюсь, что эта книга предложит вам часть этой мудрости таким образом, который легко понять.

Из социологов я также видел два распространенных недоразумения. Во-первых, я видел, как некоторые люди списывают всю идею социальных исследований с помощью инструментов цифровой эпохи из-за нескольких плохих бумаг. Если вы читаете эту книгу, вы, вероятно, уже прочитали кучу статей, которые используют данные социальных сетей способами, банальными или неправильными (или обоими). У меня тоже. Однако было бы серьезной ошибкой заключить из этих примеров, что все социальные исследования в цифровом возрасте плохи. Фактически, вы, вероятно, также прочитали кучу статей, которые используют данные опроса способами, банальными или неправильными, но вы не списываете все исследования, используя опросы. Это потому, что вы знаете, что есть большие исследования, проведенные с данными опроса, и в этой книге я собираюсь показать вам, что есть также большие исследования, проведенные с инструментами эпохи цифровых технологий.

Второе общее недоразумение, которое я видел у социологов, - это смутить настоящее с будущим. Когда мы оцениваем социальные исследования в эпоху цифровых технологий - исследование, которое я собираюсь описать, важно, чтобы мы задали два разных вопроса: «Насколько хорошо этот стиль исследований работает прямо сейчас?» И «Насколько хорошо этот стиль исследовательская работа в будущем? »Исследователи обучаются ответить на первый вопрос, но для этой книги я думаю, что второй вопрос более важен. То есть, несмотря на то, что социальные исследования в эпоху цифровых технологий еще не привели к массовым, изменяющим парадигму интеллектуальным вкладам, темпы совершенствования исследований в цифровом возрасте невероятно быстры. Именно эта скорость изменений больше, чем нынешний уровень, что делает исследования цифрового времени настолько интересными для меня.

Несмотря на то, что этот последний абзац может показаться вам потенциальным богатством в какое-то неопределенное время в будущем, моя цель - не продавать вас ни по какому конкретному типу исследований. Я лично не владею акциями в Twitter, Facebook, Google, Microsoft, Apple или любой другой технической компании (хотя, ради полного раскрытия, я должен упомянуть, что я работал или получал финансирование от Microsoft, Google и Facebook). Поэтому во всей книге моя цель - оставаться надежным рассказчиком, рассказывая вам обо всех интересных новых вещах, которые возможны, и направляя вас от нескольких ловушек, которые я видел, когда другие падают (и иногда попадают в себя) ,

Пересечение социальной науки и науки о данных иногда называют вычислительной социальной наукой. Некоторые считают, что это техническая область, но это не будет техническая книга в традиционном смысле. Например, в главном тексте нет уравнений. Я решил написать книгу таким образом, потому что я хотел представить всеобъемлющий взгляд на социальные исследования в эпоху цифровых технологий, включая большие источники данных, опросы, эксперименты, массовое сотрудничество и этику. Оказалось, что невозможно охватить все эти темы и предоставить технические подробности о каждом из них. Вместо этого указатели на более технический материал приводятся в разделе «Что читать дальше» в конце каждой главы. Другими словами, эта книга не предназначена для того, чтобы научить вас, как делать какие-либо конкретные вычисления; скорее, он призван изменить то, как вы думаете о социальных исследованиях.

Как использовать эту книгу в курсе

Как я сказал ранее, эта книга частично возникла из выпускного семинара по вычислительной социальной науке, который я преподаю с 2007 года в Принстоне. Поскольку вы можете подумать об использовании этой книги для обучения курсу, я подумал, что мне может быть полезно объяснить, как она выросла из моего курса и как я представляю, что она используется в других курсах.

В течение нескольких лет я преподавал свой курс без книги; Я бы просто назначил коллекцию статей. Хотя ученики могли учиться на этих статьях, одни статьи не привели к концептуальным изменениям, которые я надеялся создать. Поэтому я бы проводил большую часть времени в классе, предоставляя перспективы, контекст и советы, чтобы помочь студентам увидеть общую картину. Эта книга - это моя попытка записать всю эту перспективу, контекст и советы таким образом, чтобы не было никаких предпосылок - с точки зрения социальной науки или науки о данных.

В семестровом курсе я бы рекомендовал соединить эту книгу с различными дополнительными показаниями. Например, такой курс может проводиться в течение двух недель в экспериментах, и вы можете связать главу 4 с чтением по таким темам, как роль информации перед обработкой при проектировании и анализе экспериментов; статистические и вычислительные вопросы, поднятые крупномасштабными испытаниями A / B в компаниях; проектирование экспериментов, специально ориентированных на механизмы; и практические, научные и этические вопросы, связанные с использованием участников с онлайн-рынков труда, таких как Amazon Mechanical Turk. Он также может быть сопряжен с чтением и действиями, связанными с программированием. Соответствующий выбор между этими многими возможными связями зависит от студентов вашего курса (например, бакалавриата, магистра или доктора философии), их происхождения и их целей.

Курс на семестр может также включать еженедельные наборы проблем. Каждая глава имеет множество видов деятельности, которые обозначены степенью сложности: легкая ( легко ), средний ( средний ), жесткий ( жесткий ), и очень тяжело ( очень сложно ). Кроме того, я обозначил каждую проблему навыками, которые она требует: математика ( требует математики ), кодирование ( требует кодирования ) и сбор данных ( Сбор данных ). Наконец, я назвал несколько видов деятельности, которые являются моими личными фаворитами ( мой любимый ). Надеюсь, что в рамках этой разнообразной коллекции вы найдете некоторые, которые подходят для ваших учеников.

Чтобы помочь людям, использующим эту книгу на курсах, я начал сборник учебных материалов, таких как учебные планы, слайды, рекомендуемые пары для каждой главы и решения некоторых видов деятельности. Вы можете найти эти материалы и внести свой вклад в них - на http://www.bitbybitbook.com.