Ta książka rozpoczęła się w 2005 roku w piwnicy na Uniwersytecie Columbia. W tym czasie byłem studentem studiów magisterskich i prowadziłem eksperyment online, który ostatecznie stał się moją dysertacją. Opowiem wam o naukowych częściach tego eksperymentu w rozdziale 4, ale teraz powiem wam o czymś, czego nie ma w mojej rozprawie ani w żadnym z moich artykułów. I to jest coś, co zasadniczo zmieniło moje myślenie o badaniach. Pewnego ranka, kiedy wszedłem do mojego biura w piwnicy, odkryłem, że w nocy w moim eksperymencie wzięło udział około 100 osób z Brazylii. To proste doświadczenie wywarło na mnie głęboki wpływ. W tym czasie miałem przyjaciół, którzy prowadzili tradycyjne eksperymenty laboratoryjne i wiedziałem, jak ciężko pracowali, aby rekrutować, nadzorować i płacić ludziom za udział w tych eksperymentach; gdyby mogli uruchomić 10 osób w ciągu jednego dnia, to byłby dobry postęp. Jednak w moim eksperymencie online uczestniczyło 100 osób podczas snu . Przeprowadzanie badań podczas snu może wydawać się zbyt piękne, aby mogło być prawdziwe, ale tak nie jest. Zmiany w technologii - szczególnie przejście od wieku analogowego do epoki cyfrowej - oznaczają, że możemy teraz zbierać i analizować dane społeczne na nowe sposoby. Ta książka dotyczy badań społecznych na te nowe sposoby.
Ta książka jest dla naukowców społecznych, którzy chcą zrobić więcej danych naukowych, naukowców danych, którzy chcą robić więcej nauk społecznych, i wszystkich zainteresowanych hybrydą tych dwóch dziedzin. Zważywszy na to, dla kogo ta książka jest przeznaczona, nie trzeba dodawać, że dotyczy to nie tylko studentów i profesorów. Chociaż obecnie pracuję na uniwersytecie (Princeton), pracowałem również w administracji rządowej (w US Census Bureau) oraz w branży technologicznej (w Microsoft Research), więc wiem, że jest wiele ciekawych badań uniwersytety. Jeśli myślisz o tym, co robisz, jako o badaniach społecznych, ta książka jest dla Ciebie, bez względu na to, gdzie pracujesz i jakich technik obecnie używasz.
Jak już mogłeś zauważyć, ton tej książki jest nieco inny niż w wielu innych książkach akademickich. To jest zamierzone. Ta książka wyszła z seminarium dla absolwentów na temat obliczeniowej nauki społecznej, którą wykładałem w Princeton na Wydziale Socjologii od 2007 r. I chciałbym, aby uchwycił część energii i emocji z tego seminarium. W szczególności chcę, aby ta książka miała trzy cechy: chcę, aby była pomocna, nastawiona na przyszłość i optymistyczna.
Pomocne : Moim celem jest napisanie książki, która jest dla Ciebie pomocna. Dlatego zamierzam pisać w otwartym, nieformalnym i przykładowym stylu. To dlatego, że najważniejszą rzeczą, którą chcę przekazać, jest pewien sposób myślenia o badaniach społecznych. Moje doświadczenie sugeruje, że najlepszym sposobem przekazania tego sposobu myślenia jest nieformalna i pełna przykładów. Na koniec każdego rozdziału mam sekcję zatytułowaną "Co dalej czytać", która pomoże ci przejść do bardziej szczegółowych i technicznych odczytów na wiele tematów, które przedstawiam. W końcu mam nadzieję, że ta książka pomoże wam zarówno prowadzić badania, jak i oceniać badania innych.
Zorientowana na przyszłość : ta książka pomoże ci przeprowadzić badania społeczne za pomocą systemów cyfrowych, które istnieją dzisiaj i tych, które zostaną utworzone w przyszłości. Zacząłem robić tego rodzaju badania w 2004 roku i od tamtej pory widziałem wiele zmian i jestem pewien, że w trakcie swojej kariery również zobaczysz wiele zmian. Sztuczka polegająca na pozostaniu istotnym w obliczu zmiany to abstrakcja . Na przykład nie będzie to książka, która uczy dokładnie, jak korzystać z Twitter API, jak istnieje dzisiaj; zamiast tego nauczy Cię, jak uczyć się z dużych źródeł danych (rozdział 2). To nie będzie książka, która daje instrukcje krok po kroku do przeprowadzania eksperymentów na Amazon Mechanical Turk; zamiast tego nauczy Cię projektowania i interpretowania eksperymentów opartych na infrastrukturze wieku cyfrowego (rozdział 4). Dzięki wykorzystaniu abstrakcji mam nadzieję, że będzie to ponadczasowa książka na temat aktualnego tematu.
Optymistyczny : dwie społeczności, w które angażuje się ta książka - socjolodzy i naukowcy zajmujący się danymi - mają bardzo różne pochodzenie i zainteresowania. Oprócz tych różnic związanych z nauką, o których mówię w książce, zauważyłem również, że te dwie wspólnoty mają różne style. Naukowcy danych są ogólnie podekscytowani; mają tendencję do postrzegania szkła jako w połowie pełnego. Naukowcy społeczni z drugiej strony są na ogół bardziej krytyczni; mają tendencję do postrzegania szkła jako w połowie pustego. W tej książce zamierzam przyjąć optymistyczny ton danych naukowca. Tak więc, kiedy przedstawię przykłady, powiem wam, co uwielbiam w tych przykładach. I kiedy wskażę problemy z przykładami - i zrobię to, ponieważ żadne badania nie są doskonałe - spróbuję wskazać te problemy w sposób pozytywny i optymistyczny. Nie będę krytyczny dla bycia krytycznym - zamierzam być krytyczny, abym mógł pomóc ci stworzyć lepsze badania.
Wciąż jesteśmy w początkach badań społecznych w erze cyfrowej, ale widziałem pewne nieporozumienia, które są tak powszechne, że sensowne jest dla mnie, aby zwrócić się do nich tutaj, we wstępie. Od danych naukowców, widziałem dwa powszechne nieporozumienia. Pierwszym jest myślenie, że więcej danych automatycznie rozwiązuje problemy. Jednak w przypadku badań społecznych to nie było moje doświadczenie. W rzeczywistości w przypadku badań społecznych lepsze dane - w przeciwieństwie do większej ilości danych - wydają się bardziej pomocne. Drugie nieporozumienie, które dostrzegłem od naukowców zajmujących się danymi, jest takie, że nauka społeczna to tylko gromada wymyślnych rozmów, które są związane z zdrowym rozsądkiem. Oczywiście, jako społeczny naukowiec, a dokładniej jako socjolog, nie zgadzam się z tym. Inteligentni ludzie ciężko pracowali, aby zrozumieć ludzkie zachowanie przez długi czas i wydaje się nierozsądne ignorowanie mądrości, która narosła z tego wysiłku. Mam nadzieję, że ta książka da ci trochę tej mądrości w sposób łatwy do zrozumienia.
Od naukowców społecznych, widziałem również dwa powszechne nieporozumienia. Po pierwsze, widziałem, jak niektórzy ludzie spisują całą ideę badań społecznych, używając narzędzi epoki cyfrowej z powodu kilku złych gazet. Jeśli czytasz tę książkę, prawdopodobnie już przeczytałeś kilka artykułów, które wykorzystują dane w mediach społecznościowych w sposób banalny lub niewłaściwy (lub oba). Muszę. Byłoby jednak poważnym błędem wyciągać wnioski z tych przykładów, że wszystkie badania społeczne w dziedzinie demografii cyfrowej są złe. W rzeczywistości prawdopodobnie czytałeś także kilka artykułów, które wykorzystują dane ankiet w sposób banalny lub niewłaściwy, ale nie spisujesz wszystkich badań za pomocą ankiet. Dzieje się tak dlatego, że wiesz, że przeprowadziliśmy świetne badania z danymi ankietowymi, i w tej książce pokażę ci, że są również świetne badania z narzędziami epoki cyfrowej.
Drugim powszechnym nieporozumieniem, które widziałem od socjologów, jest dezorientacja teraźniejszości z przyszłością. Kiedy oceniamy badania społeczne w erze cyfrowej - badania, które zamierzam opisać - ważne jest, aby zadać im dwa odrębne pytania: "Jak dobrze działa obecnie ten styl badań?" I "Jak dobrze będzie ten styl prace badawcze w przyszłości? "Naukowcy są przeszkoleni, aby odpowiedzieć na pierwsze pytanie, ale dla tej książki myślę, że drugie pytanie jest ważniejsze. Oznacza to, że mimo że badania społeczne w erze cyfrowej nie przyniosły jeszcze znaczących, zmieniających paradygmat wkładów intelektualnych, tempo poprawy badań nad cyfrową erą jest niezwykle szybkie. To właśnie tempo zmian - więcej niż obecny poziom - sprawia, że badania nad cyframi wieku są dla mnie tak ekscytujące.
Mimo że ten ostatni akapit może wydawać się potencjalnym bogactwem w jakimś nieokreślonym czasie w przyszłości, moim celem nie jest sprzedawanie cię w jakimkolwiek konkretnym rodzaju badań. Nie posiadam osobiście udziałów na Twitterze, Facebooku, Google, Microsoft, Apple ani żadnej innej firmie technologicznej (chociaż, z uwagi na pełne ujawnienie, powinienem wspomnieć, że pracowałem lub otrzymałem finansowanie badań od Microsoft, Google i Facebook). Dlatego w całej mojej książce moim celem jest pozostanie wiarygodnym narratorem, informującym o wszystkich nowych, ekscytujących rzeczach, które są możliwe, jednocześnie prowadząc cię z dala od kilku pułapek, w które wpadłam (a czasami wpadłam w siebie) .
Przecięcie nauk społecznych i nauk o danych jest czasami nazywane obliczeniową nauką społeczną. Niektórzy uważają, że jest to pole techniczne, ale nie będzie to książka techniczna w tradycyjnym sensie. Na przykład w tekście głównym nie ma równań. Zdecydowałem się napisać tę książkę w ten sposób, ponieważ chciałem przedstawić kompleksowy obraz badań społecznych w erze cyfrowej, w tym duże źródła danych, ankiety, eksperymenty, masową współpracę i etykę. Okazało się, że niemożliwe jest omówienie wszystkich tych tematów i dostarczenie szczegółów technicznych na temat każdego z nich. Zamiast tego, wskaźniki do bardziej technicznego materiału są podane w sekcji "Co dalej przeczytać" na końcu każdego rozdziału. Innymi słowy, książka ta nie ma na celu nauczyć cię wykonywania określonych obliczeń; ma raczej na celu zmianę sposobu myślenia o badaniach społecznych.
Jak korzystać z tej książki w kursie
Jak powiedziałem wcześniej, książka ta powstała częściowo z seminarium magisterskiego na temat obliczeniowych nauk społecznych, którego uczę od 2007 roku w Princeton. Ponieważ możesz myśleć o używaniu tej książki do nauczania kursu, pomyślałem, że może mi pomóc wytłumaczyć, jak wyrósł z mojego kursu i jak wyobrażam sobie, że jest on używany w innych kursach.
Przez kilka lat uczyłem mojego kursu bez książki; Właśnie przydzieliłem zbiór artykułów. Podczas gdy uczniowie mogli wyciągnąć naukę z tych artykułów, same artykuły nie prowadziły do zmian koncepcyjnych, które miałem nadzieję stworzyć. Tak więc spędzałem większość czasu na zajęciach, zapewniając perspektywę, kontekst i porady, aby pomóc uczniom zobaczyć wielki obraz. Ta książka jest moją próbą zapisania całej tej perspektywy, kontekstu i porady w sposób, który nie ma żadnych warunków wstępnych - ani w naukach społecznych, ani w naukach o danych.
W trakcie semestralnego kursu polecam powiązanie tej książki z wieloma dodatkowymi odczytami. Na przykład, taki kurs może spędzić dwa tygodnie na eksperymentach, a ty możesz połączyć rozdział 4 z odczytami na tematy takie jak rola informacji przed leczeniem w projektowaniu i analizie eksperymentów; kwestie statystyczne i obliczeniowe powstałe w wyniku dużych testów A / B w przedsiębiorstwach; projektowanie eksperymentów ukierunkowanych konkretnie na mechanizmy; oraz praktyczne, naukowe i etyczne kwestie związane z wykorzystaniem uczestników z internetowych rynków pracy, takich jak Amazon Mechanical Turk. Może być również sparowany z odczytami i czynnościami związanymi z programowaniem. Odpowiedni wybór pomiędzy tymi wieloma możliwymi parami zależy od uczniów w twoim kursie (np. Licencjackich, magisterskich lub doktoranckich), ich pochodzenia i celów.
Kurs długości semestru może również obejmować cotygodniowe zestawy problemów. Każdy rozdział ma wiele działań oznaczonych stopniem trudności: łatwe ( ), średni ( ), ciężko ( ) i bardzo trudne ( ). Ponadto określiłem każdy problem za pomocą umiejętności, których wymaga: matematyki ( ), kodowanie ( ) oraz gromadzenie danych ( ). Na koniec opisałem kilka działań, które są moimi ulubionymi ( ). Mam nadzieję, że w tym zróżnicowanym zbiorze zajęć znajdziesz kilka odpowiednich dla swoich uczniów.
Aby pomóc osobom używającym tej książki w kursach, rozpocząłem zbiór materiałów dydaktycznych, takich jak sylabusy, slajdy, zalecane pary dla każdego rozdziału i rozwiązania niektórych działań. Możesz znaleźć te materiały i przyczynić się do nich - na stronie http://www.bitbybitbook.com.