Jesteśmy zawsze będzie trzeba pytać ludzi pytania.
Biorąc pod uwagę, że coraz więcej naszych zachowań jest rejestrowanych w dużych źródłach danych, takich jak dane administracyjne rządu i biznesu, niektórzy ludzie mogą myśleć, że zadawanie pytań należy już do przeszłości. Ale to nie jest takie proste. Są dwa główne powody, dla których naukowcy nadal będą zadawać ludziom pytania. Po pierwsze, jak omówiłem w rozdziale 2, istnieją rzeczywiste problemy z dokładnością, kompletnością i dostępnością wielu dużych źródeł danych. Po drugie, oprócz tych praktycznych powodów, istnieje bardziej podstawowy powód: są pewne rzeczy, które są bardzo trudne do nauczenia się na podstawie danych behawioralnych - nawet doskonałe dane behawioralne. Na przykład niektóre z najważniejszych wyników społecznych i czynników prognostycznych to stany wewnętrzne , takie jak emocje, wiedza, oczekiwania i opinie. Wewnętrzne stany istnieją wewnątrz ludzkich głów, a czasami najlepszym sposobem na poznanie wewnętrznych stanów jest zapytanie.
Praktyczne i fundamentalne ograniczenia dużych źródeł danych oraz sposoby ich przezwyciężenia za pomocą ankiet ilustrują badania Moiry Burke i Roberta Krauta (2014) dotyczące wpływu kontaktów na Facebooku na siłę przyjaźni. W tym czasie Burke pracowała na Facebooku, dzięki czemu miała pełny dostęp do jednego z najbardziej masywnych i szczegółowych zapisów zachowań ludzkich, jakie kiedykolwiek stworzono. Ale mimo to Burke i Kraut musieli użyć ankiet, aby odpowiedzieć na ich pytanie badawcze. Ich wynik zainteresowania - subiektywne poczucie bliskości między respondentem a jej przyjacielem - jest stanem wewnętrznym, który istnieje tylko wewnątrz głowy respondenta. Co więcej, oprócz korzystania z ankiety w celu zebrania wyników zainteresowania, Burke i Kraut również musieli wykorzystać ankietę, aby dowiedzieć się o potencjalnie mylących czynnikach. W szczególności chcieli oddzielić wpływ komunikacji na Facebooku od komunikacji za pośrednictwem innych kanałów (np. E-mail, telefon i twarz). Mimo że interakcje za pośrednictwem poczty elektronicznej i telefonu są automatycznie rejestrowane, te ślady nie były dostępne dla Burke i Krauta, więc musieli je zebrać za pomocą ankiety. Łącząc swoje dane z ankiety o sile przyjaźni i interakcji spoza Facebooka z danymi z dziennika na Facebooku, Burke i Kraut doszli do wniosku, że komunikacja za pośrednictwem Facebooka w rzeczywistości prowadzi do zwiększenia poczucia bliskości.
Jak pokazuje praca Burke'a i Krauta, duże źródła danych nie wyeliminują potrzeby zadawania ludziom pytań. W rzeczywistości, wyciągnę z tego badania przeciwną lekcję: duże źródła danych mogą rzeczywiście zwiększyć wartość zadawania pytań, co pokażę w tym rozdziale. Dlatego najlepszym sposobem myślenia o związku między pytaniem a obserwowaniem jest to, że są one raczej uzupełnieniami niż substytutami; są jak masło orzechowe i galaretka. Kiedy jest więcej masła orzechowego, ludzie chcą więcej galaretki; kiedy jest więcej dużych danych, myślę, że ludzie będą chcieli więcej ankiet.