Im analogen Zeitalter, Daten über das Sammeln verhaltens, wer was wann-war teuer, und deshalb relativ selten. Nun, im digitalen Zeitalter, das Verhalten von Milliarden von Menschen werden aufgezeichnet, gespeichert und analysierbar. Zum Beispiel, jedes Mal auf einer Website klicken, wird ein Anruf auf dem Handy zu machen, oder etwas mit Ihrer Kreditkarte bezahlen, eine digitale Aufzeichnung Ihres Verhaltens wird erstellt und von einem Unternehmen gespeichert. Da diese Daten ein Nebenprodukt von Menschen jeden Tag Aktionen sind, werden sie oft digitale Spuren genannt. Zusätzlich zu diesen von den Unternehmen gehalten Spuren haben die Regierungen auch unglaublich reiche Daten über die beiden Menschen und Unternehmen, Daten, die oft digitalisiert und analysierbar ist. Zusammen stellen diese Unternehmen und Behörden Aufzeichnungen werden oft große Datenmengen genannt.
Die ständig steigende Flut von großen Daten bedeutet, dass wir von einer Welt bewegt haben, wo Verhaltensdaten war knapp zu einer Welt, in der Verhaltensdaten reichlich. Aber, weil diese Art Daten relativ neu sind, eine unglückliche Menge an Forschung mit ihnen sieht aus wie Wissenschaftler verfügbaren Daten blind zu jagen. Dieses Kapitel bietet stattdessen einen prinzipiellen Ansatz, die verschiedenen Datenquellen zu verstehen und wie sie verwendet werden. Dieses reicheren Verständnis soll Ihnen helfen, besser zu entsprechenden Datenquellen Ihre Forschungsfragen entsprechen. Oder, wenn solche bestehenden Quellen fehlen, überzeugen Sie Ihre eigenen Daten zu sammeln, die Ideen in Zukunft Kapiteln verwenden.
Ein erster Schritt von großen Daten zu lernen , ist zu erkennen , dass es Teil einer breiteren Kategorie von Daten ist die seit vielen Jahren für Sozialforschung verwendet wurde: Beobachtungsdaten. Grob gesagt, ist Beobachtungsdaten alle Daten, die ein soziales System führt ohne Eingriff in irgendeiner Weise aus der Beobachtung. Eine grobe Art und Weise, darüber nachzudenken ist, dass Beobachtungsdaten ist alles, was nicht mit Menschen reden mit sich bringt (zB Umfragen, das Thema Kapitel 3) oder Volks Umgebungen (zB Experimente, das Thema Kapitel 4) zu verändern. Somit umfasst neben Geschäfts- und Regierungsakten, Beobachtungsdaten auch Dinge wie den Text von Zeitungsartikeln und Satellitenfotos.
Dieses Kapitel besteht aus drei Teilen. Zunächst wird in Abschnitt 2.2, beschreibe ich große Daten genauer und zu klären, einen grundlegenden Unterschied zwischen ihm und den Daten, die für Sozialforschung verwendet wurden in der Vergangenheit im Allgemeinen sind. Dann wird in Abschnitt 2.3, beschreibe ich zehn gemeinsame Merkmale von großen Datenquellen. diese Eigenschaften zu verstehen ermöglicht es uns, schnell die Stärken und Schwächen der vorhandenen Quellen erkennen und wird uns helfen, die neuen Quellen nutzen, die in der Zukunft geschaffen werden. Schließlich wird in Abschnitt 2.4, beschreibe ich drei Hauptforschungsstrategien, die Sie von Beobachtungsdaten zu lernen verwenden: Zählen Dinge, Prognose Dinge, und ein Experiment annähert.