Πρόλογος

Το βιβλίο αυτό ξεκίνησε το 2005 σε υπόγειο στο Πανεπιστήμιο της Κολούμπια. Εκείνη την εποχή, ήμουν πτυχιούχος φοιτητής, και έτρεχα ένα online πείραμα που τελικά θα γίνει η διατριβή μου. Θα σας πω όλα τα επιστημονικά μέρη αυτού του πειράματος στο κεφάλαιο 4, αλλά τώρα θα σας πω για κάτι που δεν είναι στη διατριβή μου ή σε κάποια από τα χαρτιά μου. Και είναι κάτι που ουσιαστικά άλλαξε το πώς σκέφτομαι την έρευνα. Ένα πρωί, όταν ήρθα στο γραφείο μου στο υπόγειο, ανακάλυψα ότι μια διανυκτέρευση περίπου 100 ατόμων από τη Βραζιλία είχε συμμετάσχει στο πείραμά μου. Αυτή η απλή εμπειρία είχε μια βαθιά επίδραση σε μένα. Εκείνη την εποχή είχα φίλους που έκαναν παραδοσιακά εργαστηριακά πειράματα και ήξερα πόσο σκληρά έπρεπε να εργαστούν για να προσλάβουν, να επιβλέψουν και να πληρώσουν τους ανθρώπους να συμμετάσχουν σε αυτά τα πειράματα. αν μπορούσαν να τρέξουν 10 άτομα σε μια μέρα, αυτό ήταν καλή πρόοδος. Ωστόσο, με το online πείραμά μου, συμμετείχαν 100 άτομα ενώ κοιμόμουν . Κάνοντας την έρευνά σας ενώ κοιμάστε μπορεί να ακούγεται πολύ καλό για να είναι αλήθεια, αλλά δεν είναι. Οι αλλαγές στην τεχνολογία - συγκεκριμένα η μετάβαση από την αναλογική εποχή στην ψηφιακή εποχή - σημαίνει ότι μπορούμε τώρα να συλλέγουμε και να αναλύουμε τα κοινωνικά δεδομένα με νέους τρόπους. Αυτό το βιβλίο αφορά την κοινωνική έρευνα με αυτούς τους νέους τρόπους.

Αυτό το βιβλίο απευθύνεται σε κοινωνικούς επιστήμονες που θέλουν να κάνουν περισσότερα επιστημονικά δεδομένα, επιστήμονες δεδομένων που θέλουν να κάνουν περισσότερες κοινωνικές επιστήμες και όσους ενδιαφέρονται για το υβρίδιο των δύο αυτών πεδίων. Δεδομένου του ποιος είναι το βιβλίο αυτό, δεν πρέπει να ξεχνάμε ότι δεν είναι μόνο για τους φοιτητές και τους καθηγητές. Παρόλο που εργάζομαι αυτήν την περίοδο σε ένα πανεπιστήμιο (Princeton), εργάστηκα επίσης στην κυβέρνηση (στο Γραφείο απογραφής των ΗΠΑ) και στην τεχνολογική βιομηχανία (στην Microsoft Research), οπότε γνωρίζω ότι υπάρχει μεγάλη συναρπαστική έρευνα που συμβαίνει έξω από πανεπιστήμια. Εάν σκέφτεστε τι κάνετε ως κοινωνική έρευνα, τότε αυτό το βιβλίο είναι για σας, ανεξάρτητα από το πού εργάζεστε ή τι είδους τεχνικές χρησιμοποιείτε σήμερα.

Όπως ίσως έχετε παρατηρήσει ήδη, ο τόνος αυτού του βιβλίου είναι λίγο διαφορετικός από αυτόν των πολλών άλλων ακαδημαϊκών βιβλίων. Αυτό είναι σκόπιμο. Αυτό το βιβλίο προέκυψε από ένα μεταπτυχιακό σεμινάριο για την υπολογιστική κοινωνική επιστήμη που έχω διδάξει στο Princeton στο Τμήμα Κοινωνιολογίας από το 2007 και θα ήθελα να συλλάβει μέρος της ενέργειας και του ενθουσιασμού από αυτό το σεμινάριο. Ειδικότερα, θέλω αυτό το βιβλίο να έχει τρία χαρακτηριστικά: θέλω να είναι χρήσιμη, προσανατολισμένη στο μέλλον και αισιόδοξη.

Χρήσιμο : Ο στόχος μου είναι να συντάξω ένα βιβλίο που είναι χρήσιμο για εσάς. Ως εκ τούτου, πρόκειται να γράψω σε ένα ανοιχτό, ανεπίσημο και στυλ με γνώμονα το παράδειγμα. Αυτό συμβαίνει επειδή το πιο σημαντικό πράγμα που θέλω να μεταφέρω είναι ένας ορισμένος τρόπος σκέψης για την κοινωνική έρευνα. Και η εμπειρία μου δείχνει ότι ο καλύτερος τρόπος να μεταδοθεί αυτός ο τρόπος σκέψης είναι ανεπίσημα και με πολλά παραδείγματα. Επίσης, στο τέλος κάθε κεφαλαίου, έχω μια ενότητα με τίτλο "Τι να διαβάσετε στη συνέχεια" που θα σας βοηθήσει να μεταβείτε σε λεπτομερέστερες και τεχνικές αναγνώσεις σε πολλά από τα θέματα που παρουσιάζω. Στο τέλος, ελπίζω ότι αυτό το βιβλίο θα σας βοηθήσει να κάνετε έρευνα και να αξιολογήσετε την έρευνα άλλων.

Προσανατολισμός στο μέλλον : Αυτό το βιβλίο θα σας βοηθήσει να κάνετε κοινωνική έρευνα χρησιμοποιώντας τα ψηφιακά συστήματα που υπάρχουν σήμερα και εκείνα που θα δημιουργηθούν στο μέλλον. Ξεκίνησα αυτό το είδος έρευνας το 2004 και από τότε έχω δει πολλές αλλαγές και είμαι βέβαιος ότι κατά τη διάρκεια της καριέρας σας θα δείτε πολλές αλλαγές επίσης. Το τέχνασμα για να παραμείνει συναφές με την αλλαγή είναι η αφαίρεση . Για παράδειγμα, αυτό δεν πρόκειται να είναι ένα βιβλίο που σας διδάσκει ακριβώς πώς να χρησιμοποιήσετε το Twitter API όπως υπάρχει σήμερα. Αντίθετα, πρόκειται να σας διδάξει πώς να μάθετε από μεγάλες πηγές δεδομένων (κεφάλαιο 2). Αυτό δεν πρόκειται να είναι ένα βιβλίο που σας δίνει βήμα προς βήμα οδηγίες για τη διεξαγωγή πειραμάτων στο Amazon Mechanical Turk. Αντίθετα, πρόκειται να σας διδάξει πώς να σχεδιάσετε και να ερμηνεύσετε πειράματα που βασίζονται στην υποδομή ψηφιακής εποχής (κεφάλαιο 4). Μέσω της χρήσης της αφαίρεσης, ελπίζω ότι αυτό θα είναι ένα διαχρονικό βιβλίο για ένα επίκαιρο θέμα.

Αισιόδοξη : Οι δύο κοινότητες που εμπλέκονται σε αυτό το βιβλίο - κοινωνικοί επιστήμονες και επιστήμονες δεδομένων - έχουν πολύ διαφορετικό υπόβαθρο και ενδιαφέροντα. Εκτός από αυτές τις επιστημονικές διαφορές, για τις οποίες μιλάω στο βιβλίο, παρατήρησα επίσης ότι αυτές οι δύο κοινότητες έχουν διαφορετικό στυλ. Οι επιστήμονες δεδομένων είναι εν γένει ενθουσιασμένοι. τείνουν να βλέπουν το ποτήρι ως μισό γεμάτο. Οι κοινωνικοί επιστήμονες, από την άλλη πλευρά, είναι γενικά πιο κρίσιμοι. τείνουν να βλέπουν το ποτήρι ως μισό άδειο. Σε αυτό το βιβλίο, πρόκειται να υιοθετήσω τον αισιόδοξο τόνο ενός επιστήμονα δεδομένων. Έτσι, όταν παρουσιάζω παραδείγματα, θα σας πω τι αγαπώ για αυτά τα παραδείγματα. Και όταν επισημαίνω προβλήματα με τα παραδείγματα -και θα το κάνω αυτό επειδή δεν υπάρχει καμία έρευνα τέλεια- θα προσπαθήσω να επισημάνω τα προβλήματα αυτά με τρόπο θετικό και αισιόδοξο. Δεν πρόκειται να είμαι κρίσιμος για να είμαι κρίσιμος - θα είμαι κρίσιμος, ώστε να μπορώ να σας βοηθήσω να δημιουργήσετε καλύτερη έρευνα.

Είμαστε ακόμα στις πρώτες μέρες της κοινωνικής έρευνας στην ψηφιακή εποχή, αλλά έχω δει μερικές παρεξηγήσεις τόσο συνηθισμένες ώστε να έχει νόημα να τους απευθύνω εδώ, στον πρόλογο. Από τους επιστήμονες των δεδομένων, έχω δει δύο κοινές παρανοήσεις. Ο πρώτος θεωρεί ότι περισσότερα δεδομένα αυτομάτως λύουν προβλήματα. Ωστόσο, για την κοινωνική έρευνα, αυτό δεν ήταν η εμπειρία μου. Στην πραγματικότητα, για την κοινωνική έρευνα, καλύτερα δεδομένα - σε αντίθεση με περισσότερα δεδομένα - φαίνεται να είναι πιο χρήσιμα. Η δεύτερη παρεξήγηση που έχω δει από τους επιστήμονες δεδομένων πιστεύει ότι η κοινωνική επιστήμη είναι απλώς μια δέσμη φανταστικών συζήτησης που τυλίγεται γύρω από την κοινή λογική. Φυσικά, ως κοινωνικός επιστήμονας - ειδικότερα ως κοινωνιολόγος - δεν συμφωνώ με αυτό. Έξυπνοι άνθρωποι εργάζονται σκληρά για να κατανοήσουν την ανθρώπινη συμπεριφορά για μεγάλο χρονικό διάστημα, και φαίνεται παράλογο να αγνοήσουμε τη σοφία που έχει συσσωρευτεί από αυτή την προσπάθεια. Η ελπίδα μου είναι ότι αυτό το βιβλίο θα σας προσφέρει κάποια από αυτή τη σοφία με έναν τρόπο που είναι εύκολο να κατανοηθεί.

Από κοινωνικούς επιστήμονες, έχω δει δύο κοινές παρανοήσεις. Πρώτον, έχω δει μερικούς ανθρώπους να διαγράφουν ολόκληρη την ιδέα της κοινωνικής έρευνας χρησιμοποιώντας τα εργαλεία της ψηφιακής εποχής λόγω μερικών κακών εγγράφων. Εάν διαβάζετε αυτό το βιβλίο, πιθανότατα έχετε ήδη διαβάσει μια δέσμη χαρτιών που χρησιμοποιούν δεδομένα κοινωνικών μέσων με τρόπους που είναι κοινόχρηστοι ή λάθος (ή και οι δύο). Εχω επίσης. Ωστόσο, θα ήταν σοβαρό λάθος να συμπεράνουμε από αυτά τα παραδείγματα ότι όλες οι κοινωνικές έρευνες ψηφιακής ηλικίας είναι κακές. Στην πραγματικότητα, πιθανότατα έχετε επίσης διαβάσει μια δέσμη εγγράφων που χρησιμοποιούν στοιχεία έρευνας με τρόπους που είναι κοινόχρηστοι ή λάθος, αλλά δεν διαγράφετε όλες τις έρευνες χρησιμοποιώντας έρευνες. Αυτό συμβαίνει επειδή γνωρίζετε ότι υπάρχει μεγάλη έρευνα με δεδομένα έρευνας και σε αυτό το βιβλίο θα σας δείξω ότι υπάρχει επίσης μεγάλη έρευνα με τα εργαλεία της ψηφιακής εποχής.

Η δεύτερη κοινή παρεξήγηση που έχω δει από τους κοινωνικούς επιστήμονες είναι να συγχέουμε το παρόν με το μέλλον. Όταν αξιολογούμε την κοινωνική έρευνα στην ψηφιακή εποχή - την έρευνα που πρόκειται να περιγράψω - είναι σημαντικό να θέτουμε δύο ξεχωριστές ερωτήσεις: "Πόσο καλά λειτουργεί αυτό το στυλ έρευνας τώρα;" και "Πόσο καλά θα γίνει αυτό το στυλ ερευνητικές εργασίες στο μέλλον; "Οι ερευνητές εκπαιδεύονται να απαντήσουν στην πρώτη ερώτηση, αλλά για αυτό το βιβλίο θεωρώ ότι το δεύτερο ερώτημα είναι πιο σημαντικό. Δηλαδή, παρόλο που η κοινωνική έρευνα στην ψηφιακή εποχή δεν έχει παράγει τεράστιες πνευματικές συνεισφορές που αλλάζουν πρότυπο, ο ρυθμός βελτίωσης της έρευνας ψηφιακής ηλικίας είναι εξαιρετικά γρήγορος. Αυτός ο ρυθμός αλλαγής - περισσότερο από το σημερινό επίπεδο - κάνει την έρευνα για την ψηφιακή εποχή τόσο συναρπαστική για μένα.

Παρόλο που αυτή η τελευταία παράγραφος φαίνεται να σας προσφέρει πιθανό πλούτο σε κάποια απροσδιόριστη χρονική στιγμή στο μέλλον, ο στόχος μου δεν είναι να σας πω για κάποιο συγκεκριμένο είδος έρευνας. Δεν διαθέτω προσωπικά μετοχές στο Twitter, στο Facebook, στο Google, στη Microsoft, στην Apple ή σε οποιαδήποτε άλλη τεχνολογική εταιρεία (αν και, για λόγους πλήρους αποκάλυψης, θα πρέπει να αναφέρω ότι έχω εργαστεί ή έχω λάβει χρηματοδότηση από τη Microsoft, Google και Facebook). Σε όλο το βιβλίο λοιπόν, ο στόχος μου είναι να παραμείνω ένας αξιόπιστος αφηγητής, που να σας λέει για όλα τα συναρπαστικά νέα πράγματα που είναι δυνατόν, ενώ σας οδηγεί μακριά από λίγες παγίδες που έχω δει να πέσουν άλλοι (και μερικές φορές πέθαναν στον εαυτό μου) .

Η διασταύρωση της κοινωνικής επιστήμης και της επιστήμης των δεδομένων αποκαλείται μερικές φορές υπολογιστική κοινωνική επιστήμη. Κάποιοι θεωρούν ότι αυτό είναι τεχνικό πεδίο, αλλά αυτό δεν θα είναι ένα τεχνικό βιβλίο με την παραδοσιακή έννοια. Για παράδειγμα, στο κύριο κείμενο δεν υπάρχουν εξισώσεις. Επέλεξα να γράψω το βιβλίο με αυτόν τον τρόπο επειδή ήθελα να δώσω μια ολοκληρωμένη εικόνα της κοινωνικής έρευνας στην ψηφιακή εποχή, συμπεριλαμβανομένων των μεγάλων πηγών δεδομένων, των ερευνών, των πειραμάτων, της μαζικής συνεργασίας και της δεοντολογίας. Αποδείχθηκε ότι είναι αδύνατο να καλύψουμε όλα αυτά τα θέματα και να παράσχουμε τεχνικές λεπτομέρειες για το καθένα. Αντ 'αυτού, οι δείκτες σε περισσότερο τεχνικό υλικό δίνονται στην ενότητα "Τι πρέπει να διαβάσετε στη συνέχεια" στο τέλος κάθε κεφαλαίου. Με άλλα λόγια, αυτό το βιβλίο δεν έχει σχεδιαστεί για να σας διδάξει πώς να κάνετε κάποιον συγκεκριμένο υπολογισμό. Αντίθετα, έχει σχεδιαστεί για να αλλάξει τον τρόπο που σκέφτεστε για την κοινωνική έρευνα.

Πώς να χρησιμοποιήσετε αυτό το βιβλίο σε ένα μάθημα

Όπως προανέφερα, αυτό το βιβλίο προέκυψε εν μέρει από ένα μεταπτυχιακό σεμινάριο για την υπολογιστική κοινωνική επιστήμη που διδάσκω από το 2007 στο Princeton. Εφόσον ίσως σκεφτείτε να χρησιμοποιήσετε αυτό το βιβλίο για να διδάξετε ένα μάθημα, σκέφτηκα ότι θα ήταν χρήσιμο να εξηγήσω πώς εξελίχθηκε από την πορεία μου και πώς φαντάζομαι ότι χρησιμοποιείται σε άλλα μαθήματα.

Για αρκετά χρόνια, δίδαξα την πορεία μου χωρίς ένα βιβλίο. Είχα αναθέσει μόνο μια συλλογή άρθρων. Ενώ οι μαθητές ήταν σε θέση να μάθουν από αυτά τα άρθρα, μόνο τα άρθρα δεν οδηγούσαν στις εννοιολογικές αλλαγές που ελπίζω να δημιουργήσω. Έτσι θα περάσω τις περισσότερες φορές στην τάξη παρέχοντας προοπτική, πλαίσιο και συμβουλές για να βοηθήσουν τους μαθητές να δουν τη μεγάλη εικόνα. Αυτό το βιβλίο είναι η προσπάθειά μου να γράψω όλη αυτή την προοπτική, το πλαίσιο και τις συμβουλές με έναν τρόπο που δεν έχει προϋποθέσεις - είτε από την άποψη της κοινωνικής επιστήμης ή της επιστήμης των δεδομένων.

Σε μαθήματα διάρκειας ενός εξάμηνου, θα συνιστούσα την αντιστοίχιση αυτού του βιβλίου με μια ποικιλία πρόσθετων αναγνώσεις. Για παράδειγμα, ένα τέτοιο μάθημα μπορεί να περάσει δύο εβδομάδες σε πειράματα και θα μπορούσατε να συνδυάσετε το κεφάλαιο 4 με αναγνώσεις σε θέματα όπως ο ρόλος των πληροφοριών προ-θεραπείας στο σχεδιασμό και την ανάλυση των πειραμάτων. στατιστικά και υπολογιστικά ζητήματα που εγείρονται από δοκιμές A / B μεγάλης κλίμακας σε επιχειρήσεις. σχεδιασμό πειραμάτων ειδικά εστιασμένων στους μηχανισμούς · και πρακτικά, επιστημονικά και δεοντολογικά ζητήματα που σχετίζονται με τη χρήση των συμμετεχόντων από τις ηλεκτρονικές αγορές εργασίας, όπως το Amazon Mechanical Turk. Θα μπορούσε επίσης να συνδυαστεί με αναγνώσεις και δραστηριότητες σχετικές με τον προγραμματισμό. Η κατάλληλη επιλογή μεταξύ αυτών των πολλών πιθανών συνδυασμών εξαρτάται από τους σπουδαστές στην πορεία σας (π.χ. προπτυχιακό, μεταπτυχιακό ή διδακτορικό), το υπόβαθρο και τους στόχους τους.

Ένα μάθημα διάρκειας ενός εξάμηνου θα μπορούσε επίσης να περιλαμβάνει εβδομαδιαία σύνολα προβλημάτων. Κάθε κεφάλαιο περιλαμβάνει μια ποικιλία δραστηριοτήτων που χαρακτηρίζονται από το βαθμό δυσκολίας: εύκολο ( εύκολος ), Μεσαίο ( Μεσαίο ), σκληρά ( σκληρά ) και πολύ σκληρά ( πολύ δύσκολο ). Επίσης, έχω επισημάνει κάθε πρόβλημα με τις δεξιότητες που απαιτεί: μαθηματικά ( απαιτεί μαθηματικά ), κωδικοποίηση ( απαιτεί κωδικοποίηση ) και τη συλλογή δεδομένων ( συλλογή δεδομένων ). Τέλος, έχω επισημάνει μερικές από τις δραστηριότητες που είναι τα προσωπικά μου αγαπημένα ( το αγαπημένο μου ). Ελπίζω ότι μέσα σε αυτή τη διαφορετική συλλογή δραστηριοτήτων, θα βρείτε μερικά που είναι κατάλληλα για τους σπουδαστές σας.

Προκειμένου να βοηθήσω τους ανθρώπους που χρησιμοποιούν το βιβλίο αυτό στα μαθήματα, ξεκίνησα μια συλλογή διδακτικού υλικού, όπως προγράμματα σπουδών, διαφάνειες, συνιστώμενες αντιστοιχίσεις για κάθε κεφάλαιο και λύσεις σε ορισμένες δραστηριότητες. Μπορείτε να βρείτε αυτά τα υλικά - και να συμβάλλετε σε αυτά - στο http://www.bitbybitbook.com.