Eenvoudig tellen kan interessant zijn als je combineren een goede vraag met goede gegevens.
Hoewel het is gesteld in verfijnde klinkende taal, is veel sociaal-wetenschappelijk onderzoek eigenlijk gewoon tellen dingen. In het tijdperk van big data, kunnen de onderzoekers meer dan ooit te tellen, maar dat betekent niet automatisch dat het onderzoek gericht moet op het tellen van meer en meer spullen. In plaats daarvan, als we gaan om goed onderzoek te doen met big data, moeten we ons afvragen: welke dingen de moeite waard te tellen zijn? Dit lijkt misschien een geheel subjectieve aangelegenheid, maar er zijn enkele algemene patronen.
Vaak studenten te motiveren hun tellen onderzoek door te zeggen: Ik ga iets dat niemand ooit heeft geteld tellen. Bijvoorbeeld, een student zou kunnen zeggen, veel mensen hebben bestudeerd migranten en veel mensen hebben gestudeerd een tweeling, maar niemand heeft migrant tweelingen bestudeerd. Motivatie door afwezigheid niet leiden meestal tot goed onderzoek. Natuurlijk kunnen er goede redenen om migranten tweeling studeren, maar het feit dat ze nog niet eerder onderzocht, betekent niet dat zij nu moeten worden onderzocht. Niemand heeft ooit het aantal threads op het tapijt in mijn kantoor geteld, maar dat betekent niet automatisch dat dit een goede onderzoeksproject zou zijn. Motivatie door afwezigheid is net zoiets als zeggen: kijk, er is een gat daar, en ik ga heel hard werken om het te vullen. Maar niet elk gat moet worden opgevuld.
In plaats van te motiveren door afwezigheid, ik denk dat het tellen leidt tot goed onderzoek in twee situaties, wanneer het onderzoek is interessant of belangrijk is (of idealiter beide). Bijvoorbeeld, het meten van de werkloosheid is belangrijk omdat het in indicator van de economie die beleidsbeslissingen drijft. Over het algemeen, mensen hebben een vrij goed gevoel voor wat belangrijk is. Dus, in de rest van deze sectie, ga ik drie voorbeelden waarbij tellen is interessant te bieden. In elk geval werden de onderzoekers niet lukraak te tellen, eerder waren ze te tellen in zeer bijzondere instellingen die belangrijke inzichten in meer algemene ideeën over hoe de sociale systemen werken geopenbaard. Met andere woorden, veel wat deze bijzonder counting oefeningen interessanter is niet in de gegevens zelf, het komt uit deze meer algemene ideeën.
1) de werkende gedrag van taxichauffeurs in New York (paragraaf 2.4.1.1), 2) de vorming van vriendschap door studenten (paragraaf 2.4.1.2) en 3), social media censuur gedrag van de Chinese overheid: Hieronder heb ik drie voorbeelden zal presenteren (paragraaf 2.4.1.3). Deze voorbeelden delen is dat ze allemaal zien dat counting big data kunnen worden gebruikt om theoretische voorspellingen te testen. In sommige gevallen, big data bronnen stellen u in staat om dit tellen relatief rechtstreeks doen (zoals in het geval van New York Taxis). In andere gevallen zullen de onderzoekers moeten omgaan met onvolledigheid door elkaar en operationaliseren samenvoegen van gegevens theoretische concepten (zoals in het geval van vriendschap vorming); en in sommige gevallen onderzoekers zullen nodig hebben om hun eigen observationele gegevens te verzamelen (zoals in het geval van sociale media censuur). Zoals ik hoop dat deze voorbeelden laten zien, voor onderzoekers die in staat zijn om interessante vragen te stellen, big data veelbelovend.