საქმიანობის

გასაღები:

  • ხარისხი სირთულის: მარტივი ადვილი საშუალო საშუალო , მძიმე მძიმე , ძალიან რთული ძალიან რთული
  • მოითხოვს მათემატიკის ( მოითხოვს მათემატიკის )
  • მოითხოვს კოდირების ( მოითხოვს კოდირების )
  • მონაცემთა შეგროვების ( მონაცემთა შეგროვების )
  1. [ ძალიან რთული , მოითხოვს კოდირების , მონაცემთა შეგროვების ] ერთ-ერთი ყველაზე საინტერესო პრეტენზიები Benoit et al. (2015) გულშემატკივარი კოდირება პოლიტიკური manifestos არის, რომ შედეგების განმეორებადობა. Merz, Regel, and Lewandowski (2016) უზრუნველყოფს ხელმისაწვდომობის მანიფესტის Corpus. შეეცადეთ რეპროდუცირება Fig 2 Benoit et al. (2015) გამოყენებით მუშებს Amazon მექანიკური Turk. როგორ მსგავსი იყო თქვენი შედეგები?

  2. [ საშუალო ] In InfluenzaNet პროექტის მოხალისე ჟიური ხალხს ანგარიშს სიხშირე, გავრცელების და ჯანმრთელობის ეძებს ქცევა დაკავშირებული გრიპისმაგვარი ავადმყოფობას (ILI) (Tilston et al. 2010; Noort et al. 2015) .

    1. შეადარეთ და განსხვავებით დიზაინი, ხარჯები და სავარაუდოდ შეცდომები InfluenzaNet, Google გრიპის ტენდენციები და ტრადიციული გრიპის ნავიგაციის სისტემები.
    2. განვიხილოთ მოუგვარებელია დროს, როგორიცაა ღორის გრიპის ეპიდემიის. აღწერეთ შესაძლო შეცდომების თითოეული სისტემა.
  3. [ მძიმე , მოითხოვს კოდირების , მონაცემთა შეგროვების ] The Economist ყოველკვირეული საინფორმაციო ჟურნალი. ადამიანის შექმნა გამოთვლები პროექტის თუ რაციონი, ქალები საფარი გაიზარდა დროთა განმავლობაში.

    1. ჟურნალი შეიძლება ჰქონდეს სხვადასხვა მოიცავს რვა სხვადასხვა რეგიონებში (აფრიკა, აზია, ევროკავშირის, ლათინური ამერიკის, ახლო აღმოსავლეთის, ჩრდილოეთ ამერიკაში, და დიდი ბრიტანეთი) და მათ შეუძლიათ ყველა გადმოწერილი ვებ- ეკონომისტი . დახვედრა, ერთი ამ რეგიონებში და შეასრულოს ანალიზი. რა თქმა უნდა, აღწერს პროცედურების საკმარისი დეტალურად, რომ ისინი შეიძლება ტირაჟირებული ვინმეს.

    ეს შეკითხვა შთაგონებული ანალოგიური პროექტის მიერ Justin Tenuto, მონაცემთა მეცნიერ crowdsourcing კომპანია CrowdFlower , ვხედავ "ახლა ჟურნალი ნამდვილად უყვარს Dudes" .

  4. [ ძალიან რთული , მოითხოვს კოდირების , მონაცემთა შეგროვების ] შენობა კითხვაზე ზემოთ, ახლა ასრულებს ანალიზი ყველა რვა რეგიონში.

    1. რა განსხვავებაა არც თქვენთვის რეგიონებში?
    2. რამდენი ზედმეტი დრო და ფული დასჭირდა, რათა მასშტაბის-up თქვენი ანალიზი რვა რეგიონებში?
    3. წარმოიდგინეთ, რომ ეკონომისტი აქვს 100 სხვადასხვა მოიცავს ყოველ კვირას. შეაფასებს რამდენად ზედმეტი დრო და ფული უნდა მიიღოს, გავაფართოვოთ-up თქვენი ანალიზი 100 ჰიტები კვირაში.
  5. [ მძიმე , მოითხოვს კოდირების ] [Kaggle] (https://www.kaggle.com/) არის ნახვა, რომ მასპინძლობს ღია მოწოდება პროექტები. მონაწილეობის ერთ-ერთი იმ პროექტებს.

  6. [ საშუალო ] გადახედეთ ბოლო საკითხი ჟურნალი თქვენს სფეროში. არსებობს რაიმე საბუთები, რომ შეეძლო შეეცვალა, როგორც ღია მოწოდება პროექტები? რატომ ან რატომ არ?

  7. [ ადვილი ] Purdam (2014) აღწერილი მონაცემების შეგროვებასა შესახებ begging ლონდონში. შეჯამება ძლიერი და სუსტი მხარეები ამ კვლევის დიზაინი.

  8. [ საშუალო ] Redundancy მნიშვნელოვანი გზა, რათა შეაფასოს ხარისხის ნაწილდება მონაცემების შეგროვება. Windt and Humphreys (2016) განვითარება და შეამოწმოთ სისტემა შეაგროვოს ანგარიშები კონფლიქტის მოვლენების ადამიანი აღმოსავლეთ კონგოს. დაწვრილებით ქაღალდი.

    1. როგორ ამჯამად მათი დიზაინი უზრუნველყოს redundancy?
    2. მათ ვთავაზობთ რამდენიმე მიდგომები, რათა შეამოწმოს მონაცემები შეგროვდა მათი პროექტი. შეჯამება მათ. რომელი იყო ყველაზე დამაჯერებელი, რომ თქვენ?
    3. შესთავაზოს ახალ გზას, რომ მონაცემები შეიძლება დამტკიცდა. წინადადებები უნდა შეეცადოს, რომ გაზარდოს რწმენა, რომ თქვენ, რომ აქვს მონაცემების ისე, რომ არის ეფექტური და ეთიკური.
  9. [ საშუალო ] Karim ლახანის და კოლეგები (2013) ის ღია კონკურსის შუამდგომლობას ახალი ალგორითმები პრობლემის გადაჭრას წელს გამოთვლითი ბიოლოგიის. მათ მიიღეს 600-ზე მეტი წარდგინება შემცველი 89 რომანი კომპიუტერული მიდგომები. საქართველოს წარდგინება, მათ მიიღეს 30 რომ გადააჭარბა შესრულება აშშ ჯანმრთელობის ეროვნულ ინსტიტუტში ის MegaBLAST და საუკეთესო წარდგენის მიღწეული როგორც დიდი სიზუსტე და სიჩქარე (1,000 ჯერ უფრო სწრაფად).

    1. წავიკითხე მათი ქაღალდი და შემდეგ შესთავაზოს სოციალური კვლევის პრობლემა, რომელიც შეიძლება გამოიყენოთ იგივე სახის ღია კონკურსი. კერძოდ, ამ ტიპის ღია კონკურსი ორიენტირებულია დაჩქარების და გაუმჯობესების არსებული ალგორითმი. თუ თქვენ არ ვფიქრობ, რომ მსგავსი პრობლემის თქვენს სფეროში, ცდილობენ ახსნას თუ რატომ არ არის.
  10. [ საშუალო ] ბევრი ადამიანის გამოთვლითი პროექტები დაეყრდნოს მონაწილე Amazon მექანიკური Turk. შესვლა რომ გახდეს თანამშრომელი Amazon მექანიკური Turk. დახარჯავს ერთი საათი მუშაობს. როგორ აკეთებს ამას გავლენა თქვენი აზრები დიზაინი, ხარისხის და ეთიკის ადამიანის compuation პროექტები?