Informatiker auf Twitter

Motivation #

Mit Hilfe eines am Forschungszentrum L3S entwickelten Ansatzes ist es möglich, Wissenschaftler zu entdecken, die Twitter nutzen. Im Rahmen dieser Arbeit wurde ein Datensatz mit mehr als 9000 Informatikern veröffentlicht und analysiert. Viele Fragestellungen, die den Inhalt der Tweets aber auch die Selbstdarstellung der Forscher betreffen wurden bisher jedoch noch nicht untersucht, wie z.B.

  • Über welche Themen tweeten die Forscher?
  • Welche Entitäten (Personen, Orte, Organisationen) und Webseiten werden in den Tweets erwähnt?
  • Bei welchen Firmen oder Institutionen arbeiten die Forscher und aus welchen Ländern kommen Sie?
  • Gibt es einen Zusammenhang zwischen der Popularität der Forscher oder der Anzahl ihrer Publikationen und ihren Arbeitgebern?
  • Werden die Benutzeraccounts hauptsächlich privat oder eher beruflich genutzt?
  • Welche Unterschiede gibt es in der Nutzung und Herkunft zwischen Professoren und Doktoranden?
  • usw.

Zusätzlich sind die vorhandenen Daten in ihrer jetzigen Form eher für die Analyse denn für die Forscher selbst nützlich. Darauf aufbauende Dienste (z.B. zur Empfehlung relevanter Tweets oder wichtiger Forscher) würden ihnen einen Mehrwert bieten.

Ziele #

Ziel dieser Arbeit ist eine tiefergehende Analyse des Informatiker-Datensatzes zur Beantwortung der genannten (und weiterer, sich im Laufe der Arbeit ergebender) Fragestellungen. Des weiteren soll eine web-basierte Demo-Anwendung aufgebaut werden, die den Forschern Mehrwerte (z.B. Ranking, Empfehlungen bietet).

Aufgabe #

Im Einzelnen sollen dazu u.A. die folgenden Arbeitsschritte durchgeführt werden:

  1. Literaturrecherche zu bestehenden Analysen im Rahmen der Erforschung von Twitter bzw. der Nutzung des Social Webs durch Forscher
  2. Aktualisierung und ggf. Ergänzung der Daten mit Hilfe des existierenden Ansatzes
  3. Konkretisierung der Fragestellungen und Analyse der vorhandenen und ggf. weiter notwendiger Datenquellen
  4. Recherche zu möglichen Plattformen für die web-basierte Demo-Anwendung bzw. Entwurf einer eigenen Anwendung
  5. Implementierung von Klassen zur Auswertung der Daten und Beantwortung der Fragestellungen
  6. Analyse der Daten
  7. Implementierung der Demo-Anwendung und Integration der Auswertungsklassen
  8. Testen der Anwendung
  9. Aufschreiben der Ergebnisse

Der Schwerpunkt der Arbeit kann je nach Interesse mehr auf der Datenauswertung oder mehr auf der Implementierung einer Anwendung liegen. Bei einer Masterarbeit wird die Veröffentlichung der Ergebnisse auf einer wissenschaftlichen Konferenz angestrebt.

Wenn Sie Interesse an Web-Technologien, dem Umgang mit großen Datenmengen, Erfahrungen mit Skriptsprachen wir Python oder Ruby (oder Interesse, sich diese anzueignen) haben, dann melden Sie sich bei Robert Jäschke.