Volltextsuche über PDF-Dokumente

Unser Social-Bookmarking-System BibSonomy (weitere Informationen und Themen) bietet Forschern die Möglichkeit, Links zu interessanten Webseiten oder Publikationsmetadaten (Titel, Autor, Jahr, usw.) und auch Dokumente zu speichern und sich mit anderen Forschern auszutauschen. Dabei können die Benutzer Ressourcen mit frei wählbaren Schlagwörtern - so genannten Tags - versehen und die Ressourcen dadurch leicht wieder auffinden - siehe z.B. die Ergebnisse für die Tags Suchmaschine, Klassifikation oder Bibliothek. Andererseits ist es möglich, Ressourcen durch eine Suche über die Metadaten wiederzufinden - siehe z.B. die Ergebnisse für eine Suche nach Bibliothek. Leider können die Benutzer derzeit noch nicht über den Volltext der hochgeladenen Dokumente suchen.

Das Ziel dieses Projekts ist daher die Integration einer Volltextsuche für die Dokumente in BibSonomy. Dabei soll eine Standardlösung wie Solr zum Einsatz kommen. Besondere Herausforderungen sind die Integration in die existierende Softwareinfrastruktur, die korrekte Implementierung der Zugriffsberechtigungen sowie die Überführung in den Produktivbetrieb. Voraussetzung für dieses Projekt sind erweiterte Programmierkenntnisse in Java sowie die Fähigkeit und Bereitschaft, sich in existierende Programm-Bibliotheken und Frameworks einzuarbeiten. Von Vorteil ist Erfahrung mit Java Server Pages und dem Framework Spring MVC. Sie können in diesem Projekt einerseits die Grundlagen von Suchmaschinen kennenlernen und ausprobieren, andererseits mit einem Team von Entwicklern ihre Ergebnisse in ein tausendfach genutztes System integrieren und dieses damit verbessern.