Seit Beginn des Jahres 2011 entwickeln die SLUB Dresden und die junge Firma Avantgarde Labs eine multilinguale semantische Katalogsuche — SLUBsemantics.
SLUBsemantics - Multilinguale semantische Suche
SLUBsemantics macht in der ersten Ausbaustufe unsere etwa 4 Mio. lokalen Titeldaten mit Hilfe von automatisch generierten thematischen Facetten zugänglich. Die eingegebenen Suchbegriffe werden auf semantische Konzepte zurückgeführt und in ihren jeweiligen Wissenskontext eingeordnet. Auf diese Weise können Suchanfragen, die in verschiedenen Sprachen gestellt werden, mit relevanten Titeln aus unserem Katalog bedient werden - unabhängig von der Sprache, in der diese Titel verfasst bzw. beschrieben sind.
Die magisch wirkende Funktionsweise von SLUBsemantics ist Resultat eines einfachen Prinzips: des Rückgriffs auf große, sozial gepflegte und netzwerkartig angelegte Informationsstrukturen zum Zweck der automatischen Anreicherung und Verknüpfung von Katalogdaten. Wir bedienen uns dabei unter anderem der freien Enzyklopädie „Wikipedia“, des größten Lexikons der Welt. Die Software erkennt vollautomatisch den inhaltlichen Zusammenhang der Suchanfrage und gibt strukturierte Trefferlisten aus. Gibt der Benutzer zum Beispiel das Wort „Bank“ ein, werden ihm sowohl relevante Katalogeinträge zu (einzelnen) Kreditinstituten, der Bankenkrise oder dem Eurosystem als auch zum Sitzmöbel oder einer Sandbank vorgeschlagen. Sucht er „Hauptstadt Belgien“, werden auch alle Treffer mit „Brüssel“ berücksichtigt. Lautet die Eingabe „Gone with the wind“, erhält er zugleich Treffer zum deutschen Filmtitel „Vom Winde verweht“, zum Regisseur Victor Fleming, zu Max Steiner, dem Komponisten der Filmmusik, und zu Margaret Mitchell, der Autorin der Romanvorlage.
Die normale Indexsuche des SLUB-Katalogs mit Rechtschreibkorrektur, Wortformennormalisierung, vielfältigen Drill-down-Möglichkeiten und einstellbaren Sortierkriterien ist ein Fortschritt zur altbekannten Feldsuche, kann aber letztlich nur ausgeben, was über ein Matching der Suchanfrage mit den beschreibenden Informationen in den Titeldaten herausgefiltert wird. Titel, die mit anderssprachigen Deskriptoren beschrieben sind oder deren Deskriptoren Synonyme der Suchbegriffe darstellen, können oft nicht gefunden werden. Sonstige semantische Relationen zwischen den Deskriptoren fehlen überwiegend ganz. SLUBsemantics erfasst dagegen bereits in der ersten Ausbaustufe die Bedeutung aller lokalen Katalogdaten und ermöglicht die Eingabe der Suchbegriffe in drei Sprachen: Deutsch, Englisch und Polnisch. Semantische Beziehungen zwischen den Themen werden als Verzweigungsstrukturen dargestellt. Dabei kann von der standardmäßig eingestellten grafischen Visualisierung auf eine Baumdarstellung umgeschaltet werden.
SLUBsemantics befindet sich aktuell in der Betaphase. Im Interesse höherer Transparenz des Suchergebnisses werden wir noch die automatisch erzeugten Anreicherungsterme für unsere Titeldaten in der Detailansicht der Treffer anzeigen und mit den entsprechenden Wikipedia-Artikeln hinterlegen. Mittelfristig ist die Ausweitung des Suchraumes von SLUBsemantics auf sämtliche Daten des SLUB-Katalogs und die Integration von SLUBsemantics in die Standardsuche vorgesehen. Darüber hinaus sollen Sie die Anreicherungsdaten korrigieren und erweitern können.
Bitte helfen Sie uns, SLUBsemantics laufend zu verbessern und weiter zu entwicklen. Für Ihre Hinweise benutzen Sie bitte unser Feedback-Formular auf der SLUBsemantics-Seite.
Weitere Informationennach oben
Projektpartner
Avantgarde Labs, Dresden
Projektstatus
Open Beta
Finanzierung
SLUB Dresden
Publikationen
Ansprechpartnernach oben
Leiter der Abteilung Benutzung und Information
Dr. Jens Mittelbach
Tel.: +49 351 4677-192
Fax: +49 351 4677-721
E-Mail: SLUBsemantics@slub-dresden.de