Sie sind hier

  1. SLUB Dresden
  2. Besuchen
  3. Veranstaltungen
  4. Details

Details

Grundlagen automatischer Texterkennung für historische Drucke (OCR) und Handschriften (HTR)

TextLabKurse / WorkshopsOnline-Seminar

Dieses Online-Seminar ist Teil einer virtuellen Veranstaltungsreihe der TU9 Bibliotheken zu forschungsnahen Themen.

Inhaltsbeschreibung:

Die Generierung durchsuch- und maschinenlesbarer Volltexte ist eine wichtige Voraussetzung für die breite Nachnutzung retrodigitalisierter Bestände in Bibliotheken und Archiven. Kommerzielle Software zur Texterkennung ist im Allgemeinen nicht dazu geeignet,  die große Diversität und Spezifik historischer Materialien so zu berücksichtigen, dass die Textqualität der resultierenden Volltexte wissenschaftlichen Ansprüchen genügt. Durch den verstärkten Einsatz von Techniken des maschinellen Lernens im Bereich von OCR und HTR und deren Verfügbarkeit in freier Software wie Tesseract ist es mittlerweile möglich materialadäquate Workflows und Erkennungsmodelle auf komfortable Art und Weise selbst auf- und einzusetzen! Der Vortrag gibt einen Einblick in zugrundeliegende Konzepte und unterstützt Sie bei Ihren ersten Schritten hin zu selbsterzeugten digitalen Volltexten.

Vorkenntnisse:

Kenntnisse der Kommandozeile in Linux, Windows oder Mac OS sind hilfreich.

 

Die Veranstaltung nutzt das Videokonferenz-Tool Zoom. Eine Anmeldung ist nicht erforderlich. Der Raum wird zu Veranstaltungsbeginn geöffnet und ist über folgenden Link erreichbar:

https://zoom.us/j/95626175567?pwd=UW5wQ1VNZ3JlM1ZYSDJtaEJiU0RNQT09

Meeting-ID: 956 2617 5567

Kenncode: 814860

Porträt von
Kay-Michael Würzner

Kay-Michael Würzner ist Sprachwissenschaftler und hat Computerlinguistik und Germanistik studiert. Nach dem Studium arbeitete er als wissenschaftlicher Mitarbeiter an der Universität Potsdam und der Berlin-Brandenburgischen Akademie der Wissenschaften im Bereich korpuslinguistischer Forschungsdateninfrastrukturen. Seit April 2019 ist Kay-Michael Würzner an der SLUB tätig und bearbeitet Themen des maschinellen Lernens und der automatischen Sprachverarbeitung. Darüber hinaus ist er für die Koordination der Beratungsangebote rund um den offenen Forschungskreislauf verantwortlich und berät Sie gerne zu diesen Inhalten.

Veranstaltungsort Online-Veranstaltung