Sie sind hier

  1. SLUB Dresden
  2. Mitmachen
  3. SLUB TextLab
  4. Veranstaltungen
  5. Details

Details

Hands On Workshop-Reihe OCR (Optical Character Recognition): Teil 1 - Motivation und grundlegende Konzepte der optischen Texterkennung (OCR)

Zielgruppe Studierende Zielgruppe Promovierende Open Science / Publishing Online-Seminar
Die Veranstaltung wurde abgesagt.
Do, 29.04.2021 15:00 Uhr - 15:30 Uhr, Online-Veranstaltung, Kay-Michael Würzner

Die zunehmende Verfügbarkeit digitaler Inhalte lässt die Ansprüche bezüglich Umfang und Benutzbarkeit auch für historische Dokumente wachsen. Hier kommt der automatischen Texterkennung eine besondere Bedeutung zu, da Bücher, Handschriften und Zeitungen aus dem prädigitalen Zeitalter im allgemeinen nicht als maschinenlesbarer Volltext vorliegen. Mit Hilfe von Verfahren der Optical Character Recognition (OCR) können Digitalisate um einen solchen ergänzt werden. In unserem dreiteiligen Tutorial erläutern wir zunächst die grundsätzliche Herangehensweise sowie Techniken der OCR, widmen uns dann frei verfügbaren Werkzeugen zur automatischen Texterkennung wie Tesseract, OCRopy und Calamari und demonstrieren abschließend Techniken zur Domänenadaptierung (sog. Training) der Erkennungsmodelle.

Die Veranstaltungsreihe darf im Besten Sinne als Hands-On verstanden werden und bietet Möglichkeiten, die vermittelten Inhalte direkt anzuwenden. Einzige Voraussetzungen sind eine funktionierende Linux-Installation und Kenntnisse im Umgang mit der Unix-Kommandozeile.

Teilnehmende mit ZIH-Login erreichen den Raum über folgenden Link:
https://selfservice.zih.tu-dresden.de/l/link.php?m=99724&p=8ad26721

Teilnehmende ohne Hochschul-Login erreichen den Raum über folgenden Link:
https://selfservice.zih.tu-dresden.de/link.php?m=99724&p=351ed18c

Porträt von Kay-Michael Würzner
Kay-Michael Würzner

Kay-Michael Würzner ist Sprachwissenschaftler und hat Computerlinguistik und Germanistik studiert. Nach dem Studium arbeitete er als wissenschaftlicher Mitarbeiter an der Universität Potsdam und der Berlin-Brandenburgischen Akademie der Wissenschaften im Bereich korpuslinguistischer Forschungsdateninfrastrukturen. Seit April 2019 ist Kay-Michael Würzner an der SLUB tätig und bearbeitet Themen des maschinellen Lernens und der automatischen Sprachverarbeitung. Darüber hinaus ist er für die Koordination der Beratungsangebote rund um den offenen Forschungskreislauf verantwortlich und berät Sie gerne zu diesen Inhalten.

Ort Online-Veranstaltung