Analyse natürlichsprachiger Dokumente - Analysis of Natural Language Systems
Schwerpunkt
Digital Technologies
Beschreibung
Die Forschungsgruppe beschäftigt sich mit der Entwicklung von KI-basierten Analysewerkzeugen für natürlichsprachige Dokumente. Eine spezielle Rolle spielt die automatisierte Extraktion von Metainformationen aus schwach strukturierten Dokumenten wie beispielsweise PDFs. So können beispielsweise Schlüsselwörter zugeordnet, Strukturen rekonstruiert und Informationen semantisch erfasst werden. Dabei kommen Verfahren aus dem Natural Language Processing (NLP) Bereich zum Einsatz. Ein besonderes Augenmerk liegt dabei in der Kombination unterschiedlicher KI-Techniken um auch Datenquellen mit wenigen Trainingsdaten erfassen zu können.