Few-Shot-Anpassung für die Informationsextraktion aus Rechnungen und Belegen
Motivation
Kleine und mittlere Unternehmen (KMU) durchlaufen derzeit durch die Digitalisierung einen entscheidenden Veränderungsprozess. Insbesondere wenn es um das Automatisieren von Aufgaben wie das Verarbeiten großer Dokumentenbestände geht, können die bisher manuell aufwändigen, sich wiederholenden und dadurch fehleranfälligen Tätigkeiten mit Hilfe von Methoden der Künstlichen Intelligenz (KI) gezielt beschleunigt und verbessert werden. Herausfordernd sind hierbei aber immer noch unstrukturierte Informationsquellen, die sich beispielsweise durch eine hohe Heterogenität in Text und Layout auszeichnen.
Ziele und Vorgehen
Das Verbundvorhaben „FewTuRe“ hat daher eine neuartige Strategie zum Ziel, um relevantes Wissen automatisiert am Beispiel von Belegen und Rechnungen zu extrahieren. Unter der Leitung der dida Datenschmiede werden gemeinsam mit der Humboldt-Universität zu Berlin Methoden auf Basis von KI im Bereich des „Few Shot Learning“ erforscht und optimiert, um darauf aufbauend ein prototypisches Text-Layout-Modell zu entwickeln. Dieses Tool soll es langfristig und domänenübergreifend ermöglichen, bereits anhand weniger Datenpunkte strukturierte und qualitative Informationen aus diversen Dokumententypen zu gewinnen und weiterzuverarbeiten.
Innovationen und Perspektiven
Die besondere Innovation liegt darin, dass das Modell aus „FewTuRe“ nach Finalisierung für mehrere Sprachen funktionieren soll – neben Deutsch und Englisch auch für Spanisch, Französisch, Niederländisch, Portugiesisch und Italienisch. Die Mehrsprachigkeit wird kombiniert mit den dahinterstehenden, aktuellen Forschungsfragen und Bedürfnissen. Denn es geht auch darum, wie man schon anhand weniger Datenpunkte qualitative und verlässliche KI-Werkzeuge entwickeln kann, die zudem auch für KMU erschwinglich und anpassungsfähig sind.
Projektinformation
Projektleitung
dida Datenschmiede GmbH
Hauptstraße 8
10827 Berlin
Volumen
0,60 Mio. €
Laufzeit
04/2024 – 03/2027
Projektpartnerinnen und -partner
Humboldt-Universität zu Berlin
Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.