In den vergangenen Jahren wurde eine Reihe bahnbrechender Ergebnisse mit großen KI-Sprachmodellen erzielt. So ist z. B. das GPT-3-Modell von OpenAI für offene Textgenerierung ein gigantisches neuronales Sprachmodell. Seine Leistungsfähigkeit und Größe übertrifft alle bisherigen Sprachmodelle um ein Vielfaches. Die in Europa ansässigen Technologieentwickler und insbesondere die Anwender aus dem KMU-Bereich, die aufbauend auf diesen Sprachmodellen eigene Anwendungen realisieren wollen, müssen gegenwärtig selbst stark in Vorleistung gehen. Insbesondere die Anpassung der Sprachmodelle auf die Domäne oder Nische, in der Unternehmen ihre Services anbieten, stellt eine große Herausforderung dar. Für die meisten KMU rechnet sich der zusätzliche finanzielle und zeitliche Aufwand nicht.
Ziele und Vorgehen
Ziel ist es, Methoden und ein Framework zu entwickeln, um Sprachmodelle für KMU-spezifische Anwendungen effizient anpassen zu können. Damit sollen Texte für die Finanzbranche verfasst, Dokumente für Unternehmen im Legal Tech gematcht sowie die Lesereihenfolge in Dokumenten im Bereich Legal und Finance besser erkannt werden können. Dies betrifft den Kern für das maschinelle Textverständnis von Verträgen und Berichten.
Innovationen und Perspektiven
Das Vorhaben folgt dem datenzentrierten Ansatz. Dabei werden erprobte Trainingsmethoden modifiziert, damit vorhandene Trainingsdaten wesentlich effizienter und effektiver eingesetzt werden können. Die aktuelle Forschung an Sprachmodellen folgt dem Ansatz „bigger is better“. Das ist für die deutsche Industrie nicht praktikabel umsetzbar. Im Vorhaben werden daher internationale und eigene Vorarbeiten fortgesetzt, insbesondere zu Adaptern, Datenfusion und zum Lernen aus mehreren Sprachen sowie aus wenigen Daten.
Projektinformation
Projektleitung
Merantix Momentum GmbH
Max-Urich-Straße 3
13355 Berlin
Volumen
1.572.773 € (inkl. Projektpauschale für die beteiligte Hochschule)
Laufzeit
04/2023 – 03/2026
Projektpartnerinnen und -partner
2txt NLG GmbHBerliner Hochschule für TechnikFraunhofer IAIS
Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.