Nachdem wir im ersten Blogbeitrag auf die intelligente Dokumentenverarbeitung (Intelligent Document Processing, IDP) eingegangen sind, betrachtet dieser Artikel das Thema Datenqualität. Diese ist für das Training von KI-Modellen von großer Bedeutung und bestimmt somit wesentlich die Zuverlässigkeit von Anwendungen der intelligenten Dokumentenverarbeitung. Nichtsdestotrotz wird dieser Aspekt häufig unterschätzt.
KI-Modelle werden in der intelligenten Dokumentenverarbeitung eingesetzt, um Daten im Kontext zu verstehen und daraus die richtigen Handlungsempfehlungen abzuleiten. Dazu müssen sie Muster und Strukturen in Dokumenten erkennen, um relevante Inhalte zu erschließen, die dann in Erkenntnisse überführt werden. Hierfür ist es wiederum erforderlich, die KI-Modelle zu trainieren. Als Grundlage dienen sowohl die vorhandenen Dokumente als auch die daraus extrahierten Inhalte. Je besser deren Qualität ist, desto höher ist die Wahrscheinlichkeit, dass die KI-Modelle aus zukünftig zu verarbeitenden Dokumenten die richtigen Insights generieren. Umgekehrt liefern sie bei minderwertigem Ausgangsmaterial höchstwahrscheinlich fehlerhafte Ergebnisse (Stichwort: Garbage In, Garbage Out). Man kann dies mit Sportlern vergleichen: Wer nicht oder falsch trainiert, kann auch keine Spitzenleistungen erbringen.
Wie viele Dokumente einem KI-Modell für das Training zur Verfügung gestellt werden sollten, hängt vom jeweiligen Anwendungsfall ab. Das Motto „je mehr, desto besser“ gilt dabei nicht uneingeschränkt, denn es birgt die Gefahr, KI-Modelle zu übertrainieren. Sollen beispielsweise bestimmte Formulare erkannt werden, die in PDF-Dokumenten mit 50 oder mehr Seiten „versteckt“ sind, empfiehlt es sich, diese Formulare vorab zu separieren und gezielt für das Training zu verwenden. Andernfalls verarbeitet das Modell den Inhalt der gesamten PDF-Datei und zieht möglicherweise falsche Schlussfolgerungen. Bei der Verarbeitung von Eingangsrechnungen sollten Unternehmen darauf achten, das KI-Modell mit Rechnungen aller Lieferanten zu trainieren. Werden lediglich Rechnungen eines Lieferanten bereitgestellt, kann das KI-Modell auch nur aus diesen zuverlässig Inhalte extrahieren und verstehen. Es fehlt dann an inhaltlicher Breite, was die Leistungsfähigkeit des Modells einschränkt.
Generell lässt sich sagen, dass textbasierte Modelle mit einer geringeren Zahl an Trainingsdokumenten auskommen als grafische KI-Modelle und zudem weniger Rechenleistung benötigen. Sie können daher problemlos auf eigenen Servern trainiert werden, was meist innerhalb weniger Tage möglich ist. Unternehmen sollten sich jedoch ausreichend Zeit für die Zusammenstellung des Trainingsmaterials nehmen, um optimale Ergebnisse zu erzielen.
Für die Klassifizierung von Dokumenten sollten sowohl korrekt interpretierte Dokumente einbezogen werden als auch solche, die ähnlich aufgebaut sind, aber nicht der Ziel-Dokumentenart entsprechen. Auf Basis sich wiederholenden Strukturen und Inhalte gelangen KI-Modelle dann mit sehr hoher Wahrscheinlichkeit zu den richtigen Ergebnissen. Idealerweise unterstützen Anbieter beim Trainieren und Erstellen von textbasierten KI-Modellen, beispielsweise über ein Portal, in dem Anwender Fragen zu ihrer Mission beantworten und dann sukzessive durch den Prozess geführt werden. So können selbst Nutzer ohne IT- oder KI-Kenntnisse eigene Modelle trainieren. Dabei sollte auch definiert werden, wie die gewonnenen Inhalte weiterverarbeitet werden – etwa als JSON-Datei für andere Applikationen, per E-Mail im CSV-Format oder durch Ablage in einem bestimmten Verzeichnis.
Grafische Modelle, die bei komplexeren Ausgangsdaten wie Handschriften oder schlecht gescannten oder fotografierten Dokumenten zum Einsatz kommen, erfordern hingegen tiefergehende IT-Kenntnisse, insbesondere im Bereich Labeling und Training. Daher werden solche KI-Modelle stets von professionellen KI-Architekten und KI-Consultants der applord GmbH aktiv begleitet und bereitgestellt.
Unabhängig davon, wie gut KI-Modelle trainiert wurden, sollten Unternehmen den erzielten Ergebnissen keinesfalls blind vertrauen. Vielmehr empfiehlt es sich, validierende Mechanismen zu integrieren. Bei grafischen Modellen können beispielsweise die Dokumenteninhalte noch einmal mittels OCR-Technologie ausgelesen werden, um anschließend die KI-Ergebnisse textbasiert zu verifizieren. Eine weitere Möglichkeit besteht darin, zwei KI-Modelle zu verwenden und die jeweils gewonnenen Erkenntnisse miteinander zu vergleichen.
Wo KI-Modelle im Rahmen von IDP-Anwendungen zum Einsatz kommen sollten, ist je nach Unternehmen und dessen Anforderungen unterschiedlich. Unabhängig davon, so die Empfehlung von applord, sollte das Pferd nicht von hinten aufgezäumt werden. Es geht nicht darum, KI einzuführen, weil dies gerade en vogue ist, sondern konkret zu definieren, welche Herausforderung damit gemeistert werden soll. Branchenübergreifend zählt hier die Verarbeitung kaufmännischer Dokumente, etwa von Eingangsrechnungen oder handschriftlich ausgefüllten SEPA-Formularen, zu den meistgenannten Szenarien. Bei Maschinen- und Anlagenbauern ist auch die automatisierte Auswertung von Wartungsprotokollen zu nennen. Dabei prüfen KI-Modelle, ob bestimmte Richtwerte eingehalten werden. Ist dies nicht der Fall, wird ein entsprechender Bearbeitungsprozess angestoßen.
Der Einsatz von KI-Modellen erfordert aus technischer Sicht eine ausreichende Menge an qualitativ hochwertigen Trainingsdaten und -dokumenten. Nur wenn diese gegeben ist, können die Modelle den gewünschten Output generieren und so einen wichtigen Beitrag zur Automatisierung von Prozessen leisten. Auf der konzeptionellen Seite benötigen Unternehmen eine klare (Er-)Kenntnis darüber, wie sie KI-Modelle effizient einsetzen können, um den gewünschten Erfolg zu erzielen.
Kontaktieren Sie uns und erfahren Sie, wie Sie KI-Modelle zuverlässig trainieren können!
Um Ihnen ein optimales Erlebnis zu bieten, verwenden wir Technologien wie Cookies, um Geräteinformationen zu speichern und/oder darauf zuzugreifen. Wenn Sie diesen Technologien zustimmen, können wir Daten wie das Surfverhalten oder eindeutige IDs auf dieser Website verarbeiten. Wenn Sie Ihre Zustimmung nicht erteilen oder zurückziehen, können bestimmte Merkmale und Funktionen beeinträchtigt werden.