27. Jänner 2022 von Tim Strohschneider
Relevante Informationen mit Hilfe moderner KI nutzbar machen - Anwendungsfall Textextraktion
Allgemeine Betrachtung zum Einsatz Künstlicher Intelligenz (KI) in der Bankenwelt
In unserer KI-Studie ist eine Meinung klar: Wer in den nächsten fünf Jahren in KI investiert, wird einen Wettbewerbsvorteil haben. Daher ist dies relevant für all unsere Kunden.
Grundlegend wird bei der Verwendung von KI im Bankenbereich der Inhaltserkennung die höchste Relevanz zugesprochen. Die bisherigen Ansätze zur Verarbeitung strukturierter und unstrukturierter Informationen in Form von Dokumenten fordern einen hohen manuellen Aufwand. Scan-Strecken werden oft durch Menschen überwacht und eingehende Kundenkommunikation wird manuell ausgewertet und weiterverarbeitet.
Die manuelle Verwertung dieser Information ist nicht nur langsam, sondern ebenso der Ursprung vermeidbarer Fehler. Ein einfaches Vertippen bei der Adresse kann die zukünftige Kundenkommunikation zum Erliegen bringen. Dieser Vorgang kann mit Hilfe von Textextraktionen deutlich optimiert werden. Durch das Einsetzen moderner Machine-Learning-Algorithmen senken wir den manuellen Aufwand, erhöhen die Qualität der Informationsverarbeitung und steigern die Geschwindigkeit deutlich. Eine Maschine kann skalierbar eingesetzt werden und sich so an das Aufkommen dynamisch anpassen.
Textextraktion als unterstützende Kraft
In Kundensituationen erarbeiten wir im Interaction Room eine Prozessskizze des aktuellen Ablaufs: Wo kommen Kundendokumente an, wie werden sie verarbeitet und was sind Ausgabeinformationen oder Formate? Nachdem eine prozessuale Klarheit geschaffen wurde, wird ein Zielbild designt. Das heißt eine Abbildung, wie der zukünftige Prozess aussehen kann, also nach der Optimierung mit Hilfe der Möglichkeiten, die uns Künstliche Intelligenz bietet. In einem Proof of Concept (PoC) bauen wir für die Textextraktion ein neuronales Netz auf (meist SpaCy oder Flair). Dies erkennt Entitäten (spezifische Begriffe) und Intents (Anliegen) in Texten. Darunter fallen zum Beispiel Entitäten wie: Personen, Organisationen, Städte, Produkte, Adressen und vieles mehr.
Demzufolge kann beispielsweise das Wort „Müller“ in einem Text viele Bedeutungen haben. Die Kernkompetenz der Textextraktion besteht darin, Mehrdeutigkeiten von Namen und Wörtern durch die Verknüpfung mit den passenden Entitäten und Konzepten einer Wissensbank aufzulösen. Was heißt das also? Das Wort „Müller“ kann je nach Kontext sowohl den Beruf Müller als auch die Drogeriekette Müller oder den Fußballer Thomas Müller und so weiter beschreiben. Mittels der Textextraktion findet unsere Lösung ganz einfach heraus, welche Detailinformationen die übermittelten Daten beziehungsweise Texte beinhalten. Das KI-Element Textextraktion ordnet Namen und Wörter durch Abgleichen der an das Unternehmen angepassten Wissensbank ihren wahrhaftigen Bedeutungen zu. Genauso ist es mit Synonymen möglich, Entitäten zu gruppieren. So können Begriffe wie „Audi“, „BMW“ und „VW“ alle als Synonym von „Auto“ erkannt und entsprechend zugeordnet werden.
Die Verwendung von Ansätzen zur Textextraktion lässt sich daher vielfältig anwenden und kann aus unstrukturierten Dokumenten strukturierte Informationen machen. Mit Hilfe von anderen Technologien wie OCR kann auch Handschriftliches digitalisiert, aufbereitet und an Umsysteme überführt werden.
Textextraktion – die Reduktion von manuellen Aufwänden im Dokumentenmanagement
Gemeinsam mit unseren Kunden implementieren wir, basierend auf modernen Ansätzen, eine Lösung, die die manuellen Verarbeitungsschritte reduziert oder ablöst. Diese stellt dann eine deutlich höhere Qualität schneller und zuverlässiger zur Verfügung, als ein Mensch es kann. Dabei ist die Lösung transparent, anpassbar und erweiterbar. Auf diese Weise können also durch Textextraktion große, unstrukturierte Datenmengen aufgelöst und bearbeitbar gemacht werden.