Wüssten Sie auf Anhieb, welches Rechtsproblem in Deutschland am häufigsten auftritt? Oder ob nach Weihnachten eher mehr oder eher weniger Scheidungsfragen in der Erstberatung gestellt werden? Ein KI-basiertes Programm gibt uns in der DAHAG Antworten auf diese und viele weitere Fragen.
Informationen über den Autor
Jonas Zimmermann – Vorstand DAHAG Rechtsservices AG
Rückfragen, Feedback und Anmerkungen zum Artikel sind immer willkommen!
Schreiben Sie an jonas.zimmermann@dahag.de
Grundidee: Beratungsinhalte in Zahlen umwandeln
Den Gedanken, aus (anonymisierten) Beratungsinhalten spannende Daten abzuleiten, tragen wir bereits sehr lange mit uns herum. Immerhin landen in der Telefon- und Chat-Rechtsberatung täglich zahlreiche Versicherungsnehmer mit Rechtsfragen, welche im Anschluss von den Kooperationsanwälten der DAHAG stichpunktartig im jeweiligen Ticket dokumentiert werden.
Zunächst dachten wir daran, eine Art Rechtsberatungsindex für Deutschland zu erstellen, welcher große Verschiebungen innerhalb der Gesellschaft abbilden sollte. So wollten wir etwa ganz allgemein wissen, ob mehr arbeitsrechtliche Fälle als früher gemeldet werden oder ob sich anhand der Daten saisonale „Beratungstrends“ ablesen lassen.
Neues Ziel: Claimsfishern zuvorkommen
Dieser Gedanke blieb im Kopf und rückte schließlich mit einem neuen Fokus wieder in den Vordergrund: Immer mehr Claimsfisher versuchten, über bezahlte Google-Anzeigen Massenschäden im großen Stil abzugreifen, diese standardisiert abzuarbeiten und kostenoptimiert abzurechnen. Paradebeispiele hierfür sind etwa kostspielige Kreditwiderrufe und Dieselgate-Fälle. Als neues Ziel wollten wir daher ein KI-basiertes Frühwarnsystem schaffen, das bei einer Häufung derartiger Fälle möglichst früh Alarm schlägt und uns so die nötige Zeit verschafft, möglichst schnell kundenorientierte Services zu entwickeln und Claimsfishern so ganz einfach zuvor zu kommen.
Gute Daten, schlechte Daten
Der Weg zu diesem Frühwarnsystem war jedoch steiniger als gedacht. Das wohl größte Problem bereitete die schwankende Qualität der Daten, die in Form von Freitext festgehalten wurden. Ein und dasselbe Rechtsproblem wurde von Anwalt A etwa kurz und knapp als „Kündigung Arbeitsvertrag“ beschrieben, während Anwalt B im Ticket etwas weiter ausholte: „VN will Anstellungsvertrag beenden und hat Frage zu Kündigungsfrist gemäß § 622 BGB.“
Um derartig unterschiedliche Daten strukturiert analysieren zu können, mussten wir uns den folgenden Aufgaben stellen:
- Relevante von irrelevanten Wörtern unterscheiden: Das System musste lernen, dass die Worte „Kündigung“, „Arbeitsvertrag“ und „Kündigungsfrist“ relevant sind, während Worte wie „VN“ und „Frage“ vernachlässigt werden können.
- Kontextuellen Bezug herstellen: Ein Mensch kann aus Wörtern Bedeutung extrahieren – ein Computer nicht. Wir mussten einen Weg finden, wie nicht eindeutigen Wörtern wie „Kündigung“ ein klarer Bezug und damit auch eine Bedeutung zugewiesen werden kann.
Das erste Problem war noch einigermaßen einfach anhand einer Blacklist mit nicht relevanten Wörtern zu lösen. Das zweite Problem gestaltete sich als etwas komplexer. Zunächst versuchten wir es mit linguistischen Modellen, die sich einen kompletten Satz ansehen und so einen Bezug zwischen den Wörtern herstellen können. Diese scheiterten jedoch an stichpunktartigen Falldokumentationen. Stattdessen griffen wir auf eine zweite Datenquelle zurück: die Leistungsarten. Im Ticket muss der Anwalt vermerken, auf welche Leistungsart – grob gesagt welches Rechtsgebiet – sich ein Fall bezieht. So konnte dem mehrdeutigen Wort „Kündigung“ – welches sich unter anderem auf den Arbeitsvertrag, den Mietvertrag oder die Fitnessstudiomitgliedschaft beziehen konnte – in Zusammenhang mit der Leistungsart „Arbeitsrechtsschutz“ relativ exakt die Bedeutung „Kündigung Arbeitsvertrag“ zugewiesen werden.
Cluster statt Einzelbegriffe
Auch wenn die Kombination aus Einzelbegriffen und Leistungsarten schon eine ganz gute Basis liefert, reicht sie oft nicht aus. Geht es etwa um den Begriff „Nachzahlung“ aus der Leistungsart „Mietrecht“, so kann sich dieser noch immer auf die Miete, die Nebenkostenabrechnung, Hausgeld oder Sonstiges beziehen. Als nächstes mussten wir daher Cluster bilden, welche die jeweiligen Einzelbegriffe mit Begriffen ergänzen sollten, die oft in räumlicher Nähe dazu stehen. Beispiele für solche Cluster sind etwa „Nachzahlung Nebenkosten“ oder „Kündigung Arbeitsvertrag“.
Was bringt uns dieses Wissen?
Aufgrund dieses intelligenten Systems haben wir Antworten auf die folgenden Fragen:
- Welche Rechtsprobleme sind gänzlich neu?
- Wie hat sich die Anzahl an spezifischen Rechtsproblemen relativ verändert?
- Wie hat sich die Anzahl an spezifischen Rechtsproblemen absolut verändert?
All diese Fragen können wir sowohl für Einzelbegriffe als auch für Cluster beantworten. So wissen wir nun etwa, dass die arbeitsrechtliche Kündigung tatsächlich das häufigste bei der DAHAG gemeldete Rechtsproblem der Deutschen ist.
Wie geht es weiter?
Das KI-basierte Frühwarnsystem befindet sich derzeit im Testbetrieb. Künftig soll uns die Datenanalyse unter anderem ermöglichen, die Beratungsqualität zu erhöhen, da wir die Kooperationsanwälte mit spezifischen Beratungsleitfäden zu den häufigsten Rechtsfragen versorgen können. Auch Prozesse, wie zum Beispiel die Ticketverwaltung, können durch derartige Daten optimiert werden. Und natürlich nicht zuletzt: Durch das KI-Frühwarnsystem können wir auch gänzlich neue und plötzlich massenhaft auftretende Rechtsprobleme schnell erkennen, zeitig reagieren und passende Services für RSV konzipieren.