Asset-Herausgeber

Sag‘s doch einfach - Sprachassistenten als Mittler zwischen Verwaltung und Bürger:innen

 

Sag‘s doch einfach - Sprachassistenten als Mittler zwischen Verwaltung und Bürger:innen

von Thilo Ernst

Editor's Note: Für effektive, innovative und effiziente Lösungen auf Grundlage von künstlicher Intelligenz (KI) braucht es ein Verständnis der Domäne, in der sie zum Einsatz kommen sollen. Die Arbeit an möglichen KI-Anwendungen sollte somit immer mit einer Problem- und Anforderungsanalyse aus der Domäne heraus beginnen. Mit Blick auf die öffentliche Verwaltung fallen in diesem Zusammenhang drei allgemeine Entwicklungstrends ins Auge, die sowohl den domänenspezifischen Kontext als auch die Nutzungspotenziale für den Einsatz von KI veranschaulichen.

Sie hören aufs Wort: Sprachassistenten als Interaktionskanal und Alltagshelfer

Die Beiträge dieser Serie konzentrieren sich auf ein Thema, das dank in jüngerer Zeit massiv an Popularität gewinnender Produkte und Services großer Internetdienstleister heute im Wortsinn in aller Munde ist: Intelligente Sprachassistenten. Im Zwiegespräch mit Siri, Alexa oder Google Assistant ist es so bequem wie nie zuvor, sich über die aktuelle Wettervorhersage, die neuesten Nachrichten oder den Stand eines Bundesligaspiels zu informieren. Auffinden und Abspielen von Musik- oder Videoinhalten, Zugriff auf Wikipedia-Einträge, Mobilitätsdienste und sogar die Ausführung kompletter Onlinebestellungen physischer Güter werden von diesen Assistenten ebenso unterstützt. Diese aus kostenoptimierten Frontend-Geräten (auch Smartphones können als Klienten verwendet werden) und einem cloudbasierten, den Löwenanteil der Intelligenz realisierenden Backend bestehenden Lösungen etablieren sich in einem schnell wachsenden Spektrum von Dienstkontexten als weitreichende Alternative zur konventionellen Interaktion mit Touchscreen oder Tastatur und Maus. Sie eröffnen den Internetkonzernen zusätzliche Kundenschichten und Geschäftssegmente und ermöglichen eine noch tiefere Durchdringung und perfektere Unterstützung des Alltagslebens der Nutzer mit den auf diese Weise umgesetzten Online-Dienstleistungen. Die Kehrseite ist ein substanzieller Zusatzschub für die kommerzielle Überwachung: Noch mehr Nutzerdaten werden im Alltagsleben erfasst und zentralisiert bei den Internetkonzernen verwertet - was jedoch der breiten Popularität der Smart Assistants offensichtlich keinen Abbruch tut. Fairerweise ist auch zu erwähnen, wie hilfreich Siri, Alexa und Google Assistant insbesondere für sehbehinderte oder mobilitätseingeschränkte Nutzer:innen sind, welchen diese Technologien eine z. T. qualitativ gesteigerte Teilhabe am modernen Leben ermöglichen können.

Wegweiser und Übersetzer: Potenziale für die öffentliche Verwaltung

Ein im kommerziellen Sektor so populärer und leistungsfähiger neuer Interaktionskanal erscheint natürlich auch hochinteressant, um die Interaktion von Bürger:innen mit öffentlichen Verwaltungen und konkret mit digital unterstützten Verwaltungsprozessen effizienter und attraktiver zu gestalten. Maßgeschneidert an die konkrete Prozess- und Datenlandschaft angepasste, KI-gestützte digitale Verwaltungsassistenten könnten einfache Beratungsfunktionen wahrnehmen und die Bürger:in beim Stellen von Anträgen unterstützen. Die Attraktivität der Verwaltungsdienstleistungen einer Behörde kann so erheblich gesteigert werden, ohne dass zusätzliche Personalressourcen benötigt werden. Entscheidend hierfür ist zunächst eine natürlichsprachliche Schnittstelle, die den Nutzer:innen ermöglicht, ihr Anliegen frei gesprochen zu formulieren, anstatt sie mit einem starren Korsett vorgegebener Einordnungen oder Menüauswahlen zu konfrontieren, worin sie erst mühsam ihrer Intention nahekommende Einträge suchen müssen.

Aus technischer Sicht könnte auch ein sprachgestützter digitaler Verwaltungsassistent einer deutschen Behörde auf der Basis einer Assistenzplattform eines global agierenden Internetdiensteanbieters realisiert werden. Diese Plattformen sind allerdings einerseits für andere Anwendungsfälle optimiert. Andererseits sind sie aber auch nicht durchgängig an die substanziellen Anforderungen deutscher Behörden bezüglich Datenschutz und Datensouveränität angepasst – ein Problem, das ähnlich auch in anderen Bereichen (z. B. sichere industrielle Cloud-Anwendung) existiert und einen nachhaltigen Bedarf an deutscher bzw. europäischer Technologie für solche sensitiven Bereiche impliziert, um den Datenschutz der Bürger:innen und die Datensouveränität der Behörden zu gewährleisten. Daher wurden auf diesem Gebiet bereits entsprechende Forschungs- und Entwicklungsinitiativen gestartet.

Unter der Motorhaube: Deep Learning

Um gesprochene oder als Freitext eingegebene Nutzeranfragen maschinell zu analysieren, ausreichend zu verstehen und inhaltlich passende Antworten zu erzeugen, steht inzwischen eine breite Vielfalt von Methoden zur Verfügung. Die traditionellen, hochspezialisierten und überaus komplexen Algorithmen zur Spracherkennung und -Synthese erhalten inzwischen sehr starke (z. T. sogar überlegene) Konkurrenz durch maßgeschneiderte Deep-Learning-Verfahren, und auch bei der textuellen Sprachauswertung (natural language processing, NLP), der Intentionserkennung und der Antwortgenerierung werden zusätzlich zu klassischen KI-Methoden (wie bspw. Regelsystemen) in immer stärkerem Maße Verfahren des maschinellen Lernens eingesetzt.

Sie können's auch schriftlich

Zusammen sind die genannten KI-Methoden (die in zukünftigen Beiträgen dieser Serie noch näher diskutiert werden) in der Lage, die Realisierung allgemeiner Konversationsschnittstellen zu unterstützen. Damit kann dasselbe Kernsystem den Nutzer:innen sowohl in gesprochener Kommunikation als auch als schriftlicher Konversationspartner mit E-Mail- oder Chatinterface gegenübertreten. Derartige textbasierte Systeme, wenn auch bisher meist mit eher begrenzter Intelligenz, wurden als „Chatbots" bekannt und sind inzwischen in vielen beratungsintensiven Branchen (z. B. Versicherungswesen) mit Erfolg in entsprechende Webauftritte und deren Backendsysteme integriert. Sie reduzieren den Aufwand für Hotlines und Anfragebearbeitung per E-Mail erheblich, indem zumindest häufig vorkommende und einfache Anfragen automatisch beantwortet werden. Der Rest wird automatisch vorklassifiziert sowie zur Weiterleitung an menschliche Bearbeiter mit geeigneter Spezialkompetenz aufbereitet.

Obwohl sich schon ein formfreier textueller Austausch mit einem Chatbot für viele Nutzer als deutlich angenehmer darstellt als eine klassische formularbasierte Web-Schnittstelle, belegt der Erfolg der Smart Assistants, dass eine Konversation in gesprochener Sprache oft als noch natürlicher und flüssiger empfunden wird. Manche Nutzer:innen bevorzugen jedoch weiterhin einen rein schriftlichen Austausch oder sind wegen einer Behinderung darauf angewiesen. Ein KI-gestützter digitaler Verwaltungsassistent sollte daher idealerweise sowohl die textuelle als auch die gesprochene Interaktion unterstützen.

 
Erweiterung von digitalen Verwaltungsdiensten durch intelligente Assistenzkomponenten
Abbildung 1: Erweiterung von digitalen Verwaltungsdiensten durch intelligente Assistenzkomponenten
 

Wegen der aktuellen Popularität des Themas, aber auch in Anbetracht des erheblichen Interesses seitens konkreter Behörden und ihrer IT-Dienstleister werden die nächstfolgenden Beiträge dieser Serie sich primär den für die Sprachschnittstelle eines solchen Assistenzsystems relevanten KI-Methoden zuwenden, wie Spracherkennung, Sprachsynthese und NLP, und werden Möglichkeiten aufzeigen, entsprechende Funktionalität auch ohne Rückgriff auf die Angebote der Internetriesen zu realisieren, um sie in naher Zukunft für die Bürger:innen nutzbar zu machen.


Veröffentlicht: 27.02.2020