Es wirkt etwas verrückt, was uns der Regisseur Spike Jonze in seinem 2013 produzierten Film «Her» zum Thema künstliche Intelligenz erzählt: Theodore Twombly, der Hauptcharakter des Films, verliebt sich in Samantha, ein Betriebssystem auf seinem Rechner, mit dem er via Headset und Videokamera kommuniziert. Samantha ist eine künstliche Intelligenz. Sie lernt über die soziale Interaktion mit Theodore, und ihr Verhalten wird immer menschlicher. Am Ende ist Theodore in die künstliche Intelligenz verliebt und beginnt sogar, eine intime Beziehung mit Samantha aufzubauen.
Schon klar, wir sprechen hier von einem Film, der nicht den Anspruch erhebt, in allen Punkten der Realität zu entsprechen. Doch wie weit sind wir 2019, ein halbes Jahr nachdem in Japan ein Mann ein Hologramm zur Frau nahm, von einem solchen Szenario entfernt? Wie intelligent ist heute bereits die künstliche Intelligenz und wie gut kann sie mit uns kommunizieren?
Was KI bedeutet
Um diese Fragen beantworten zu können, muss zunächst die Frage geklärt werden: Was ist überhaupt künstliche Intelligenz? Das ist nicht einfach, denn der Begriff künstliche Intelligenz, kurz KI, ist nicht einheitlich definiert – auch weil die KI-Forschung, seit ihren Anfängen in den 1950er-Jahren, eine interdisziplinäre ist. Für die praktische Anwendung hat sich jedoch folgende Definition als sinnvoll erwiesen: «Künstliche Intelligenz ist die Eigenschaft eines IT-Systems, menschenähnliche, intelligente Verhaltensweisen zu zeigen.»
Viele Systeme, die wir für intelligent halten, setzen gar nicht auf künstliche Intelligenz. Diktierfunktionen und Sprachsteuerung sind für uns zwar hilfreich, jedoch nicht Ausdruck eines intelligenten Sprachverständnisses. Sie arbeiten bisher vielmehr mit voreingestellten Stichwörtern, die bestimmte Funktionen ansteuern wie beispielsweise «Wecker auf 7 Uhr stellen» oder «Lampe an».
Etwas genauer betrachtet, beschreibt der Begriff künstliche Intelligenz Informatikanwendungen, die das Zeigen intelligenter Verhaltensweisen zum Ziel haben. Dies setzt folgende vier Kernfähigkeiten voraus:
- wahrnehmen,
- verstehen,
- handeln und
- lernen.
Sie erweitern das Grundprinzip «Eingabe, Verarbeitung, Ausgabe» aller EDV-Systeme. Die künstliche Intelligenz soll Menschen beim Erreichen ihrer Ziele unterstützen – nicht überflüssig machen. Um Menschen jedoch optimal unterstützen zu können, sind die genannten Kernfähigkeiten nötig. Das wirklich Neue an den heutigen KI-Systemen ist das Lernen und damit verbunden das Verstehen.
KI bei Maschinen und Systemen
Moderne Systeme können in der Verarbeitungskomponente trainiert werden, immer bessere Ergebnisse zu erzielen – und zwar in der Regel bessere als mit herkömmlichen Verfahren. Letztere basieren nämlich im Wesentlichen auf starren, klar definierten und festprogrammierten Regelwerken (wenn …, dann …). Beispiele hierfür sind die Bild- und Spracherkennung. KI-Systeme hingegen erkennen nicht nur Buchstaben in einem Bild, sie wissen auch, was das Wort «Beschwerde» in einem eingescannten Brief bedeutet und können einen Beschwerdevorgang einleiten. Und oft sind sie viel leistungsfähiger als Menschen – zum Beispiel, wenn es darum geht, Millionen Webseiten zu durchsuchen und alle Bilder zur Verfügung zu stellen, die einen Hund zeigen. Für Menschen wäre das
so unmöglich.
Moderne KI-Systeme werden aktuell zur Ergänzung einer eindeutigen Systemsteuerung eingesetzt. Dabei ist das Besondere an ihnen, dass sie während der Testphase und im laufenden Betrieb anhand ihrer Fehler beziehungsweise anhand eines Feedbacks lernen.
Maschinen lernen im Prinzip ähnlich wie Menschen. So kann ein Computerprogramm beispielsweise auch lernen, bestimmte Objekte zu erkennen. Dazu wird es zunächst mit Daten gefüttert und trainiert. Ihm wird zum Beispiel gesagt, welches Objekt ein Pferd ist und welches nicht. Danach erhält das Programm regelmässig eine Rückmeldung vom Programmierer, ob es die Unterscheidung «Pferd» und «kein Pferd» richtig traf. Dieses Feedback nutzt der Algorithmus, um sich selbst so lange zu verbessern, bis er am Ende sicher die Unterscheidung «Pferd» und «kein Pferd» trifft.
Die Machine-Learning-Systeme bestehen in der Regel aus drei Komponenten:
- aus einem Modell, das Vorhersagen und Identifikationen trifft,
- aus Parametern, Signalen oder Faktoren, die vom System genutzt werden, um Entscheidungen zu treffen, und
- aus dem lernenden System.
Das lernende System passt die Parameter und somit auch das Modell an, indem es sich die Unterschiede zwischen der Vorhersage und dem tatsächlichen Ergebnis anschaut.
Zu Beginn des Modells wird sehr häufig eine Prognose aufgestellt, die für eine ganz bestimmte Situation gilt. Anfangs weichen die Ergebnisse noch oft von der Prognose ab. Das System muss also Neues lernen. Dazu überprüft es die eingespeisten Daten kontinuierlich und lernt weiter aus ihnen. Hierzu werden mithilfe mathematischer Algorithmen die ursprünglichen Annahmen angepasst und so wird das Modell immer weiter optimiert.
KI in Unternehmen
Insbesondere Dienstleistungsunternehmen wie Banken und Versicherungen investieren heute bereits viel Zeit und Geld in künstliche Intelligenz. Sie setzen beispielsweise auf KI-Disziplinen wie Robotic Process Automation (RPA), Knowledge-Management-Software, digitale Assistenten und Predictive Analytics. Dabei sehen sie den künftigen Nutzen der künstlichen Intelligenz vor allem im Kontakt mit den Kunden. Mithilfe der KI sollen die Produkte und Kundenansprache individueller gestaltet werden. Dabei werden die Kunden heute jedoch noch meist von persönlichen Kundenberatern bedient; die KI hat sozusagen nur eine Unterstützungsfunktion – auch weil es auf Menschen meist befremdlich wirkt, sich mit einer Computerstimme zu unterhalten, die unsere natürliche Sprache nicht versteht.
Google stellte jedoch auf der Developer Conference 2018 mit Google Duplex eine Technologie vor, mit der es möglich ist, natürliche Gespräche zu führen und echte Aufgaben über das Telefon ausführen zu lassen. Das Video, in dem Google Duplex vorgestellt wird, erzielte bei Youtube über 2,5 Millionen Aufrufe (Grubb, J./Youtube 2018. Google Duplex: A.I. Assistant Calls Local Business To Make
Appointments.). Beim Anschauen wird schnell klar: Menschen können die Computerstimme nicht von der Stimme eines echten Menschen unterscheiden, und das System versteht echte menschliche Sprache und reagiert passend hierauf. Es vereinbart beispielsweise für seinen Gesprächspartner einen Friseurtermin oder bestellt einen Restauranttisch.