Digitalisierung & Transformation

Digitalisierung / IT-Sicherheit I

KI-Agenten – die neue Suchmaschinenoptimierung

Das Thema KI-Agenten ist aus zwei Perspektiven zu betrachten. Einerseits geht es darum, welche Aufgaben Mitarbeitende mit KI-Agenten wie ChatGPT Tasks oder Operator automatisieren können. Andererseits ist die Frage, welche Anpassungen auf der Website notwendig sind, um die Interaktion mit KI-Agenten entweder zu optimieren oder zu unterbinden.
PDF Kaufen

In den letzten zwei Jahren haben viele Unternehmen unterschiedliche generative KI-Modelle beobachtet, getestet und auch eingesetzt: zum Beispiel KI-Text­erstellung, KI-Bilderstellung, KI-Video­erstellung. Je nachdem, was eine KI generieren soll, wird ein spezifischer Al­gorithmus, Machine Learning oder ein neuronales Netz eingesetzt. So kann eine KI die spezifische Aufgabe schneller erledigen als jeder Mensch. 

Aber eben nur diese eine spezifische ­Aufgabe. Für eine andere Aufgabe wird ein anderer spezifischer Algorithmus, Machine Learning oder ein neuronales Netz benötigt. KI-Agenten kombinieren nun unterschiedliche KI-Technologien. So können KI-Agenten eine ganze Reihe von unterschiedlichen Aufgaben in der richtigen Abfolge durchführen. 

ChatGPT Tasks

ChatGPT Tasks ist eine – zurzeit noch – experimentelle Funktion, mit der Aufgaben (Tasks) als Prompt eingegeben und durchgeführt werden können. Die Funktion ähnelt zunächst sehr der Aufgabenfunktion in Onlinekalendern wie beispielsweise Outlook. Doch es ist nicht nur eine Erinnerungsfunktion für wiederkehrende Aufgaben. ChatGPT Tasks kombiniert die Aufgabenfunktion mit dem, was das sogenannte grosse Sprachmodell hinter ChatGPT – aktuell die GPT-4-Serie von OpenAI – am besten kann: Contents recherchieren und erstellen.

Beispiel-Prompts: 

  • Erstelle mir täglich drei Vorschläge für Beiträge, die ich auf Linkedin zum «Thema XY» posten kann – mit je zwei Bildvorschlägen.
  • Informiere mich, sobald «Marktbegleiter XY» eine neue Pressemeldung herausgibt. 
  • Sende mir täglich drei Übungen, die ich zur Stärkung meiner «XY-Muskulatur» machen kann.

Anfang 2025 hat OpenAI sein ChatGPT Tasks vorgestellt. ChatGPT Tasks vollzieht schon die ersten Schritte in Richtung eines vollwertigen KI-Agenten, weil die gestellten Aufgaben aus mehreren Schritten bestehen.

Schritte zur Erfüllung der ­Aufgabe von Beispiel-Prompt 1:

  • Recherche von aktuellen Informationen zum «Thema XY»
  • Erstellung von drei Blogbeiträgen, wie sie typischerweise auf Linkedin ver­öffentlicht werden
  • Erstellen von je zwei Bildvorschlägen zu den drei Blogbeiträgen
  • Senden der täglichen Vorschläge per ­E-Mail

Die Erstellung von sich wiederholenden Tasks kann viel Zeit sparen oder helfen, sich besser zu organisieren. Tasks ist bereits als Betaversion (in Deutschland) verfügbar – wenn man einen Plus-Account für 20 $ oder einen geschäftlichen Team-Account für 25 $ pro Monat hat. 

Der ChatGPT Operator

ChatGPT Operator (auch über operator.chatgpt.com erreichbar) ist das neueste Feature von OpenAI. Es ist in Deutschland noch nicht offiziell verfügbar. Der Operator lässt sich aber bereits nutzen, wenn man über einen seriösen VPN-Anbieter einen amerikanischen Internet-Zugang simuliert und den Pro-Account für 200 $ pro Monat abonniert hat. ChatGPT Operator ist eine erweiterte Version für Unternehmen, die spezielle Tools, Schnittstellen und Funktionen für die Automation von Aufgaben nutzen möchten.

So kann der Operator Webseiten wie ein Mensch bedienen. Er kann – wenn man ihm einmal die Anmeldung zur eigenen Website gegeben hat – beispielsweise die Website pflegen: Dateien öffnen, alternative Bildbeschreibungen oder SEO-Texte einfügen, speichern usw. Das erspart einem Web-Content-Manager viel klicken, warten und wieder klicken. Der Operator kann sich aber auch auf anderen Web­seiten bewegen: klicken, scrollen und Formulare ausfüllen. Der Operator pausiert nur, wenn Log-ins oder die Bestätigung eines «Captcha» erforderlich sind. Hier muss er rein rechtlich manuell von einem Menschen unterstützt werden. ­Log-ins, die einmal eingegeben wurden, merkt sich das System.

Beispiel-Prompts und ­angestossene Abläufe: 

  • Finde ein libanesisches Restaurant in Frankfurt am Main, Deutschland, und reserviere einen Tisch für fünf Personen zum Business-Lunch für «XY Datum», «XY Uhrzeit, Central European Time»
    • Der Operator durchsucht jetzt Plattformen wie beispielsweise Open Table und zeigt Reservierungs-Optionen an, die dann manuell bestätigt werden müssen. Diese Aufgabe kann vom Operator sehr schnell ausgeführt werden, da nur eine Plattform durchsucht werden muss. Es werden aber nur Restaurants berücksichtigt, die OpenTable als Reservierungsplattform nutzen.
  • Alternativ: Durchsuche Websites von Restaurants in Frankfurt am Main, Deutschland. Zeige mir Restaurants mit libanesischer Küche, die eine Online-Reservierungs-Option und einen Tisch für fünf Personen zum Business-Lunch für «XY Datum», «XY Uhrzeit, CET» haben.
    • Der Operator durchsucht jetzt die Webseiten von Restaurants in Frankfurt und zeigt Reservierungs-Optionen an, die dann manuell bestätigt werden müssen.  Diese Aufgabenstellung dauert deutlich länger, weil einzelne Webseiten von Restaurants in Frankfurt durchsucht werden müssen. Es werden gegebenenfalls aber deutlich mehr Restaurants gefunden.
  • Erstelle eine Liste mit fünf Unternehmen in Hessen, die eine Stelle auf der HR-Plattform Indeed für einen «In­novations-Manager m/w/d» ausgeschrieben haben. Finde im Impressum die ­Geschäftsführer zu den Unternehmen ­heraus und liste Unternehmen, Ansprechpartner, Anschriften und zentrale Telefonnummern in einer Excel-Liste auf. Das Durchsuchen von Indeed (Suchmaschine) geht schnell. Das Befüllen der Excel-Liste dauert etwas länger. Und wenn man deutlich mehr Adressen haben möchte, bricht der Operator gegebenenfalls auch die Aufgabe ab.

Die Erledigung einer Aufgabe kann – je nach Umfang – schon einmal ein paar ­Minuten dauern. Es lassen sich allerdings mehrere Aufträge im Operator gleichzeitig starten und ausführen. Zusätzlich können in den Einstellungen angelegte Aufgaben und Anforderungen gespeichert werden. Dadurch lässt sich eine Aufgaben-Datenbank anlegen, die man später wiederverwenden kann.

Der Operator arbeitet mit vorgefertigten KI-Agenten für die Kategorien «Essen und Veranstaltungen», «Essenslieferungen», «Lokale Dienstleistungen», «Einkäufe», «Reisen» und «News». Diese Rubriken sind momentan für den amerikanischen Sprachraum ausgelegt, funktionieren aber zum Teil auch für Deutschland. Es gibt auch nur eine Auswahl von Partner-Webseiten, auf denen man zum Beispiel Präferenzen für Flüge, Unterkünfte oder Essen hinterlegen kann. Zu den Partner-Webseiten, die auch in Deutschland funktionieren, gehören beispielsweise Airbnb, Booking.com, Etsy, Open Table, Trip­advisor, Uber und Uber Eats.

Datenschutz und -sicherheit

Jeder Schritt, den der Operator ausführt, wird live angezeigt und in der Aufgaben-Historie aufgelistet. Damit ist der Ope­rator keine Blackbox, denn die Schritte bleiben nachvollziehbar. Das hilft auch bei der Suche nach Fehlern oder der Optimierung der Prompts. Eine mögliche Fehlerquelle kann beispielsweise bei der Übersetzung der deutschen Quellen oder bei unterschiedlichen Zeitzonen liegen. Über den Button «Take Control» haben Anwender jederzeit die Möglichkeit, selbst die Kontrolle zu übernehmen. 

Der Operator ist benutzerfreundlich, da Mitarbeitende kein technisches Know-how benötigen, um Abläufe zu automa­tisieren. Allerdings muss es im Unter­nehmen zum Beispiel durch eine KI-Richt­linie erlaubt sein, überhaupt mit KI-Agenten zu arbeiten und gegebenenfalls benötigte Log-ins einzugeben. Der Operator arbeitet in einer kontrollierten virtuellen Umgebung, in der die Daten geschützt sind. Dennoch sollte die IT-Ab­teilung involviert werden. Denn diese Version von ChatGPT Operator erstellt für das Training von jedem Schritt einen Screenshot. In den Settings gibt es allerdings eine Privacy-Einstellung, mit der sich das Modell-Training ausschalten lässt. Während ein Mitarbeitender die Kontrolle übernimmt, werden auf keinen Fall Screenshots erstellt, weil hier meist Zugangsdaten eingegeben werden.

Zwischen-Fazit 

ChatGPT Tasks und Operator sind noch keine fertigen KI-Agenten. Unternehmen können aber bereits das Potenzial erahnen, was sich in Zukunft alles mit KI-Agenten wird automatisieren lassen. KI-Agenten haben zudem Auswirkungen auf Geschäftsmodelle: Adressdatenbanken werden beispielsweise durch KI-Agenten an Bedeutung verlieren. Es sei denn, die Anbieter setzen selbst ChatGPT Operator oder andere KI-Modelle ein.

Wie sich Unternehmen auf den neuen Kommunikations­kanal vorbereiten

Durch die Nutzung von KI und KI-Agenten entwickelt sich ein weiterer wichtiger Kommunikationskanal, den Unternehmen für sich nutzen können. Unternehmen müssen sich jetzt entscheiden, ob und wie sie diesen neuen zusätzlichen Kanal aktiv unterstützen wollen oder ob sie sich ihm bewusst entziehen möchten. Denn die Fähigkeit, mithilfe von KI die Informationen einer Website nutzen zu können, hängt von mehreren Faktoren ab.

Website-Typen und KI-Agenten

Websites, die ohne Anmeldung oder spezielle Berechtigungen aufgerufen werden können, sind für KI-Agenten leicht zugänglich. Dazu zählen beispielsweise ­öffentlich zugängliche Nachrichtenseiten wie Wikipedia, Blogs oder Unternehmenswebsites. Webseiten, die eine klare HTML-Struktur haben und deren Inhalte statisch abrufbar sind, funktionieren für KI-Agenten generell besser. 

Geschützte Seiten, die eine Log-in-Pflicht, eine Bezahlschranke, einen Captcha oder eine IP-Blockade haben, sind nicht direkt zugänglich. Das sind beispielsweise Online-Zeitungen mit Bezahl-Inhalten hinter einer Paywall; E-Books/Whitepaper, die für Content-Marketing genutzt werden und nur gegen die Angabe von Daten heruntergeladen werden können; interne Unternehmenswebsites (Intranets) oder auch private Social-Media-Profile. Bei ­Facebook und Linkedin kann man zum Beispiel einstellen, ob das eigene Profil ein geschütztes oder ein öffentlich zugängliches sein soll.

Darüber hinaus gibt es dynamische Websites, die stark von Java Script abhängen und schwer auslesbar sind. Aber auch die Inhalte von Websites, die Java-Frameworks verwenden wie zum Beispiel React, Angular, Vue.js, sind schwer zu analysieren, weil Inhalte oft erst nachträglich geladen werden. Netflix oder Spotify sind zum Beispiel nicht auslesbar, weil ihre Inhalte dynamisch und/oder geschützt sind. Und bei Websites etwa von Banken blockieren zusätzliche Sicherheitsmassnahmen automatisierte Zugriffe – dazu zählen Captchas, Firewalls oder auch spezielle Schutzsysteme wie zum Beispiel Cloudflare.

Es gibt auch Websites, die das Scraping oder die Indexierung durch Bots in den Bestimmungen der robots.txt-Datei steuern. In der robots.txt-Datei wird angegeben, wie die Daten auf einer Site genutzt werden dürfen. Das ist allerdings nur eine Richtlinie und bietet keinen wirklichen Schutz der Daten. Viele Plattformen haben zudem API-Zugriffsbegrenzungen. Selbst wenn der Zugriff prinzipiell über die API erlaubt ist, kann der Zugang bei ungewöhnlich vielen Anfragen gesperrt werden. 

Fazit

KI-Agenten stehen zurzeit noch am Anfang ihrer Entwicklung. Sie sind aber bereits einsetzbar und sie werden sich sehr schnell etablieren, weil sie für Unter­nehmen Zeit sparen und helfen, komplexe Aufgaben zu automatisieren.

Für Unternehmen ist es daher wichtig, jetzt eine Strategie zu entwickeln, welche Informationen sie besonders leicht für KI-Agenten zugänglich machen wollen und welche besser nicht. Die Strategie muss auch enthalten, welche Informationen – nach wie vor – für Menschen spannend sind und welche nur für Maschinen.

Webseiten können vor dem Zugriff durch KI-Systeme auch geschützt werden. Es kann allerdings sinnvoller sein, Massnahmen zu ergreifen, um die Zugänglichkeit der Website für KI-Systeme zu verbessern. Es ist möglich, auf einer Plattform oder Unternehmenswebsite extra aufbereitete Daten für KI-Agenten bereitzustellen – als besondere Datei oder in Tabellenform. Oder Unternehmen stellen eine API für das Auslesen bestimmter Informationen auf ihrer Website zur Verfügung.

Porträt