27.06.2023 / Knud Wassermann

KI – wohin geht die Reise? (Teil 1)

Seit Ende November 2022 ist das Thema «Künstliche Intelligenz» in aller Munde. Durch neue Entwicklungen steht KI aufgrund ihrer Benutzerfreundlichkeit wirklich allen zur Verfügung. Mit ChatGPT kann man sich einen Text schreiben lassen, und Stable Diffusion oder Midjourney genieren realistische Bilder. Was kommt da auf die Kreativ-, Medien- und Druckindustrie zu?
 
Schon seit vielen Jahren wird KI in ganz unterschiedlichen Bereichen eingesetzt. Vor allem in der Prozessoptimierung hat sich KI breitgemacht – und autonomes Drucken, wie es von einzelnen Herstellern propagiert wird, geht ohne KI überhaupt nicht. Im Bereich von Publishing kommt KI etwa bei der Verschlagwortung von Bildern und Grafiken zum Einsatz. Algorithmen bringen Bilder auf Hochglanz, und in vielen Fällen erfolgt der Ausschuss der Druckbogen heute schon mittels KI.
 
Für diese Anwendungen hat sich daher auch der Begriff «Machine Learning» etabliert, was das, was diese KI ausmacht, sehr gut beschreibt. Aber auch in unser privates Leben ist KI schon weit vorgedrungen. Mittels Gesichtserkennung entsperren wir unsere Mobiltelefone und wickeln Bankgeschäfte ab, ohne gross darüber nachzudenken. Warum dann also die ganze Aufregung?
 
KI: ein datengetriebener Algorithmus
Hinter KI steht immer ein datengetriebener Algorithmus. Die Daten dafür liefert das Internet in Hülle und Fülle, und über die Plattformen von E-Commerce oder Social Media geschieht dies de facto on-the-fly. Im Hintergrund agierende Datenbanken füttern die Algorithmen ganz gezielt, bis sie im Laufe der Zeit zu mächtigen Werkzeugen herangewachsen sind.
 
Amazon etwa hat schon vor Jahren einen Algorithmus geschaffen, der vorhersagt, was Kund(inn)en als Nächstes kaufen werden. Mit dem Chatbot ChatGPT von OpenAI und Bildgeneratoren wie Stable Diffusion oder Midjourney erschliesst sich die KI-Welt für alle, ohne eine einzige Zeile selbst programmieren zu müssen.
 
KI als Co-Pilot
Erstaunlich ist, wie rasch die Entwicklung und die Marktpenetration einzelner KI-Lösungen vonstattengegangen ist. Microsoft als wesentlicher Player der OpenAI-Plattform hat ChatGPT in zweieinhalb Jahren aus dem Boden gestampft. Am 30. November 2022 wurde sie scharf gestellt. Innerhalb von fünf Tagen registrierten sich eine Millionen Nutzer, zwei Monate später waren es bereits 100 Millionen. Im Vergleich dazu benötigte Facebook zehn Monate.
 
Satava Natella, CEO von Microsoft, betonte am Weltwirtschaftsforum 2023 in Davos, wie sehr KI-Anwendungen den Menschen in seinem Alltag unterstützen und die Funktion eines Co-Piloten übernehmen werden. Als Bespiel führte er ein indisches Unternehmen an. Dieses hätte ChatGPT bereits in seine Plattform integriert und unterstützt damit Menschen bei Antragsstellungen in Behörden, es übernehme dort neben der Formulierung auch gleich die entsprechende Übersetzung. In einem Land mit 22 Amtssprachen ist eine solche Lösung sehr hilfreich. Die KI-Lösung soll noch in diesem Jahr fixer Bestandteil der Microsoft-Welt werden und in verschiedene Applikationen wie Word, Teams aber vor allem auch im eigenen Browser integriert werden.
 
Ungeklärte Fragen stehen im Raum
Grundsätzlich stellt sich die Frage, ob der Begriff Künstliche Intelligenz überhaupt passend ist. Auf Wikipedia findet sich folgende Definition: «Intelligenz ist die kognitive bzw. geistige Leistungsfähigkeit speziell im Problemlösen. Der Begriff umfasst die Gesamtheit unterschiedlich ausgeprägter kognitiver Fähigkeiten des Menschen zur Lösung eines logischen, sprachlichen, mathematischen oder sinnorientierten Problems.»
 
KI allerdings versucht diese Fähigkeiten nur zu simulieren und möglichst menschlich zu wirken. Das hat aber nichts mit menschlicher Entscheidungsfähigkeit zu tun, die von Emotionen, Empathie, Fantasie, Verstand und vielem mehr geprägt ist. «Wir dürfen nicht den Fehler machen, der KI ein menschliches Verstehen zu unterstellen», betont der KI-Experte Marnus Flatz. Vielleicht wäre die Bezeichnung Technische Intelligenz (IT) besser gewählt.
 
Ein Problem ist auch der Grundstock, auf dem KI aufbaut: Woher kommen die Daten? Mit welchen Daten werden die Algorithmen gefüttert? Wie wird in KI-Lösungen etwa Diversität abgebildet? Das sind mit Sicherheit nicht die einzigen Fragen, die ungeklärt im Raum stehen. Wo liegen die Urheberrechte – beim Unternehmen, das die KI-Lösung entwickelt hat, oder beim Nutzer der KI-Lösung?
 
Die Bildagentur Getty Images hat bereits eine Klage gegen den Bildgenerator Stability AI eingereicht, um hier eine Klärung herbeizuführen. Auch Fragen des Datenschutzes müssen neuerlich hinterfragt werden, denn KI-Anwendungen finden Grossteils in der Cloud statt, und das Thema Nachhaltigkeit wurde bis dato sowie so ausgeblendet.
 
Wer übernimmt die Verantwortung?
ChatGPT und all die anderen KI-Tools werden auf Dauer nicht für alle Nutzer kostenlos bleiben – dazu ist der Betrieb offensichtlich doch zu teuer. Experten sprechen davon, dass der Energieverbrauch ähnlich hoch sein wird, wenn nicht noch höher, als jener der Block-Chain. Allein für das Schürfen von Bitcoins wurde 2022 laut dem Bitcoin Electricity Consumption Index 107 Terawattstunden verbraucht, was in etwa dem Stromverbrauch der Niederlande entspricht.
 
Wenn das Datenvolumen weiterhin so massiv ansteigt, und davon kann man auszugehen, benötigt es eine andere IT-Infrastruktur, um die zukünftigen KI-Anwendungen zu stemmen. Beim Sprung von Chat CPT3 auf 4 hat sich das Datenvolumen von ursprünglich 500 GB verzehntausendfacht. Quantencomputer könnte hier die Lösung liefern, aber bis dahin, wird es noch dauern.
 
ChatGPT lässt sich durchaus im professionellen Umfeld einsetzen. Etwa als Unterstützung in der Beratung im Online-Shop, wo Chatbots ja bereits heute im Einsatz sind. Aber auch im Kundenservice, im Marketing, wenn es um die Erstellung von Posting-Texten geht, oder für den Aufbau von Produktseiten – und hier vor allem für das Formulieren von Beschreibungstexten. Gerade in diesen Bereichen lassen sich manuell zeitaufwändige Aufgaben durch den Einsatz von KI optimieren. Die Verantwortung für die Überprüfung und Validierung der generierten Informationen liegt aber klar beim Benutzer – das heisst im Umkehrschluss: Blind kann man einer KI nicht vertrauen.
 
Das perfekte Bild oder Anzeige
Mit Mindjourney oder DALL-E, erhält man, vorausgesetzt man gibt die passenden Prompts (Schlagwörter) ein, sehr schnell ein brauchbares Ergebnis. Je detailreicher die Prompts ausfallen, desto besser werden die Bilder – und das ohne eine Programmierzeile in die Tastatur zu klopfen. Ob das Ergebnis gut oder schlecht ist, liegt wie immer im Auge des Betrachters. Die Plattform www.looka.com hilft bei der Erstellung von Logos und unterschiedlichsten Corporate-Design-Elementen. Das Ganze gibt es natürlich auch für den Video-Bereich, und dann sind wir ganz schnell bei dem Thema «Deep Fake». Der Begriff bringt es ziemlich gut auf den Punkt: Es entstehen neue Bilder oder Videosequenzen, die nicht unbedingt etwas mit der Realität zu tun haben müssen.
 
Öffentliches Bewusstsein schaffen
Trotz vieler offener Fragen, die jetzt aufgetaucht sind und noch auftauchen werden, werden uns KI-gestützte Lösungen von vielen repetitiven Aufgabe befreien. Der wirtschaftliche Nutzen wird gewaltig sein – vor allem dann, wenn man an die Verbindung von KI, Robotik und 3D-Druck denkt. Davon könnten alle Gesellschaftsschichten profitieren, nur fehlen derzeit noch die Rahmenbedingungen. Dazu passt auch ein Zitat des Physikers Stephen Hawking: «Der Erfolg bei der Schaffung einer effektiven Künstlichen Intelligenz könnte das grösste Ereignis in der Geschichte unserer Zivilisation werden. Oder das schlimmste.»
 
Vor diesem Hintergrund müssen die Ziele, die gerade diese breit angelegten Algorithmen wie etwa ChatCPT verfolgen, offengelegt werden. Das Thema kann man nicht einfach den Tech-Giganten überlassen werden, die im Grund genommen nur wirtschaftliche Interessen verfolgen. Auch wenn OpenAI versichert, dass man an offenen, allgemein zugänglichen KI-Lösungen arbeite, von der die gesamte Menschheit profitieren soll. Grundsätzlich ist Technik nicht gut oder böse. Aber wie KI eingesetzt wird, dafür braucht es klare gesetzliche Regeln. Für jedes Medikament benötigt man eine Zulassung, eine ähnliche Vorgehensweise braucht es auch im generativen KI-Bereich.
 
Positive wie negative Auswirkungen abwägen
Kritiker verweisen in diesem Zusammenhang darauf hin, dass solche Regelungen innovationshemmend seien. Doch Hand aufs Herz: Bei all den tiefgreifenden Innovationen der letzten Jahrzehnte, wäre es vielleicht gar nichts schlecht, ein bisschen Dampf rauszunehmen und sich die möglichen positiven wie negativen Auswirkungen etwas genauer abzuwägen. Selbst Elon Musk hat vor kurzem eine Petition unterschrieben, die einen Entwicklungsstopp von sechs Monate bei grossen KI-Projekten wie etwa ChatGPT fordert. Parallel dazu hat Musk aber das Unternehmen «X.AI» gegründet, was seine Glaubwürdigkeit einmal mehr konterkariert.
 
Und zum Schluss noch diese Anmerkung: Künstliche der Technische Intelligenz ist nicht mit der menschlichen vergleichbar. Aus dieser Erkenntnis lassen sich Ängste entkräften, dass die Maschine den Menschen ersetzen wird. Die Stärke des Menschen liegt in seiner Empathie, Kreativität, Fantasie und der Interpretation komplexer Zusammenhänge. Technologie ist per se nicht gut oder schlecht, sondern das entscheidet letztlich die Gesellschaft, was sie mit ihr macht.
 
Im zweiten KI-Blog in einer Woche an dieser Stelle schauen wir uns an, wie KI bereits heute in der Publishing- und Druckindustrie eingesetzt wird!
 
Ihr
Knud Wassermann,
Chefredakteur «Graphische Revue»
 
27.06.2023 Knud Wassermann Chefredaktor «Graphische Revue»