Stand generativer KI in kreativen und planenden Berufen
Warum heißt KI jetzt KO?
Weil Chuck Norris sie trainiert hat.*
Künstliche Intelligenz und deren Anwendungsmöglichkeiten sind derzeit DAS Trendthema. Es gibt tägliche Medienberichterstattung auf allen Kanälen dazu, und KI ist vermutlich eines der häufigsten Gesprächsthemen an den Bürokaffeemaschinen dieser Republik. Firmen mit Spezialisierung auf die Nutzung und den Betrieb von KI werden an der Börse zu astronomischen Kursen gehandelt. Mit der Hilfe von KI erstellte Bildfälschungen und Deepfake-Videos erzeugen Krisen und belasten politische Beziehungen auf höchsten diplomatischen Ebenen.
Wenige allerdings bemerken, dass sie bereits Nutzer von KI-unterstützten Anwendungen in ihrem Alltag sind, oder arbeiten sogar proaktiv mit entsprechenden Lösungen.
Leistungsfähige KI-Anwendungen kommen nun mehr und mehr in der Alltagswelt an. Vor allem sogenannte generative KI-Tools erzeugen derzeit große Aufmerksamkeit, die vollkommen neue und als kreativ anzusehende Inhalte erschaffen können. Wir sind fasziniert und zugleich erschrocken darüber, wie gut die Ergebnisse dieser Tools mittlerweile sind. Gerade im Bereich der kreativen Berufe fühlten sich die Menschen den Maschinen stets haushoch überlegen, doch selbst diese Domäne wird nun zunehmend und erfolgreich von KI erobert.
Die Software ChatGPT von Open AI beherrscht derzeit ziemlich unangefochten die Schlagzeilen, die gebührenfrei öffentlich zugänglich ist, und mit der sich beliebige Texte hoher Qualität und durchaus einiger Originalität generieren lassen. Momentan haben KI-Anwendungen allerdings oftmals noch Kinderkrankheiten, und die Entwickler haben Probleme mit der Skalierung ihrer Tools für Millionen von neuen Anwendern.
Für Architekt:innen und Planer sind solche textbasierten Tools momentan eher ein Randthema für ihre Arbeit, da sie sich hauptsächlich mit visuellen und technischen Fragestellungen auseinandersetzen. Dabei gibt es am Markt tatsächlich auch schon bemerkenswerte KI-Anwendungen im Bereich der Unterstützung der visuellen Kreativität.
Microsoft hat vor Kurzem mit Microsoft Copilot eine auf den Lösungen von Open AI basierende KI-Technologie in das Office-Paket integriert, die unter anderen Möglichkeiten auch Bilder aus Texteingaben erzeugen kann.
Eines der führenden Unternehmen im Bereich kreativer Software-Anwendungen, Adobe, investiert derzeit massiv mit Adobe Firefly in eine eigene KI-Technologie für die nahtlose Integration in die eigene Kreativ-Suite.
Zudem gibt es mit der über den Umweg einer Chat-Plattform namens Discord zugänglichen Software Midjourney eine sehr interessante KI Image-Engine, die auf einer eigenen proprietären leistungsfähigen KI-Technologie aufbaut.
Wie funktionieren diese Anwendungen?
Nutzer interagieren mit Tools wie Midjourney zur Erzeugung gewünschter Bildmotive auf der Basis der Eingabe von möglichst präzisen Textbefehlen, sogenannten „Prompts“. Hierbei kann der Nutzer textlich beschreiben, welche Inhalte ein Bild enthalten soll und welche Art der Darstellung gewünscht ist. Das Erstaunliche hierbei ist, dass die KI-Anwendungen durchaus dazu in der Lage sind, mehrere gewünschte Bildelemente zu einem schlüssigen realistisch wirkenden neuen Ganzen zu verarbeiten. Möchte man beispielsweise das Bild eines modernen Wohnhauses mit einer Holzfassade am Ufer eines Sees mit einem Wald im Hintergrund und schlussendlich das Ganze in einer winterlichen Atmosphäre, so erzeugt die KI Engine ohne Probleme realistische Bildmotive in der gewünschten Kombination dieser sechs einzelnen Schlüsselinformationen, obschon die einzelnen Elemente miteinander vernetzt werden müssen und nicht einfach additiv nebeneinander aufgereiht werden können. Sicher kommt es mitunter auch vor, dass die Software Bildmotive erzeugt, die nicht direkt dem gewünschten Ergebnis entsprechen. In den meisten Fällen kann man allerdings durch Variation der Texteingaben zu einem zufriedenstellenden Ergebnis kommen. Werden es zu viele einzelne Wunschelemente, oder widersprechen sich gewünschte Bildinhalte, kommt kein schlüssiges und nutzbares Bild zustande. Oftmals liegt ein Bild-Fail allerdings auch an der unpräzisen Vorstellung über das gewünschte Zielmotiv seitens des Nutzers. Die Grenzen setzt angesichts mächtiger und leistungsfähiger Werkzeuge immer öfter unsere eigene Vorstellungskraft. In manchen Fällen erzeugt die KI-Engine allerdings unerwartet auch bei vermeintlich leichteren Aufgaben noch unsinnige Motive oder fehlerhafte Details, da die zugrundeliegende Technologie extrem komplex und noch nicht ganz ausgereift ist.
Anspruchsvolle kreative Berufsbilder werden in absehbarer Zeit zwar nicht durch KI-Lösungen ersetzt werden, aber man kann durchaus prophezeien, dass die Erzeugung von visuellen Werken mit Unterstützung künstlicher Intelligenz zukünftig einen festen Platz einnehmen wird, und dass Anwender, die diese Möglichkeiten rechtzeitig proaktiv annehmen einen starken Produktivitätsvorteil bekommen. Gerade in der kreativen Frühphase von Projekten können KI-Tools schnell und unkompliziert neue Ideen visualisieren als auch den eigenen Horizont erweitern. Auch bei der Zusammenstellung von Moodboards könnten KI-unterstützte Lösungen demnächst ganz selbstverständlich mit eingesetzt werden, da die Ergebnisse im positiven Sinne durchaus unerwartet sein können, und für den eigenen Findungsprozess nützlich sind.
Zudem werden auch der Kundenseite die neuen KI-Möglichkeiten nicht verborgen bleiben, und Planer:innen können sich dem Umstand ausgesetzt sehen, dass ihre Kunden nun mit noch detaillierter bebilderten und komplexen Wunschvorstellungen auf sie zukommen. Da die auf KI basierenden visuellen Anwendungen absehbar noch keinerlei Prüfroutinen hinsichtlich der technischen Umsetzbarkeit bestimmter räumlicher Darstellungen haben, kann dies in Zukunft auch zu neuen Problemen in der gemeinsamen Festlegung der gewünschten Ziele zwischen Kunde und Planer führen. Die kreativen Berufstätigen sollten allein schon deshalb den wesentlichen Einsatzhorizont als auch die momentanen Grenzen generativer KI-Tools kennen.
Unternehmen kommerzieller Bilddatenbanken wie Shutterstock, Getty Images und andere werden es allerdings in naher Zukunft sehr schwer haben, vergleichsweise hohe Preise für exklusive Motive bzw. deren Nutzungsrechte verlangen zu können, da Nutzer vermutlich immer öfter auf die individuellen Bedürfnisse optimal zugeschnittenen und schnell erzeugte Alternativlösungen auf der Basis von KI-Modellen zurückgreifen werden. Für die hinter den Datenbanken stehenden Fotografen könnten sich durch diese Entwicklung ebenfalls bislang etablierte Einnahmequellen reduzieren.
Es lassen sich aber nicht nur neue Motive mit der Hilfe von KI-Tools erzeugen. Mit Anwendungen auf Basis künstlicher Intelligenz können auch bereits bestehende Bildmotive modifiziert werden. Auch hier könnte in Zukunft möglicherweise der ein oder andere Auftrag für Kreativdienstleister entfallen. Nicht umsonst arbeitet Adobe gerade mit Hochdruck an einer eigenen nativ integrierten KI-Lösung, um neue einträgliche Geschäftsmodelle zu erschließen, bevor bislang etablierte Einkommensquellen an die neue Konkurrenz entfallen. Des Einen Gewinn ist immer auch des Anderen Verlust.
Fotografen, Künstler und generell Erzeuger kreativer visueller Werke kritisieren zum Beispiel zurecht, dass KI-Anwendungen mit der Hilfe ihrer eigenen bisherigen Schöpfungen ohne ihre explizite Erlaubnis- geschweige denn der Zahlung von Lizenzgebühren – trainiert werden, um dann in Zukunft womöglich einen Teil ihrer Geschäftsgrundlage zu gefährden.
Was Bildrechte anbelangt so gibt es derzeit Licht und Schatten und noch einige Graubereiche. Als regulärer Nutzer einer kommerziellen KI-Software erhält man in der Regel die Nutzungsrechte an den Motiven und kann die erzeugten Werke kommerziell uneingeschränkt einsetzen. Die mit der Unterstützung von KI erzeugten visuellen Werke unterliegen allerdings momentan noch keinem Urheberschutz und können deshalb theoretisch auch von Dritten jederzeit kopiert und für ihre eigenen Zwecke eingesetzt werden. Entsprechende bestehenden Rechteregulierungen werden sicher im Zuge der weiteren Verbreitung von KI-Tools auf die neuen Anwendungen angepasst werden.
Wir dürfen gespannt sein, wie schnell und in welche Richtung sich die generativen KI-Anwendungen zukünftig weiterentwickeln werden. Eines ist jedoch schon klar: Sie sind extrem leistungsfähig. Mit dem noch jungen Start und dem überschaubaren Markt der ersten kommerziellen Tools ist man nun gut beraten, sich mit den neuen Möglichkeiten frühzeitig auseinanderzusetzen, die Potenziale und Grenzen der neuen Technologien kennenzulernen, und diese optimalerweise für sich nutzbar zu machen.
* Copyright: A. Flinterhoff – ergo NI (Natürliche Intelligenz)
KI-Variante: „Chuck Norris benutzt keine KI, weil selbst sein Schatten schon schlauer ist als jede Maschine!“ (Quelle: ChatGPT)
#KI #KünstlicheIntelligenz #Architektur #Technologie #Planung #Innenarchitektur