Bilder mit Hilfe künstlicher Intelligenz (KI) zu beschreiben und darin Objekte und Situationen zu erkennen, war für Forscher*innen lange eine große Herausforderung. Schließlich gelang dies mit Algorithmen des maschinellen Lernens. Mit dem Erfolg entstand die Idee, den Prozess umzukehren: Ist es möglich, realistische Bilder aus einer Textbeschreibung zu erzeugen?
In der aktuellen KI-Forschung werden hierfür zwei neuronale Netze miteinander kombiniert. Das eine erzeugt Bilder ohne Kenntnis des Inhalts, das andere wurde mit Milliarden von Bild-Text-Paaren aus Internetquellen trainiert. Dadurch enthält es eine umfangreiche Sammlung von visuellem Wissen, mit dem es die Ähnlichkeit eines Bildes mit einer gegebenen Textbeschreibung bewertet. Der Prozess führt das generative Netz zu einem gewünschten Bild. Diese Technik macht das Schaffen, Kombinieren und Bearbeiten von Bildern leicht zugänglich.
Bei dieser Installation geben Anwender*innen genaue Bildanweisungen als Text ein. Über einen Chat steht das Tool mit ihnen im Dialog. Es erstellt aus dem Text-Input ein Bild. Nach längerer Nutzung entsteht ein Korpus von Bildern mit Situationen und Objekten, die so zuvor noch nicht existierten.
Computerprogramme, die auf Machine Learning basieren, sind aus kreativen Praktiken nicht mehr wegzudenken. Sie erweitern die individuelle Kreativität und werden besonders in frühen Phasen der Ideenfindung eingesetzt, wenn Elemente aus dem persönlichen und kulturellen Gedächtnis zu neuen Konzepten kombiniert werden. Machine Learning macht riesige Datenmengen zugänglich. Die Programme ermöglichen eine Arbeit mit der „eigenen Kultur“, wie sie vorher noch nicht möglich war: mit visuellen Zeichen und Ikonografie, mit Sprache und musikalischen Elementen.
Was hierbei als „eigene Kultur“ gilt, ist hoch individuell und personalisierbar. Anfang der 2020er Jahre arbeitete die KI-Forschung noch mit Datensätzen, die aus dem Internet stammten. Sie spiegelten die Kultur einer weißen männlichen (Internet-)Gesellschaft wider, was Monokultur und Ausgrenzung schuf. Inzwischen ist jede*r in der Lage, Datensätze und Modelle zu erstellen, die die eigene singuläre lokale Kultur repräsentieren.
Eine neue Infrastruktur ermöglicht das Teilen dieser lokalen Modelle mit anderen Communities. Die Kollaboration zwischen Mensch und KI ist demnach eigentlich eine Kollaboration zwischen Mensch und Mensch. Kreative Leistungen werden als Resultate von Gemeinschaften, nicht Individuen gesehen.
Bilder mit Hilfe künstlicher Intelligenz (KI) zu beschreiben und darin Objekte und Situationen zu erkennen, war für Forscher*innen lange eine große Herausforderung. Schließlich gelang dies mit Algorithmen des maschinellen Lernens. Mit dem Erfolg entstand die Idee, den Prozess umzukehren: Ist es möglich, realistische Bilder aus einer Textbeschreibung zu erzeugen?
In der aktuellen KI-Forschung werden hierfür zwei neuronale Netze miteinander kombiniert. Das eine erzeugt Bilder ohne Kenntnis des Inhalts, das andere wurde mit Milliarden von Bild-Text-Paaren aus Internetquellen trainiert. Dadurch enthält es eine umfangreiche Sammlung von visuellem Wissen, mit dem es die Ähnlichkeit eines Bildes mit einer gegebenen Textbeschreibung bewertet. Der Prozess führt das generative Netz zu einem gewünschten Bild. Diese Technik macht das Schaffen, Kombinieren und Bearbeiten von Bildern leicht zugänglich.
Bei dieser Installation geben Anwender*innen genaue Bildanweisungen als Text ein. Über einen Chat steht das Tool mit ihnen im Dialog. Es erstellt aus dem Text-Input ein Bild. Nach längerer Nutzung entsteht ein Korpus von Bildern mit Situationen und Objekten, die so zuvor noch nicht existierten.
Computerprogramme, die auf Machine Learning basieren, sind aus kreativen Praktiken nicht mehr wegzudenken. Sie erweitern die individuelle Kreativität und werden besonders in frühen Phasen der Ideenfindung eingesetzt, wenn Elemente aus dem persönlichen und kulturellen Gedächtnis zu neuen Konzepten kombiniert werden. Machine Learning macht riesige Datenmengen zugänglich. Die Programme ermöglichen eine Arbeit mit der „eigenen Kultur“, wie sie vorher noch nicht möglich war: mit visuellen Zeichen und Ikonografie, mit Sprache und musikalischen Elementen.
Was hierbei als „eigene Kultur“ gilt, ist hoch individuell und personalisierbar. Anfang der 2020er Jahre arbeitete die KI-Forschung noch mit Datensätzen, die aus dem Internet stammten. Sie spiegelten die Kultur einer weißen männlichen (Internet-)Gesellschaft wider, was Monokultur und Ausgrenzung schuf. Inzwischen ist jede*r in der Lage, Datensätze und Modelle zu erstellen, die die eigene singuläre lokale Kultur repräsentieren.
Eine neue Infrastruktur ermöglicht das Teilen dieser lokalen Modelle mit anderen Communities. Die Kollaboration zwischen Mensch und KI ist demnach eigentlich eine Kollaboration zwischen Mensch und Mensch. Kreative Leistungen werden als Resultate von Gemeinschaften, nicht Individuen gesehen.