Verzerrte Realität 21.10.2024, 13:30 Uhr

Warum KI-generierte Bilder oft zu positiv erscheinen

KI-generierte Bilder erscheinen oft übertrieben positiv. Expertinnen und Experten warnen vor einer zu einseitigen Darstellung, die die Realität verzerrt.

KI-Bild Teanager

Alle gut aussehend und aus einer sozialen Schicht: Soll eine KI Menschen, zum Beispiel Teenager, zeichnen, ist Vielfalt meist nur auf den ersten Blick gegeben.

Foto: Die Illustration hat das Forschungsteam mit Hilfe von ChatGPT/Dall-E 3 erstellt

Künstliche Intelligenz hat in den letzten Jahren eine beachtliche Entwicklung durchlaufen, insbesondere im Bereich der Bilderstellung. Tools wie Dall-E 3, ein KI-basierter Bildgenerator, der in ChatGPT integriert ist, erzeugen beeindruckend realistische Bilder. Doch es gibt eine zunehmende Kritik: Diese Bilder erscheinen oft übertrieben positiv und sind in ihrer Darstellung von Menschen und Situationen erstaunlich einseitig.

Vielfalt nur auf den ersten Blick

„Sie sind so schön gemacht, dass es aufdringlich wird“, sagt die Forscherin Gunhild Kvåle von der norwegischen Universität Agder. Diese Aussage fasst treffend die Kritik zusammen, die sich immer häufiger im Zusammenhang mit KI-generierten Bildern äußert. Kvåle hat gemeinsam mit ihrem Kollegen Gustav Westberg von der Universität Örebro untersucht, wie Dall-E 3 insbesondere Teenager darstellt. Dabei stießen die Wissenschaftlerin und ihr Kollege auf mehrere auffällige Muster, die auf tiefere Probleme hinweisen.

Eine der zentralen Entdeckungen war die oberflächliche Darstellung von Vielfalt. Auf den ersten Blick scheinen die Bilder Personen unterschiedlicher ethnischer Herkunft zu zeigen. „Es ist auffällig, wie Dall-E einerseits auf ethnische und geschlechtsspezifische Vielfalt achtet, während die Bilder andererseits nicht sehr vielfältig sind“, erklärt Kvåle. Dies bedeutet, dass die visuelle Diversität auf den Bildern nur die Oberfläche berührt.

Stellenangebote im Bereich Softwareentwicklung

Softwareentwicklung Jobs
Narda Safety Test Solutions GmbH'-Firmenlogo
Einkäufer für den Bereich Elektrotechnik (m/w/d) mit der Möglichkeit zur Teamleitung Narda Safety Test Solutions GmbH'
Pfullingen Zum Job 
Evonik Operations GmbH-Firmenlogo
EMR-Anlageningenieur (m/w/d) Evonik Operations GmbH
Rheinfelden (Baden) Zum Job 
TenneT TSO GmbH-Firmenlogo
Site Manager (m/w/d) Wilhelmshaven TenneT TSO GmbH
Hannover, Wilhelmshaven Zum Job 
VIVAVIS AG-Firmenlogo
Sales Manager (m/w/d) Industrie VIVAVIS AG
Ettlingen Zum Job 
VIVAVIS AG-Firmenlogo
Sales Manager (m/w/d) Metering VIVAVIS AG
Berlin, Homeoffice Zum Job 
Haus der Technik e.V.-Firmenlogo
Fachdozent/in und Berater/in (m/w/d) für Krane und Hebezeuge in der Weiterbildung Haus der Technik e.V.
THU Technische Hochschule Ulm-Firmenlogo
W2-Professur Technische Informatik THU Technische Hochschule Ulm
über ifp | Executive Search. Management Diagnostik.-Firmenlogo
Teamleiter:in Mechanical & Electrical Engineering über ifp | Executive Search. Management Diagnostik.
Emlichheim Zum Job 
IMS Messsysteme GmbH-Firmenlogo
Systemingenieur (m/w/i) für Oberflächeninspektion IMS Messsysteme GmbH
Heiligenhaus Zum Job 
ZVEI e.V.-Firmenlogo
Manager/in Automation (w/m/d) ZVEI e.V.
Frankfurt am Main Zum Job 
Evos Hamburg GmbH-Firmenlogo
Betriebsingenieur EMSR (m/w/d) Evos Hamburg GmbH
Hamburg Zum Job 
Stadtwerke Schneverdingen-Neuenkirchen GmbH-Firmenlogo
Netzplaner (m/w/d) Stadtwerke Schneverdingen-Neuenkirchen GmbH
Schneverdingen-Neuenkirchen Zum Job 
TenneT TSO GmbH-Firmenlogo
Ingenieur als Projektleiter Leitungsbau (m/w/d) TenneT TSO GmbH
Tebis ProLeiS GmbH-Firmenlogo
MES Consultant (m/w/d) Tebis ProLeiS GmbH
Martinsried/Planegg, Erndtebrück, Aachen, Home-Office Zum Job 
Heraeus Electronics GmbH & Co. KG-Firmenlogo
Head (m/f/d) of Global Quality Heraeus Electronics GmbH & Co. KG
BEC Robotics-Firmenlogo
Application Engineer (m/w/d) BEC Robotics
Pfullingen Zum Job 
Hochschule Esslingen - University of Applied Sciences-Firmenlogo
Professur (W2) für das Lehr- und Forschungsgebiet "Automatisierungstechnik mit Schwerpunkt Antriebstechnik" Hochschule Esslingen - University of Applied Sciences
Esslingen am Neckar Zum Job 
Birkenstock Productions Hessen GmbH-Firmenlogo
Verantwortliche Elektrofachkraft (m/w/d) Birkenstock Productions Hessen GmbH
Steinau-Uerzell Zum Job 
TenneT TSO GmbH-Firmenlogo
Elektroingenieur für die Planung und Sicherstellung der europäischen Stromversorgung (m/w/d) TenneT TSO GmbH
Netzgesellschaft Potsdam GmbH-Firmenlogo
Ingenieur (m/w/d) Strategische Netzplanung Strom Netzgesellschaft Potsdam GmbH
Potsdam Zum Job 
Narda Safety Test Solutions GmbH'-Firmenlogo
Einkäufer für den Bereich Elektrotechnik (m/w/d) mit der Möglichkeit zur Teamleitung Narda Safety Test Solutions GmbH'
Pfullingen Zum Job 
Evonik Operations GmbH-Firmenlogo
EMR-Anlageningenieur (m/w/d) Evonik Operations GmbH
Rheinfelden (Baden) Zum Job 
TenneT TSO GmbH-Firmenlogo
Site Manager (m/w/d) Wilhelmshaven TenneT TSO GmbH
Hannover, Wilhelmshaven Zum Job 
VIVAVIS AG-Firmenlogo
Sales Manager (m/w/d) Industrie VIVAVIS AG
Ettlingen Zum Job 

Die Forschenden gaben der KI allgemeine Anweisungen wie „Erstelle Bilder von Teenagern“. Auch als sie Dall-E 3 erlaubten, selbst kreative Texteingaben zu generieren, änderte sich das Ergebnis kaum. Zwar wurde die Vielfalt betont, aber in den Details ähnelten sich die Darstellungen stark: Alle Teenager auf den Bildern tragen ähnliche Kleidung, sind durchweg attraktiv, haben makellose Haut und voluminöses Haar. Eine reale Vielfalt, die auch soziale und individuelle Unterschiede widerspiegelt, fehlt.

Eine übertrieben positive Darstellung

Ein weiteres gemeinsames Merkmal der von Dall-E generierten Bilder ist die durchweg positive Darstellung der Menschen und Situationen. Die Teenager erscheinen immer glücklich, sei es beim gemeinsamen Lernen, bei Konzerten oder in Freizeitaktivitäten. „Auf den Bildern sind alle glücklich, niemand ist traurig“, beschreibt Kvåle.

Dieses positive Bild lässt jedoch bestimmte Aspekte des Alltags komplett außen vor. Es fehlen Darstellungen von Arbeit oder Herausforderungen des Lebens. Die dargestellten Situationen sind meist Freizeitaktivitäten, die von der Gesellschaft geschätzt werden, wie Marshmallow-Grillen oder Konzertbesuche. Das Bildmaterial zeigt Menschen in einem idealisierten Umfeld, was oft nicht der Realität entspricht.„Es ist auffällig, wie Dall-E einerseits auf ethnische und geschlechtsspezifische Vielfalt achtet, während die Bilder andererseits nicht sehr vielfältig sind“, sagt Kvåle.

Fotorealismus als Standard

Ein drittes auffälliges Merkmal der von Dall-E erstellten Bilder ist der starke Fokus auf Fotorealismus. Die Beleuchtung, die Anordnung der Objekte im Bild sowie die Schauplätze wirken auf den ersten Blick authentisch. „Die Bilder erwecken den Eindruck von Authentizität“, so Kvåle, „aber durch den Kontext werden diese jungen Menschen auch sozial positioniert.“

Die Orte, an denen die Teenager dargestellt werden, sind Parks, Jugendclubs oder gemütliche Jugendzimmer. Doch eine Vielfalt an Szenarien, die auch weniger privilegierte Lebensumstände abbilden, fehlt fast vollständig.

Eingeschränkte Kreativität

Eine weitere Erkenntnis des Forschungsteams betrifft die begrenzte Vorstellungskraft von Dall-E. Obwohl die KI in der Lage ist, fantasievolle Szenarien zu erstellen, wie etwa Teenager, die in einer Schneekugel Schlittschuh laufen, geschieht dies nur auf ausdrückliche Aufforderung. Standardmäßig bevorzugt Dall-E realistische, fast sterile Darstellungen.

„Fotorealistische Bilder werden von Dall-E offensichtlich bevorzugt“, erklärt Kvåle. Dies lässt wenig Raum für kreative, alternative Darstellungen, die von der Realität abweichen.

Ein kritischer Blick auf KI-generierte Bilder

Bildgeneratoren wie Dall-E sind heute sehr leistungsfähig und zugänglich. Doch trotz der wachsenden Popularität dieser Technologie fluten sie nicht die Welt mit KI-generierten Bildern. „Es heißt, dass sich durch künstliche Intelligenz alles ändern wird, aber das stimmt eindeutig nicht“, merkt Kvåle an. In vielen Bereichen, wie etwa in Redaktionen oder Kommunikationsabteilungen, gelten weiterhin etablierte Standards.

Dennoch ist es wichtig, ein kritisches Bewusstsein für die Macht von KI-generierten Bildern zu entwickeln. „Dienste wie Dall-E können einen starken Einfluss auf unsere visuelle Kultur haben“, sagt Kvåle. Sie mahnt, dass die Art und Weise, wie diese Bilder Menschen und Situationen darstellen, nicht immer die Vielfalt und Realität unserer Gesellschaft widerspiegelt.

Hier geht es zur Originalpublikation

Ein Beitrag von:

  • Dominik Hochwarth

    Redakteur beim VDI Verlag. Nach dem Studium absolvierte er eine Ausbildung zum Online-Redakteur, es folgten ein Volontariat und jeweils 10 Jahre als Webtexter für eine Internetagentur und einen Onlineshop. Seit September 2022 schreibt er für ingenieur.de.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.