Objekte erkennen 05.06.2024, 09:30 Uhr

Mit den Augen einer KI: Wie sehen Maschinen?

Künstliche Intelligenz wird immer besser darin, Bilder zu erkennen und zu kategorisieren? Doch wie macht sie das, funktioniert das ähnlich wie bei Menschen? Wiener Forschende kommen zu verblüffenden Ergebnissen.

KI schaut

Wie schaffen es Maschinen, Objekte zu erkennen? Forschende der TU Wien kommen zu verblüffenden Ergebnissen.

Foto: PantherMedia / BiancoBlue

Wie kann man Maschinen beibringen, Objekte in Bildern zu erkennen? In den letzten Jahren gab es enorme Fortschritte auf diesem Gebiet. Durch den Einsatz neuronaler Netze ist es nun zum Beispiel möglich, Bilder von Tieren mit hoher Genauigkeit der richtigen Tierart zuzuordnen. Dies gelingt, indem man ein neuronales Netz mit vielen Beispielbildern trainiert. Das Netz wird schrittweise angepasst, bis es möglichst präzise Ergebnisse liefert.

Welche Strukturen und Mechanismen sich in einem neuronalen Netz während des Trainings entwickeln, ist oft nicht klar. Ein Forschungsteam der TU Wien unter der Leitung von Prof. Radu Grosu und ein Team vom MIT unter Prof. Daniela Rus haben diese Frage untersucht und erstaunliche Ergebnisse erzielt. Sie entdeckten, dass sich in künstlichen neuronalen Netzen Strukturen bilden, die denen im Nervensystem von Tieren oder Menschen ähneln.

Mehrschichtige neuronale Netze

„Wir arbeiten mit sogenannten Convolutional Neural Networks, die häufig zur Verarbeitung von Bilddaten verwendet werden“, erklärt Zahra Babaiee vom Institut für Computer Engineering der TU Wien. Babaiee ist die Erstautorin der Studie und führte einen Teil der Forschungsarbeit am MIT und den anderen an der TU Wien durch. Das Design dieser Netzwerke ist von den neuronalen Netzwerken in Augen und Gehirnen inspiriert, wo visuelle Eindrücke durch mehrere Schichten von Neuronen verarbeitet werden.

In künstlichen neuronalen Netzen wird dieses Prinzip digital nachgeahmt. Ein Bild wird Pixel für Pixel durch die erste Schicht des Netzwerks geleitet. Die Aktivität der Neuronen in dieser Schicht hängt davon ab, ob sie einen hellen oder dunklen Pixel verarbeiten. Diese Aktivitäten bestimmen wiederum die Aktivität der Neuronen in der nächsten Schicht. Jedes Neuron der nachfolgenden Schicht kombiniert die Signale der vorherigen Schicht nach einem bestimmten Muster.

Stellenangebote im Bereich Softwareentwicklung

Softwareentwicklung Jobs
Octapharma Produktionsgesellschaft Deutschland mbH-Firmenlogo
Ingenieur (m/w/d) Automatisierung (Schwerpunkt: Prozessleitsystem PCS7) Octapharma Produktionsgesellschaft Deutschland mbH
Springe Zum Job 
Synthos Schkopau GmbH-Firmenlogo
Maintenance Engineer (m/w/d) Synthos Schkopau GmbH
Schkopau Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Ingenieur/in (m/w/d) für Tunnelsicherheit Die Autobahn GmbH des Bundes
Stuttgart Zum Job 
SE Tylose GmbH & Co. KG-Firmenlogo
Ingenieur der Mess- und Regeltechnik (m/w/d) für Investitionsprojekte SE Tylose GmbH & Co. KG
Wiesbaden Zum Job 
Industriepark Nienburg GmbH-Firmenlogo
Ingenieur (m/w/d) Elektrotechnik als Leiter Elektrotechnik & Automation Industriepark Nienburg GmbH
Nienburg Zum Job 
Evonik Operations GmbH-Firmenlogo
EMR-Anlageningenieur (m/w/d) mit Sonderqualifikation Evonik Operations GmbH
Rheinfelden (Baden) Zum Job 
CR3-Kaffeeveredelung M. Hermsen GmbH-Firmenlogo
Projektleiter (m/w/d) Elektrotechnik CR3-Kaffeeveredelung M. Hermsen GmbH
THU Technische Hochschule Ulm-Firmenlogo
Laboringenieur*in (w/m/d) mit Leitungsfunktion am Institut für Automatisierungssysteme THU Technische Hochschule Ulm
Fachhochschule Münster-Firmenlogo
Professur für "Elektrische Netze" (w/m/d) Fachhochschule Münster
Steinfurt Zum Job 
Zweckverband Bodensee-Wasserversorgung-Firmenlogo
Ingenieur (m/w/d) für Automatisierungstechnik SPS / OT-Sicherheit Zweckverband Bodensee-Wasserversorgung
Sipplingen Zum Job 
B. Braun Melsungen AG-Firmenlogo
Senior Prozess Experte (w/m/d) Reinmedien / Einwaage / Ansatz B. Braun Melsungen AG
Melsungen Zum Job 
Deutsches Zentrum für Luft- und Raumfahrt e. V.-Firmenlogo
Versorgungsingenieur/in, Elektroingenieur/in o. ä. (w/m/d) Projektsteuerung von Baumaßnahmen Deutsches Zentrum für Luft- und Raumfahrt e. V.
DTU Nanolab-Firmenlogo
Technicians / Service Engineers (f/m/d) DTU Nanolab
Kongens Lyngby (Dänemark) Zum Job 
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 
Stuttgart Netze GmbH-Firmenlogo
(Junior) Ingenieur Elektrotechnik Projektierung (w/m/d) Stuttgart Netze GmbH
Stuttgart Zum Job 
Lincoln Electric GmbH-Firmenlogo
Schweißfachingenieur / Schweißtechniker (m/w/d) Lincoln Electric GmbH
Evonik Operations GmbH-Firmenlogo
Ingenieur (m/w/d) Informatik / Elektrotechnik / Automatisierungstechnik / Chemische Produktion Evonik Operations GmbH
VIVAVIS AG-Firmenlogo
Partner-Manager Metering (m/w/d) VIVAVIS AG
Koblenz, Home-Office Zum Job 
VIVAVIS AG-Firmenlogo
Sales Manager Bahn (m/w/d) VIVAVIS AG
Berlin, Home-Office Zum Job 
B. Braun Melsungen AG-Firmenlogo
Head of (w/m/d) Portfolio Development Team Pain Therapy B. Braun Melsungen AG
Melsungen Zum Job 

Ähnlichkeiten mit biologischen neuronalen Netzen

„Nicht alle Neuronen einer Schicht sind für jedes Neuron der nachfolgenden Schicht relevant“, erklärt Babaiee. „Auch im Gehirn sind Neuronen nicht mit allen Neuronen der vorhergehenden Schicht verbunden, sondern nur mit benachbarten.“ In Convolutional Neural Networks werden daher „Filter“ verwendet, die bestimmen, welche Neuronen Einfluss auf ein bestimmtes nachfolgendes Neuron haben. Diese Filter entstehen während des Trainings des Netzes von selbst.

Während des Trainings passen sich diese Filter und andere Parameter kontinuierlich an, um die Genauigkeit zu maximieren. Nach dem Training kann man analysieren, welche Filter sich entwickelt haben. Interessanterweise fallen diese Filter in mehrere einfache Kategorien. Manche Filter lassen ein Neuron stark von seinem direkten Vorgänger beeinflusst werden, andere haben kreuzförmige Muster oder zeigen entgegengesetzte Bereiche.

Parallelen zur Biologie

„Diese Muster wurden auch in biologischen Nervensystemen beobachtet“, sagt Babaiee. Die visuelle Datenverarbeitung beim Menschen funktioniert wahrscheinlich ähnlich. Dass sowohl die Evolution als auch Machine-Learning-Algorithmen ähnliche Filter-Funktionen hervorgebracht haben, ist kein Zufall. Wenn man diese Strukturen beim visuellen Lernen berücksichtigt, können Machine-Learning-Algorithmen entwickelt werden, die schneller und effizienter arbeiten.

Ein Beitrag von:

  • Dominik Hochwarth

    Redakteur beim VDI Verlag. Nach dem Studium absolvierte er eine Ausbildung zum Online-Redakteur, es folgten ein Volontariat und jeweils 10 Jahre als Webtexter für eine Internetagentur und einen Onlineshop. Seit September 2022 schreibt er für ingenieur.de.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.