Mit den Augen einer KI: Wie sehen Maschinen?
Künstliche Intelligenz wird immer besser darin, Bilder zu erkennen und zu kategorisieren? Doch wie macht sie das, funktioniert das ähnlich wie bei Menschen? Wiener Forschende kommen zu verblüffenden Ergebnissen.
Wie kann man Maschinen beibringen, Objekte in Bildern zu erkennen? In den letzten Jahren gab es enorme Fortschritte auf diesem Gebiet. Durch den Einsatz neuronaler Netze ist es nun zum Beispiel möglich, Bilder von Tieren mit hoher Genauigkeit der richtigen Tierart zuzuordnen. Dies gelingt, indem man ein neuronales Netz mit vielen Beispielbildern trainiert. Das Netz wird schrittweise angepasst, bis es möglichst präzise Ergebnisse liefert.
Welche Strukturen und Mechanismen sich in einem neuronalen Netz während des Trainings entwickeln, ist oft nicht klar. Ein Forschungsteam der TU Wien unter der Leitung von Prof. Radu Grosu und ein Team vom MIT unter Prof. Daniela Rus haben diese Frage untersucht und erstaunliche Ergebnisse erzielt. Sie entdeckten, dass sich in künstlichen neuronalen Netzen Strukturen bilden, die denen im Nervensystem von Tieren oder Menschen ähneln.
Mehrschichtige neuronale Netze
„Wir arbeiten mit sogenannten Convolutional Neural Networks, die häufig zur Verarbeitung von Bilddaten verwendet werden“, erklärt Zahra Babaiee vom Institut für Computer Engineering der TU Wien. Babaiee ist die Erstautorin der Studie und führte einen Teil der Forschungsarbeit am MIT und den anderen an der TU Wien durch. Das Design dieser Netzwerke ist von den neuronalen Netzwerken in Augen und Gehirnen inspiriert, wo visuelle Eindrücke durch mehrere Schichten von Neuronen verarbeitet werden.
In künstlichen neuronalen Netzen wird dieses Prinzip digital nachgeahmt. Ein Bild wird Pixel für Pixel durch die erste Schicht des Netzwerks geleitet. Die Aktivität der Neuronen in dieser Schicht hängt davon ab, ob sie einen hellen oder dunklen Pixel verarbeiten. Diese Aktivitäten bestimmen wiederum die Aktivität der Neuronen in der nächsten Schicht. Jedes Neuron der nachfolgenden Schicht kombiniert die Signale der vorherigen Schicht nach einem bestimmten Muster.
Ähnlichkeiten mit biologischen neuronalen Netzen
„Nicht alle Neuronen einer Schicht sind für jedes Neuron der nachfolgenden Schicht relevant“, erklärt Babaiee. „Auch im Gehirn sind Neuronen nicht mit allen Neuronen der vorhergehenden Schicht verbunden, sondern nur mit benachbarten.“ In Convolutional Neural Networks werden daher „Filter“ verwendet, die bestimmen, welche Neuronen Einfluss auf ein bestimmtes nachfolgendes Neuron haben. Diese Filter entstehen während des Trainings des Netzes von selbst.
Während des Trainings passen sich diese Filter und andere Parameter kontinuierlich an, um die Genauigkeit zu maximieren. Nach dem Training kann man analysieren, welche Filter sich entwickelt haben. Interessanterweise fallen diese Filter in mehrere einfache Kategorien. Manche Filter lassen ein Neuron stark von seinem direkten Vorgänger beeinflusst werden, andere haben kreuzförmige Muster oder zeigen entgegengesetzte Bereiche.
Parallelen zur Biologie
„Diese Muster wurden auch in biologischen Nervensystemen beobachtet“, sagt Babaiee. Die visuelle Datenverarbeitung beim Menschen funktioniert wahrscheinlich ähnlich. Dass sowohl die Evolution als auch Machine-Learning-Algorithmen ähnliche Filter-Funktionen hervorgebracht haben, ist kein Zufall. Wenn man diese Strukturen beim visuellen Lernen berücksichtigt, können Machine-Learning-Algorithmen entwickelt werden, die schneller und effizienter arbeiten.
Ein Beitrag von: