Künstliche Intelligenz 02.06.2021, 07:00 Uhr

Computer sieht fast wie ein Mensch – Nobelpreisträger helfen ihm dabei

Ein Forscherteam der TU Graz bringt Computern das Sehen bei und orientiert sich dafür am menschlichen Gehirn. Durch die künstliche Intelligenz entsteht eine ganz neue Form der Bildverarbeitung. Ohne die Erkenntnisse sehr renommierter Kollegen wäre das nicht möglich gewesen.

Veränderte Bilder

So verändert der Algorithmus die Bilder.

Foto: Pock, TU Graz / ICG

Für uns ist es selbstverständlich, dass wir etwas sehen – im Alltag macht sich wohl keiner Gedanken darüber, was für hochkomplexe Vorgänge im Gehirn ablaufen müssen, damit das möglich ist. Genau genommen ist es der Wissenschaft bis heute nicht gelungen, im Detail zu entschlüsseln, wie die Informationsverarbeitung in unseren Köpfen abläuft. Fest steht: Der sogenannte visuelle Cortex ist der Bereich im Gehirn, der dafür sorgt, dass wir in Höchstgeschwindigkeit unsere Umgebung erkennen können. Forscher der TU Graz haben jetzt alle Informationen gesammelt, die über das menschliche Sehen bekannt sind – und sie als Grundlage für eine neue Generation der Bildverarbeitung genutzt. Sie wollen der künstlichen Intelligenz (KI) das Sehen beibringen und sind dabei schon einen guten Schritt vorangekommen.

Künstliche Intelligenz soll sich am Gehirn orientieren

Es ist schon faszinierend, dass das Gehirn offensichtlich besser und schneller arbeitet als ein Hochleistungscomputer. Das wird beim Sehen besonders deutlich. Denn der visuelle Cortex ist in der Lage, Bilder zu erfassen, auch wenn er sie nur extrem kurz sieht. Zudem erkennt er Objekt, von denen er nur einen Teilbereich wahrnimmt. Dabei passieren zwar durchaus Fehler, es sind aber erstaunlich wenige. Das hängt mit dem speziellen Aufbau des visuellen Cortex zusammen. Vereinfacht gesagt, werden die eingehenden Informationen mit bekanntem Wissen abgeglichen. Zusammenhänge und vertraute Muster dienen dazu, die neuen Informationen einzuordnen und gegebenenfalls zu ergänzen.

Die Idee, diese Aufgabe einer künstlichen Intelligenz beizubringen, ist natürlich nicht neu. Entsprechend programmierte Deep-Learning-Algorithmen schneiden bei Mustererkennungsaufgaben zum Teil hervorragend ab. Hier entsteht aber eine ähnliche Problematik wie beim Gehirn selbst: Die Arbeitsstruktur liegt nicht offen. Die Forscher können also nicht nachvollziehen, wie genau die Algorithmen die Informationen verarbeiten – und wann sie welche Fehler machen.

Künstliche Intelligenz, kombiniert mit gut erforschtem Wissen

Thomas Pock vom Institut für Maschinelles Sehen und Darstellen der TU Graz ist daher mit seiner Arbeitsgruppe einen anderen Weg gegangen. Im Rahmen seines ERC-Starting-Grant-Projekts HOMOVIS (High Level Prior Models for Computer Vision) haben er und seine Kollegen die bekannte Arbeitsweise des visuellen Cortex über mathematische Modelle abgebildet und Anwendungen zur Bildverarbeitung damit gefüttert.

Stellenangebote im Bereich IT/TK-Projektmanagement

IT/TK-Projektmanagement Jobs
VIAVI-Firmenlogo
Senior / Software Engineer (C++, Python & Cloud) (m/w/d) VIAVI
Eningen Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Teamleitung (w/m/d) BIM-Management Die Autobahn GmbH des Bundes
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 
Stadt Worms-Firmenlogo
Projektleiter (m/w/d) CAFM Stadt Worms
Die Autobahn GmbH des Bundes-Firmenlogo
Ingenieur (w/m/d) C-ITS Entwicklung Die Autobahn GmbH des Bundes
Frankfurt am Main Zum Job 
Recogizer-Firmenlogo
Projektingenieur (m/w/d) KI-gestützte CO2-Reduktion Recogizer
Recogizer-Firmenlogo
Projektingenieur (m/w/d) KI-gestützte CO2-Reduktion Recogizer
HAWK Hochschule Hildesheim/Holzminden/Göttingen-Firmenlogo
Laboringenieur*in für das Digitallabor HAWK Hochschule Hildesheim/Holzminden/Göttingen
Holzminden Zum Job 
Tagueri AG-Firmenlogo
Consultant OTA - Connected Cars (m/w/d)* Tagueri AG
Stuttgart Zum Job 
WIRTGEN GmbH-Firmenlogo
System- und Softwarearchitekt (m/w/d) - mobile Arbeitsmaschinen WIRTGEN GmbH
Windhagen (Raum Köln/Bonn) Zum Job 
WIRTGEN GmbH-Firmenlogo
Embedded Anwendungs-Softwareentwickler (m/w/d) - mobile Arbeitsmaschinen WIRTGEN GmbH
Windhagen (Raum Köln/Bonn) Zum Job 
CS CLEAN SOLUTIONS GmbH-Firmenlogo
Mitarbeiter für die Steuerungstechnik Software (m/w/d) CS CLEAN SOLUTIONS GmbH
Ismaning bei München Zum Job 
Hochschule für Technik und Wirtschaft Berlin-Firmenlogo
Professur (W2) | auf Lebenszeit Fachgebiet Rechnerarchitekturen und Rechnersysteme Hochschule für Technik und Wirtschaft Berlin
Regierungspräsidium Freiburg-Firmenlogo
Manager für Building Information Modeling (BIM) (w/m/d) Bauingenieurwesen, Bauinformatik, Vermessungswesen, Geodäsie, Geoinformatik, Geomatik Regierungspräsidium Freiburg
Freiburg Zum Job 
HAWK Hochschule für angewandte Wissenschaft und Kunst-Firmenlogo
Transfermanager*in HAWK Hochschule für angewandte Wissenschaft und Kunst
Hildesheim Zum Job 
Hochschule für Technik und Wirtschaft Berlin-Firmenlogo
Professor (W2) | Permanent Computer Architecture and Computer Systems Hochschule für Technik und Wirtschaft Berlin
Frankfurt University of Applied Sciences-Firmenlogo
Professur »Künstliche Intelligenz in Kommunikationsnetzen« (w/m/d) // Professor »Artificial Intelligence in Communication Networks Frankfurt University of Applied Sciences
Frankfurt am Main Zum Job 
FlowChief GmbH-Firmenlogo
Techniker:in Automatisierung (SCADA) (m/w/d) FlowChief GmbH
Wendelstein Zum Job 
Wirtgen GmbH-Firmenlogo
Software-Ingenieur (m/w/d) Elektrotechnik im Bereich Steuerungssoftware für mobile Arbeitsmaschinen Wirtgen GmbH
Windhagen Zum Job 
Hochschule Osnabrück-Firmenlogo
Tandem-Professur Robotik, Data Science and AI, Digitalisierte Wertschöpfungsprozesse Hochschule Osnabrück
Osnabrück, Lingen Zum Job 
Einstein
Dieses Bild von Albert Einstein wurde aus unvollständigen Daten rekonstruiert.

Foto: Ferdinand Schmutzer, Creative Commons Public Domain

Louvre
Hier sieht man, wie die künstliche Intelligenz das Rauschen von der Abbildung des Louvres herausgerechnet hat.

Foto: Beau Wade from New York, NY, United States

Wissenschaftler Pock
Thomas Pock hat neue Bildverarbeitungsalgorithmen zur Korrektur von Unschärfen, defekten Pixel oder anderen technischen Bildfehlern entwickelt.

Foto: Lunghammer, TU Graz

Für die Grundlagen der künstlichen Intelligenz griff Pock auf die Arbeit früherer Kollegen zurück: Max Wertheimer ist einer der wichtigsten Begründer der Gestaltpsychologie und hat mit seinen Theorien nach Ansätzen gesucht, wie Reize und Sinneseindrücke im Gehirn zu einem großen Ganzen zusammensetzt werden. „Der Mensch kann schon anhand einzelner Punkte oder subjektiver Konturen (Scheinkonturen) lückenhafte beziehungsweise unvollständige Objekte korrekt erkennen. Das menschliche Gehirn ergänzt die fehlende Bildinformation automatisch. Beispielsweise, indem es die Punkte über möglichst glatte Kurven miteinander verbindet“, erklärt Pock. Dieses Prinzip haben er und sein Team mit mathematischen Modellen beschrieben, die auf Euler’s Elastica beruhen. Mit dieser Gleichung des Mathematikers Leonhard Euler können Kurven anhand minimalster Krümmung berechnet werden.

Auf Basis dieser Formel entwickelten die Wissenschaftler Algorithmen für krümmungsabhängige Bildverarbeitungsprobleme. Dabei stellte sich heraus: Die Lösung ist leichter, wenn die (2D-)Bilder und deren Merkmale als Datenpunkte in einem dreidimensionalen Raum dargestellt werden. „In der dritten Dimension bekommen wir mit der Orientierung der Objektkanten eine zusätzliche Variable“, erklärt Pock. Auch diese Vorgehensweise der künstlichen Intelligenz gleicht dem menschlichen Sehen und zieht die Arbeiten der beiden Nobelpreisträger David Hubel und Torsten Wiesel heran. Sie hatten schon 1959 festgestellt, dass der visuelle Cortex aus orientierungssensitiven Schichten aufgebaut ist.

Erfolgreiche Tests mit medizinischen Verfahren zur Bildgebung

Im nächsten Schritt wollen die Forscher die bekannten strukturellen Eigenschaften des visuellen Cortex mit Deep-Learning-Algorithmen kombinieren. Ihr Ziel sind Modelle, die genauso gut funktionieren wie derzeitige Deep-Learning-Algorithmen, aber verbunden mit einem Verständnis über die gelernten Strukturen. Unter anderem ließen sich so mögliche Fehlerquellen leichter finden.

Testweise haben die Wissenschaftler bereits Computertomografien (CT) und Magnetresonanzbilder (MRT) rekonstruiert. „Mit den neu entwickelten Algorithmen lassen sich nun trotz weniger aufgenommener Daten Bilder mit höchster Qualität rekonstruieren. Das spart Zeit und Rechenleistung und somit auch Kosten“, erklärt Pock. Die künstliche Intelligenz hat ihren Nutzen also bereits bewiesen.

Das kann künstliche Intelligenz:

Ein Beitrag von:

  • Nicole Lücke

    Nicole Lücke macht Wissenschaftsjournalismus für Forschungszentren und Hochschulen, berichtet von medizinischen Fachkongressen und betreut Kundenmagazine für Energieversorger. Sie ist Gesellschafterin von Content Qualitäten. Ihre Themen: Energie, Technik, Nachhaltigkeit, Medizin/Medizintechnik.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.