Theorien in der Physik: Ist der nächste Einstein eine KI?
Die ganz Großen in der Physik wurden dadurch berühmt, dass sie eine Theorie aufgestellt haben – man denke an Newton oder Einstein. Forschende haben nun eine KI programmiert, die das ebenfalls können soll.
Die Entwicklung neuer Theorien wird oft mit herausragenden Persönlichkeiten der Physik wie Newton oder Einstein in Verbindung gebracht, für die zahlreiche Nobelpreise verliehen wurden. Forscherinnen und Forscher des Forschungszentrums Jülich haben jetzt eine künstliche Intelligenz entwickelt, die eventuell ähnliche Leistungen vollbringen kann. Die KI soll in der Lage sein, Muster in komplexen Datensätzen zu erkennen und daraus physikalische Theorien abzuleiten.
Wie entsteht eine neue Theorie?
Prof. Moritz Helias vom Jülicher Institute for Advanced Simulation (IAS-6) erklärt: „Üblicherweise geht man von Beobachtungen des Systems aus, und versucht, einen Vorschlag zu machen, wie die verschiedenen Systemkomponenten miteinander interagieren, um das beobachtete Verhalten zu erklären. Dann leitet man neue Vorhersagen daraus ab, und prüft diese. Ein bekanntes Beispiel ist das Gravitationsgesetz von Isaac Newton. Es beschreibt nicht nur die Anziehungskraft auf der Erde. Auch die Bewegungen von Planeten, Monden und Kometen lassen sich damit – genau wie die Bahnen moderner Satelliten – ziemlich exakt vorhersagen“.
Die Entwicklung solcher Hypothesen kann laut Prof. Helias auf verschiedenen Wegen erfolgen: Zum einen könne man von allgemeinen physikalischen Prinzipien und Grundgleichungen ausgehen, um eine Hypothese zu formulieren. Zum anderen ist ein phänomenologischer Ansatz möglich, der sich darauf konzentriert, Beobachtungen möglichst genau zu beschreiben, ohne notwendigerweise deren Ursachen zu ergründen. Die Herausforderung besteht darin, aus der Vielzahl der möglichen Ansätze den geeignetsten auszuwählen und ihn gegebenenfalls anzupassen und zu vereinfachen.
Was steckt hinter Physik-KI?
Die Arbeitsgruppe verfolgte einen Ansatz, den sie „Physics for Machine Learning“ nannte. Dabei verwendet die Gruppe physikalische Methoden, um zu analysieren und zu verstehen, wie künstliche Intelligenz (KI) funktioniert. Claudia Merger aus der Gruppe hatte die Idee, ein neuronales Netz zu verwenden, das darauf trainiert ist, komplexes beobachtetes Verhalten auf ein einfacheres System zu projizieren.
Das Hauptziel besteht laut Prof. Helia darin, die vielfältigen komplexen Interaktionen zwischen den Systemkomponenten durch KI vereinfachen zu lassen. Anschließend wird die KI genutzt, um eine Rückabbildung des vereinfachten Systems auf das komplexe System zu erstellen. Während dieses Rückprozesses rekonstruiert das Forschungsteam schrittweise die komplexen Interaktionen aus den einfacheren Elementen und entwickelt so eine neue Theorie.
Wie Prof. Helia erklärt, ähnelt diese Methode grundsätzlich der Vorgehensweise von Physikern, mit dem Unterschied, dass die Zusammensetzung der Wechselwirkungen aus den Parametern der KI abgeleitet wird. Dieser Ansatz, die Welt durch die Interaktion ihrer Teile zu erklären, die bestimmten Gesetzen folgen, ist ein Grundprinzip der Physik. Das Forschungsteam verwendet daher den Begriff „Physics of AI“.
Einsatz der KI in der Praxis
In ihrer Doktorarbeit untersuchte Claudia Merger vom Forschungszentrum Jülich einen Datensatz von Schwarz-Weiß-Bildern mit handgeschriebenen Zahlen, der häufig in der Forschung mit neuronalen Netzen verwendet wird. Sie konzentrierte sich darauf, wie kleine Bildunterstrukturen, insbesondere die Ränder der Zahlen, durch Interaktionen zwischen Pixeln entstehen. Dabei identifizierte sie Gruppen von Pixeln, die dazu neigen, gemeinsam aufzuhellen und so zur Bildung der Zahlenränder beitragen.
Prof. Helia erläutert, dass der Einsatz von künstlicher Intelligenz es erst ermöglicht, komplexe Berechnungen mit einer enormen Anzahl von möglichen Wechselwirkungen durchzuführen. Ohne diesen Trick könnten nur sehr kleine Systeme untersucht werden. Trotz der Fortschritte durch KI ist der Rechenaufwand für die Analyse großer Systeme nach wie vor hoch. Dies liegt an der Vielzahl möglicher Wechselwirkungen innerhalb dieser Systeme.
Durch effiziente Parametrisierung sei es jedoch möglich, Systeme mit bis zu tausend interagierenden Komponenten zu analysieren, erklärt Prof. Helia. Zum Beispiel Bildbereiche mit bis zu 1000 Pixeln. In Zukunft könnten durch weitere Optimierungen sogar noch wesentlich größere Systeme bearbeitet werden.
Worin unterscheidet sich Physik-KI von ChatGPT?
Viele KIs haben das Ziel, aus ihren Trainingsdaten zugrundeliegende Theorien zu erlernen. Diese Theorien sind jedoch oft nicht direkt zugänglich oder interpretierbar, da sie in den Parametern der KI verborgen bleiben. Der Ansatz des Forschungszentrums Jülich zielt dagegen darauf ab, die von der KI erlernten Theorien explizit zu machen, wie Prof. Helia erklärt.
Das Forscherteam formuliert die Theorien in einer Sprache, die auf den Wechselwirkungen zwischen den Systemkomponenten beruht, ähnlich den Prinzipien der Physik. Dieser Ansatz fällt in den Bereich der Erklärbaren Künstlichen Intelligenz (Explainable AI), genauer gesagt in den Bereich „Physics of AI“. Das Team nutzt physikalische Konzepte, um die Erkenntnisse der KI verständlich zu machen. Dieser Ansatz ermöglicht es, die komplexe Funktionsweise der KI mit für Menschen verständlichen Theorien zu verknüpfen.
Ein Beitrag von: