Forscher des Institute of Science and Technology Austria (IST Austria) und des Max-Planck-Institutes für Intelligente Systeme haben eine erste Methode für maschinelles Lernen entwickelt, die Roboter-Verhalten auch in neuen, unbekannten Situationen vorhersagen kann.
»Lernen« bei Maschinen und Robotern bestand bislang darin, zu interpolieren, d.h. eine Situation, die »zwischen« anderen, bekannten Situationen liegt, vorherzusagen. Forscher des Institute of Science and Technology Austria (IST Austria) und des Max-Planck-Institutes für Intelligente Systeme haben eine Methode entwickelt, mit der sich erstmals maschinelles Lernen extrapolieren lässt.
Das Besondere der neuen Methode ist, dass sie versucht, die wahre Dynamik der Situation herauszufinden: Aufgrund von Daten liefert sie Gleichungen, die die zugrundeliegende Physik beschreiben. »Wenn man diese Gleichungen kennt«, sagt Georg Martius, ehemaliger Postdoc des IST Austria und ISTFELLOW und seit 2017 Gruppenleiter am MPI für Intelligente Systeme in Tübingen, »dann kann man sagen, was in allen Situationen passieren wird, auch, wenn man sie nicht gesehen hat.«
Das ermöglicht es der Methode, zuverlässig zu extrapolieren. Martius entwickelt die neue maschinelle Lernmethode gemeinsam mit Subham S. Sahoo, einem PhD Student am MPI für Intelligente Systeme, und Christoph Lampert, Professor am IST Austria. Die Lösungen, die maschinelles Lernen zuvor erstellte, waren bislang viel zu komplex, als dass ein Mensch sie verstehen könnte.
Die Gleichungen, die aus der neuen Methode resultieren, sind erheblich einfacher: »Die Gleichungen unserer Methode sind etwas, was man in einem Lehrbuch sehen würde – einfach und intuitiv«, sagt Christoph Lampert. Letzteres ist ein weiterer Vorteil: Andere maschinelle Lernmethoden geben keinen Einblick in den Zusammenhang zwischen Eingaben und Ergebnissen – und damit auch keine Einsicht darüber, ob das Modell überhaupt plausibel ist.
»In allen anderen Forschungsbereichen erwarten wir Modelle, die physikalisch Sinn machen, und die uns sagen, warum«, ergänzt Lampert. »Das sollten wir auch vom maschinellen Lernen erwarten und das ist, was unsere Methode bietet.« Deshalb basierte das Team seine Lernmethode auf einer einfacheren Architektur als übliche Methoden, um die Interpretierbarkeit zu gewährleisten und sie für physikalische Situationen zu optimieren. In der Praxis bedeutet das, dass weniger Daten benötigt werden, um die gleichen oder sogar bessere Ergebnisse zu erzielen.
»In meiner Gruppe arbeiten wir an der Entwicklung eines Roboters, der diese Art des Lernens nutzt. In Zukunft würde der Roboter mit verschiedenen Bewegungen experimentieren und dann in der Lage sein, die Gleichungen herauszufinden, die seinen Körper und seine Bewegung beschreiben, so dass er gefährliche Aktionen oder Situationen vermeiden kann«, fügt Martius hinzu. Geht die Forschung hauptsächlich in Richtung Roboteranwendung, kann die Methode mit jeder Art von Daten eingesetzt werden, von biologischen Systemen bis hin zu Röntgenübergangsenergien und lässt sich auch in größere maschinelle Lernnetzwerke integrieren.