

Schweizer, deutsche und amerikanische Ingenieure brachten dem ANYmal-Roboter bei, zu gehen, zu laufen und sich von Stürzen zu erholen, indem ein neuronaler Netzwerkalgorithmus verwendet wurde, anstatt manuell Controller-Algorithmen einzustellen. Die Besonderheit der Arbeit liegt auch darin, dass zunächst der Algorithmus während der Simulation trainiert wurde und dann das erlernte Können auf einen realen Roboter übertragen wurde, sagen die Autoren des Artikels in Science Robotics.
Ingenieure haben bereits viele Laufroboter unterschiedlicher Bauart entwickelt, darunter auch recht fortgeschrittene. Weithin bekannt sind beispielsweise Roboter der Firma Boston Dynamics, die nach einem Aufprall auf den Beinen bleiben können. Neben der Hardwarekomponente ist jedoch die Softwarekomponente ebenso wichtig. Und hier gibt es noch ein offensichtliches Problem – in der Regel müssen Ingenieure selbst Regelalgorithmen entwickeln, basierend auf dem Verhalten realer Lauftiere oder virtueller Modelle. Dieser Ansatz ist zeitaufwendig und garantiert nicht, dass Designer die optimale Gangart für die vorhandene Struktur finden. Es gibt Arbeiten, in denen Ingenieure ein neuronales Netz zur Steuerung nutzten und dessen Verhalten zunächst in der virtuellen Welt simulierten und dann in die reale Welt übertrugen, aber sie verwendeten Roboter mit einfachem Design.
Einen ähnlichen Ansatz verfolgte eine Gruppe von Ingenieuren um Marco Hutter von der Schweizerischen Höheren Technischen Schule Zürich, wandte sie jedoch auf den viel komplexeren ANYmal-Roboter an. Es hat vier Beine, die in zwei Segmente unterteilt sind. Insgesamt 12 Elektromotoren sind im Roboter verbaut – drei für jedes Bein, zwei davon biegen es und einer an der Basis lenkt das gesamte Bein relativ zum Körper zur Seite.
Dabei verfolgten die Forscher einen zweistufigen Ansatz, bei dem ein neuronales Netz für die Planung der Bewegungen der Segmente als Ganzes zuständig ist, das zweite diese Bewegungen empfängt und für jeden Elektromotor spezifische Kraftwerte auswählt. Beide Netzwerke haben eine mehrschichtige Perzeptronstruktur. Um ihnen verschiedene Bewegungen beizubringen, verwendeten die Autoren die Methode des Reinforcement Learning, bei der der Algorithmus für die ausgeführten Aktionen eine Belohnung aus der virtuellen Umgebung erhält und dadurch nach und nach die optimalen Aktionen lernt. Nach dem Training in einer virtuellen Umgebung wurden die trainierten neuronalen Netzmodelle in den Computer eines realen ANYmal-Roboters geladen.

Diagramm des Robotersteuerungsalgorithmus
Dank der neuen Algorithmen konnten die Ingenieure drei Hauptergebnisse erzielen. Erstens sind die Bewegungen des Roboters stabiler und energieeffizienter geworden. Zweitens ist die maximale Bewegungsgeschwindigkeit des Roboters 25 Prozent höher als bei anderen bestehenden Algorithmen dafür. Drittens hat der Roboter gelernt, selbstständig aus der Liegeposition aufzustehen.
Hutter und seine Kollegen experimentieren schon lange mit dem ANYmal-Roboter, nicht nur mit seiner Software. Zum Beispiel haben sie kürzlich eine Modifikation davon geschaffen, an deren Enden Räder befestigt sind, die von Elektromotoren angetrieben werden. Dadurch kann der Roboter zwischen verschiedenen Bewegungsmodi wechseln und schwieriges Gelände effizienter passieren als vergleichbare Konstruktionen.