Die Virtuelle Umgebung Hat Dem Roboter Beigebracht, Den Würfel Geschickt Zu Drehen

Video: Die Virtuelle Umgebung Hat Dem Roboter Beigebracht, Den Würfel Geschickt Zu Drehen

Video: Die Virtuelle Umgebung Hat Dem Roboter Beigebracht, Den Würfel Geschickt Zu Drehen
Video: ANALYSEBERICHT “KÜNSTLICHES BEWUSSTSEIN JACKIE. BESONDERHEITEN, GEFAHREN UND PERSPEKTIVEN” 2023, März
Die Virtuelle Umgebung Hat Dem Roboter Beigebracht, Den Würfel Geschickt Zu Drehen
Die Virtuelle Umgebung Hat Dem Roboter Beigebracht, Den Würfel Geschickt Zu Drehen
Anonim
Image
Image

Spezialisten des OpenAI-Forschungslabors haben einen Algorithmus für eine robotische Kopie einer menschlichen Hand entwickelt, der es ermöglicht, einen Würfel in eine vorgegebene Position zu drehen. Zunächst wurde der Algorithmus im virtuellen Raum trainiert, dann wurde die erlernte Fähigkeit auf die physische Umsetzung übertragen, sagen die Entwickler im Blog des Projekts. In einem der Tests konnte der Roboter den Würfel 50 Mal hintereinander erfolgreich in die gewünschte Position drehen, ohne ihn fallen zu lassen.

Ingenieure haben lange gelernt, komplexe elektromechanische Analoga der menschlichen Hand zu erstellen. In der Regel werden sie jedoch als Prothesen anstelle einer amputierten Extremität oder als ferngesteuertes Gerät verwendet. Algorithmen zur autonomen Steuerung solch komplexer Geräte hinken den technischen Entwicklungen bei der Herstellung von Roboterarmen noch deutlich hinterher.

Eine Gruppe von Entwicklern der gemeinnützigen Organisation OpenAI konnte einen Algorithmus erstellen, der es einem Roboter-Analogon einer Hand ermöglicht, eine für Menschen einfache, für Roboter jedoch extrem schwierige Aufgabe selbstständig auszuführen - den Würfel in die richtige Richtung zu drehen ohne die Hilfe einer zweiten Hand oder zusätzlicher Gegenstände. Da das Training für die physische Implementierung eines Roboterarms sehr viel Zeit in Anspruch nimmt, trainierten die Forscher ihn an einer Computersimulation. Die von den Entwicklern erstellte virtuelle Umgebung basiert auf der MuJuCo-Physik-Engine und der Unity-Spiele-Engine. Darin simulierten sie die Arbeit der Shadow Dexterous Hand.

Obwohl die Engine reale physikalische Interaktionen recht genau simuliert, weist sie dennoch einige Vereinfachungen auf und berücksichtigt auch nicht den allmählichen Verschleiß des realen Roboterarms. Damit die durch den Algorithmus erlernte Fertigkeit auf ein reales Gerät übertragen werden konnte, veränderten die Forscher die Parameter während der Simulation zufällig. So änderten sich beispielsweise Größe und Gewicht des Würfels, die Reibung zwischen Objekten und sogar die Kraftrichtung.

Image
Image

Algorithmus-Lernschema

Als Algorithmus für die Bewegungsplanung wählten die Forscher ein rekurrentes neuronales Netz mit langem Kurzzeitgedächtnis (LSTM). Das Vorhandensein eines solchen Speichers ermöglichte es dem Algorithmus, mit zufälligen Änderungen der Umgebungsparameter erfolgreich fertig zu werden. Bei jeder Simulation erhielt er Daten zur Position der Fingerkuppen und des Würfels und plante die nächste Bewegung. Versuche galten als erfolgreich, wenn der virtuelle Roboterarm den Würfel in die richtige Richtung drehte und nicht fallen ließ. Darüber hinaus bereiteten die Forscher das System für eine reale Umgebung vor und erstellten einen zusätzlichen Zwischenalgorithmus auf Basis eines konvolutionellen neuronalen Netzes, der als Eingabe drei synthetisierte Fotografien der Hand aus unterschiedlichen Winkeln erhielt und die Position des Würfels ermittelte.

Um die Algorithmen zu trainieren, verwendeten die Forscher einen Computer mit 6144 Prozessorkernen und acht leistungsstarken Videobeschleunigern, die es ihnen ermöglichten, in 50 Echtzeitstunden etwa hundert Jahre simulierter Versuche zu verbringen. Dadurch konnten die Forscher Algorithmen trainieren und Fähigkeiten auf eine reale Umgebung übertragen. Es verwendete einen echten Roboterarm und verwendete Daten über die Position ihrer Finger und Bilder von drei Kameras als Eingabe. Darüber hinaus wurde ein 16-Kamera-Cube-Tracking-System installiert, um die Algorithmen separat in einer realen Umgebung zu testen.

Es stellte sich heraus, dass der Algorithmus zur Berechnung der Position eines Würfels aus drei Bildern von Kameras einem komplexen Motion-Tracking-System praktisch nicht nachsteht. Mit ihr betrug die durchschnittliche Anzahl aufeinanderfolgender erfolgreicher Versuche 13-mal und ohne sie - 11, 5. Die maximalen Ergebnisse waren viel höher. Die Forscher zeigten das Video mit einer Rekordrate von 50 aufeinanderfolgenden erfolgreichen Versuchen:

Im Jahr 2016 haben Spezialisten der Firma X (früher bekannt als Google X) das Problem des schnellen Lernens von Roboterarmen anders gelöst. Dafür schufen sie ein System aus mehreren Manipulatoren, vereint in einem einzigen Netzwerk. Die Daten der Manipulatoren wurden an den zentralen Server gesendet, wo zusätzliches Training und Tuning des neuronalen Netzmodells stattfand, dessen Parameter an die Manipulatoren zurückgesendet wurden.

Beliebt nach Thema