Verschiedene Roboter verstehen Befehle
Das LLM wird dazu mit dem Robot Operating System (ROS) verknüpft, der am weitesten verbreiteten Robotersteuerungssoftware. Daher kann das Verfahren für die Steuerung einer Vielzahl von Robotern unterschiedlicher Hersteller und Bauarten genutzt werden.
"Autonome Roboter, die in der Lage sind, Anweisungen in natürlicher Sprache in zuverlässige physische Aktionen umzusetzen, sind nach wie vor eine zentrale Herausforderung in der künstlichen Intelligenz", schreiben der Informatiker Christopher E. Mower und seine Kollegen im Wissenschaftsjournal "Nature", in dem sie ihr System kürzlich vorgestellt haben. "Wir zeigen, dass die Verbindung eines großen Sprachmodells mit dem ROS ein vielseitiges Framework für verkörperte Intelligenz ermöglicht und wir veröffentlichen die vollständige Implementierung als frei verfügbaren Open-Source-Code."
Befehle zerlegt und abgearbeitet
"Der Agent übersetzt die Ausgaben des großen Sprachmodells automatisch in Roboteraktionen, erlernt neue Fähigkeiten durch Nachahmung und verfeinert diese kontinuierlich durch automatisierte Optimierung und Reflexion anhand von Feedback durch Menschen oder aus der Umgebung", so die Autoren.
Schriftliche Befehle an den Roboter werden dazu in kleinere Segmente zerlegt und einzeln als ROS-Befehle weitergegeben. So wird die Anweisung "Nimm den grünen Block und lege ihn auf das schwarze Regal" in die Einzelbefehle "Nimm", grünen Block", "lege" und schwarze Regal" aufgeteilt, sodass der Roboter die Anweisungen nacheinander abarbeiten kann. In Tests mit verschiedenen Robotern konnten die meisten die Befehle korrekt umsetzen. (pte)