Katzen sind Stars im Internet und beliebte Haustiere, die es geschafft haben, Menschen zu ihren Butlern zu machen. Doch statt dass sich Widerstand gegen die stille Unterjochung durch Felis catus regt, wird den herrschenden Samtpfoten weiterhin bei jeder Gelegenheit große Ehre erwiesen.

Auch das Team von Google Deepmind bildet keine Ausnahme. Dort hat man ein KI-Modell entwickelt, das es Robotern ermöglicht, selbstständig neue Aufgaben zu erlernen. Der irreführende Name lautet "Robocat".

Irreführend ist die Betitelung deshalb, weil die künstliche Intelligenz mithilfe eines Roboterarms visuelle Aufgabenstellungen löst, Katzen aber dafür bekannt sind, Kommandos in der Regel zu ignorieren, sofern keine essbare Bestechung im Spiel ist.

Massive Verbesserung

Trainiert wurde Robocat zunächst in verschiedenen Tätigkeiten mit 100 bis 1.000 Demonstrationen durch einen von einem Menschen gesteuerten Roboterarm sowie Simulationen. Die resultierenden Daten wurden in einer Instruktionsdatenbank versammelt.

In den Aufgaben wurde der Software eine Reihe aus mehreren Gegenständen vorgelegt. Diese wurden anschließend neu arrangiert, und die Aufgabe der KI war es, die Anordnung wiederherzustellen. Dafür musste sie mittels Robotergreifarm etwa verschiedene Dinge in korrekter Anordnung aufeinanderstapeln, unterschiedlich große Ringe auf die richtigen Stangen auffädeln oder Früchte in einen Korb räumen bzw. aus diesem entfernen.

RoboCat: A self-improving robotic agent

RoboCat is a self-improving AI agent for robotics that learns to perform a variety of tasks across different arms, and then self-generates new training data to improve its technique. Google DeepMind

Zunächst lag die Erfolgsrate für Aufgaben, mit denen die KI zuvor noch nie konfrontiert war, bei 36 Prozent auf Basis von 500 Vorführungen. Aus den Versuchen generierte das System jedoch neue Lerndaten, mit deren Hilfe es seine eigene Technik bei der Erfüllung der Vorgaben verbesserte. Durch dieses Training konnte die Erfolgsrate für neu hinzukommende Tasks bei gleicher Anzahl an Demonstrationen mehr als verdoppelt werden (74 Prozent). Die Wissenschafter vergleichen den Fortschritt mit einem Menschen, der sich durch die Vertiefung in einen Aufgabenbereich neue Fertigkeiten aneignet.

Nicht nur das: Das Modell war auch in der Lage, sein "Wissen" auf andere Hardware zu übertragen. Es war in der Lage, die gleichen Tätigkeiten auch mit anderen, unterschiedlich spezifizierten Roboterarmen auszuführen. Dazu klappt auch die Szenenerkennung zuverlässig, selbst wenn störende Elemente wie etwa menschliche Hände in der Vorgabe sichtbar sind.

Google Deepmind

Turbo für Roboterforschung

Dieser Zugang lässt RoboCat viel schneller lernen als andere aktuelle KI-Modelle, sagen die Deepmind-Forscher. Aufgrund des eigenständig ausgebauten Bestands an Lerndaten ist es in der Lage, neue Tätigkeiten bereits auf Basis von 100 Vorführungen zu erlernen.

Die gezeigten Tätigkeiten mögen zwar simpel wirken, doch eine KI dazu zu bringen, sich die korrekte Ausführung mit einem Roboterarm selbst anzueignen, ist eine signifikante Errungenschaft. Mit ihr lassen sich der manuelle Trainingsaufwand verringern und damit die Roboterforschung beschleunigen.

Mehr Informationen zu RoboCat liefern die Forscherinnen und Forscher in einem Blogeintrag sowie in einem auf Arxiv veröffentlichten Paper. (gpi, 27.6.2023)