Archiv für October 2023
Robot Cooking – Überführung von Beobachtungen in eine Planungssprache
Überführung von Beobachtungen in eine Planungssprache: Ein automatisierter Ansatz im Bereich des Kochen
Im Robot Cooking Projekt wird eine automatisierte Methode entwickelt, um Bewegungsdaten zu analysieren, identifizieren und in eine maschinenlesbare Planungssprache zu überführen. Dies geschieht am Beispiel eines Kochszenarios, indem die Bewegungsdaten durch die Aufzeichnung der Handpose des Kochs erfasst werden.
Die Aufzeichnung erfolgt mit einem Motion-Capture-System, bestehend aus sieben Kameras und einem Handschuh mit drei Markern auf dem Handrücken des Kochs. Die Position der Marker wird durch Triangulation bestimmt. Dies liefert genügend Informationen, um die Handpose abzuleiten. Die Aufnahme erfolgt mit 120 Bildern pro Sekunde. Vor dem Kochvorgang werden alle Objekte im Arbeitsraum identifiziert und ihre Ausgangspositionen bestimmt. Die Bewegungsdaten werden kontinuierlich aufgezeichnet und in Posen mit Zeitstempeln umgewandelt. Zusätzliche Informationen wie Geschwindigkeit, Beschleunigung und Winkel in Bezug auf die Tischplatte werden aus den Rohdaten abgeleitet.
Eine erste Strukturierung des Datensatzes erfolgt durch die Identifizierung der Nebenhandlungen mittels Klassifikation. Hierbei werden Greifen, Bewegen und Ablegen als wiederkehrende Handlungen erkannt. Ein eigener Trainingsdatensatz wird verwendet, um einen Klassifikator zu trainieren, der diese Handlungen erkennt. Dies ermöglicht eine einfachere Analyse der verbleibenden Aktionen.
Das Clustering wird angewendet, um unbekannte Aktionen zu identifizieren. Ein dynamischer Ansatz ermöglicht die Analyse trotz hoher Variabilität in der Ausführung. Ein eindeutiger Fingerabdruck für jede Handlung wird gefunden, basierend auf der Ausrichtung des Handrückens und seiner Geschwindigkeit auf der Tischebene, um jedes Einzelbild einem Cluster und schließlich einer Aktionen zuzuordnen.
Die gewonnenen Erkenntnisse aus Klassifikation und Clustering werden in eine maschinenlesbare Planning Domain Definition Language (PDDL) übersetzt. Ein Zeitplan wird erstellt, wobei bekannte Aktionen direkt zugeordnet werden. Start- und Endpositionen werden festgelegt, und virtuelle Objektverfolgung wird verwendet, um den Verlauf von Objekten während des Kochens darzustellen. Für unbekannte Aktionen werden Vorbedingungen und Auswirkungen dynamisch gehandhabt. Die Ergebnisse werden in eine maschinenlesbare PDDL übersetzt. Diese formale Darstellung ermöglicht die effiziente automatische Planung und Ausführung der zuvor demonstrierten Kochaufgabe.
Zusätzliche Informationen sind im oben verlinkten Video, dem Poster und dem Paper verfügbar.
Ansprechpartner:
Markus Schmitz