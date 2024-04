Ze vallen misschien nog om de haverklap op de grond, maar deze mensachtige robots voetballen een stuk beter dan andere humanoïden. En ze hebben het zichzelf aangeleerd.

Voetballende robots zijn niet nieuw, er is zelfs ieder jaar een internationale wedstrijd: de RoboCup. En hoewel sommige autonome robots al best een aardig potje kunnen spelen, is het voor mensachtige robots (humanoïden) nog een flinke uitdaging. Bekijk bijvoorbeeld de video hieronder.



Robotici van DeepMind Technolgies (sinds 2014 onderdeel van Google) is het nu wel gelukt om tweevoetige robots volledig zelfstandig een voetbalwedstrijd te laten spelen, en dat gaat best aardig. Ze vallen misschien nog regelmatig om, maar ze staan ook snel weer op en spelen door. Bekijk de video hieronder.



Leren als een huisdier

Waar de meeste vergelijkbare voetbalrobots voorgeprogrammeerde bewegingen uitvoeren, hebben de bots van DeepMind het spelletje en de benodigde bewegingen zelf onder de knie gekregen. Daarvoor maakten ze gebruik van Deep Reinforcement Learning (Deep-RL).

De robotici ontworpen een digitale simulatie waarin de AI die de robots bestuurt non-stop kon oefenen. En dat oefenen ging via vallen en opstaan. Als de AI wist te scoren, kreeg hij een ‘beloning’ – vergelijkbaar met het trainen van een huisdier. Als hij faalde, leerde hij hoe het de volgende keer niet moest. Zo kende het systeem na vele pogingen de beste voetbalbewegingen en -technieken.

Snel strategisch spel

Wat de AI in de simulatie heeft geleerd, kon vervolgens worden toegepast in de echte robots. Daarvoor gebruikte DeepMind de ROBOTIS OP3, een miniatuur humanoïde die 51 centimeter lang is en 3,5 kilogram weegt. ROBOTIS OP3 is een robotplatform dat wel vaker wordt gebruikt voor onderzoek.

Tijdens de oefenwedstrijden pronkten de autonome robots met hun zelfgeleerde vaardigheden. Ze speelden zelfs strategisch en wisten hoe ze schoten van de tegenstander konden blokkeren en hoe ze balbewegingen moesten anticiperen.

Volgens de onderzoekers liepen de getrainde robots bovendien 181 procent sneller, draaiden ze 302 procent sneller, trapten ze 34 procent sneller tegen de bal en hadden ze 63 procent minder tijd nodig om na een val op te staan dan robots met voorgeprogrammeerde vaardigheden.

Kampioen?

Betekent dat dat DeepMind met de beker naar huis gaat na de volgende RoboCup? Nee, voorlopig nog niet, hun robots voldoen nu namelijk niet aan de wedstrijdeisen. Zo zijn ze alleen getraind in wedstrijden die een-tegen-een zijn, en voor de cup moeten ze in teams kunnen spelen. Bovendien krijgen de humanoïden nu nog informatie over hun positie van camera’s aan de rand van het veld, tijdens de RoboCup mogen alleen camera’s in de bots zelf worden gebruikt.

Voetballende robots zijn natuurlijk leuk, maar hebben we er ook wat aan? Aan het voetballen zelf misschien niet, maar de techniek erachter kan natuurlijk worden toegepast voor andere doeleinden. De hier gebruikte Deep-RL-leermethode kan robots bijvoorbeeld in een simulatie veilig klaarstomen voor werk in gevaarlijke omgevingen, zoals mijnbouw of missies in rampgebieden.

Bronnen: Science Robotics, AAAS via EurekAlert!

Beeld: Tuomas Haarnoja/Google DeepMind