Jak naučit robota jezdit bez pokynů? Projekt Dominika Finka z Fakulty strojní ZČU využívá reinforcement learning – metodu strojového učení, při níž se robot učí rozhodovat na základě odměn a trestů. Výsledky projektu budou nejen součástí výuky, ale i základem navigace studentského Roveru pro prestižní soutěž European Rover Challenge.
Cílem miniprojektu bylo vytvořit studijní podklady, dokumentaci a ukázkový software pro výuku i praktické využití metod strojového učení v mobilní robotice. Projekt se zaměřil na Q-learning – algoritmus, který umožňuje robotovi naučit se samostatně hledat nejefektivnější trasu i bez přesného zadání kroků. Výstupem je devatenáctistránkový učební text s komentovanými kódy, na kterém si studenti mohou vyzkoušet, jak reinforcement learning funguje v praxi. Demonstrační příklad využívá model taxislužby, který umožňuje pochopit princip rozhodování na základě posílené zpětné vazby.
— Ing. Dominik Fink
Kromě výukových materiálů vznikla také zadávací dokumentace pro vývoj navigačního softwaru studentského Roveru, který bude reprezentovat ZČU v soutěži European Rover Challenge. Dokument shrnuje výběr algoritmů, práci s trajektoriemi i podrobný komentář ke kódu v prostředí Jupyter Notebooku. Projekt tak představuje nejen přínos pro výuku, ale i praktickou oporu pro špičkový studentský vývoj. Díky propojení s prestižní mezinárodní soutěží navíc podporuje prestiž univerzity i atraktivitu studia technických oborů.