Jak automaticky proměnit přednášku ve výukové video nebo textový záznam? Projekt Romana Moučka z FAV zkoumá, jaké AI nástroje jsou nejvhodnější pro přepis, parafrázování a syntézu řeči. Cílem je usnadnit tvorbu studijních materiálů a podpořit dostupnost výuky i mimo přednáškovou místnost.
Tým projektu testuje kombinace nástrojů pro převod řeči na text (Speech-to-Text), automatické shrnutí nebo parafrázování, a převod textu zpět do řeči (Text-to-Speech). Nejvíce se zatím osvědčil systém Deepgram, který podporuje přepis v reálném čase i z nahrávek. V užším výběru je také Beey, ElevenLabs nebo modely OpenAI a Google, zatímco některé nástroje vykazovaly vyšší latenci nebo nestabilitu při delších záznamech. První fáze projektu ukázala, že české prostředí klade na AI nástroje specifické nároky – od správné práce s jazykem až po technické parametry.
— doc. Ing. Roman Mouček, Ph.D.
Projekt bude pokračovat integrací vybraných nástrojů do jednotného systému, který bude testován na konkrétních záznamech přednášek. Výsledky budou porovnány z hlediska přesnosti, přirozenosti výstupu i časové náročnosti. Do budoucna by tak mohly vznikat automaticky generované výukové materiály – přepisy, přehledy nebo výuková videa – prakticky bez zásahu učitele. Projekt tak přináší konkrétní řešení pro moderní a přístupnou formu výuky na univerzitě.