"Dvě stovky mrtvých při leteckém neštěstí...," odříkává hlasatelka v televizi. V témže okamžiku se její slova sunou na papíře z počítačové tiskárny v centrále mediální společnosti Newton I.T.

Umožňuje to nedávno dokončený program automatického převodu hlasu do tištěné podoby, který vymysleli na Technické univerzitě v Liberci. Poprvé v historii se mluvené slovo "přetiskuje" do češtiny. Bez zásahu člověka.

"Jedná se o průlom v přepisu mluveného slova. Díky této technologii můžeme významně rozšířit počet přepisovaných televizních a rozhlasových pořadů," uvedl Petr Pazour, výrobní a technický ředitel společnosti Newton I.T.

Tým Ústavu informačních technologií a elektroniky univerzity zkoumá oblast hlasových technologií od roku 1993. Na aplikaci pro Newton I.T. pracoval kolektiv Jindřicha Žďánského.

Komerční možnosti

"Projekt, který jsme spustili ve spolupráci se společností Newton, je komplikovaný a složitý. Software sice může fungovat na současných běžných počítačích, ale náklady na vývoj a vyladění aplikace se pohybují v řádu milionů korun.

Komerční využití by bylo možné jen tehdy, pokud by někdo software zaplatil, zavěsil na některý server a vybíral poplatky za používání," uvedl Žďánský.

Systém, který využívá společnost Newton, obsahuje databázi 320 tisíc českých výrazů. To je dvacetkrát víc než 15 tisíc slov, s nimiž si vystačí běžná angličtina.

Zatímco Angličan se spokojí s výrazem master, v češtině musí v databázi existovat tvary pán, pána, pánovi, pane, pánem, pánovo, pánova či pánovy.

"Záleží i na intonaci řeči. Zpěv se přepíše jen s obtížemi. Systém je nastaven na takzvaného primárního mluvčího, to je styl mluvy průměrného člověka nezatíženého deformacemi řeči. K tomu jsme přidali i hovorové profily některých televizních moderátorů," vysvětlil Žďánský.

Využití u soudu

Systém pro Newton I.T. umí vytisknout rozhlasové i televizní zpravodajství či publicistiku, umí dodat titulky k videu. Bezchybně přepíše až 90 procent mluvy. Liberečtí vědci ale již loni vyvinuli software vhodný pro soudy.

"Na soudech jsou přepisováním zahlceni, ať již jde o přípravné dokumenty nebo o zápisy z jednacích síní. Spojili jsme se proto s několika okresními soudy na Liberecku, připravili a ověřili pilotní projekt. Spokojeni byli všichni zúčastnění soudci i jejich zapisovatelky. Na přelomu roku jsme projekt nabídli ministerstvu spravedlnosti. Od té doby čekáme na vyjádření," uvedl profesor Jan Nouza, šéf Ústavu informačních technologií a elektroniky liberecké univerzity.

Podobný systém, vyžadující však přediktování zapsaného textu, funguje u některých soudů ve Spojených státech a Velké Británii.

V anglicky mluvících zemích využívají systém automatického zápisu mluveného slova i lékaři při stanovení diagnózy nebo při operacích. Známé jsou i automatické zápisy policejních výslechů.

Telefonická interview

"Systém může fungovat i pro telefonická interview novinářů. Při použití digitálního telefonu, kde má každý hovořící svůj kanál, dokážeme rozeznat i jednotlivé mluvčí," připojil Žďánský.

Automatický přepis mluvené češtiny by podle něho bylo možné využít i při poradách v podnicích.

Zápisy by však byly neúměrně dlouhé, protože na rozdíl od připravených relací v televizi či v rozhlase se v nepřipravené běžné řeči objevuje příliš mnoho zbytečných slov.

Další hlasové systémy

Software pro společnost Newton I.T. není prvním hlasovým systémem, který liberečtí vědci vyvinuli. Příkladem do praxe dovedené aplikace je systém InfoCity, založený na telefonním dialogu s počítačem, který běží v Liberci ve veřejném provozu již od roku 1999.

A v roce 2005 představil tým profesora Nouzy pod názvem MyVoice hlasové ovládání počítače pro handicapované lidi.

Systém funguje nejen v češtině. Studentka z univerzity v Granadě, která přijela do Liberce na stáž, během týdne převedla MyVoice do španělštiny.

"Systémy nemusí být drahé. Záleží na tom, jak dalece se rozšíří. Například MyVoice lze pořídit za pět tisíc korun. Připravujeme i diktovací systém, který bude znát půl milionu českých slov a mohl by stát kolem deseti tisíc korun," uvedl Nouza.

Ovládání domácnosti

Výrazný obchodní úspěch si šéf univerzitního ústavu slibuje od projektu, na němž jeho tým právě nyní pracuje.

"Vyvíjíme systém hlasového ovládání domácnosti. Hlasem, prostřednictvím počítače, bude možné odemykat a zamykat dveře, stahovat žaluzie, zapnout a vypnout televizor nebo pračku. Systém představíme do šesti měsíců. Je určen především pro handicapované lidi, ale poslouží každému," řekl profesor Nouza.