Lidský hlas je unikátní. Zatímco většina lidí přes telefon odhadne pouze to, zda je člověk na druhém konci muž či žena a zda je mladší nebo starší, software brněnské Phonexie dokáže přesně určit jeho identitu. Unikátní technologie se již rozšířila do celého světa. Využívá ji například německý Spolkový kriminální úřad – Bundeskriminalamt, což je obdoba americké FBI. Kriminalisté ji uplatňují pro porovnání hlasů podezřelých, stejně jako třeba otisky prstů. V Jižní Americe takhle slouží při únosech. Ve vládním a komerčním sektoru pomáhá ve více než 60 státech. 

Brněnští odborníci na řečové technologie o sobě poprvé dali světu vědět už před 17 lety. V mezinárodní soutěži, kterou pořádá americký institut pro standardy a technologie (NIST), parta nadšenců z Vysokého učení technického porazila týmy Massachusettského technologického institutu i dalších prestižních univerzit. Tématem bylo rozpoznání jazyka, kterým lidé mluví na nahrávkách. O rok později měli soutěžící představit technologie na rozpoznání mluvčího. Ani v tomto ročníku neměli Češi konkurenci. Zrod úspěšné firmy byl na cestě.

„Začalo se štěbetat o týmu z Brna, o kterém do té doby nikdo neslyšel. Jak to, že porazil všechny ty úspěšné instituce, které se řečovým technologiím věnují desítky let? V Brně o nich výzkumníci věděli jen krátce, nadchl je dnes na VUT stále působící Jan Černocký po své stáži v zahraničí. Úspěch brněnského softwaru přilákal potenciální zákazníky z řad bezpečnostních složek, jeho komercializace však v rámci univerzity nebyla možná, proto v roce 2006 vznikla Phonexia,“ vypráví její současný ředitel Michal Hrabí. 

Nadšení jako startovní bod

Dnes světově působící firma vznikla hlavně díky obrovskému nadšení. Šest zakladatelů z akademického prostředí po večerech a víkendech pracovalo na zdokonalování své technologie tak, aby nefungovala jen v laboratoři, ale i v praxi. Tři z nich, Petr Schwarz, Pavel Matějka a Lukáš Burget, ve společnosti stále působí a jsou jejími společníky.

První roky Phonexia občas něco prodala, ale její členové byli mentalitou stále spíše vědci než byznysmeni. Kolem roku 2008 se Schwarz ujal vedení a firma se rozrostla o vývojáře i obchodníky. „Na začátku byla Phonexia akademický punk. Neměla ohlídané termíny, řízení kvality, chyběl tomu řád,“ prozrazuje Hrabí, který do firmy nastoupil až v roce 2014. Tehdy již ve Phonexii dvě desítky zaměstnanců zdokonalovaly program na rozpoznávání mluvčího.

Ten staví na jedinečnosti hlasového ústrojí. „I když mluvíme jiným jazykem nebo v jiné situaci, naše plíce, dýchací trubice, hlasivky jsou stále stejné a identické pro každého z nás. S pomocí umělé inteligence tedy hledáme, co je v hlase unikátní, a na základě toho hlas přiřadíme ke konkrétnímu člověku. Říkáme tomu voice print, hlasový otisk,“ popisuje Hrabí. 

Hlasový otisk například v bankách zvyšuje uživatelskou přívětivost a bezpečnost. Pracovník banky za pouhé tři vteřiny mluvené řeči nezávisle na tématu rozhovoru identifikuje volajícího, jehož hlas je v systému již registrovaný. Řešení umožňuje autorizaci požadavků po telefonu, stejně jako odhalování podvodů.

Snem Hrabího je, aby podobné ověření fungovalo i z druhé strany. Tedy v situaci, kdy se volající vydává za pracovníka banky a její zákazník si chce ověřit, zda je to opravdu on. Zatím je ale systém Phonexie dimenzovaný spíše na větší instituce než na jednotlivce.

Phonexia

- Vznikla v roce 2006 v Brně, kde dosud v Králově Poli sídlí.

- Má kořeny na Fakultě informačních technologií brněnského Vysokého učení technického.

- Duchovním otce je Jan Černocký, který na univerzitě stále působí a vede tam výzkumnou skupinu Speech@FIT.

- Zabývá se technologiemi na rozpoznávání řeči, mluvčího i přepisem řeči na text.

- Společníky jsou tři ze šesti zakladatelů – Lukáš Burget, Petr Schwarz a Pavel Matějka.

- Ředitelem je Michal Hrabí, který dříve pracoval například pro Jihomoravské inovační centrum.

- Nyní zaměstnává více než 60 lidí.

- Loňský obrat přesáhl 80 milionů korun, zisk čtyři miliony koruny, meziročně vzrostl o 3,5 milionu.

- Asi 80 tržeb procent plyne ze zahraničí, působí ve více než 60 státech světa.

- Software Phonexie používají například kriminalisté v Německu nebo banky v Mexiku či Spojených arabských emirátech.

- V roce 2020 získala ocenění Férový zaměstnavatel v kategorii do 100 zaměstnanců.

Neprůchodná legislativa

Tuzemské instituce ovšem ověřování mluvčího zatím nevyužívají. Důvodem je kromě jiného i legislativa, která neřeší použití umělé inteligence, a některé firmy nevědí, jak s ní naložit. Technologie našla uplatnění kromě výše zmíněných policejních složek z Německa a Latinské Ameriky také v bankách ve Spojených arabských emirátech a v Mexiku. Tam je ověřování zkombinované s hlasovým příkazem, pomocí kterého bude možné zasílat peníze.

Kromě toho Phonexia nabízí technologie, které umí přepsat řeč na text. Využívají se třeba v call centrech jako podklady pro datové analytiky. Například aby věděli, co bylo v daný den nejčastějším tématem nebo zda se pracovník kontaktního centra k volajícím nechoval hrubě. 

Hrabí know-how Phonexie vnímá jako jedinečné. „Jsou firmy, které si vezmou přepis řeči od Googlu a nějak jej zdokonalují, ale těch, jež to samy vytváří, je opravdu málo. Konkurenční společnosti bych spočítal na prstech dvou rukou. A jsou rozprostřené po celém světě,“ dodává.

I díky tomu se Phonexia dostává k zajímavým příležitostem v neobvyklých zemích. V těch rozvojových především v souvislosti s koronavirovou pandemií řešila ověřování nikoli volajícího, ale zaměstnance call-center. „S nástupem práce z domova se začaly objevovat případy, kdy zaměstnanci kontaktních center místo sebe nechali pracovat děti, mnohdy z ulice. Nezletilí dostávali desetinu ze mzdy, zatímco jejich „pasák“ shrábl zbytek. Pro instituci je to obrovské reputační riziko,“ míní Hrabí. 

Rozdělaný projekt má nyní Phonexia i v Africe. „Žijí tam stamiliony chudých lidí s nízkou gramotností, kteří nemají chytrý telefon a kamkoliv to mají daleko. Spolupracujeme s jednou nizozemskou neziskovkou a naší technologií jim chceme zpřístupnit služby, které by jinak třeba vůbec neměli. Například konzultaci s lékařem, kterou poté musí zaplatit. Něco jako internetové bankovnictví v telefonu tam není, musí si vystačit se svým hlasem. Tam chceme aplikovat ověřování mluvčího,“ říká Hrabí. Pilot tohoto projektu měl být v etiopské metropoli Addis Abeba, kvůli hrozící válce se ale odložil. 

Český mindrák versus světový úspěch

Jak vyplývá ze slov ředitele společnosti, většina tržeb firmy, asi 80 procent, plyne ze zahraničí. Obrat loni přesáhl 80 milionů korun, zisk čtyři miliony korun. Společnost nabrala 17 zaměstnanců a nyní pro ni pracuje přes 60 lidí, většina z Brna, ale někteří třeba z Portugalska nebo Izraele. A není vyloučené, že se firma ještě rozroste, spíše naopak. Plánů je spousta, tvrdí Hrabí. Přiznává zároveň, že mnohdy jsou služby Phonexie firmami vnímány jako nadstandard, který si mohou dovolit, zbudou-li koncem roku nějaké peníze.

Z dlouhodobého hlediska ale společnosti nahrává nevyhnutelná digitalizace světa. Díky ní mohou i malé země konkurovat gigantům, jako je USA nebo Čína, které Hrabí spolu s Českem považuje za lídry v oblasti řečových technologií. „Stačí si jen věřit. My Češi jsme skvělí na technologie, ale jakmile dojde na prodej, tak si nevěříme. Vytváříme si mindráky o naší malosti a nedůležitosti, ale úplně zbytečně. Musíme si umět představit, že dokážeme všechno, co chceme,“ radí Hrabí, jak se stát světově úspěšnou firmy. Nezbytná je podle něj také firemní kultura založená na týmovosti, důvěře a respektu.

Článek byl publikován ve speciální příloze HN Firmy a živnostníci.

Tento článek máteje zdarma. Když si předplatíte HN, budete moci číst všechny naše články nejen na vašem aktuálním připojení. Vaše předplatné brzy skončí. Předplaťte si HN a můžete i nadále číst všechny naše články. Nyní první 2 měsíce jen za 40 Kč.

  • Veškerý obsah HN.cz
  • Možnost kdykoliv zrušit
  • Odemykejte obsah pro přátele
  • Ukládejte si články na později
  • Všechny články v audioverzi + playlist