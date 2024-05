Umělá inteligence jako moderátorka, sportovní komentátorka nebo recepční. „V dnešní době je už v podstatě možné vše. Záleží jen, za jakých podmínek a za jakou cenu,“ říká Tomáš Ondráček, spoluzakladatel skupiny Artin, která mimo jiné vyvíjí autonomní recepce s využitím umělé inteligence. S nimi se budete v reálném životě setkávat stále častěji. AI totiž nahrazuje lidi v rutinních a až nedůstojných podmínkách. A kdo by chtěl neustále přepojovat telefony.

Blondýna, nebo zrzka? Jaké jsou požadavky firem na virtuální asistentku?

Preference na vzhled jsou různé, ale v poslední době firmy hodně preferují androidy. Souvisí to totiž s psychologií a očekáváním. Ve chvíli, kdy bude virtuální asistent vypadat jako člověk, návštěvník očekává, že bude umět vše co on. Zatímco když rovnou použijete postavu, která je trochu robotická, podvědomě pracuje s tím, že je to jen technologie, která má svá omezení.

Jak probíhá uvedení do praxe?

Vždy když se recepční nainstaluje do firmy, nastává přibližně měsíční období, během kterého ji všichni zkouší. Testují, co zvládne a co si na ni mohou dovolit. Přicházejí požadavky na vypnutí nebo pozvání na rande, která odmítá s tím, že přes den pracuje a v noci se musí aktualizovat. Ve chvíli, kdy virtuální asistentku programujeme, vytváříme jí nějakou osobnost. Každý zákazník může mít jiný požadavek, ale obecně se snažíme dávat do komunikace lehkost a nadsázku, aby odpovědi nezněly strojově.

Jak vypadá virtuální recepce, která využívá umělou inteligenci?

Virtuální recepční je taková placatá slečna, kluk nebo android, kteří jsou schopni komunikovat s návštěvníkem tak, jak je zvyklý. Jinými slovy ho poslouchají a pak mu odpovídají v přirozené řeči. Umožňují také dotykovou komunikaci, aby mohli posloužit lidem, kteří neslyší nebo nemohou mluvit. Je to vlastně takový parťák, který dělá rutinní, pro lidi až nedůstojné úkoly.

Taková interakce probíhá jak?

Virtuální recepce zvládne řešit běžné rutinní úkoly a jejím cílem je zjistit záměr návštěvníka a reagovat na něj. Ve chvíli, kdy někdo přijde na recepci, zeptá se ho, s čím mu může pomoci a za kým jde na návštěvu. Vyžádá si od něj jméno a pak zavolá příslušnou osobu, aby ji informovala o tom, že za ní jde někdo na návštěvu. Zároveň se zeptá, co má s návštěvníkem dělat, jestli má například počkat na recepci, pustit ho do objektu nebo ho má předat k telefonu. Kromě ohlášení návštěvy zvládne převzít zásilku nebo se připojit do systému budovy a přivolat výtah. Naprogramovaná je i na běžnou komunikaci. Má v sobě zabudovaný ChatGPT, takže si s vámi může během čekání povídat. Já například rád včelařím, takže spolu můžeme mluvit o včelaření – jestli jsem nakrmil včely či zda mají dostatek přístupu k vodě a podobně.

Takže když se při čekání nudím, mohu si s ní povídat o jakémkoliv tématu, od včel po teo­rii relativity?

Ano. Když budete chtít vědět i nějakou encyklopedickou informaci, například kolik váží atom vodíku nebo kdy byla objevená Amerika, vysype vám ji z rukávu. Většinou ale čekajícím dává informace o firmě.

Odpovědi hledá na internetu, nebo má uvnitř pevné scénáře?

Princip je jednoduchý a vše se točí kolem obsahu. Uvnitř je základní umělá inteligence, která rozumí řeči a umí ji převést do textu. Reaguje na vaše slova, převede je na text, ten pošle do chatovacího robota, který vygeneruje správnou odpověď a virtuální asistentka ji svým hlasem přečte. Část obsahu je ale daná napevno. K dispozici jsou připravené scénáře, dvě tři varianty možností, jak by na konkrétní situaci měla reagovat. Až ve chvíli, kdy nenajde odpověď v předpřipravených scénářích, zeptá se Googlu. Když odpověď ani Google neví, pošle otázku do ChatGPT, který už vždy něco vymyslí.

Virtuální asistentka tedy není uzavřený systém, ale neustále se učí nové věci?

Pevné scénáře samozřejmě musí aktualizovat nějaký člověk, ale jinak se sama na pozadí zdokonaluje tím, jak se neustále vyvíjí Google a ChatGPT.

Jak dlouho trvá naprogramovat virtuální recepci?

Při běžném provozu recepce je to otázka několika týdnů. Nejdéle trvá, než si zákazník ujasní, jak by měla fungovat. Vyřešit se totiž musí spousta věcí – co se stane, když se zaměstnanci recepční nedovolá, jaké jsou záložní osoby, kdo bude přijímat poštu nebo zda pro ni bude k dispozici nějaký box. Ve chvíli, kdy si tohle všechno ujasníme, trvá vývoj jeden až dva týdny. Po nasazení probíhá ještě ladění v praxi, kdy vyplynou na povrch věci, které by se daly dělat ještě trochu jinak. Připravená by měla být na všechny možné scénáře, občas se ale stane, že něco neví. Jednou se jí například někdo zeptal, kde je hlavní uzávěr plynu. Na to připravená nebyla, ale je pravda, že jsme poměrně dlouho hledali odpověď i u živých osob.

Co se stane, když se vypne proud?

V tom případě přestane fungovat. Nebude fungovat, ani když vypadne internet.

Nemá záložní zdroj?

Teoreticky by ho mít mohla, ale když se vypne proud, řeší se většinou ve firmě mnohem důležitější problémy, než že vám nejede recepce.

Podle serveru Statista by v roce 2026 mělo být ve světě 4,2 miliardy digitálních hlasových asistentů. Neděsí vás to?

Když se nad tím zamyslíte, máte hlasového asistenta i v mobilu, a kdybychom to započítali, možná už na tomhle čísle jsme. Je to prostě trend, který je zřejmý. Souvisí ale podle mě s tím, že je verbální komunikace pro nás tisíce let přirozená, a i když naše generace byla ovlivněna počítačovou érou, kdy se muselo ťukat do klávesnice a hýbat myší, děti se zase k verbální komunikaci vrací. Raději nahrají hlasovou zprávu, než aby ji napsaly.

Kde všude je možné uplatnění virtuálních asistentů? Jaké zajímavé aplikace jste už řešili?

Naše recepční se například stala moderátorkou při vyhlášení osobností e‑governmentu, kde pomáhala živému moderátorovi při prezentaci medailonků osobností. Také jsme ji viděli v roli sportovní komentátorky ve VIP salonku na basketbalovém zápase. Běžně mluví o exponátech v různých vědeckých centrech, dají se z ní vytvořit rozličné virtuální slavné osobnosti nebo může dělat noční recepční v hotelech, které těžko shánějí lidi na tyto směny. Aktuálně pracujeme na projektu virtuálního avatara v dětské nemocnici, kde bude navigovat lidi, aby se nemuseli neustále vyptávat doktorů a sester. A zrovna nedávno jsem byl na jednání ve Vídni s klientem, kterých chtěl, aby se stala členkou posádky zaoceánské lodi a cestujícím podávala informace o tom, do jakého přístavu se blíží, co je ve městě k vidění, kam by si mohli zajít na oběd nebo jak si zavolají taxíka.

Kde jsou hranice nahrazení lidské inteligence umělou?

Když se člověk narodí, nemá žádné znalosti ani informace, postupně je získává, stává se zkušenějším a dokáže propojovat souvislosti. Jenže nakonec umře. To se umělé inteligenci nestane, takže už z principu bude mít časem ve stále více věcech navrch. A v mnohých už má dnes. Například dokáže porazit nejlepší hráče go, protože vymyslí inovátorská řešení, která před tím nikoho jiného nenapadla, jelikož jsou za hranicí lidského uvažování. Chybí jí ale lidskost a emoční inteligence, takže v mnoha jiných oblastech bude stále pozadu.

I tak si mnoho lidí klade otázku, zde vývoj AI není rychlý až moc.

Vývoj AI je až překotný. Když jsem před dvaceti lety studoval neuronové sítě, byla umělá inteligence ještě v plenkách. Mluvilo se o tom, že by mohla přepisovat rozhovory, ale její praktické využití bylo v podstatě nulové. Doteď mám ještě v živé paměti, jak jsem byl před necelými dvěma lety v šoku, když jsem poprvé viděl ChatGPT. A i když jsem byl poměrně dobře informovaný o pokrocích v oblasti umělé inteligence, úplně mě mrazilo z toho, jak skokově překonala všechny problémy předchozích řešení. Na druhou stranu je to pořád jen nástroj. Matematický model, který i když má v sobě spoustu informací a dokáže se neustále zdokonalovat, postrádá záměr, touhu a potřeby, které jsou přirozené pro lidské bytosti. Na něco se jí zeptáte a ona vám odpoví, dokáže v samořiditelném autě detekovat překážky na cestě, ale lidské vlastnosti nemá.

Zatím.

Je otázka, jestli se někdo bude snažit tyhle vlastnosti do umělé inteligence dostat a stvořit Frankensteina, umělou reálnou bytost. Vývoj je kaž­dopádně tak rychlý, že se nedá predikovat ani v nejbližších pěti letech. Těžko říct, co bude, jaké oblasti zasáhne a v jakých profesích nastane na pracovním trhu převrat. Třeba ještě nedávno jsme si mysleli, že poslední budou na řadě kreativní činnosti a že umělá inteligence bude dělat jen rutinní úkoly. A už teď vidíme, že dokáže generovat obrázky, které firmám pro jejich marketingové účely úplně stačí, a tak zcela převrátila trh s grafickými pracemi.

Jaká jsou omezení virtuální asistentky? Zvládá například hluky na pozadí?

Omezení je hned několik. Pořád je to technologie, která vám neudělá kafe a ani vás nikam nezavede. Tedy pokud ji nepropojíte s humanoidním robotem, ale většinou nikdo nechce, aby mu po recepci pobíhal robot. Také když před ní budou stát tři lidé a budou mluvit chvilku s ní a chvilku spolu, nepozná, kdy mluví na ni a kdy na kamaráda vedle.

Existují i psychologická omezení?

Existuje několik skupin lidí, někdo si bude s virtuální asistentkou nadšeně ­povídat, jiný s ní vyřeší jen to nejnutnější a pak je skupina těch, kteří za ní nikdy nepůjdou, a když budou mít jakoukoli možnost ji obejít, udělají to. Vždycky proto zákazníkům říkáme, že není na světě robot ten, který by se zavděčil lidem všem. Samozřejmě i tohle časem zmizí, protože mladší generace bere technologie přirozeně. Proto se i snažíme dávat virtuální asistenty do vědeckých center, kde se s nimi lidé mohou setkat v přirozeném nestresovém prostředí a vyzkoušet si je.

Hodně důležité je také jejich umístění, protože pořád je v lidech jakýsi ostych. Přišli jsme na to, že s ní chtějí komunikovat raději v intimnějším, tišším prostředí, kde na ně všichni nekoukají, jak si povídají s robotem. Nebo jsme na začátku chtěli dělat virtuální asistentku v nadživotní velikosti, ale lidé s ní raději mluví, když je menší.

Jaké technologické výzvy teď u virtuálních asistentů řešíte?

Problém, který nás asi trápí nejvíce, je relativně pomalá, přibližně pětisekundová odezva u ChatGPT. Čas, který je v pořádku u chatbota, je problematický u mluvené konverzace. Nejvíce by nám tedy pomohlo, kdyby se ChatGPT zrychlil a odpovídal do půl vteřiny. Abychom nemuseli při vývoji neustále balancovat mezi tím, na co ho použít a kdy dát raději prostor rychlým, ale pevným scénářům. A pak nás trápí i několik technických problémů jako různé odstínění ruchů, a aby neslyšela sama sebe, když mluví.

Takže se snažíte zabránit tomu, aby si donekonečna sama sobě odpovídala?

Přesně tak.

Jak se to dělá? Naučíte ji, aby poznala svůj hlas?

Dělá se to na trochu nižší úrovni, ona když mluví, tak ví, že to říká ona, protože při tom používá určité algoritmy, takže se pak její hlas dá ze zvukového vstupu „odečíst“. Není to tak, že bychom jí to nejprve nechali celé vyslechnout a pak jí dodatečně řekli, že tu svoji pasáž má zahodit. To by bylo moc pomalé.

Práce v IT Stáhněte si přílohu v PDF

Jak můžete s informacemi, které od lidí získává, pracovat?

Zde se dotýkáme tématu GDPR, zařízení sice obsahuje kameru a mikrofon, ale veškeré záznamy se mažou. Kamera slouží jen k monitorování a k tomu, aby virtuální asistentka nečekala pořád na hosta, který se zapomněl rozloučit. K dispozici zůstávají pouze anonymní textové přepisy, z nich ale můžeme zjistit, jaké otázky lidé pokládali, jaké byly jejich potřeby, a pak na to můžeme reagovat například přidáním nových scénářů. Některá zařízení máme i na školách, a pokud by se některý student virtuálnímu asistentovi svěřil, že je šikanován, můžeme díky tomu upozornit výchovného poradce nebo někoho jiného z kompetentních osob, že je na škole něco v nepořádku.

Ještě mi prozraďte, jak vytváříte virtuální asistentce osobnost.

Není to žádná raketová věda, jen si musíte představit, jak by reálná osoba v situaci zareagovala. Vytvořit přirozenou komunikaci jde pomocí nějaké schopnosti empatie a pak je nutné, aby její reakce byly konzistentní. Například by bylo divné, kdyby na nějakou otázku odpovídala vysoce kultivovaně a na druhou hantecem. Při přípravě pevných scénářů se vždy snažíme dát obsah do souladu s představou její osobnosti. Můžeme jí říct, jak se má chovat. Jestli má být veselá recepční, která ráda odpovídá na dotazy, nebo zlá čarodějnice.

Dělali jste virtuální asistentku, která mluvila hantecem?

Ještě ne, ale určitě by to šlo. Jen nevím, jak by si s tímhle oříškem poradil Google Speech při převodu na text.

Článek byl publikován ve speciální příloze HN Práce v IT.