Rok poté, co se Google ocitl v úzkých a několikrát se ztrapnil nepovedenými ukázkami vlastního systému generativní umělé inteligence, přichází obrat. Google představil světu novou generaci svého jazykového modelu s označením Gemini – Blíženci.
Trojjediný systém tvoří varianty Gemini Ultra, Gemini Pro a Gemini Nano, které se liší svými schopnostmi i nároky na výkon. Google tentokrát nenechal nic náhodě a prezentaci systému, který souběžně umí pracovat s textem, obrazem i zvukem, si vzal na starost přímo šéf firmy Sundar Pichai. Vypilované video ovšem uživatele klamalo.
Nedávno jste již předplatné aktivoval
Je nám líto, ale nabídku na váš účet v tomto případě nemůžete uplatnit.
Tento článek pro vás někdo odemknul
Obvykle jsou naše články jen pro předplatitele. Dejte nám na sebe e-mail a staňte se na den zdarma předplatitelem HN i vy!
Navíc pro vás chystáme pravidelný výběr nejlepších článků a pohled do backstage Hospodářských novin.
Zadejte e-mailovou adresu
Zadejte e-mailovou adresu. Zadaná e-mailová adresa je ve špatném formátu.
Máte již účet? Přihlaste se.
Zpracování osobních údajů a obchodní sdělení
Využitím nabídky beru na vědomí, že mé osobní údaje budou zpracovány dle Zásad ochrany osobních a dalších zpracovávaných údajů, a souhlasím se Všeobecnými obchodními podmínkami vydavatelství Economia, a.s.
Přihlaste se,
nebo si jen přečtěte odemčený článek bez přihlášení.
Zdá se, že už se známe
Pod vámi uvedenou e-mailovou adresou již evidujeme uživatelský účet.
Děkujeme, teď už si užijte váš článek zdarma
Na váš e-mail jsme odeslali bližší informace o vašem předplatném.
Od tohoto okamžiku můžete číst neomezeně HN na den zdarma. Začít můžete s článkem, který pro vás někdo odemknul.
Na váš e-mail jsme odeslali informace k registraci.
V e-mailu máte odkaz k nastavení hesla a dokončení registrace. Je to jen pár kliků, po kterých můžete číst neomezeně HN na den zdarma. Ale to klidně počká, zatím si můžete přečíst článek, který pro vás někdo odemknul.
Pokračovat na článekVideo, které ukazuje schopnosti jazykového modelu Gemini Ultra, je hodně povedené, skoro jako by ho vytvořili marketingoví mágové z Applu. Gemini ve videu reaguje na obrázky, ukazuje schopnost pracovat s více jazyky než jen angličtinou a používá rozpoznávání hlasu a hlasovou syntézu v plynulém a přirozeném rozhovoru s uživatelem.
Reparát z prezentace umělé inteligence Google zvládl na první pohled s vyznamenáním, ale byl to klam. Agentura Bloomberg zjistila, že nejde o záznam reálného použití Gemini, ani o mírně sestříhaný produkt. Gemini s uživatelem nekomunikovalo hlasem, ani nesledovalo obraz kontinuálně. Příkazy dostal systém textově a rozpoznávání objektů probíhalo formou statických obrázků, nikoliv napojením na kameru sledující dění v místnosti.
To nejdůležitější bez ohledu na další marketingovou blamáž teprve přijde. Firma musí přesvědčit uživatele, že se výsledky interních testů schopností Gemini potvrdí i v praxi.
Očekávání jsou přitom vysoká. Podle Googlu je Gemini Ultra nejvýkonnější systém generativní umělé inteligence na světě a jako první překonal i schopnosti lidských expertů ve víceoborovém testu MMLU. Ten zahrnuje 57 různých úkolů včetně základů matematiky, počítačové vědy, fyziky, práva, etiky či dějepisu (amerického) a vyžaduje jak encyklopedické znalosti, tak i schopnost řešit problémy.
Gemini Ultra podle Googlem zveřejněných výsledků překonává lídra trhu ChatGPT-4 ve 30 ze 32 testů používaných pro porovnávání schopností systémů generativní umělé inteligence. Takové tvrzení je hodně působivé, ale rozdíly se pohybují v řádu jednotek procent. V testu MMLU má Gemini náskok 3,6 procentního bodu – 90 procent proti 86,4 procenta v případě ChatGPT-4. U matematických výpočtů je Gemini Ultra lepší o 0,3 procentního bodu, oba systémy ale dosahují výsledku pouze na hranici 53 procent.
Amazon spustil vlastního chatbota Q jako konkurenci pro ChatGPT. Má pomoci hlavně v byznysu
Systém společnosti OpenAI naopak s náskokem 7,5 procentního bodu zvítězil v testu logického uvažování při řešení každodenních úkolů s poměrem 95,3 procenta proti 87,8 procenta u Gemini Ultra. Velký náskok má OpenAI také při práci s větším počtem jazyků. Automatické překlady mluveného slova z 21 jazyků zvládlo Gemini s náskokem 11 procentních bodů, v testu se 62 jazyky měl systém Whisper v3 od OpenAI výsledek vyšší o deset procentních bodů, ale i to znamenalo skóre jen 17,6 procenta. To ukazuje na velkou propast mezi schopnostmi velkých jazykových systémů v angličtině a ostatních jazycích.
Zásadní pro srovnávání Gemini a systémů od OpenAI je také dostupnost. Google sice oznámil Gemini, ale verze Ultra bude dostupná až v průběhu příštího roku, ChatGPT-4 je dostupný globálně od března letošního roku a OpenAI schopnosti svého systému průběžně upravuje a většinou vylepšuje.
Google zatím zpřístupnil pouze Gemini Pro, které je v testech srovnatelné se systémem ChatGPT-3,5, který před týdnem oslavil rok od zpřístupnění veřejnosti. A co je horší, Gemini Pro dostupné v prostředí Google Bard je pouze v angličtině a uživatelé v zemích Evropské unie si budou muset počkat, podobně jako při spuštění systému Bard AI.
Stejně tak zatím Bard s Gemini Pro postrádá možnost oboustranné hlasové komunikace, která se v prezentačním videu zásadně podílí na výsledném dojmu. Dá se přitom čekat, že přístup ke Gemini Ultra s hlasovou komunikací bude vyhrazený platícím uživatelům. Google zatím ale neoznámil, jaké má v této oblasti plány.
Firma může spustit čistě placený produkt pro přístup ke generativní umělé inteligenci po vzoru OpenAI, stejně tak ale může začlenit tyto funkce do svého předplatného Google One. To se jeví jako zajímavější varianta, Google One totiž zatím kromě větší kapacity online úložiště moc nadstandardních funkcí nenabízí.
Placená verze může vyřešit problémy Googlu s monetizací vyhledávání prostřednictvím umělé inteligence. Už nyní je služba Google Bard v některých ohledech lepší než vyhledávač Google – umí lépe obejít výsledky z webů optimalizovaných pro vyhledávač a neukazuje záplavu reklamy, na rozdíl od Googlu.
Mírně falešný start
Kromě dvou velkých modelů, které Google provozuje ve svých datových centrech, zpřístupnila firma také verzi Gemini Nano, která běží lokálně na mobilních telefonech. Jediným zatím podporovaným mobilem je googlovský Pixel 8 Pro. Využití tohoto modelu je omezené na dvě funkce: vytváření sumářů z nahraných audiozáznamů a pomoc s psaním textu prostřednictvím klávesnice Gboard.
Gemini tak zatím nenahradí Google Asistenta jako vyhledávač, rádce a pomocník přímo v telefonu, který by fungoval bez připojení k internetu a chránil uživatelská data před šmírováním ze strany Googlu – to je ostatně nežádoucí (pro Google). Data z komunikace mezi uživateli a systémy umělé inteligence firmy používají k dalšímu ladění jejich fungování.
V tom je největší slabina Googlu proti OpenAI – zatímco OpenAI ohromila všechny představením systému ChatGPT a nechala celý svět si s ním hrát, Google ukázal fantastický kus marketingu, přidal spoustu technických informací pro odborníky a vývojáře, ale uživatelům nabízí jen zlomek z toho, čím se chlubí. Gemini bude mít šanci na úspěch jen ve chvíli, kdy bude všude a bude fungovat podle očekávání.
Přidejte si Hospodářské noviny mezi své oblíbené tituly na Google zprávách.
Tento článek máteje zdarma. Když si předplatíte HN, budete moci číst všechny naše články nejen na vašem aktuálním připojení. Vaše předplatné brzy skončí. Předplaťte si HN a můžete i nadále číst všechny naše články. Nyní první 2 měsíce jen za 40 Kč.
- Veškerý obsah HN.cz
- Možnost kdykoliv zrušit
- Odemykejte obsah pro přátele
- Ukládejte si články na později
- Všechny články v audioverzi + playlist