Nedávno jsme dostali posudky na výzkum zaslaný do jednoho ze tří světově nejprestižnějších vědeckých žurnálů. Hned první posudek radil použít jiný velký dataset, který se pro danou věc perfektně hodí. Jak jsme tohle mohli minout? Ukázalo se, že dataset neexistuje a nikdy neexistoval. Byla to typická halucinace. Část posudku za oponenta psala umělá inteligence a on si výstup neověřil.

Překvapivě mnoho chytrých lidí neumí umělou inteligenci používat účinně. Někteří ji zkoušeli před třemi lety po startu ChatGPT a pak s opovržením z halucinací odhodili. Další zadají otázku a pak nám ukazují, jak je první odpověď nepřesná: říkají AI „generátor uvěřitelného obsahu“. Ale ještě horší než se umělé inteligence bát je používat ji špatně – přesně jako náš oponent.

Řešením těchto problémů je uspořádat duel mezi AI modely. Nechat je navzájem napadat odpovědi konkurence a zkoušet najít chybu v argumentaci nebo faktech. Po několika kolech dostanete nesrovnatelně užitečnější výstup, než jaký by vám dal model jediný. Kdyby duel použil náš oponent v časopise, neměl by ostudu. Navíc je to dnes tak jednoduché, že to zvládne kdokoli, kdo umí otevřít okno ChatGPT.

Duel využívá skutečnosti, že každý model je natrénován jinak a na jiných datech. Halucinace, které neodhalí opakované dotazování ChatGPT, většinou opraví konkurence. Celek je lepší než jednotlivé části. Vědecká analogie je metaanalýza: lepší než dívat se na jedinou vědeckou studii, byť sebelepší, je zkoumat literaturu jako celek. U jednotlivé studie nikdy nevíme, nakolik jsou výsledky taženy náhodou či publikačním zkreslením. Podobně každý AI model má své vlastní zkreslení.

Zvládne to i začátečník

Duel AI modelů není nový nápad. Mezi experty se tomuto přístupu říká Multi-Agent Debate (MAD) a používá se přes dva roky, často interně velkými AI firmami. Nicméně využití MAD dosud vyžadovalo znalosti programování a API, případně schopnost práce se strukturovanými nástroji typu AutoGen (či LangGraph nebo CrewAI). Teď jsme připravili prompt, který MAD demokratizuje: stačí zkopírovat do ChatGPT, doplnit váš problém, zapnout agent mód a čekat.

Aby tento přístup fungoval hladce, potřebujete předplatné ChatGPT. To má řada z nás, kdo umělou inteligenci často používají. Stejně tak obvykle máme přístup k dalšímu placenému modelu ze strany našeho zaměstnavatele – často je to třeba na univerzitách Gemini od Googlu. Proto náš duelový protokol pracuje s těmito modely, ale stejný přístup můžete aplikovat na Claude nebo Grok.

Nemáte-li předplatné, duel snadno provedete manuálně. Otevřete si vedle sebe dva či více zdarma dostupných AI modelů. Všem dáte stejné informace (soubory, fotky), ale protichůdnou roli. Prvnímu řeknete, aby byl kreativní vizionář a nápad rozvíjel, druhému přikážete být ďáblovým advokátem, který má za úkol najít každou logickou díru. Pak jednotlivé odpovědi kopírujete mezi modely s tím, že se jedná o výstup jiného AI s danou rolí. Po několika kolech už má smysl začít číst výstupy.

Takový duel, kdy jeden model bojuje s druhým, ověřuje, útočí, opakuje, znovu a znovu, se nehodí pro všechny každodenní otázky. Ale z naší zkušenosti je nepostradatelný pro důležité profesionální úkoly. Ani tak za vás AI vaši práci neudělá. Ale pracujete-li u počítače a naučíte-li se využívat duelový přístup (byť třeba jen k hledání chyb ve vlastních výstupech), budete produktivnější a přesnější než drtivá většina vašich kolegů.

Autoři jsou ekonomové

Tento článek máteje zdarma. Když si předplatíte HN, budete moci číst všechny naše články nejen na vašem aktuálním připojení. Vaše předplatné brzy skončí. Předplaťte si HN a můžete i nadále číst všechny naše články. Nyní první 2 měsíce jen za 40 Kč.

  • Veškerý obsah HN.cz
  • Možnost kdykoliv zrušit
  • Odemykejte obsah pro přátele
  • Ukládejte si články na později
  • Všechny články v audioverzi + playlist