RAG (Retrieval-Augmented Generation) je technika, která umožní AI odpovídat z vašich firemních dat - ceníků, produktových katalogů, interních pravidel. Bez RAG AI zná jen to, na čem se naučila. S RAG zná i vaše produkty, ceny a obchodní podmínky.
Jak to funguje
Představte si studenta u zkoušky. Bez RAG odpovídá jen z paměti - může si vymyslet. S RAG má k dispozici složku s poznámkami a podívá se do nich, než odpoví.
Technicky to probíhá ve čtyřech krocích:
- Vaše dokumenty (FAQ, ceník, produktový katalog) se uloží do speciální databáze
- Zákazník položí otázku
- Systém najde nejrelevantnější části dokumentů
- AI z nich sestaví odpověď
Zásadní rozdíl oproti běžné AI: RAG nehádá, ale čerpá z konkrétních zdrojů. A ty zdroje může citovat, takže si odpověď ověříte.
K čemu se RAG hodí
- Chatbot na e-shopu - zákazník se zeptá "Máte notebook do 20 000 Kč na kancelář?" a chatbot prohledá katalog a odpoví s konkrétními produkty a aktuálními cenami
- Interní helpdesk - zaměstnanci se ptají na firemní procesy, HR pravidla, IT návody. AI odpovídá z vaší interní dokumentace
- Zákaznická podpora - chatbot řeší dotazy o objednávkách, vrácení zboží, reklamacích podle vašich obchodních podmínek
- Dokumentový asistent - prohledávání smluv, zápisů z porad, směrnic
Proč ne přetrénovat celý model?
Fine-tuning (přetrénování) modelu stojí desítky tisíc a trvá týdny. Když se změní ceník, musíte trénovat znovu. RAG je levnější, rychlejší a data se aktualizují okamžitě - stačí nahrát nový dokument.
Kolik to stojí
Překvapivě málo. Uložení 10 000 dokumentů stojí v přepočtu asi 2,50 Kč. Provoz chatbotu pro malou firmu vyjde na 200-2 000 Kč měsíčně podle objemu dotazů. Srovnejte to s cenou zaměstnance, který by ty samé dotazy zodpovídal ručně.
Na co si dát pozor
RAG není bezchybný. Když AI nenajde správný dokument, může si odpověď domyslet. Proto je důležitá kvalita zdrojových dat - neuspořádané, zastaralé dokumenty znamenají špatné odpovědi. Nastavení RAG vyžaduje zkušenosti s dělením dokumentů a napojením na AI model.
Stavím RAG řešení v n8n, které má nativní podporu pro celý RAG pipeline. Pokud chcete AI chatbot, který odpovídá z vašich dat, ozvěte se.
Pavel Szabo
Programátor webů, eshopů a informačních systémů s více než 23 lety praxe. Pomáhám firmám i jednotlivcům s online podnikáním, automatizacemi a využitím AI v praxi.