Fine-tuning je proces přetrénování existujícího jazykového modelu na vlastní sadě příkladů. Výsledkem je nový model, který pracuje jako originál, ale trvale změnil své chování podle vzorů z vašich dat. Místo opakovaného vysvětlování "odpovídej tímto stylem" si to model zapamatuje natrvalo.
Fine-tuning versus Prompt engineering versus RAG
Tři metody přizpůsobení AI, které se navzájem nevylučují:
- Prompt engineering - instrukce v každém dotazu. Vyřeší 80 % případů, nic nestojí, trvá hodiny.
- RAG - model v reálném čase vyhledává ve vaší databázi. Vhodné pro aktuální nebo interní znalosti.
- Fine-tuning - trvalá změna chování. Vhodné pro specifický styl, formát nebo doménovou terminologii, kterou nelze spolehlivě zaručit promptem.
Doporučené pořadí: začněte prompt engineeringem, přidejte RAG pokud potřebujete aktuální data, fine-tuning použijte jako poslední krok pro produkční systémy s vysokým provozem.
Jak fine-tuning probíhá
Připravíte sadu párů příklad/odpověď ve formátu JSONL - každý řádek je jeden trénovací příklad. Doporučovaný start je 50-100 příkladů. Soubor nahrajete přes API nebo webové rozhraní, spustíte tréninkový job a za minuty až hodiny dostanete model s vlastním ID, který voláte stejně jako originál.
Ceny (duben 2026)
OpenAI nabízí nejrozvinutější ekosystém. Fine-tuning GPT-4o mini: 7 Kč za 1 milion tréninkových tokenů. Fine-tuning GPT-4o: 575 Kč za 1 milion tokenů. Inference (provoz) fine-tuned modelu je přibližně dvakrát dražší než základního. Příprava 100 příkladů zákaznické podpory (asi 100 000 tokenů) vyjde na GPT-4o mini přibližně 0,70 Kč jednorázově.
Google Vertex AI a Amazon Bedrock mají vlastní ceníky. Anthropic (Claude) nabízí fine-tuning Haiku 3 přes AWS Bedrock.
Pro jaké případy se hodí
Fine-tuning přináší hodnotu zejména pro konzistentní zákaznickou komunikaci ve firemním tónu, kategorizaci ticketů nebo objednávek do specifických kategorií, extrakci dat ze strukturovaných dokumentů (faktury, formuláře) a odpovědi s pevně daným formátem výstupu.
Kdy fine-tuning nepomůže
Fine-tuning efektivně neučí model novým faktům - pro aktuální informace je RAG vždy lepší. Průzkum FineTuneBench ukázal průměrnou přesnost při vkládání nových znalostí přes fine-tuning jen 19 %. Model si také "zapamatuje" přesné příklady, ale u přeformulovaných otázek může selhat. Pod 50 trénovacích příkladů jsou výsledky nepředvídatelné.
Nasazení fine-tuningu v produkci vyžaduje správnou přípravu dat, výběr modelu, evaluaci a monitoring kvality. Implementaci zpravidla zajišťuje vývojář s přístupem k API a zkušeností s hodnocením výstupů.
Nauč se Claude Code
po individuální domluvě
Pavel Szabo
Programátor webů, eshopů a informačních systémů s více než 23 lety praxe. Pomáhám firmám i jednotlivcům s online podnikáním, automatizacemi a využitím AI v praxi.