Tři-dílný seriál · 2026

RAG vysvětlený lidsky

Co je Retrieval Augmented Generation, jak funguje uvnitř a kde v reálném nasazení selhává. Tři texty, tři úrovně. Od běžného uživatele Claude nebo ChatGPT, přes IT manažery a vývojáře, až po experty kteří přemýšlí nad nasazením RAG v produkci.

Bez marketingu, bez floskulí. To co v běžných tutoriálech chybí: kde věci přestávají fungovat a co se s tím v praxi dělá.

Autor Pavel Horák Publikováno Květen 2026 Celkem ~50 minut čtení

Díl 01 / 03 ~8 minut

RAG pro každého

Pro běžné uživatele Claude, ChatGPT, Gemini

Bez programátorského žargonu. Proč nahrávat dokumenty do chatu funguje pro pět souborů a selhává pro pět tisíc, co je RAG a proč ho velké firmy potřebují. Vysvětlené přes knihovníka v knihovně.

Číst první díl
Díl 02 / 03 ~18 minut

RAG technicky, jak to funguje uvnitř

Pro IT manažery, juniorní vývojáře, technické PO

Tři fáze RAG do hloubky. Embedding modely, vektorové databáze, kosinová podobnost. Pět chunkovacích strategií a jejich kompromisy. Hybrid retrieval (sémantické plus fulltextové plus strukturované). Proč jsou metadata u malých chunků důležitější než samotný obsah.

Číst druhý díl
Díl 03 / 03 ~25 minut

RAG v praxi, kde to selhává a co s tím

Pro experty, kritické čtenáře, vedoucí AI projektů

Sedm slabých míst naivního RAG: drift k hodnověrnému nesmyslu, chunkování láme myšlenku, temporal validity, ingestion pipeline jako skrytý zabiják, nepřenositelnost, long context není záchrana. A k tomu late-stage context injection jako návrh řešení.

Číst třetí díl

O autorovi

Pavel Horák staví AI nástroje a píše o tom co s nimi funguje a nefunguje v reálném byznysu. Provozuje pprojects.cz jako sbírku experimentů a článků a phorak.cz jako osobní web. Související projekt claude-limits.pprojects.cz se zabývá efektivním kontextovým oknem Claude a fenoménem Lost in the Middle.

Pokud máte k seriálu připomínku, opravu nebo chcete pokračovat v diskusi, napište na LinkedIn.