# RAG vysvětlený lidsky

> Úvodní díl o tom, jak dnes pracovat s vlastními daty v AI nástrojích, plus čtyř-dílný seriál o RAG (Retrieval Augmented Generation) v češtině. Od mapy variant přes laický úvod, technické fungování a expertní analýzu slabých míst v produkčním nasazení až po pokročilé architektury (GraphRAG, CAG, Agentic RAG). Autor Pavel Horák, AI Solutions Architect, květen 2026.

Web odpovídá na pět otázek:

0. **Jak dnes vůbec pracovat s vlastními daty v AI** (úvodní mapa variant od Claude Projects po lokální AnythingLLM, plus Perplexity Spaces, Mistral Le Chat, Glean, Jan, Msty a další)
1. **Co je RAG a proč existuje** (laická úroveň, pro uživatele Claude, ChatGPT a Gemini)
2. **Jak RAG technicky funguje uvnitř** (pro IT manažery, juniorní vývojáře a technické product ownery)
3. **Kde RAG v praxi selhává a co s tím** (pro experty, kritické čtenáře a vedoucí AI projektů)
4. **Za hranicí klasického RAGu, pokročilé architektury** (Contextual Retrieval, GraphRAG, CAG, Agentic a Self-RAG, multimodální a temporal RAG)

Každý článek obsahuje sekci „Ověření faktů a revize", která transparentně dokumentuje opravy a upřesnění s odkazy na primární zdroje. Texty jsou bez marketingových floskulí, s důrazem na praktická úskalí.

## Články seriálu

- [Práce s vlastními daty v LLM, mapa variant](https://rag.pprojects.cz/rag-pro-data): Úvodní díl. Šest úrovní jak dnes pracovat s vlastními soubory v AI: drag and drop do Claude/ChatGPT/Gemini/Perplexity/Le Chat/Grok, trvalá místa (Claude Projects a Skills, ChatGPT Custom GPTs, Gemini Gems, Perplexity Spaces, Le Chat Libraries, Grok Projects), NotebookLM a source-grounded nástroje, Obsidian s pluginy (Smart Connections, Copilot for Obsidian, Reor, Khoj), firemní cesty (Microsoft 365 Copilot, Google Workspace, Glean, Cohere North, Le Chat Enterprise), plně lokální AI (Ollama, LM Studio, AnythingLLM, Jan, Msty, Open WebUI, GPT4All, PrivateGPT, vektorové databáze, LlamaIndex, LangChain). Plus klíčová sekce „Limity, o kterých výrobci nemluví" o Lost in the Middle, degradaci s délkou konverzace a automatickém přepnutí Claude Projects do RAG módu. ~25 minut čtení, glosář 13 pojmů.

- [RAG pro každého](https://rag.pprojects.cz/rag-pro-kazdeho): Co je RAG vysvětlené bez programátorského žargonu. Knihovník v knihovně. Proč nahrávání pěti dokumentů funguje a pěti tisíc selhává. Tři fáze RAG: indexace, vyhledávání, generování odpovědi. ~8 minut čtení, glosář 13 pojmů.

- [RAG technicky](https://rag.pprojects.cz/rag-technicky): Embedding modely (OpenAI text-embedding-3, Voyage AI, BGE, multilingual E5, Cohere Embed v3), vektorové databáze (Pinecone, Weaviate, Qdrant, Milvus, Chroma, pgvector), cosine similarity. Pět chunkovacích strategií. Hybrid retrieval kombinující sémantické, fulltextové (BM25) a strukturované vyhledávání. RRF, reranking (Cohere Rerank, BGE Reranker). Proč jsou metadata u malých chunků důležitější než obsah. ~18 minut čtení, glosář 18 pojmů.

- [RAG v praxi](https://rag.pprojects.cz/rag-v-praxi): Sedm slabých míst naivního RAG. Drift k hodnověrnému nesmyslu (embedding hledá podobnost slov, ne logickou ekvivalenci závěru). Chunkování láme myšlenku. Paradox metadat. Hierarchické chunkování a Anthropic Contextual Retrieval. Temporal validity (čtyři časové osy v právním kontextu). Ingestion pipeline jako skrytý zabiják. Nepřenositelnost legaltech RAG (přenese se 20-30 %). Lost in the Middle a effective context length. Late-stage context injection jako návrh řešení. Ekonomika RAG v právu, medicíně a financích. ~25 minut čtení.

- [Za hranicí RAGu, pokročilé architektury](https://rag.pprojects.cz/rag-za-hranici): RAG není jeden, je to rodina architektur. Contextual Retrieval od Anthropic (snížení chybovosti retrievalu o 35-67 %). GraphRAG od Microsoft (knowledge graf, community summaries, map-reduce nad komunitami, global vs local search). CAG, Cache-Augmented Generation s celým korpusem v KV cache pro stabilní uzavřené korpusy. Agentic RAG s iteračním retrievalem a tools. Self-RAG s reflection tokens. HyDE, RAG-Fusion, multi-query RAG. Multimodální a temporal RAG. Pohled kam to směřuje (memory-augmented agents, MCP jako runtime, multi-agent RAG, entailment-aware embeddings). Mapa která architektura na jaký problém. ~28 minut čtení, glosář 30 pojmů.

## Ověřené opravy faktů (vybrané)

- **Claude kontextové okno**: Sonnet 4.5, Sonnet 4.6, Opus 4.6 i Opus 4.7 mají plné 1 milionové kontextové okno (ne 200 000 tokenů). Zdroj: platform.claude.com/docs/en/about-claude/pricing
- **Anthropic Contextual Retrieval**: Snižuje retrieval failure rate o 35 % samostatně, 49 % v kombinaci s kontextovým BM25, 67 % s rerankingem. Zdroj: anthropic.com/news/contextual-retrieval
- **Casetext**: V srpnu 2023 koupený společností Thomson Reuters za 650 milionů dolarů, není to samostatná firma. Zdroj: legaldive.com
- **NIAH testy**: Původně dílo Grega Kamradta (2023), ne Stanfordu. Stanford je autor souvisejícího výzkumu „Lost in the Middle" (Liu et al., TACL 2024). Zdroje: github.com/gkamradt/LLMTest_NeedleInAHaystack, aclanthology.org/2024.tacl-1.9
- **GraphRAG**: Microsoft Research, Edge et al. „From Local to Global: A Graph RAG Approach to Query-Focused Summarization", 2024. Open-source: github.com/microsoft/graphrag
- **Self-RAG**: Asai et al. „Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection", 2023.
- **MCP (Model Context Protocol)**: Původně Anthropic (listopad 2024), v prosinci 2025 darován Linux Foundation pod Agentic AI Foundation. Zdroj: anthropic.com/news/donating-the-model-context-protocol

## Související projekty autora

- [claude-limits.pprojects.cz](https://claude-limits.pprojects.cz): Analyzátor Project Knowledge, kalkulace tokenů, vizualizace tří režimů Claude (plný, efektivní, úsporný), článek o Lost in the Middle a Goal Drift.
- [saioai.cz](https://saioai.cz) (s AI o AI): Studie a longitudinální analýzy LLM modelů (Claude, ChatGPT, Gemini, Copilot, Perplexity). Praktické testy pro byznys a automatizaci.
- [pprojects.cz](https://pprojects.cz): Portfolio funkčních webových aplikací a nástrojů vytvořených ve spolupráci s jazykovými modely. Vibe coding v praxi.
- [phorak.cz](https://phorak.cz): Osobní web autora.
- [vibecodingindex.cz](https://vibecodingindex.cz): Komunitní index českých a slovenských vibe coderů.

## Autor

- **Pavel Horák**, AI Solutions Architect, autor analýz o AI
- Identita: https://phorak.cz/#pavel-horak
- LinkedIn: https://www.linkedin.com/in/pavelhorakeu
- X: https://x.com/PavelHorakCZ
- GitHub: https://github.com/pavel-horak-cz
- Email: pavelhorakit@gmail.com

## Licence a citace

© 2026 Pavel Horák. Pokud používáte tento obsah, citujte zdroj URL konkrétního článku. Pro diskusi nebo opravy: LinkedIn nebo email výše.