Перейти к содержимому
Продукт17 мая 2026 г.

RAG проигрывает простому поиску: архитектура агентов в 2026

Векторный поиск хуже grep и wiki-хранилища в большинстве задач. Гибридная схема дает точность 91% против 65-78% у чистого RAG.

RAGи почти всегда плохо работают. Лучше, когда агент ищет конкретную цитату, а не «смысл».

Когда агент достаёт ответ из базы знаний, у него, образно, два инструмента.
а) Векторный поиск (RAG) — груда книг на полу: все рядом, в одной куче, ищешь «на ощупь» по семантической близости.
б) Полнотекстовый поиск — шкаф с ярлыками: открываешь нужную полку и читаешь точную цитату.

Лучший способ организовать такой шкаф – obsidian-like хранилище. Например: https://github.com/kepano/kepano-obsidian

Сначала, в условиях когда все вокруг тащились от RAGов казалось, что это избретаю велосипед. Но в марте Брис Черный из Anthropic объяснил: ранние Claude Code тоже строили на векторной базе, но обычный grep «уделал её в тестах». В апреле Karpathy назвал такую архитектуру LLM Wiki: вместо RAG поиска — обычный wiki, который агент читает.

Если базу всё-таки нужно строить серьёзно — гибрид «полнотекстовый + векторный» поднимает точность с 65–78% до 91% (LLM при этом сама пишет поисковые запросы). Это рабочая архитектура 2026 года.

Главное: «умный» поиск не всегда лучше простого. Иногда надо дать агенту просто прочитать документы.

newsletter.pragmaticengineer.com/p/building-claude-code-with-boris-cherny

#агенты #инструменты

Оригинал в Telegram: https://t.me/zvasilchannel/2433