RAG проигрывает простому поиску: архитектура агентов в 2026
Векторный поиск хуже grep и wiki-хранилища в большинстве задач. Гибридная схема дает точность 91% против 65-78% у чистого RAG.
RAGи почти всегда плохо работают. Лучше, когда агент ищет конкретную цитату, а не «смысл».
Когда агент достаёт ответ из базы знаний, у него, образно, два инструмента.
а) Векторный поиск (RAG) — груда книг на полу: все рядом, в одной куче, ищешь «на ощупь» по семантической близости.
б) Полнотекстовый поиск — шкаф с ярлыками: открываешь нужную полку и читаешь точную цитату.
Лучший способ организовать такой шкаф – obsidian-like хранилище. Например: https://github.com/kepano/kepano-obsidian
Сначала, в условиях когда все вокруг тащились от RAGов казалось, что это избретаю велосипед. Но в марте Брис Черный из Anthropic объяснил: ранние Claude Code тоже строили на векторной базе, но обычный grep «уделал её в тестах». В апреле Karpathy назвал такую архитектуру LLM Wiki: вместо RAG поиска — обычный wiki, который агент читает.
Если базу всё-таки нужно строить серьёзно — гибрид «полнотекстовый + векторный» поднимает точность с 65–78% до 91% (LLM при этом сама пишет поисковые запросы). Это рабочая архитектура 2026 года.
Главное: «умный» поиск не всегда лучше простого. Иногда надо дать агенту просто прочитать документы.
newsletter.pragmaticengineer.com/p/building-claude-code-with-boris-cherny
#агенты #инструменты
Оригинал в Telegram: https://t.me/zvasilchannel/2433