В этой статье я дал вам один инструмент (отвертку), а в телеграм канале лежит много пользы, инструментов и видео.

SEO · AI-агенты · история одного провала

Как я пошёл за эмбеддингами и вернулся без них

90 000 поисковых запросов, три часа падений, консилиум ИИ-зануд — и решение, которое оказалось проще модного слова.

Решил банальную SEO-задачу: взять большой массив семантики из Яндекс Метрики и разметить — понять, какие реальные интересы у аудитории. Загрузил 90 тысяч запросов своему милому роботу в ChatGPT. Робот сделал круто, но честно признался: смысловые сегменты он задал «глазами», а Python посчитал строки и проценты.

Когда я начал возмущаться, модель сказала волшебное слово: тебе нужны эмбеддинги. Это частотное слово. Его говорят все гуру.

Я пошёл в Polza.ai закидывать деньги. Из всех моделей самой гуманной к русскому языку оказалась Qwen. Стал пилить приложение: загружаешь файл → скрипт превращает запросы в эмбеддинги → кластеризует → рассказывает правду про мои 90 тысяч ключевых слов.

Я не писал код сам

Claude Code работал оркестрантом, а код через CLIProxyAPI писали ChatGPT 5.5 и Gemini Flash. Промпт-инжиниринг был подлый, менеджерский: будто я начальник, который унижает подчинённого — «ты не справляешься, проси ChatGPT сделать».

Думал, робот обидится, будет плакать и доказывать, как избитый ученик из малобюджетного фильма про кунг-фу. Но он не рожал крутого малыша — он валил на коллег, что они косячат. Вместо одного Claude Code у меня был консилиум зануд-партнёров.

А потом оно начало падать

Интерфейс поехал. Ехал недолго. Я видел на экране, как создаются эмбеддинги — и ровно на середине пути скрипт падал. Дойдёт до середины, упадёт. И так — часа три подряд.

Сначала я думал, что криворукий. Оказалось — кривой подход. 90 тысяч векторов банально не лезли в память моего ноута. Дело было не во мне и не в Claude Code. Дело было в самом модном слове.

Я выкинул эмбеддинги. Целиком.

И сделал иначе: маски ловят очевидное, а остальной массив режется на пачки по сотне запросов и размечается по смыслу — дешёвой моделью, без векторов, без кластеризации, без пяти гигабайт, которые не помещаются в память.

Поехало с первого раза и до конца. 90 тысяч запросов разложились на реальные сегменты: про что люди ищут, зачем приходят, какие из них тёплые, а какие — просто полистать. Та самая правда про аудиторию, за которой я и лез в эти эмбеддинги.

Один ИИ против многих

Главное, что я вынес: один Claude Code, который тащит всё сам, проигрывает связке моделей через CLIProxyAPI. Не потому что он плохой — потому что у задачи разные части, и каждой нужен свой исполнитель.

ТОЛЬКО Claude Code

одна модель тащит и код, и разметку, и логику
массовую работу гонит дорогой моделью
упал API — встало всё
застревает, пытается всё делать сам

CLIProxyAPI + пул моделей

код — умные дорогие, разметка — дешёвая
250 пачек на дешёвой = в десятки раз дешевле
модель отвалилась — подмена одним словом
оркестрант раздаёт, каждый на своём месте

Что в сухом остатке

Эмбеддинги — не серебряная пуляДля разметки семантики они упёрлись в память и деньги. Задача решилась проще — масками и батчевой разметкой по смыслу.

Профит CLIProxyAPI — в раскладке моделейДешёвая модель делает 90% объёма (массовые пачки), дорогая — только код и выводы. Это реальные деньги, а не магия.

Устойчивость к сбоямChatGPT 5.5 отдавал ошибки — подменял на Gemini или Claude одним параметром, без переписывания.

Много моделей > одинРазные части задачи — разным исполнителям. Оркестрант дирижирует, модели играют. Один универсал проигрывает оркестру.

Мораль

Я угрохал три часа на модное слово, которое мне продали гуру. А рабочее решение оказалось проще, дешевле и без него. Иногда сила не в том, чтобы взять самый умный инструмент, — а в том, чтобы дать каждому кусочку задачи своего исполнителя.

Как разметить свою семантику по слоям — без векторов и гуру-магии — разбираю в Telegram-канале.