Справочник

NeuralDeep: российский AI-стек на своих GPU — от LLM API до сети агентов

AI-инфраструктура на собственных серверах в РФ: OpenAI-совместимый API, браузерный AI-IDE, self-hosted сеть агентов, корпоративный RAG и каталог скиллов под российские сервисы. Модели gpt-oss-120b, Qwen3.6, BGE/E5. Бесплатный тариф на Hub и Search, on-prem развёртывание за 1–2 недели.

16 июня 2026 г. ai-агенты api ИИ Инструменты инфраструктура open-source RAG

NeuralDeep — российский AI-хаб, который держит весь стек на собственных GPU в РФ. Чат с открытыми моделями, OpenAI-совместимое API, браузерный AI-IDE, сеть агентов, корпоративный поиск с RAG и каталог скиллов под российские сервисы. У части продуктов есть бесплатный тариф, тот же стек команда разворачивает on-premise в контуре заказчика. В материале разбираем устройство платформы, ключевые продукты, тарифы и сценарии, в которых NeuralDeep выгоднее зарубежных провайдеров.

Ключевое правило: для проектов с требованием «данные не должны покидать РФ» или «нельзя зависеть от зарубежного провайдера» NeuralDeep закрывает оба требования одним стеком. Если таких ограничений нет, выбор между локальным и облачным решением остаётся экономическим.

Что это

NeuralDeep — AI-инфраструктура, собранная на открытых моделях (gpt-oss-120b, Qwen3.6, BGE/E5-embeddings, Whisper) и развёрнутая на собственных серверах в России. Идея простая: дать доступ к топовым OSS-моделям без VPN, без зарубежных платёжек и без передачи данных за рубеж.

Платформа состоит из двух частей. Первая — готовые продукты, которыми можно пользоваться прямо сейчас на серверах NeuralDeep, у части есть бесплатный тариф. Вторая — внедрение в контуре заказчика: тот же стек команда разворачивает on-premise, на ваших GPU, с вашими данными, под ваши процессы. Проект ведёт Валера Ковальский (Head of AI), в open source у NeuralDeep более 1100 звёзд на GitHub.

Зачем нужно

Заменить зарубежный LLM-провайдер. Перевести существующий проект на локальные модели в РФ, поменяв base URL и ключ, без VPN и зарубежных платёжек.
Кодить на локальных моделях. Открыть репозиторий в браузерном Coder и работать с opencode-агентом без установки и без OpenAI/Anthropic.
Собрать корпоративный поиск. Поднять RAG по внутренним документам через Search или развернуть его on-premise с embeddings + reranker + Qdrant или pg-vector.
Запустить сеть агентов. Через Drift поднять Telegram-бота и веб-клиент со скиллами и расписаниями на собственных моделях.
Расширить агентов под RU-сервисы. Поставить скиллы из каталога skillsBD для Яндекса, 1С, Битрикса, Wildberries, DaData.
Транскрибировать аудио on-prem. Расшифровывать совещания и звонки через Whisper, не отдавая записи в облако.

Как устроено

Шесть витрин закрывают основные сценарии работы с LLM — от чата до сети агентов. Объединяет их один и тот же набор локальных моделей и единый вход через Hub: авторизовались один раз, и чат, API, IDE, агенты и поиск работают на общем стеке.

Продукт	Что делает	Адрес
Hub	Свой LLM API на GPU NeuralDeep. OpenAI-совместимый gateway, 10 моделей (gpt-oss-120b, Qwen3.6, e5/bge-embeddings, Whisper). Есть бесплатный тариф	hub.neuraldeep.ru
API	Прямой программный доступ к тем же моделям: /v1/chat, /v1/embeddings, /v1/audio. Подключается как OpenAI	api.neuraldeep.ru
Coder	Браузерный AI-IDE: opencode-агент в одноразовой Firecracker microVM. Подключаете GitHub, открываете репозиторий и кодите на локальных OSS-моделях	coder.neuraldeep.ru
Drift	Self-hosted сеть AI-агентов: Telegram-бот, веб-клиент и OpenAI-совместимое API. Скиллы, расписания, инструменты	drift.neuraldeep.ru
Search	Корпоративный поиск и RAG по внутренним данным и веб-источникам. Единый вход через Hub, есть бесплатный тариф	search.neuraldeep.ru
skillsBD	Open-source каталог скиллов и MCP-серверов для российских сервисов: Яндекс, 1С, Битрикс, GigaChat, Wildberries. 46+ инструментов	neuraldeep.ru/skills

Модели и стек

Всё крутится на собственных GPU в России, без проксирования в зарубежные облака. В стек входят четыре класса моделей: диалоговые LLM, эмбеддинги, реранкер, речевые модели. По продуктам это распределяется так: Hub и API дают диалоговые LLM и эмбеддинги, Search добавляет реранкер для переранжирования результатов, audio-endpoint — распознавание речи.

Класс модели	Конкретные модели	Где используется
Диалоговые LLM	gpt-oss-120b, Qwen3.6	Чат в Hub, агенты Drift, кодинг в Coder
Эмбеддинги	e5, bge	RAG в Search, корпоративный поиск
Реранкер	Собственная модель NeuralDeep	Переранжирование результатов Search
Речевые	Whisper	Транскрипция в API и audio-endpoint

Когда использовать

Ситуация	Решение
Данные не должны покидать РФ	On-prem LLM gateway + Search за 1–2 недели
Нужен быстрый старт без своего железа	Hub + бесплатный тариф, регистрация за 2 минуты
Миграция с OpenAI API без переписывания кода	Заменить base_url + api_key в OpenAI-клиенте
RAG по корпоративной базе знаний	Search с бесплатным тарифом или on-prem с pg-vector/Qdrant
Агенты с интеграциями в RU-сервисы	Drift + скиллы из skillsBD для Яндекса, 1С, Битрикса, DaData
Транскрибация совещаний on-prem	WhisperX + docker-compose с UI

Тарифы и развёртывание on-premise

Для внедрения в своём контуре команда NeuralDeep предлагает четыре направления. Срок развёртывания — от 1–2 недель на базовые сценарии, дольше — для сложных кастомных агентов и интеграции с документооборотом заказчика.

LLM gateway на ваших GPU — self-hosted OpenAI-совместимый API, multi-tenant, с биллингом и observability. Срок 1–2 недели.
Корпоративный RAG / поиск — embeddings + reranker + Qdrant или pg-vector, с подключением к Confluence, Bitrix и файловым шарам. Без утечек в облако.
Кастомный AI-агент — под ваш стек: CRM, базу знаний, документооборот. На проверенных open-source кирпичах (Claude Code, Cursor, MCP).
Audio / транскрипция on-prem — Whisper на ваших GPU, real-time через WebSocket и batch для архивов.

Пример

Подключение через Python SDK. Поскольку API совместим с форматом OpenAI, миграция сводится к замене base URL и ключа.

from openai import OpenAI

client = OpenAI(
    base_url="https://api.neuraldeep.ru/v1",
    api_key="<ваш ключ из hub.neuraldeep.ru>",
)

response = client.chat.completions.create(
    model="gpt-oss-120b",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(response.choices[0].message.content)

Доступные эндпоинты стандартные для OpenAI: /v1/chat/completions, /v1/embeddings, /v1/audio. Ключ выпускается в личном кабинете Hub. Имена моделей при миграции меняются на локальные: gpt-oss-120b вместо gpt-4o, BGE/E5 для embeddings.

Важно: перед установкой скилла из skillsBD читайте SKILL.md. Скилл — это инструкции для агента, и в нём может быть prompt injection. Каталог проходит модерацию, но базовую проверку делайте сами.

Open source: проекты NeuralDeep на GitHub

Команда выкладывает в open source инструменты, которыми пользуется сама. Аккаунт github.com/vakovalskii, 1 100+ звёзд суммарно по всем проектам.

Проект	Что делает	Звёзды
KVDesk	Локальный AI-ассистент с виджетами и поддержкой MCP	326
searcharvester	Self-hosted поиск и markdown-harvester для агентов (SearXNG + FastAPI), Tavily-совместимый	213
codbash	Браузерный дашборд для сессий Claude Code и Codex: просмотр, поиск, теги, resume	201
topsha	Локальный AI-агент для простых задач на ПК (gpt-oss, Qwen, GLM)	147
whisperx-fronted-docker-compose	WhisperX с UI и docker-compose: таймстампы, диаризация, RU/EN из коробки	66
LocalTaskClaw	Персональный AI-агент, деплой в 3 шага на любой Linux-сервер	34

Каталог скиллов skillsBD

skillsBD — open-source каталог скиллов и MCP-серверов, заточенный под российские сервисы. Скилл — это папка с файлом SKILL.md, который учит агента, как выполнить задачу. Каталог закрывает нишу, которой нет в западных агрегаторах: скиллы для Яндекса, 1С, Битрикса и DaData там просто не найти.

Характеристика	Описание
Количество	46+ инструментов (скиллы + MCP-серверы)
CLI-установщик	npx skillsbd add <owner/repo> — установка одной командой
Модерация	Добавление через форму с ревью, авторизация через GitHub OAuth
Совместимость	Claude Code, Cursor, Codex, Windsurf, а также GigaCode, Koda, SourceCraft
Фокус	Российские сервисы: Яндекс, 1С, Битрикс, GigaChat, Wildberries, DaData

Характеристика	Описание
Количество	46+ инструментов (скиллы + MCP-серверы)
CLI-установщик	npx skillsbd add <owner/repo> — установка одной командой
Модерация	Добавление через форму с ревью, авторизация через GitHub OAuth
Совместимость	Claude Code, Cursor, Codex, Windsurf, а также GigaCode, Koda, SourceCraft
Фокус	Российские сервисы: Яндекс, 1С, Битрикс, GigaChat, Wildberries, DaData

Установка скилла через CLI — глобальная установка не нужна. После установки скилл появляется в .claude/skills/ и сразу доступен агенту.

# Установить скилл
npx skillsbd add theYahia/dadata-mcp/dadata-skills

# Найти скиллы в каталоге
npx skillsbd search "яндекс"

# Посмотреть установленные
npx skillsbd list

Как установить скилл

CLI работает через npx — глобальная установка не нужна. После установки скилл появляется в .claude/skills/ и сразу доступен агенту.

# Установить скилл
npx skillsbd add theYahia/dadata-mcp/dadata-skills

# Найти скиллы в каталоге
npx skillsbd search "яндекс"

# Посмотреть установленные
npx skillsbd list

Прежде чем ставить скилл — прочитайте SKILL.md. Скилл — это инструкции для агента, и в нём может быть prompt injection. Плюс skillsBD в том, что всё проходит модерацию, но базовую проверку делайте сами.

Ограничения

Что учитывать

Линейка моделей ограничена открытыми.

Если нужен GPT-5 или Claude Opus 4.7, придётся комбинировать NeuralDeep с зарубежным провайдером.

On-prem развёртывание требует собственных GPU.

Минимальный вход — 4–8 GPU A100/H100, считайте заранее, есть ли они в контуре.

Бесплатный тариф Hub имеет лимиты.

Для production-нагрузок считайте расход: 10 моделей в gateway дают выбор, но и стоимость растёт с объёмом.

Open-source проекты NeuralDeep развиваются командой одного человека.

Если зависите от конкретного репозитория (KVDesk, codbash, topsha), закладывайте план Б.

Coder работает в браузерной Firecracker microVM.

Это изоляция, но и накладные расходы — для маленьких задач быстрее запустить локально.

Антипаттерны

Чего не делать

Не делать: ставить скилл из skillsBD без чтения SKILL.md

— потому что скилл это инструкции для агента, и prompt injection в нём даёт агенту чужие команды.

Не делать: переносить проект с OpenAI на NeuralDeep без проверки качества на ваших данных

— потому что gpt-oss-120b не равен gpt-4o по качеству на узких задачах.

Не делать: разворачивать on-prem без пилота на Hub

— потому что 1–2 недели развёртывания без проверки гипотезы это дорогая ошибка.

Не делать: использовать Coder для production-кода без code review

— потому что opencode-агент в microVM изолирован, но не гарантирует качество.

Чеклист

Проверка перед запуском

Требование по размещению данных зафиксировано:

данные в РФ, on-prem, без зарубежного облака.

Пилот на Hub или Search прошёл, качество моделей проверено на реальных задачах.

Если планируется on-prem

— свои GPU посчитаны, бюджет и сроки развёртывания согласованы.

API-ключ хранится в переменной окружения или в хранилище секретов, в коде только ссылка.

Для каждого скилла из skillsBD прочитан SKILL.md, проверены команды и возможные риски prompt injection.

Fallback-провайдер определён на случай, если конкретный open-source репозиторий NeuralDeep перестанет поддерживаться.

Ссылки

NeuralDeep: neuraldeep.ru
Hub: hub.neuraldeep.ru
API: api.neuraldeep.ru
Каталог скиллов: neuraldeep.ru/skills
GitHub: github.com/vakovalskii
Telegram-канал: t.me/neuraldeep

Разобрать статью с ИИ

Получите короткий разбор: суть материала, ключевые идеи, что можно применить в своей задаче, что стоит уточнить и с каких шагов начать.

ChatGPT Claude Gemini

Разбери статью VOROBEOFF AI.

Название: «NeuralDeep: российский AI-стек на своих GPU — от LLM API до сети агентов»
Ссылка: https://vorobeoffai.ru/knowledge/neuraldeep-rossiiskii-ai-stek/

Сначала дай короткое резюме: 5–7 пунктов без воды.

Затем выдели:

1. Главные принципы и критерии качества.
2. Что можно перенести в мою задачу, бизнес, сайт или рабочий процесс.
3. Что нужно уточнить перед исполнением.

В конце предложи 2–3 практических первых шага.

Не копируй текст дословно — адаптируй идеи под реальную задачу.

Продолжить тему

Материалы, которые связаны с этим разбором

Подборка строится по общим тегам, чтобы следующий шаг был связан с текущим контекстом.

Все по теме

База знаний 31 июля 2026 г.

Silero: локальная речевая модель для русского TTS, STT и VAD

Open-source библиотека для синтеза, распознавания и детекции русской речи на CPU без облака и API-ключей

#ИИ #api #open-source #TTS #ai-агенты

Статьи 30 июля 2026 г.

Claude Opus 5: агент, который не бросает задачу на полпути

Релиз Claude Opus 5: рассуждение по умолчанию, 1 млн токенов контекста, пять уровней усилия, бета-фичи для инструментов и fallback. Что менять в коде и как проверить на своих задачах.

#ai-агенты #ИИ #api #DevTools #Инструменты

Блог 16 июля 2026 г.

Multica: open-source платформа для управления командой из людей и ИИ-агентов

Open-source платформа, превращающая coding-агентов в полноценных участников команды: назначение задач, очереди, навыки, автономное выполнение и единый dashboard для локальных и облачных runtime.

#ai-агенты #ИИ #Инструменты #API и данные #api

Виталий Воробьев

Есть процесс, который пора автоматизировать?

Напишите, что каждый день забирает время: заявки, документы, CRM, поддержка, контент или внутренняя рутина. Я покажу, где ИИ можно встроить без лишней сложности и какой первый рабочий шаг сделать.

Написать в Telegram Открыть канал