NeuralDeep — российский AI-хаб, который держит весь стек на собственных GPU в РФ. Чат с открытыми моделями, OpenAI-совместимое API, браузерный AI-IDE, сеть агентов, корпоративный поиск с RAG и каталог скиллов под российские сервисы. У части продуктов есть бесплатный тариф, тот же стек команда разворачивает on-premise в контуре заказчика. В материале разбираем устройство платформы, ключевые продукты, тарифы и сценарии, в которых NeuralDeep выгоднее зарубежных провайдеров.
Ключевое правило: для проектов с требованием «данные не должны покидать РФ» или «нельзя зависеть от зарубежного провайдера» NeuralDeep закрывает оба требования одним стеком. Если таких ограничений нет, выбор между локальным и облачным решением остаётся экономическим.
Что это
NeuralDeep — AI-инфраструктура, собранная на открытых моделях (gpt-oss-120b, Qwen3.6, BGE/E5-embeddings, Whisper) и развёрнутая на собственных серверах в России. Идея простая: дать доступ к топовым OSS-моделям без VPN, без зарубежных платёжек и без передачи данных за рубеж.
Платформа состоит из двух частей. Первая — готовые продукты, которыми можно пользоваться прямо сейчас на серверах NeuralDeep, у части есть бесплатный тариф. Вторая — внедрение в контуре заказчика: тот же стек команда разворачивает on-premise, на ваших GPU, с вашими данными, под ваши процессы. Проект ведёт Валера Ковальский (Head of AI), в open source у NeuralDeep более 1100 звёзд на GitHub.
Зачем нужно
- Заменить зарубежный LLM-провайдер. Перевести существующий проект на локальные модели в РФ, поменяв base URL и ключ, без VPN и зарубежных платёжек.
- Кодить на локальных моделях. Открыть репозиторий в браузерном Coder и работать с opencode-агентом без установки и без OpenAI/Anthropic.
- Собрать корпоративный поиск. Поднять RAG по внутренним документам через Search или развернуть его on-premise с embeddings + reranker + Qdrant или pg-vector.
- Запустить сеть агентов. Через Drift поднять Telegram-бота и веб-клиент со скиллами и расписаниями на собственных моделях.
- Расширить агентов под RU-сервисы. Поставить скиллы из каталога skillsBD для Яндекса, 1С, Битрикса, Wildberries, DaData.
- Транскрибировать аудио on-prem. Расшифровывать совещания и звонки через Whisper, не отдавая записи в облако.
Как устроено
Шесть витрин закрывают основные сценарии работы с LLM — от чата до сети агентов. Объединяет их один и тот же набор локальных моделей и единый вход через Hub: авторизовались один раз, и чат, API, IDE, агенты и поиск работают на общем стеке.
| Продукт | Что делает | Адрес |
|---|---|---|
| Hub | Свой LLM API на GPU NeuralDeep. OpenAI-совместимый gateway, 10 моделей (gpt-oss-120b, Qwen3.6, e5/bge-embeddings, Whisper). Есть бесплатный тариф | hub.neuraldeep.ru |
| API | Прямой программный доступ к тем же моделям: /v1/chat, /v1/embeddings, /v1/audio. Подключается как OpenAI | api.neuraldeep.ru |
| Coder | Браузерный AI-IDE: opencode-агент в одноразовой Firecracker microVM. Подключаете GitHub, открываете репозиторий и кодите на локальных OSS-моделях | coder.neuraldeep.ru |
| Drift | Self-hosted сеть AI-агентов: Telegram-бот, веб-клиент и OpenAI-совместимое API. Скиллы, расписания, инструменты | drift.neuraldeep.ru |
| Search | Корпоративный поиск и RAG по внутренним данным и веб-источникам. Единый вход через Hub, есть бесплатный тариф | search.neuraldeep.ru |
| skillsBD | Open-source каталог скиллов и MCP-серверов для российских сервисов: Яндекс, 1С, Битрикс, GigaChat, Wildberries. 46+ инструментов | neuraldeep.ru/skills |
Модели и стек
Всё крутится на собственных GPU в России, без проксирования в зарубежные облака. В стек входят четыре класса моделей: диалоговые LLM, эмбеддинги, реранкер, речевые модели. По продуктам это распределяется так: Hub и API дают диалоговые LLM и эмбеддинги, Search добавляет реранкер для переранжирования результатов, audio-endpoint — распознавание речи.
| Класс модели | Конкретные модели | Где используется |
|---|---|---|
| Диалоговые LLM | gpt-oss-120b, Qwen3.6 | Чат в Hub, агенты Drift, кодинг в Coder |
| Эмбеддинги | e5, bge | RAG в Search, корпоративный поиск |
| Реранкер | Собственная модель NeuralDeep | Переранжирование результатов Search |
| Речевые | Whisper | Транскрипция в API и audio-endpoint |
Когда использовать
| Ситуация | Решение |
|---|---|
| Данные не должны покидать РФ | On-prem LLM gateway + Search за 1–2 недели |
| Нужен быстрый старт без своего железа | Hub + бесплатный тариф, регистрация за 2 минуты |
| Миграция с OpenAI API без переписывания кода | Заменить base_url + api_key в OpenAI-клиенте |
| RAG по корпоративной базе знаний | Search с бесплатным тарифом или on-prem с pg-vector/Qdrant |
| Агенты с интеграциями в RU-сервисы | Drift + скиллы из skillsBD для Яндекса, 1С, Битрикса, DaData |
| Транскрибация совещаний on-prem | WhisperX + docker-compose с UI |
Тарифы и развёртывание on-premise
Для внедрения в своём контуре команда NeuralDeep предлагает четыре направления. Срок развёртывания — от 1–2 недель на базовые сценарии, дольше — для сложных кастомных агентов и интеграции с документооборотом заказчика.
- LLM gateway на ваших GPU — self-hosted OpenAI-совместимый API, multi-tenant, с биллингом и observability. Срок 1–2 недели.
- Корпоративный RAG / поиск — embeddings + reranker + Qdrant или pg-vector, с подключением к Confluence, Bitrix и файловым шарам. Без утечек в облако.
- Кастомный AI-агент — под ваш стек: CRM, базу знаний, документооборот. На проверенных open-source кирпичах (Claude Code, Cursor, MCP).
- Audio / транскрипция on-prem — Whisper на ваших GPU, real-time через WebSocket и batch для архивов.
Пример
Подключение через Python SDK. Поскольку API совместим с форматом OpenAI, миграция сводится к замене base URL и ключа.
from openai import OpenAI
client = OpenAI(
base_url="https://api.neuraldeep.ru/v1",
api_key="<ваш ключ из hub.neuraldeep.ru>",
)
response = client.chat.completions.create(
model="gpt-oss-120b",
messages=[{"role": "user", "content": "Привет!"}],
)
print(response.choices[0].message.content)
Доступные эндпоинты стандартные для OpenAI: /v1/chat/completions, /v1/embeddings, /v1/audio. Ключ выпускается в личном кабинете Hub. Имена моделей при миграции меняются на локальные: gpt-oss-120b вместо gpt-4o, BGE/E5 для embeddings.
Важно: перед установкой скилла из skillsBD читайте SKILL.md. Скилл — это инструкции для агента, и в нём может быть prompt injection. Каталог проходит модерацию, но базовую проверку делайте сами.
Open source: проекты NeuralDeep на GitHub
Команда выкладывает в open source инструменты, которыми пользуется сама. Аккаунт github.com/vakovalskii, 1 100+ звёзд суммарно по всем проектам.
| Проект | Что делает | Звёзды |
|---|---|---|
| KVDesk | Локальный AI-ассистент с виджетами и поддержкой MCP | 326 |
| searcharvester | Self-hosted поиск и markdown-harvester для агентов (SearXNG + FastAPI), Tavily-совместимый | 213 |
| codbash | Браузерный дашборд для сессий Claude Code и Codex: просмотр, поиск, теги, resume | 201 |
| topsha | Локальный AI-агент для простых задач на ПК (gpt-oss, Qwen, GLM) | 147 |
| whisperx-fronted-docker-compose | WhisperX с UI и docker-compose: таймстампы, диаризация, RU/EN из коробки | 66 |
| LocalTaskClaw | Персональный AI-агент, деплой в 3 шага на любой Linux-сервер | 34 |
Каталог скиллов skillsBD
skillsBD — open-source каталог скиллов и MCP-серверов, заточенный под российские сервисы. Скилл — это папка с файлом SKILL.md, который учит агента, как выполнить задачу. Каталог закрывает нишу, которой нет в западных агрегаторах: скиллы для Яндекса, 1С, Битрикса и DaData там просто не найти.
| Характеристика | Описание |
|---|---|
| Количество | 46+ инструментов (скиллы + MCP-серверы) |
| CLI-установщик | npx skillsbd add <owner/repo> — установка одной командой |
| Модерация | Добавление через форму с ревью, авторизация через GitHub OAuth |
| Совместимость | Claude Code, Cursor, Codex, Windsurf, а также GigaCode, Koda, SourceCraft |
| Фокус | Российские сервисы: Яндекс, 1С, Битрикс, GigaChat, Wildberries, DaData |
| Характеристика | Описание |
|---|---|
| Количество | 46+ инструментов (скиллы + MCP-серверы) |
| CLI-установщик | npx skillsbd add <owner/repo> — установка одной командой |
| Модерация | Добавление через форму с ревью, авторизация через GitHub OAuth |
| Совместимость | Claude Code, Cursor, Codex, Windsurf, а также GigaCode, Koda, SourceCraft |
| Фокус | Российские сервисы: Яндекс, 1С, Битрикс, GigaChat, Wildberries, DaData |
Установка скилла через CLI — глобальная установка не нужна. После установки скилл появляется в .claude/skills/ и сразу доступен агенту.
# Установить скилл
npx skillsbd add theYahia/dadata-mcp/dadata-skills
# Найти скиллы в каталоге
npx skillsbd search "яндекс"
# Посмотреть установленные
npx skillsbd list
Как установить скилл
CLI работает через npx — глобальная установка не нужна. После установки скилл появляется в .claude/skills/ и сразу доступен агенту.
# Установить скилл
npx skillsbd add theYahia/dadata-mcp/dadata-skills
# Найти скиллы в каталоге
npx skillsbd search "яндекс"
# Посмотреть установленные
npx skillsbd list
Прежде чем ставить скилл — прочитайте SKILL.md. Скилл — это инструкции для агента, и в нём может быть prompt injection. Плюс skillsBD в том, что всё проходит модерацию, но базовую проверку делайте сами.
Ограничения
| Ограничение | Пояснение |
|---|---|
| Линейка моделей ограничена открытыми | Если нужен GPT-5 или Claude Opus 4.7, придётся комбинировать NeuralDeep с зарубежным провайдером. |
| On-prem развёртывание требует собственных GPU. | Минимальный вход — 4–8 GPU A100/H100, считайте заранее, есть ли они в контуре. |
| Бесплатный тариф Hub имеет лимиты. | Для production-нагрузок считайте расход — 10 моделей в gateway дают выбор, но и стоимость растёт с объёмом. |
| Open-source проекты NeuralDeep развиваются командой одного человека | Если зависите от конкретного репозитория (KVDesk, codbash, topsha), закладывайте план Б. |
| Coder работает в браузерной Firecracker microVM. | Это изоляция, но и накладные расходы — для маленьких задач быстрее запустить локально. |
Антипаттерны
| Антипаттерн | Почему опасно |
|---|---|
| Не делать | ставить скилл из skillsBD без чтения SKILL.md — потому что скилл это инструкции для агента, и prompt injection в нём даёт агенту чужие команды. |
| Не делать | переносить проект с OpenAI на NeuralDeep без проверки качества на ваших данных — потому что gpt-oss-120b не равен gpt-4o по качеству на узких задачах. |
| Не делать | разворачивать on-prem без пилота на Hub — потому что 1–2 недели развёртывания без проверки гипотезы это дорогая ошибка. |
| Не делать | использовать Coder для production-кода без code review — потому что opencode-агент в microVM изолирован, но не гарантирует качество. |
Чеклист
| Проверка | Что сделать |
|---|---|
| Требование по размещению данных зафиксировано | данные в РФ, on-prem, без зарубежного облака. |
| Пилот на Hub или Search прошёл, качество моделей проверено на реальных задачах | свои GPU посчитаны, бюджет и сроки развёртывания согласованы. |
| API-ключ хранится в переменной окружения или в хранилище секретов, в коде только ссылка | |
| Для каждого скилла из skillsBD прочитан SKILL.md, проверены команды и возможные риски prompt injection | |
| Fallback-провайдер определён на случай, если конкретный open-source репозиторий NeuralDeep перестанет поддерживаться |