NeuralDeep — российский AI-хаб, который держит весь стек на собственных GPU в РФ. Чат с открытыми моделями, OpenAI-совместимое API, браузерный AI-IDE, сеть агентов, корпоративный поиск с RAG и каталог скиллов под российские сервисы. У части продуктов есть бесплатный тариф, тот же стек команда разворачивает on-premise в контуре заказчика. В материале разбираем устройство платформы, ключевые продукты, тарифы и сценарии, в которых NeuralDeep выгоднее зарубежных провайдеров.

Ключевое правило: для проектов с требованием «данные не должны покидать РФ» или «нельзя зависеть от зарубежного провайдера» NeuralDeep закрывает оба требования одним стеком. Если таких ограничений нет, выбор между локальным и облачным решением остаётся экономическим.

Что это

NeuralDeep — AI-инфраструктура, собранная на открытых моделях (gpt-oss-120b, Qwen3.6, BGE/E5-embeddings, Whisper) и развёрнутая на собственных серверах в России. Идея простая: дать доступ к топовым OSS-моделям без VPN, без зарубежных платёжек и без передачи данных за рубеж.

Платформа состоит из двух частей. Первая — готовые продукты, которыми можно пользоваться прямо сейчас на серверах NeuralDeep, у части есть бесплатный тариф. Вторая — внедрение в контуре заказчика: тот же стек команда разворачивает on-premise, на ваших GPU, с вашими данными, под ваши процессы. Проект ведёт Валера Ковальский (Head of AI), в open source у NeuralDeep более 1100 звёзд на GitHub.

Зачем нужно

  • Заменить зарубежный LLM-провайдер. Перевести существующий проект на локальные модели в РФ, поменяв base URL и ключ, без VPN и зарубежных платёжек.
  • Кодить на локальных моделях. Открыть репозиторий в браузерном Coder и работать с opencode-агентом без установки и без OpenAI/Anthropic.
  • Собрать корпоративный поиск. Поднять RAG по внутренним документам через Search или развернуть его on-premise с embeddings + reranker + Qdrant или pg-vector.
  • Запустить сеть агентов. Через Drift поднять Telegram-бота и веб-клиент со скиллами и расписаниями на собственных моделях.
  • Расширить агентов под RU-сервисы. Поставить скиллы из каталога skillsBD для Яндекса, 1С, Битрикса, Wildberries, DaData.
  • Транскрибировать аудио on-prem. Расшифровывать совещания и звонки через Whisper, не отдавая записи в облако.

Как устроено

Шесть витрин закрывают основные сценарии работы с LLM — от чата до сети агентов. Объединяет их один и тот же набор локальных моделей и единый вход через Hub: авторизовались один раз, и чат, API, IDE, агенты и поиск работают на общем стеке.

ПродуктЧто делаетАдрес
HubСвой LLM API на GPU NeuralDeep. OpenAI-совместимый gateway, 10 моделей (gpt-oss-120b, Qwen3.6, e5/bge-embeddings, Whisper). Есть бесплатный тарифhub.neuraldeep.ru
APIПрямой программный доступ к тем же моделям: /v1/chat, /v1/embeddings, /v1/audio. Подключается как OpenAIapi.neuraldeep.ru
CoderБраузерный AI-IDE: opencode-агент в одноразовой Firecracker microVM. Подключаете GitHub, открываете репозиторий и кодите на локальных OSS-моделяхcoder.neuraldeep.ru
DriftSelf-hosted сеть AI-агентов: Telegram-бот, веб-клиент и OpenAI-совместимое API. Скиллы, расписания, инструментыdrift.neuraldeep.ru
SearchКорпоративный поиск и RAG по внутренним данным и веб-источникам. Единый вход через Hub, есть бесплатный тарифsearch.neuraldeep.ru
skillsBDOpen-source каталог скиллов и MCP-серверов для российских сервисов: Яндекс, 1С, Битрикс, GigaChat, Wildberries. 46+ инструментовneuraldeep.ru/skills

Модели и стек

Всё крутится на собственных GPU в России, без проксирования в зарубежные облака. В стек входят четыре класса моделей: диалоговые LLM, эмбеддинги, реранкер, речевые модели. По продуктам это распределяется так: Hub и API дают диалоговые LLM и эмбеддинги, Search добавляет реранкер для переранжирования результатов, audio-endpoint — распознавание речи.

Класс моделиКонкретные моделиГде используется
Диалоговые LLMgpt-oss-120b, Qwen3.6Чат в Hub, агенты Drift, кодинг в Coder
Эмбеддингиe5, bgeRAG в Search, корпоративный поиск
РеранкерСобственная модель NeuralDeepПереранжирование результатов Search
РечевыеWhisperТранскрипция в API и audio-endpoint

Когда использовать

СитуацияРешение
Данные не должны покидать РФOn-prem LLM gateway + Search за 1–2 недели
Нужен быстрый старт без своего железаHub + бесплатный тариф, регистрация за 2 минуты
Миграция с OpenAI API без переписывания кодаЗаменить base_url + api_key в OpenAI-клиенте
RAG по корпоративной базе знанийSearch с бесплатным тарифом или on-prem с pg-vector/Qdrant
Агенты с интеграциями в RU-сервисыDrift + скиллы из skillsBD для Яндекса, 1С, Битрикса, DaData
Транскрибация совещаний on-premWhisperX + docker-compose с UI

Тарифы и развёртывание on-premise

Для внедрения в своём контуре команда NeuralDeep предлагает четыре направления. Срок развёртывания — от 1–2 недель на базовые сценарии, дольше — для сложных кастомных агентов и интеграции с документооборотом заказчика.

  • LLM gateway на ваших GPU — self-hosted OpenAI-совместимый API, multi-tenant, с биллингом и observability. Срок 1–2 недели.
  • Корпоративный RAG / поиск — embeddings + reranker + Qdrant или pg-vector, с подключением к Confluence, Bitrix и файловым шарам. Без утечек в облако.
  • Кастомный AI-агент — под ваш стек: CRM, базу знаний, документооборот. На проверенных open-source кирпичах (Claude Code, Cursor, MCP).
  • Audio / транскрипция on-prem — Whisper на ваших GPU, real-time через WebSocket и batch для архивов.

Пример

Подключение через Python SDK. Поскольку API совместим с форматом OpenAI, миграция сводится к замене base URL и ключа.

from openai import OpenAI

client = OpenAI(
    base_url="https://api.neuraldeep.ru/v1",
    api_key="<ваш ключ из hub.neuraldeep.ru>",
)

response = client.chat.completions.create(
    model="gpt-oss-120b",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(response.choices[0].message.content)

Доступные эндпоинты стандартные для OpenAI: /v1/chat/completions, /v1/embeddings, /v1/audio. Ключ выпускается в личном кабинете Hub. Имена моделей при миграции меняются на локальные: gpt-oss-120b вместо gpt-4o, BGE/E5 для embeddings.

Важно: перед установкой скилла из skillsBD читайте SKILL.md. Скилл — это инструкции для агента, и в нём может быть prompt injection. Каталог проходит модерацию, но базовую проверку делайте сами.

Open source: проекты NeuralDeep на GitHub

Команда выкладывает в open source инструменты, которыми пользуется сама. Аккаунт github.com/vakovalskii, 1 100+ звёзд суммарно по всем проектам.

ПроектЧто делаетЗвёзды
KVDeskЛокальный AI-ассистент с виджетами и поддержкой MCP326
searcharvesterSelf-hosted поиск и markdown-harvester для агентов (SearXNG + FastAPI), Tavily-совместимый213
codbashБраузерный дашборд для сессий Claude Code и Codex: просмотр, поиск, теги, resume201
topshaЛокальный AI-агент для простых задач на ПК (gpt-oss, Qwen, GLM)147
whisperx-fronted-docker-composeWhisperX с UI и docker-compose: таймстампы, диаризация, RU/EN из коробки66
LocalTaskClawПерсональный AI-агент, деплой в 3 шага на любой Linux-сервер34

Каталог скиллов skillsBD

skillsBD — open-source каталог скиллов и MCP-серверов, заточенный под российские сервисы. Скилл — это папка с файлом SKILL.md, который учит агента, как выполнить задачу. Каталог закрывает нишу, которой нет в западных агрегаторах: скиллы для Яндекса, 1С, Битрикса и DaData там просто не найти.

ХарактеристикаОписание
Количество46+ инструментов (скиллы + MCP-серверы)
CLI-установщикnpx skillsbd add <owner/repo> — установка одной командой
МодерацияДобавление через форму с ревью, авторизация через GitHub OAuth
СовместимостьClaude Code, Cursor, Codex, Windsurf, а также GigaCode, Koda, SourceCraft
ФокусРоссийские сервисы: Яндекс, 1С, Битрикс, GigaChat, Wildberries, DaData
ХарактеристикаОписание
Количество46+ инструментов (скиллы + MCP-серверы)
CLI-установщикnpx skillsbd add <owner/repo> — установка одной командой
МодерацияДобавление через форму с ревью, авторизация через GitHub OAuth
СовместимостьClaude Code, Cursor, Codex, Windsurf, а также GigaCode, Koda, SourceCraft
ФокусРоссийские сервисы: Яндекс, 1С, Битрикс, GigaChat, Wildberries, DaData

Установка скилла через CLI — глобальная установка не нужна. После установки скилл появляется в .claude/skills/ и сразу доступен агенту.

# Установить скилл
npx skillsbd add theYahia/dadata-mcp/dadata-skills

# Найти скиллы в каталоге
npx skillsbd search "яндекс"

# Посмотреть установленные
npx skillsbd list

Как установить скилл

CLI работает через npx — глобальная установка не нужна. После установки скилл появляется в .claude/skills/ и сразу доступен агенту.

# Установить скилл
npx skillsbd add theYahia/dadata-mcp/dadata-skills

# Найти скиллы в каталоге
npx skillsbd search "яндекс"

# Посмотреть установленные
npx skillsbd list

Прежде чем ставить скилл — прочитайте SKILL.md. Скилл — это инструкции для агента, и в нём может быть prompt injection. Плюс skillsBD в том, что всё проходит модерацию, но базовую проверку делайте сами.

Ограничения

ОграничениеПояснение
Линейка моделей ограничена открытымиЕсли нужен GPT-5 или Claude Opus 4.7, придётся комбинировать NeuralDeep с зарубежным провайдером.
On-prem развёртывание требует собственных GPU.Минимальный вход — 4–8 GPU A100/H100, считайте заранее, есть ли они в контуре.
Бесплатный тариф Hub имеет лимиты.Для production-нагрузок считайте расход — 10 моделей в gateway дают выбор, но и стоимость растёт с объёмом.
Open-source проекты NeuralDeep развиваются командой одного человекаЕсли зависите от конкретного репозитория (KVDesk, codbash, topsha), закладывайте план Б.
Coder работает в браузерной Firecracker microVM.Это изоляция, но и накладные расходы — для маленьких задач быстрее запустить локально.

Антипаттерны

АнтипаттернПочему опасно
Не делатьставить скилл из skillsBD без чтения SKILL.md — потому что скилл это инструкции для агента, и prompt injection в нём даёт агенту чужие команды.
Не делатьпереносить проект с OpenAI на NeuralDeep без проверки качества на ваших данных — потому что gpt-oss-120b не равен gpt-4o по качеству на узких задачах.
Не делатьразворачивать on-prem без пилота на Hub — потому что 1–2 недели развёртывания без проверки гипотезы это дорогая ошибка.
Не делатьиспользовать Coder для production-кода без code review — потому что opencode-агент в microVM изолирован, но не гарантирует качество.

Чеклист

ПроверкаЧто сделать
Требование по размещению данных зафиксированоданные в РФ, on-prem, без зарубежного облака.
Пилот на Hub или Search прошёл, качество моделей проверено на реальных задачахсвои GPU посчитаны, бюджет и сроки развёртывания согласованы.
API-ключ хранится в переменной окружения или в хранилище секретов, в коде только ссылка
Для каждого скилла из skillsBD прочитан SKILL.md, проверены команды и возможные риски prompt injection
Fallback-провайдер определён на случай, если конкретный open-source репозиторий NeuralDeep перестанет поддерживаться