Собрать данные из социальной сети выглядит простой задачей, пока не попробуешь. Каждая платформа рисует собственные границы: одну открывает полностью, другую только для бизнес-аккаунтов, третью для исследователей с одобренной заявкой.
На практике выясняется вот что. Facebook даёт доступ к постам страниц, но не к данным пользователей. Instagram ограничивает сбор 200 запросами в час и требует привязки к Facebook Page. TikTok открывает API только академическим исследователям из США и Европы. VK, наоборот, один из самых открытых: с документацией на русском и бесплатным доступом для большинства задач.
Этот справочник проходит по семи платформам, от Facebook до Reddit, и показывает, что можно получить официально, какие ограничения действуют и где скрапинг ещё имеет смысл. В конце сводная таблица и рекомендации, с чего начать под конкретную задачу.
Что это
Сводный справочник по официальным API и альтернативным методам сбора данных из социальных сетей. Охватывает семь платформ: Facebook, Instagram, Threads, ВКонтакте, TikTok, YouTube, Reddit. Для каждой официальный API, что он даёт, какие лимиты действуют и что доступно за пределами официального пути.
Зачем нужно
Данные из соцсетей нужны везде, где работает автоматизация: AI-агенты, аналитические системы, инструменты мониторинга, маркетинговые платформы. Без понимания ограничений каждой платформы можно потратить недели на интеграцию, которая упрётся в rate limit или Terms of Service.
Справочник помогает выбрать платформу под задачу, оценить стоимость входа и понять, где официальный API покрывает потребность, а где придётся искать обходные пути.
Как устроено
Официальный API: Meta Graph API. Основной канал для работы с Facebook.
Что можно получить:
- Публичные посты страниц
- Аналитику собственных страниц
- Рекламные данные через Marketing API
- Insights по постам и аудитории
Ограничения:
- Нужен бизнес-аккаунт или профиль разработчика
- Доступ только к данным, на которые есть разрешение
- Нельзя собирать данные обычных пользователей без их согласия
- Строгие rate limits
Базовый доступ бесплатен, коммерческое использование требует платных планов.
Meta требует App Review для расширенного доступа к таким разрешениям, как user\_posts и user\_link. С февраля 2023 года обязательна Business Verification для приложений, запрашивающих расширенный доступ.
Альтернативы: сторонние сервисы Data365.co и Bright Data предоставляют доступ к публичным данным через собственные решения. Использование неофициальных методов может нарушать Terms of Service Facebook.
Официальный API: Instagram Graph API. Работает через Meta.
Что можно получить:
- Данные бизнес-аккаунтов и авторов
- Insights: impressions, reach, profile views
- Медиа-контент (посты, Stories, Reels)
- Комментарии и упоминания
Ограничения:
- 200 запросов в час на пользователя
- Работает только для бизнес-аккаунтов и авторов
- Требует связки с Facebook Page
- История follower_count, максимум 30 дней
Чего не работает: сбор данных чужих личных аккаунтов, конкурентная аналитика без согласия, публичный поиск по хэштегам (сильно урезан).
После закрытия Basic Display API в 2026 году остались только скрапинг через сторонние сервисы (Apify, Bright Data) или кеширование данных через собственные решения.
Threads
Официальный API: Threads API. Запущен в июне 2024 года, всё ещё активно развивается.
Что можно:
- Публиковать контент программно
- Управлять профилем
- Получать метрики (followers_count, follower_demographics)
- Работать с медиа
API молодой, публичного доступа к чужим данным пока нет. Скрапинг технически возможен, но сложен.
ВКонтакте
Официальный API: VK API. Один из самых открытых среди крупных соцсетей, особенно если нужны русскоязычные данные.
Что можно получить:
- Публичные посты стен сообществ
- Данные пользователей (в пределах настроек приватности)
- Статистику сообществ
- Комментарии, лайки, репосты
- Истории и клипы
Преимущества: относительно простой доступ, хорошая документация на русском, бесплатно для большинства задач, официальная Python-библиотека vk\_api.
Готовые инструменты для скрапинга:
- Apify VK Scraper
- Bright Data VK Scraper
- bellingcat/vk-url-scraper (open-source)
TikTok
Официальный API: TikTok Research API. Доступ только для исследователей в США и Европе.
Требования: аффилиация с академической организацией, одобрение заявки, исследовательские цели. Что можно получить: данные об аккаунтах, публичный контент, комментарии, видео-метрики.
Для всех остальных только неофициальные библиотеки вроде TikTok-Api (только публичные данные) или сторонние сервисы. TikTok активно блокирует скрапинг, это технически сложная платформа.
YouTube
Официальный API: YouTube Data API v3. Один из лучших публичных API для работы с контентом.
Что можно получить:
- Данные о видео (метаданные, статистика)
- Информацию о каналах
- Комментарии
- Плейлисты
- Поиск по контенту
- Субтитры
YouTube Analytics API даёт детальную аналитику для владельцев каналов.
Квоты: 10 000 units в день бесплатно. Разные операции стоят разное количество units.
Документация отличная, есть официальные клиентские библиотеки для всех популярных языков.
Официальный API: Reddit API + PRAW (Python Reddit API Wrapper), официально поддерживаемая библиотека.
Что можно получить:
- Посты из сабреддитов
- Комментарии
- Метаданные пользователей
- Голоса (upvotes/downvotes)
Ограничения:
- Нельзя получить полную историю сабреддита, Reddit не поддерживает возврат всей истории
- 60 запросов в минуту для авторизованных пользователей
- С 2023 года коммерческое использование API стало платным
Для скрапинга: old.reddit.com проще парсить, также работают Bright Data Reddit Scraper и Apify.
Сводная таблица
| Платформа | Официальный API | Доступность | Сложность | Скрапинг |
|---|---|---|---|---|
| Graph API | Средняя | Средняя | Сложно | |
| Graph API | Низкая | Средняя | Очень сложно | |
| Threads | Threads API | Средняя | Средняя | Сложно |
| ВКонтакте | VK API | Высокая | Низкая | Легко |
| TikTok | Research API | Очень низкая | Высокая | Очень сложно |
| YouTube | Data API v3 | Высокая | Низкая | Средне |
| Reddit API + PRAW | Средняя | Низкая | Средне |
Когда использовать
С чего начать
- YouTube Data API, самый простой старт, отличная документация
- Reddit + PRAW, хорошая документация, открытые данные
- VK API, если нужны русскоязычные данные
Для бизнеса
- Используйте официальные API в связке с платными сервисами (Apify, Bright Data)
- Консультируйтесь с юристами по вопросам ToS
- Не экономьте на compliance
Общие правила
- Всегда читайте Terms of Service платформы
- Уважайте приватность пользователей
- Следуйте rate limits
- Коммерческое использование данных часто требует отдельной лицензии
Пример
Базовая связка для русскоязычного сценария: VK API + PRAW (Reddit) + YouTube Data API v3. Три платформы покрывают около 80% типовых задач по сбору публичного контента: посты, комментарии, видео, метрики. Для всего, что выходит за эти рамки (Facebook, Instagram, TikTok), подключаются сторонние сервисы со своими лимитами и юридическими нюансами.
Meta и её продукты (Facebook, Instagram, Threads) запрещены на территории РФ.
Ограничения
Ограничения
Юридические риски скрапинга:
неофициальные методы для Facebook, Instagram и TikTok нарушают ToS и могут привести к бану аккаунтов и судебным искам.
Неполные исторические данные:
Instagram отдаёт follower_count только за 30 дней, Reddit не возвращает полную историю сабреддита.
Гео-ограничения:
TikTok Research API работает только для исследователей из США и Европы, коммерческий доступ к платформе закрыт.
Rate limits и квоты:
YouTube даёт 10 000 units в день, Instagram 200 запросов в час, Reddit 60 RPM; для больших объёмов нужно платить или использовать несколько аккаунтов.
Привязка к бизнес-аккаунту:
Instagram Graph API и Threads API требуют Facebook Page, что делает невозможным работу от личного аккаунта.
Платный коммерческий доступ:
с 2023 года Reddit API стал платным для коммерческого использования, что меняет экономику проектов.
Антипаттерны
Антипаттерны
Полагаться только на скрапинг Facebook и Instagram:
аккаунты банятся за 2–3 дня активного сбора, нужно закладывать ротацию прокси и антидетект, и всё равно это нарушение ToS.
Игнорировать Meta App Review:
для user\_posts и user\_link нужен App Review и Business Verification, без них приложение работает только с собственными данными.
Парсить TikTok в больших объёмах:
платформа активно блокирует скрапинг, обход защиты требует серьёзных вложений и быстро устаревает.
Забывать про rate limits на этапе проектирования:
200 запросов в час Instagram означают, что сбор 10 000 постов займёт 50 часов; архитектура должна учитывать это с первого дня.
Использовать данные без проверки Terms of Service:
особенно в коммерческих продуктах: GDPR, ФЗ-152, условия платформы могут запрещать даже хранение собранных данных.
Чеклист
Чеклист
Платформа выбрана под задачу:
YouTube, Reddit или VK для открытых данных, Facebook и Instagram только для бизнес-аккаунтов.
Официальный API проверен первым:
скрапинг рассматривается только когда API не покрывает потребность или недоступен.
Rate limits заложены в архитектуру:
пагинация, очереди, retry с exponential backoff.
ToS платформы прочитан:
особенно для коммерческого использования.
Юридическая оценка проведена:
для GDPR и ФЗ-152, если собираются данные пользователей из EU и РФ.
План ротации аккаунтов готов:
если скрапинг неизбежен (TikTok, Facebook), заложен бюджет на антидетект и ротацию.
Fallback на сторонние сервисы определён:
Apify, Bright Data, Data365 как запасной вариант.
Ссылки
Ссылки
- Документация: Meta Graph API
- Документация: Instagram Graph API
- Документация: Threads API
- Документация: VK API
- Документация: TikTok Research API
- Документация: YouTube Data API v3
- Документация: YouTube Analytics API
- Документация: Reddit API
- Репозиторий: PRAW, Python Reddit API Wrapper
- Репозиторий: bellingcat/vk-url-scraper
- Репозиторий: TikTok-Api
- Сайт: Data365.co
- Сайт: Bright Data