Школа
системного анализа
и проектирования

Обзор AI-систем на базе больших языковых моделей (LLM) и чат-ботов на их основе

Автор: Алина Богачёва

О чём статья

Этот документ представляет собой структурированный обзор и сравнение современных AI-систем, работающих на базе больших языковых моделей (LLM), таких как ChatGPT, GigaChat, YandexGPT, DeepSeek и другие. В документе рассмотрены российские и зарубежные решения, с разбивкой по категориям:
■ универсальные чат-боты общего назначения,
■ специализированные модели (для кода, медицины, юриспруденции и др.),
■ инструменты для разработчиков (API, SDK),
■ корпоративные/on-premise решения,
■ модели с открытым исходным кодом.

Отдельное внимание уделено качеству поддержки русского языка, наличию или отсутствию геоблокировок, возможности оплаты из России и особенностям подключения к каждому сервису.

Обзор показывает состояние рынка на апрель 2025 года, выявляет сильные и слабые стороны решений, предлагает практические рекомендации по выбору и использованию ИИ-инструментов в России. В центре внимания – независимость от западных сервисов, возможности локализации, юридическая доступность и технологический суверенитет в сфере генеративного ИИ.

Российские решения

Российский рынок AI-ассистентов активно развивается: появляются как отечественные универсальные чат-боты, способные поддерживать беседу и генерировать тексты на русском языке, так и первые специализированные системы для отдельных задач. Предлагаются инструменты для разработчиков (API/SDK) и возможности внедрения моделей в инфраструктуру компаний (корпоративные/on-premise решения). Благодаря открытому коду, доступны модели для локального развёртывания. Ниже приведён подробный обзор по каждой категории российских решений.

Универсальные чат-боты общего назначения

GigaChat (Сбер) – первый отечественный аналог ChatGPT от Сбербанка, запущенный весной 2023 года в тестовом режиме (Russia's Sberbank releases ChatGPT rival GigaChat | Reuters). GigaChat – это мультимодальная модель: помимо текстов она умеет генерировать изображения (интегрирована модель Kandinsky 2.1). Бот способен сочинять тексты разных жанров, пересказывать и объяснять информацию, писать программный код и даже работать с файлами (например, анализировать содержимое .txt или PDF). Доступ осуществляется через портал разработчиков Сбера – требуется Сбер ID с привязанным российским номером телефона, использование пока бесплатное. Мощности GigaChat размещены в российских дата-центрах Сбера, поэтому задержки минимальны и данные остаются в стране. К плюсам GigaChat относят глубокое понимание русского контекста и культуры, умение отвечать на сложные вопросы на родном языке, поддержку голосового ввода/вывода и изображения. Из минусов – иногда встречаются неточности в ответах или отказ обсуждать некоторые чувствительные темы, а также ограниченный английский и другие языки.

YandexGPT (Алиса) – семейство больших языковых моделей от Яндекса, интегрированных в голосового помощника «Алиса». В 2023–2024 гг. «Яндекс» существенно обновил Алису, внедрив режимы чат-общения на базе генеративной модели YandexGPT. Общаться с ней можно как текстом, так и голосом; чат доступен в мобильном приложении Яндекс, колонках «Яндекс Станция», браузере и других устройствах с Алисой. YandexGPT генерирует связные ответы на русском, умеет пересказывать большие тексты простыми словами, придумывать идеи, объяснять сложные понятия и помогать с планированием. По умолчанию всем пользователям доступна базовая модель (например, YandexGPT 4), а в 2024 году запущена улучшенная Алиса Про на модели YandexGPT-3/5 Pro. Она дает более развёрнутые и точные ответы, поддерживает разные стили и сложные инструкции. «Алиса Про» доступна по подписке «Яндекс Плюс», что не требует иностранных карт и удобно для российских пользователей. Согласно Яндексу, новая модель YandexGPT 5 Pro с контекстом 32k токенов в ряде задач не уступает GPT-4 от OpenAI (YandexGPT 5 – новое поколение нейросетей Яндекса). Серверы Яндекс находятся в РФ и ближних регионах, так что сервис доступен стабильно. В начале 2024 года «Яндекс» также представил отдельный сервис «Нейро» – поискового чат-бота, который в режиме реального времени собирает информацию из интернета для ответа на запросы. «Нейро» встроен в Поиск Яндекса и умеет сам формировать уточняющие запросы, искать по картинкам, вести диалог, а в ответах указывает источники. Таким образом, YandexGPT и «Нейро» дополняют друг друга: первый ориентирован на творческое общение и решение пользовательских задач, второй – на актуальные справочные ответы с поиском. Преимущества решений Яндекса – глубокая интеграция в популярные сервисы, качественная русская речь и текст, отсутствие цензуры на локальные темы. Возможный недостаток – закрытость кода и чуть менее продвинутая английская речь по сравнению с глобальными аналогами. В целом, Яндекс предлагает массовому пользователю привычный и понятный способ воспользоваться возможностями ИИ на родном языке.

Вывод: GigaChat и YandexGPT являются флагманскими AI-чатами в России. Оба отлично понимают и генерируют русский текст, поддерживают ведение беседы и решение разнообразных задач. GigaChat больше ориентирован на экспериментаторов и разработчиков, тогда как Алиса с YandexGPT – на широкую аудиторию. GigaChat обладает уникальной функцией генерации изображений через Kandinsky 2.1, которой у Алисы нет. YandexGPT, в свою очередь, тесно связан с поиском и экосистемой Яндекс, что даёт ему преимущество в актуальных фактах и мультимодальных возможностях. Обе системы бесплатны для базового использования; за расширенные возможности Алисы взимается небольшая плата в рублях. Ни GigaChat, ни Яндекс не подвергаются гео-блокировке в РФ – они специально созданы для работы внутри страны. Их сервисы полностью хостятся на российских серверах, поэтому взаимодействие быстрое и конфиденциальное. По качеству ответов на русском эти боты уже близки к западным аналогам: так, YandexGPT 5 Pro на внутренних тестах в 67% случаев превосходит предшественника и не уступает GPT-4 OpenAI, а GigaChat изначально проектировался для русского языка и показал себя лучше ChatGPT на русском. В перспективе, конкуренция между Сбером и Яндексом будет стимулировать дальнейший рост качества универсальных чат-ботов в России.

Специализированные чат-боты

Отдельные узкопрофильные AI-ассистенты в России пока находятся на ранней стадии развития, но некоторые примеры уже появляются в сферах программирования, юриспруденции и др. Как правило, это либо доработанные версии универсальных моделей под конкретные задачи, либо эксперименты отдельных компаний.

Генерация кода. Специальных публичных ботов для программистов, аналогичных GitHub Copilot, среди российских продуктов пока нет, однако и GigaChat, и ЯндексGPT умеют помогать с кодом. Например, GigaChat может написать фрагмент программы или подсказать, в чём ошибка в коде. YandexGPT также обучен на данных с кодом и способен генерировать или переводить код. В ноябре 2024 года компания MTS AI выпустила небольшую открытую модель Cotype Nano с обучением на коде и математике («Дочка» МТС выпустила большую языковую модель с открытым исходным кодом – AI) – её можно запускать локально на ПК. Тем не менее, профессиональным разработчикам часто требуется более мощный ассистент для IDE. Многие продолжают пользоваться GitHub Copilot или аналогами через VPN, либо внедряют открытые модели в свои инструменты (например, ответвлённые проекты Codex, Code Llama и пр.). В целом, российские LLM по коду пока уступают по зрелости: они дают полезные подсказки, но могут ошибаться и не интегрированы непосредственно в редакторы. Ожидается, что по мере развития отечественных моделей потребность в иностранных код-ботах будет постепенно снижаться.

Юридические ассистенты. В сфере права и документооборота начали появляться специализированные решения на базе ИИ. Пример – чат-бот «Нейроюрист Вова», созданный консалтинговой группой «Туров и партнёры». Этот AI-юрист позиционируется как помощник в судебных делах, налоговом планировании и защите бизнеса (Юридический AI - Нейроюрист Вова: Онлайн-консультация и налоговая оптимизация от "Туров и партнёры" LawAI). Он умеет анализировать сложные юридические документы (контракты, иски, решения судов) и пояснять их содержание, предлагать варианты законной оптимизации налогов, помогать разрабатывать проекты договоров и исковых заявлений. Доступ к «Вове» организован через бота в Telegram – то есть сервис работает круглосуточно онлайн. Поскольку модель обучена на российских законах и практиках, она выдает консультации, релевантные именно для юриспруденции РФ. Плюсы: автоматизация рутинной работы юристов – бот быстро находит в тексте ошибок или упущения, переводит «юридический язык» на понятный, предлагает черновики документов. Минусы: как и любой ИИ, не гарантирует 100% точности – сложные правовые вопросы требует проверки человеком, ответственность за совет несёт пользователь. Кроме того, продукт от частной фирмы не прошёл широкой публичной апробации. Тем не менее, появление «цифровых юристов» демонстрирует интерес рынка: крупные консультанты и юрфирмы стремятся создать собственных GPT-ботов для ускорения работы. Пока что такие проекты носит экспериментальный характер и доступны ограниченному числу клиентов.

Медицинские ассистенты. В российской медицине специализированные чат-боты (например, для постановки диагнозов или расшифровки анализов) находятся преимущественно в стадии исследований. Крупные игроки, такие как СберМедИИ, занимаются использованием ИИ в диагностике для анализа снимков, прогнозирования заболеваний, но чат-интерфейсы для консультаций пациентов не анонсированы. Отчасти это связано с требованиями точности и безопасностью: даже продвинутые модели склонны «галлюцинировать» факты, что недопустимо в медицине (Glass Health is building an AI for suggesting medical diagnoses | TechCrunch). Поэтому отечественные клиники пока осторожно относятся к советам AI. Тем не менее, врачи уже экспериментируют с общими AI для вспомогательных задач: например, формулируют запросы к ChatGPT для подбора дифференциальных диагнозов или перевода латинских терминов. В будущем можно ожидать появления локальных моделей, обученных на русскоязычных медицинских данных и согласованных с Минздравом. Уже сейчас у Яндекс есть наработки: в сервис «Яндекс Здоровье» интегрированы алгоритмы для расшифровки симптомов и поиска редких заболеваний, а в 2023 году анонсирован перевод медицинских видео с китайского на русский с помощью нейросети. Возможно, эти технологии будут объединены в медицинского ассистента, но сейчас специализированный «медицинский ChatGPT» для РФ – вопрос будущего; пациентам и врачам следует критически относиться к советам ИИ и подтверждать их у профессионалов.

Аналитические и отраслевые модели. В финансовом и промышленном секторах России также идут эксперименты по применению больших моделей для аналитики. Например, крупнейшие банки создают внутренние чат-боты для сотрудников, помогающие готовить отчёты, анализировать новости и т.п.. Такие решения редко становятся публичными. Известно, что «Сбер» использует ИИ в трейдинге и экономическом прогнозировании, «Альфа-банк» тестировал GPT для ответа на клиентские запросы. В госсекторе НИЦ «Иннопрактика» и Сбертех разрабатывали модели для анализа больших массивов документов. Отдельно стоит отметить мультифункциональную платформу DeepPavlov.ai от МФТИ – она хоть и не привязана к одной отрасли, но позволяет строить чат-ботов с разными «навыками» (skills) и подключать экспертные модули (например, базу фактов) ([PDF] DeepPavlov Dream: Platform for Building Generative AI Assistants). На её базе можно создать ассистента для конкретной предметной области, включая русскоязычный сегмент. Компании-интеграторы уже используют эту и похожие технологии для внедрения «умных» чат-ботов, например, в HR, в поддержке клиентов интернет-магазинов и пр.

Ассистенты для системного и бизнес-аналитика. Пример специализрованных ассистентов для профессионалов в области системного и бизнес-анализа – Марика. Этот чат-бот использует технологию ChatGPT 4o и обеспечивает пользователей общением на профессиональные темы. С помощью @marika_tgbot вы можете получить ответы на вопросы, касающиеся системного и бизнес-анализа, включая оптимизацию и моделирование бизнес-процессов, сбор и анализ требований, проектирование информационных систем и выбор архитектуры. Бот также предоставляет информацию о методологиях управления проектами и оценке проектных рисков. Кроме того, вы можете спрашивать о методах анализа данных для принятия бизнес-решений и визуализации данных, а также о метриках для измерения эффективности внедренных решений. Он поможет с рекомендациями по выбору инструментов и технологий для решения задач в области системного и бизнес-анализа. Бесплатное общение с ботом доступно в группе «Системный анализ и Проектирование ИТ-систем» в теме «Спроси ИИ».

Таким образом, специализированные AI-боты в России только появляются. Большинство из них не доступны широкой публике, а работают или внутри организаций, или как прототипы. Уровень поддержки русского языка у таких ботов, как правило, высокий, но их компетентность ограничена узкой сферой. В отличие от универсальных моделей, узкоспециализированные боты могут давать более точные ответы в своей области (например, тот же «Вова AI» глубже понимает налоги РФ, чем общий ChatGPT), но вне своей «ниши» их польза невелика.

Вывод: Внутри категории специализированных решений конкуренция пока невелика – скорее, это набор отдельных инициатив. Российские универсальные модели пока берут на себя и роль кодовых помощников, и советчиков по общим вопросам. Узкопрофильные боты (юристы, медики и т.д.) находятся на этапе проверки концепции. Их плюсы очевидны – глубокая экспертиза в нужной области и локализация под российские реалии. Но минусов тоже хватает: высокая цена разработки, необходимость тщательно обучать на профильных данных, ответственность за ошибки. Стоит отметить, что доступ к таким решениям для обычного пользователя ограничен: либо это внутренние корпоративные системы, либо коммерческие продукты. С точки зрения доступности: все примеры, будучи отечественными, не имеют геоблокировки – подключиться из России можно свободно. Иностранная карта не нужна, оплата производится в рублях или вообще отсутствует. Серверы и данные тоже, как правило, находятся в РФ. В итоге специализированные AI в России – это перспективное направление, ожидаемое к росту, но в 2025 году широкого распространения они ещё не получили.

API и SDK-доступ

Для разработчиков, желающих встроить возможности больших языковых моделей в свои приложения или боты, в России появляются локальные API и SDK. После прекращения прямого доступа к OpenAI, такие сервисы особо актуальны.

API GigaChat (Сбер) – на платформе СберКорпорация (Sber Developer) помимо веб-интерфейса GigaChat предоставляет инструменты для интеграции. Зарегистрированные разработчики могут отправлять запросы к модели через REST API. Официально Сбер пока не анонсировал публичный коммерческий API GigaChat, но возможность подключать бота к своим проектам предусмотрена для партнеров и участников бета-тестирования. В будущем ожидается полноценный SDK от Sber AI: Сбербанк активно инвестирует в экосистему вокруг своих моделей. Уже сейчас доступны открытые модели Сбера и сопутствующие библиотеки – их можно использовать бесплатно внутри своих программ. Сбер также развивает облачную платформу SberCloud ML Space, где разработчикам доступны предобученные модели в виде API с почасовой оплатой. Все эти инструменты работают внутри России, не требуют VPN и доступны по российским аккаунтам. Ограничений по оплате нет: SberCloud принимает рубли, счета выставляются юридическим лицам в РФ. Таким образом, Сбер предлагает альтернативу OpenAI API на отечественной инфраструктуре.

API YandexGPT (Яндекс) – «Яндекс» открыл доступ к своим моделям для сторонних разработчиков через сервис Yandex Cloud AI. Самая мощная модель YandexGPT 5 Pro, которая используется в Алисе, доступна компаниям через Yandex Cloud AI Studio (YandexGPT 5 – новое поколение нейросетей Яндекса). Там же предоставляется API в Yandex Cloud для подключения модели к собственным приложениям. Документация и поддержка – на русском языке. Порог входа невысок: достаточно зарегистрировать аккаунт в Yandex.Cloud. Тарифы за использование моделируются в рублях, есть бесплатные лимиты. Дополнительно Яндекс выложил облегчённую модель YandexGPT 5 Lite в открытый доступ, которую разработчики могут запускать локально или в любом облаке. Таким образом, Яндекс предоставляет полный спектр: от готового API в своём облаке до открытых весов модели для самостоятельной сборки сервиса. Разумеется, геоблокировок нет – напротив, сервис ориентирован на российский рынок и доступен только в ряде стран СНГ. Воспользоваться API Яндекса из-за рубежа можно, но нужен аккаунт Яндекс и привязка к платежному профилю в РФ. Для российских же разработчиков это удобный и законный способ внедрять GPT-подобные функции без рисков санкций.

Другие возможности. Помимо Сбера и Яндекса, свои API для генеративных моделей начинают предлагать и другие компании. Например, MTS AI после выпуска Cotype Nano разместила веса модели на HuggingFace, а также, вероятно, предоставит SDK для её использования на устройствах. Группа «Т-Технологии», разработавшая открытые модели T-Pro и T-Lite, сотрудничает с интеграторами для внедрения этих моделей в бизнес-системы – возможно, появятся коммерческие API на их основе. Стартапы и энтузиасты также создают оболочки: в сети доступны Telegram-боты, дающие доступ к разным моделям без регистрации. К примеру, бот ChatGPT Russia (@ChatGPT_RU_Bot) работал на основе API OpenAI через прокси, позволяя задавать вопросы на русском без иностранного номера (Chat AI: Бесплатный доступ к ChatGPT). Однако неофициальные решения ненадежны: OpenAI закрывает сторонние боты, а их использование может нарушать политику. Поэтому бизнесу рекомендуются легальные российские API, а любителям – открытые модели, которые можно вызвать локально. В качестве SDK разработчики в РФ часто используют библиотеки DeepPavlov и Transformers (Hugging Face) – обе доступны, постоянно обновляются и не имеют ограничений по странам. С их помощью можно как напрямую вызывать локальные модели, так и проксировать запросы к зарубежным.

Вывод: В России формируется собственная экосистема API для больших моделей, что критически важно в условиях недоступности сервисов OpenAI/Google. Сбер и Яндекс – ведущие провайдеры: они обеспечивают готовые промышленные решения. Это выгодно отличает их от кустарных методов обхода ограничений, которые ненадёжны и могут быть закрыты в любой момент. К тому же использование официальных отечественных API снимает юридические риски – данные обрабатываются в рамках российского законодательства. По функциональности российские API пока уступают OpenAI: меньше поддерживаемых языков и моделей, возможно, ниже качество генерации в отдельных сценариях. Но этот разрыв сокращается. Для разработчиков доступность SDK на родном языке и техподдержка «рядом» тоже являются плюсами. Таким образом, уже сейчас можно строить русскоязычные AI-сервисы, не выходя за пределы локальной инфраструктуры – от чат-ботов в мессенджерах до интеллектуальных модулей в бизнесе.

Корпоративные и on-premise решения

Многие российские компании, особенно крупные корпорации и госорганы, проявляют повышенный интерес к внедрению AI-моделей внутри своей инфраструктуры (on-premises) или в изолированном режиме. Это продиктовано как соображениями безопасности данных, так и санкционными ограничениями на использование зарубежных облаков. В ответ на спрос появляются корпоративные предложения.

Отечественные облачные платформы. Сбер и Яндекс предлагают размещение генеративных моделей в своих облаках, что подходит для корпоративных клиентов. SberCloud позволяет развернуть приватную копию GigaChat или других моделей на выделенных мощностях внутри дата-центров Сбера – фактически это on-premise в модели SaaS. Yandex Cloud AI Studio аналогично даёт компаниям возможность использовать YandexGPT Pro с гарантией конфиденциальности – модель может обрабатывать корпоративный контент, оставаясь в пределах облака Яндекса в РФ. Такие решения особенно интересны банкам, телекомам, ритейлу – тем, кому нужен ChatGPT-подобный функционал, но недоступен OpenAI. Оплата идёт по контракту в рублях, сервис поддерживается на уровне SLA, и VPN не требуется, т.к. всё находится в российском сегменте.

Локальное развёртывание моделей. Для максимального контроля ряд организаций предпочитает развернуть LLM напрямую на своих серверах. Ранее это было сложно из-за отсутствия открытых мощных моделей. Но в конце 2024 – начале 2025 появились модели, свободно доступные для скачивания, сопоставимые по размеру с лучшими проприетарными. Так, группа «Т-Технологии» открыла модели T-Pro и T-Lite с лицензией Apache 2.0 (Группа "Т-Технологии" представила лучшие в мире открытые большие языковые модели на русском языке | ComNews). Они показали выдающиеся результаты на русскоязычных бенчмарках, превзойдя все существующие открытые аналоги. T-Pro даже приближается к закрытым лидерам – занимает второе место по ряду тестов, уступая лишь GPT-4 от OpenA. Эти модели доступны для скачивания и могут бесплатно использоваться любыми российскими компаниями. Другой пример – YandexGPT 5 Lite, которую Яндекс выложил в опенсорс. Это облегчённая версия на 32k контекст, доступная в претрейн-версии для дальнейшего дообучения и в «инстракт»-версии уже настроенной для диалогов. Яндекс прямо указывает, что модель можно запустить самостоятельно – в облаке или на локальном компьютере, причём даже без GPU. То есть любой разработчик может поднять у себя мини-аналог Алисы. Преимущества on-premise-развёртывания: полное сохранение конфиденциальности, гибкость в настройке, отсутствие внешних зависимостей. Недостатки: высокие требования к инфраструктуре – для моделей масштаба десятков миллиардов параметров нужны мощные серверы с GPU и большим объёмом памяти. Кроме того, компании берут на себя поддержку системы без помощи внешнего вендора.

Корпоративные приложения на основе ИИ. Некоторые российские интеграторы начали включать большие языковые модели в готовые решения. К примеру, в классических CRM/ERP-системах появляются модули с ИИ: автоответчики на письма клиентов, генерация шаблонов документов, умное заполнение форм. Компания Directum экспериментировала с использованием GPT при работе с корпоративным контентом(ChatGPT в России: умная обработка корпоративного контента). Отечественные разработчики ПО для колл-центров (NAUMEN, CustoBA) тестируют AI-модели для улучшения чат-ботов поддержки – чтобы они понимали свободный ввод от клиентов на русском. На предприятиях оборонно-промышленного комплекса обсуждается создание закрытых AI-ассистентов для ускорения научных исследований и перевода технической документации. Все эти сценарии требуют on-premise решений ввиду режима секретности и изоляции от интернета. Учитывая открытие моделей вроде T-Pro, можно ожидать, что многие корпорации будут брать их за основу и разворачивать в внутренних сетях.

Вывод: Российским компаниям фактически доступно два пути внедрения больших языковых моделей: а) воспользоваться услугами отечественного облака, б) самостоятельно внедрить открытый LLM на своих серверах. Первый вариант быстрее и проще – не нужно самому администрировать GPU-кластеры, достаточно доверить данные облачному провайдеру. Второй вариант обеспечивает максимальную независимость – ни интернет, ни внешние организации не участвуют, модель становится «собственностью» компании. Выбор зависит от ресурсов и требований к безопасности. Но важно, что геоблокировки здесь не играют роли – все решения находятся в правовом поле РФ и доступны без обходных путей. Иностранная карта не нужна – оплата либо в рублях, либо решение вообще бесплатно. Серверы – в России или непосредственно на площадке заказчика. С точки зрения доступности через VPN – не требуется, так как доступ прямой внутри страны. В итоге корпоративный сектор в России уже сейчас может пользоваться преимуществами GPT-технологий, не полагаясь на внешние сервисы. Это повышает технологический суверенитет: даже при полном отключении западных API бизнес не останется без современных AI-инструментов.

Модели с открытым исходным кодом и локальным развёртыванием

Открытие кода мощных AI-моделей стало важнейшим событием, позволившим России нивелировать разрыв с мировыми лидерами. Теперь разработчики и энтузиасты могут скачивать и запускать LLM локально, а также модифицировать их под свои нужды. Рассмотрим самые заметные open-source модели, пригодные для русскоязычных задач:

T-Lite 7B / T-Pro 32B. Эти две модели, разработанные группой «Т-Технологии», были выложены в открытый доступ в декабре 2024 года (Группа "Т-Технологии" представила лучшие в мире открытые большие языковые модели на русском языке | ComNews). Они обучены на русскоязычных и мультиязычных данных и показали выдающиеся результаты: согласно тестам (MERA, ruMMLU, AlpacaEval и др.), T-Lite и T-Pro превосходят все российские и зарубежные модели по уровню знаний и ведению диалога на русском. Среди открытых моделей аналогичного размера T-Pro заняла 1-е место по ряду задач на русском. Сравнимо она выступает и против закрытых моделей – уступая лишь GPT-4 OpenAI на некоторых бенчмарках. Обе модели доступны на HuggingFace под лицензией Apache 2.0, то есть их можно свободно использовать и в коммерческих проектах. T-Lite 7B меньше и быстрее – подойдет для экспериментов на обычном ПК. T-Pro 32B требует больше ресурсов, но даёт более высокое качество ответов, особенно на сложных запросах. Эти модели стали базовым инструментом для многих российских разработчиков, так как фактически заменяют недоступные GPT-3/GPT-4. Теперь любая компания может скачать такие веса и разворачивать своего чат-бота без ограничени. Разумеется, поддержка русского у них наилучшая – они специально оптимизированы под наш язык. Английский и другие языки они тоже знают, но немного хуже топовых англоязычных моделей. Тем не менее появление T-Pro значительно подняло планку возможностей open-source в РФ.

YandexGPT 5 Lite. Открытая версия пятого поколения модели Яндекса, представленная весной 2025 года. Яндекс выложил два варианта: «претрейн» – сырую предобученную модель, и «инстракт» – доведённую до стадии инструкционного обучения (YandexGPT 5 – новое поколение нейросетей Яндекса). Инстракт-версию можно сразу пробовать в действии – она доступна в чате Алисы и через API Яндекс.Cloud, а также опубликована на HuggingFace. Главное достоинство YandexGPT 5 Lite – возможность запуска на относительно слабом железе. Яндекс заявил, что её можно развернуть даже без видеокарты, на локальном компьютере. То есть, в отличие от огромных GPT-3 моделей, эта модель ориентирована на широкую доступность. При этом она сохраняет 32 тыс. токенов контекста и обучена понимать сложные инструкции. По качеству YandexGPT 5 Lite несколько уступает Pro-версии, но для большинства непрофессиональных задач её хватает. Сферы применения – офлайн-ассистенты, встроенные в приложения, чат-боты в корпоративных мессенджерах без подключения к интернету и т.п. Лицензия, по которой Яндекс выложил модель, позволяет некоммерческое и, в определённых условиях, коммерческое использование. Уровень русского языка у модели отличный, поскольку она обучалась на данных сервисов Яндекса, включающих гигантский пласт русскоязычного контента. Таким образом, YandexGPT Lite – вклад Яндекса в сообщество, который облегчает разработку локальных AI-решений.

RuGPT, FRED-T5 и др. от Сбера. Ещё c 2021 года Sber AI Labs выкладывал в открытый доступ части своих языковых моделей. Были опубликованы семейства RuGPT-3 разных масштабов и мультигенеративная модель FRED-T5. Именно эти наработки легли в основу GigaChat (10 крутых аналогов ChatGPT - Лайфхакер). Они свободно доступны исследователям – например, на HuggingFace можно найти RuGPT-3XL и другие версии с лицензией Sber. Однако по качеству эти модели уступают современным – на дворе уже пост-GPT-3.5 эпоха. Потому Сбер готовит новые открытые релизы. Ожидается выход модели RuGPT-3.5 175B для русского языка – упоминалось, что GigaChat работает на «RuGPT-3.5», но открыто этого веса пока нет. Также Сбер активно развивает мультимодальные open-models: Kandinsky 2.1 для генерации изображений открыт полностью, RuCLIP для поиска изображений по описанию – тоже. Интеграция визуальных и текстовых открытых моделей позволяет создавать локальные ассистенты, понимающие и текст, и картинки. Например, можно собрать стэк: T-Pro для диалога + Kandinsky для картинок + Vosk для распознавания русской речи – и получить офлайн-Алису, ни в чём не зависящую от внешних сервисов. Всё это уже становится реальностью благодаря открытости исходников.

Вывод: Открытые модели – это фундамент, на котором российское AI-сообщество строит свои решения. Доступность: любые открытые модели можно скачать из интернета в России без ограничений – площадки вроде HuggingFace не блокируются. Иностранных карт не требуется, ведь контент бесплатный. Иногда для скачивания больших весов приходится использовать VPN или прокси, но это технический нюанс. Уровень русского языка у отечественных open-models – высокий, они обгоняют зарубежные open-аналогы на наших тестах. Зарубежные открытые LLM, такие как Llama 2 (Meta), Mistral 7B, BLOOM 176B, тоже владеют русским, но в разной степени. Например, BLOOM обучалась на ~1% русскоязычного текста и может более-менее отвечать по-русски, но довольно поверхностно. Llama 2 изначально ориентирована на английский, хотя в её данных также были тексты на многих языках – она способна отвечать на русском, но может делать ошибки в сложных оборотах. При этом интеграция открытых моделей не требует больших усилий: сообщество создало множество готовых инструментов (WebUI, боты, desktop-приложения) для запуска LLM. Например, проект HuggingChat предоставляет единый веб-интерфейс к нескольким открытым моделям (Llama 2, Mistral и др.) и работает без регистрации прямо из браузера. Российские пользователи могут пользоваться HuggingChat – он работает в РФ и позволяет вести диалоги, генерировать код, картинки и т.д. на базе open-source моделе. Хотя HuggingChat – иностранный сервис, он открыт для всех стран, и VPN не нужен. Таким образом, никакой геоблокировки мир open-source не знает: знание свободно перетекает через границы.

Отдельно стоит упомянуть, что китайские разработки зачастую тоже доступны россиянам: например, лаборатория DeepSeek из КНР формально не открыла свой код, но выложила готовые модели (DeepSeek R1, V3) под свободной лицензией для коммерческого использования (DeepSeek: Everything you need to know about the AI chatbot app | TechCrunch). В результате на HuggingFace появилось более 500 производных моделей на базе DeepSeek, суммарно загруженных 2,5 млн раз. Это значит, что даже прорывные достижения Китая можно использовать локально – никаких запретов на скачивание «китайских» моделей нет. В будущем, вероятно, появятся и полностью open-source модели из Китая (сейчас, например, Alibaba выпустила Qwen-7B открыто). Все они будут доступны российским специалистам.

Вывод по российским решениям: За последний год Россия существенно продвинулась в развитии собственных AI-систем. Универсальные чат-боты уже стали реальностью и продолжают улучшаться, обеспечивая пользователям качественное общение на родном языке без необходимости обращаться к заблокированным иностранным сервисам. Специализированные решения пока делают первые шаги, но в перспективе способны занять ниши в юриспруденции, медицине, IT-отрасли, особенно с опорой на локальные модели. Для разработчиков созданы условия подключать ИИ-функции через российские API или открытые библиотеки – то есть строить свои продукты на базе больших моделей, не нарушая ограничений. Корпоративный сектор получает возможность внедрять AI либо через российских облачных провайдеров, либо самостоятельно, используя открытые наработки. Пожалуй, главным достижением стало появление открытого кода сильных русскоязычных моделей, что устранило технологическую зависимость – теперь сообщество может развивать модели коллективно. Поддержка русского языка во всех этих решениях – на высоком уровне, а где-то и наилучшая в мире, ведь зарубежные аналоги не всегда уделяют внимание «маленьким» языкам. Всё это вместе создаёт относительно автономную экосистему AI в России. Пользователи внутри страны могут свободно пользоваться отечественными ботами – без VPN, с российской учёткой и оплатой, на серверах в РФ. При этом сохраняется возможность обращаться и к глобальным наработкам через open-source. В результате, несмотря на ограничения доступа к ряду западных ИИ, у российских граждан и компаний уже есть выбор инструментов для работы с искусственным интеллектом на своем языке.

Зарубежные решения

Мировой ландшафт AI-чатботов чрезвычайно разнообразен. Ведущие технологические компании OpenAI, Google, Microsoft, Anthropic и другие за последние два года выпустили множество моделей и сервисов на базе больших языковых моделей. Ниже рассмотрены основные универсальные боты общего назначения, специализированные ассистенты для отдельных задач, а также возможности для разработчиков и предприятий за рубежом. Особый акцент сделан на том, насколько эти решения доступны или недоступны пользователям из России – в условиях санкций и блокировок это существенный фактор.

Универсальные чат-боты общего назначения

ChatGPT (OpenAI). Самый известный и популярный AI-чатбот в мире, открывший эру публичных больших языковых моделей. ChatGPT на базе GPT-3.5 и GPT-4 способен вести диалог на любые темы, писать связные тексты, решать логические и творческие задачи. В глобальном масштабе у него более 500 млн активных пользователей еженедельно (на март 2025). Поддержка русского языка: очень хорошая – модели GPT обучены на многоязычном корпусе, включающем русский. Практический опыт показал, что ChatGPT уверенно пишет и понимает по-русски, сохраняя стиль и грамматику. Однако официально сервис в России недоступен. С июля 2024 года OpenAI прекратила обслуживать пользователей из России и ряда других стран, объявив об отключении доступа к ChatGPT и API для «неподдерживаемых регионов» (OpenAI Drops ChatGPT Access for Users in China, Russia, Iran). Фактически, российские IP-адреса и аккаунты, связанные с Россией, блокируются на стороне OpenAI. Ещё раньше существовало ограничение при регистрации – требовался номер телефона из поддерживаемой страны (российские и белорусские номера не принимались). Тем не менее, некоторые пользователи продолжают пользоваться ChatGPT через обходные пути: VPN и виртуальные номера других стран для регистрации. Это позволяет получить бесплатный доступ к версии GPT-3.5. Но платная подписка ChatGPT Plus практически недосягаема для большинства россиян, т.к. требует привязки банковской карты международных платёжных систем и оплаты в иностранной валюте. С технической стороны, если доступ получен, ChatGPT работает нормально из РФ через VPN – ответы генерируются на серверах OpenAI в США/ЕС, задержка незначительна. Однако надо помнить, что все вводимые данные отправляются за рубеж, и потенциально могут анализироваться OpenAI. Вывод: ChatGPT для рядового пользователя из России фактически закрыт прямыми методами, а обходные несут неудобства и риски бана. Тем не менее, его уровень ответов зачастую эталонный, особенно у GPT-4, поэтому самые продвинутые пользователи иногда идут на ухищрения, чтобы им воспользоваться. В русскоязычном сегменте ChatGPT задаёт высокую планку качества, к которой стремятся отечественные аналоги. Но массово применять его в РФ не получится – ни гражданам, ни бизнесу.

Microsoft Bing Chat / Copilot. Компания Microsoft, будучи инвестором OpenAI, интегрировала GPT-4 в свои продукты под названием Copilot. Бесплатный чат-бот доступен через поисковик Bing и браузер Edge, а также встроен в Windows 11 (Windows Copilot). Фактически это интерфейс к обновлённой модели GPT-4 (вариант GPT-4 Turbo с подключением к интернету и генерацией картинок через DALL-E 3). Возможности: Bing Chat отвечает на вопросы с цитированием источников, ведёт беседы, пишет тексты, переводит, решает задачи по коду, генерирует изображения по описанию и даже распознаёт содержимое картинок. Он во многом схож с ChatGPT+Web, но интегрирован прямо в поисковую выдачу Bing. Поддержка русского: полная – интерфейс доступен на русском, бот корректно понимает запросы на русском и при ответе может искать информацию в Рунете. В Windows Copilot все подсказки локализованы на русский, и можно задавать вопросы на русском. Доступность: к сожалению, Microsoft ограничила использование Copilot из России. Bing Chat в веб-версии требует аккаунт Microsoft и не работает при российском IP – при попытке чат просто не запускается. При этом даже VPN не поможет в Windows 11 Copilot – система определяет местоположение по настройкам и не показывает Copilot жителям РФ вовсе. В мобильном приложении Bing аналогично: в российском Google Play его нет (нужна смена региона аккаунта), а iOS-версия требует аккаунт в App Store другой страны (хотя саму программу потом можно использовать и в России). Есть обходной путь – официальный Telegram-бот Copilot (@CopilotOfficialBot), где можно пообщаться с Bing-чатом в Телеграм. Но для его использования тоже нужна учётная запись Microsoft, зарегистрированная на иностранный номер. Иными словами, экосистема Copilot, хотя и не имеет прямого запрета как OpenAI, косвенно труднодоступна из-за региональной политики Microsoft. Это усугубляется тем, что сервис бесплатный, а вот контроль за пользователями строгий. Использование через VPN: технически возможно – например, можно зайти на bing.com/chat под VPN и логином Microsoft, и бот будет отвечать. Однако встроенный в Windows Copilot так не обмануть. Серверы: Bing Chat работает на инфраструктуре Azure по всему миру, но ближайшие датацентры – в Европе. Задержки минимальны. Вывод: Bing Chat/Copilot мог бы стать отличной бесплатной альтернативой ChatGPT для россиян, но из-за блокировок и требований к аккаунтам его аудитория в РФ ограничена наиболее продвинутыми пользователями. Большинству же приходится довольствоваться Яндекс «Нейро» или отечественными ботами, поскольку они доступны без усилий. Тем не менее Bing с GPT-4 остаётся одним из самых мощных ботов, и те, кто имеет к нему доступ, получают ответы сравнимые по качеству с ChatGPT-4, плюс встроенный поиск и картинки – существенное преимущество.

Google Bard (Gemini). Ответ Google на ChatGPT – чат-бот Bard, основанный первоначально на модели LaMDA, а с 2023 года на модели PaLM 2, с планируемым переходом на Gemini. Google изначально запустил Bard ограниченно, но постепенно расширил список стран. Доступность в России: официально отсутствует. Google включил Bard в более чем 180 странах, однако не открыл его в странах ЕС, КНР, РФ и др. из соображений регулирования и политики (Best Bard VPN [5 Secure Providers for Accessing Google Bard]). При попытке зайти на bard.google.com из РФ – сообщение «Bard isn't currently supported in your country». Тем не менее, обход возможен через VPN: при наличии даже российского Google-аккаунта Bard можно использовать, если зайти на сайт через VPN. Это подтверждает и пользовательский опыт – важно, чтобы IP был, например, европейским. Регистрировать отдельный аккаунт необязательно, российский Google-аккаунт подходит. Есть и мобильные клиенты: Bard встроен в приложение Google на iOS и Android. В AppStore РФ приложение Google можно установить и там Bard работает, а вот в Google Play российского Bard по-прежнему нет – нужно сменить регион магазина или скачать APK-файл. Поддержка русского языка: официально Bard с лета 2023 говорит на 40+ языках, включая русский. Он способен отвечать по-русски, хотя и с переменным качеством. По отзывам, Bard уступает ChatGPT в глубине ответов и может допускать ошибки или отказываться от некоторых запросов. Тем не менее, он справляется с базовыми задачами. Особенности: Bard имеет доступ к интернету, умеет работать с изображениями и интегрирован с сервисами Google . Google также экспериментирует с подключением к Bard сторонних сервисов. Серверы: в глобальной сети Google, ответы приходят быстро. Вывод: Google Bard – ещё один мощнейший ИИ-помощник, потенциально полезный русскоязычным пользователям, но прямой доступ заблокирован. С VPN и знанием нюансов его можно использовать, при этом преимуществом является отсутствие платы и интеграция с экосистемой Google. Но по качеству русский Bard всё же может проигрывать ChatGPT – Google традиционно силён в коротких фактических ответах, но может быть менее креативен. Впрочем, на подходе новое поколение Google Gemini – по заявлениям, объединяющее текст, изображения и прочие модальности. Ряд источников указывает, что Google Gemini уже стал доступен ограниченному кругу, хотя в открытом доступе этого пока нет. Российским пользователям остаётся следить за новостями – если Google когда-либо разрешит доступ для РФ, то Bard/Gemini могут стать ценным инструментом. Пока же – только через обходные методы.

Anthropic Claude. Чат-бот Claude от стартапа Anthropic – один из конкурентов ChatGPT с акцентом на безопасные и длинные диалоги. Claude доступен через ограниченную бета-версию сайта и API, коммерчески – с 2023 год. Доступность: Anthropic официально поддерживает лишь несколько стран, Россия в этот список не входит. Прямого веб-интерфейса для всех нет. Однако энтузиасты из LMSYS (Large Model Systems) предоставили публичный доступ к Claude через Chatbot Arena – исследовательский портал, где можно протестировать разные модели бесплатно. РБК рекомендует именно этот путь для россиян: зайти на arena.lmsys.org и в разделе «Direct Chat» выбрать модель Claude (Аналоги ChatGPT: какие чат-боты доступны в России | РБК Тренды). Там регистрация не требуется, VPN тоже не нужен – сайт открыт. Claude на платформе Arena работает в ограниченном режиме, но даёт общее представление. Особенности: Claude известен более высоким «здравым смыслом» и вниманием к указаниям, т.к. Anthropic делает упор на технику «Constitutional AI». Он хорошо пишет развёрнутые тексты, программирует, анализирует данные. Максимальная длина контекста у Claude 2 достигает 100k токенов – это гораздо больше, чем у ChatGPT. Поддержка русского языка: у Claude нет явного ограничения по языкам, но обучался он в основном на англоязычных данных. Доступ для разработчиков: через API, но он недоступен в РФ. Вывод: Claude – интересный альтернативный бот, особенно ценимый за большое окно контекста. К сожалению, официально россиянам им воспользоваться нельзя, но благодаря общественным платформам вроде LMSYS, фактически можно получить к нему бесплатный доступ без особых препятствий. Этим активно пользуются студенты и исследователи: Claude стал одной из моделей, с которыми сравнивают отечественные. Он показывает высокое качество ответов, близкое к GPT-4, поэтому фигурирует в рейтингах. Но для массового применения он, как и OpenAI, остаётся закрыт.

DeepSeek. Отдельно нужно упомянуть новый мощный чат-бот DeepSeek из Китая, ставший вирусным в 2025 году. Разработка лаборатории DeepSeek сумела за короткое время достичь выдающихся результатов. Их приложение DeepSeek AI Chat поднялось на вершины рейтингов загрузок в Apple App Store и Google Play весной 2025. Модели DeepSeek-V2 и V3 оказались крайне эффективны: по внутренним тестам, DeepSeek V3 превосходит доступные для скачивания открытые модели (типа LLaMA 2) и сопоставим с закрытыми API-моделями вроде GPT-4. Кроме того, у DeepSeek есть особая модель R1 (Reasoning 1) – «модель рассуждения», которая фактически пошагово проверяет собственные ответы перед выводом. Благодаря этому R1 меньше ошибается в сложных научных и математических вопросах, хоть и отвечает чуть медленнее. Такой подход позволил DeepSeek в некотором смысле «обойти» конкурентов – эксперты называют успех компании переломным моментом, бросившим вызов лидерству США в сфере ИИ. Доступность: DeepSeek изначально ориентирован на глобальный рынок, его приложение доступно для скачивания практически во всех странах. Российские пользователи могут найти DeepSeek AI в App Store и в Google Play. Как отмечает российская пресса, для Android может понадобиться сменить регион маркета или скачивание APK, но в целом бот работает в РФ без VPN (Нейросеть DeepSeek: что это, где скачать, как пользоваться). Также существует веб-версия – на неё можно зайти свободно, нужна лишь регистрация по email. Оплата: базовое использование бесплатно. DeepSeek избрала необычную модель: они либо ставят цены заметно ниже рыночных, либо вообще дают бесплатно свои сервисы. Это вызвало ажиотаж – за март 2025 DeepSeek зафиксировала 16,5 млн визитов, став вторым по трафику AI-ботом в мире после ChatGPT. Разработчики пока не монетизируют проект. Поддержка русского языка: официально не разрекламирована, но, судя по отзывам, DeepSeek может понимать русские запросы. Однако основное обучение было на китайском и английском, поэтому глубина знаний о России может быть ограничена. Лучше всего бот отвечает на английском – многие россияне используют его именно для англоязычных запросов и перевода. При запросе на русском возможны небольшие неточности или прямой перевод ответа с английского. Тем не менее, работать с DeepSeek можно без знания китайского – интерфейс приложения и сайта имеет английский язык. Сравнение с ChatGPT: DeepSeek славится «глубоким рассуждением» – режим DeepThink разбивает вопрос на шаги и детально их прорабатывает. Например, на сложный вопрос бот может сначала выдать план размышлений, а потом итог. По уровню креативности и понимания контекста DeepSeek V3 и R1 приближаются к GPT-4, хотя сравнения разнятся: есть мнения, что китайская модель всё ещё немного уступает в общих разговорах, но превосходит в строго логических задачах. Вывод: появление DeepSeek – значимое событие. Для российских пользователей этот бот интересен тем, что не заблокирован, бесплатен и обеспечивает качество топ-уровня. Конечно, нужно помнить о языковом моменте – пока их сильная сторона больше китайский/английский. Тем не менее, без ограничений по доступу в этой категории сейчас находятся почти только китайские и опенсорсные проекты.

Другие доступные боты. Помимо громких имён, существуют и менее известные универсальные AI-ассистенты, которыми можно пользоваться из России. Например, YouChat – чат-бот поискового движка You.com. Он работает по принципу совмещения поиска и генерации ответа и позволяет выбрать разные модели (GPT-3.5, GPT-4, Claude, Llama, Gemini) в качестве основы. YouChat доступен на сайте you.com без VPN, регистрация не обязательна. Русский язык он понимает, но часть функций может работать лучше на английском. Также есть Perplexity.ai – ответственный бот-поисковик, всегда дающий ссылки. Perplexity бесплатен, регистрации не требует и работает в России. Он использует комбинацию моделей (ранее GPT-3.5, сейчас, вероятно, GPT-4) и хорош для фактических вопросов, выдавая краткие справки на русском. Ещё один пример – HuggingChat: платформа с открытыми моделями, где тоже можно общаться онлайн. Она полностью доступна, лишь иногда модели могут «падать» под нагрузкой. Наконец, энтузиасты сделали множество Telegram-ботов и локальных приложений: например, проекты RWKV-4-Raven, GPT4All и др. Такие решения позволяют получить базовый функционал GPT-подобного бота без оплаты и цензуры. Однако по качеству они пока уступают крупным моделям.

Вывод: В категории универсальных чат-ботов глобального рынка лидируют продукты OpenAI, Microsoft, Google, Anthropic – но для российских пользователей их доступ ограничен. Прямое подключение часто встречает гео-блок (ChatGPT, Bard, Bing) или требует специфической учётной записи (Copilot). Кроме того, платные версии (ChatGPT Plus, Copilot для GitHub) требуют иностранной оплаты. Это резко сокращает реальное присутствие этих моделей в России. Зато на авансцену выходят альтернативы без барьеров – китайские (DeepSeek) и независимые (YouChat, Perplexity, huggingface). Они пока не столь совершенные во всех аспектах, но свободно доступны и не требуют обходных манёвров. По уровню поддержки русского языка, западные модели обычно не локализованы специально, но благодаря масштабу обучения демонстрируют отличный результат. Китайские модели, наоборот, локализованы под свой рынок, но постепенно учатся и другим языкам – DeepSeek уже стал многоязычным. Открытые модели могут быть адаптированы под русский вручную. Интересно, что по цензуре контента западные боты довольно строго придерживаются правил, китайские – цензурируют только политику Китая, а open-source могут быть настроены как угодно. Пользователю из РФ, стремящемуся получить максимально свободные ответы, зачастую приходится выбирать: либо западный бот с безопасными оговорками, либо настроенный open-source без ограничений. По подключению из России: большинство зарубежных ботов, к сожалению, требуют VPN, кроме случаев с независимыми проектами и китайскими. Геоблокировка стала существенным препятствием – например, официальные приложения Bing, Bard недоступны в российских магазинах приложений. Таким образом, в сфере универсальных AI-ассистентов для россиян сложилась двойственная ситуация. С одной стороны, лучшие модели мира технически доступны и могут общаться на русском лучше, чем кто-либо. С другой – их юридическая и практическая недоступность заставляет искать альтернативы. И эти альтернативы, к счастью, присутствуют: будь то отечественные решения или свободно доступные иностранные. В итоге продвинутый пользователь в РФ сейчас имеет доступ к практически любому из существующих ИИ, но массовому простому пользователю остаются либо отечественные чат-боты, либо те немногие иностранные, что не закрыты. Вероятно, по мере развития российские боты займут нишу для русскоязычной аудитории, а западные останутся больше для английского/международного общения через VPN.

Специализированные чат-боты

Помимо универсальных моделей «для всего», за рубежом бурно развиваются специализированные AI-системы, заточенные под определённые задачи: написание кода, юридические консультации, медицинские рекомендации, финансовая аналитика и т.д. Эти решения часто построены на основе больших моделей типа GPT-4, но дообучены на профильных данных. Рассмотрим несколько направлений и продуктов, а также их применимость в русском контексте.

Кодовые ассистенты. В сфере помощи программистам революцию совершил GitHub Copilot – интегрированный в среду разработки ИИ-помощник, предлагающий продолжение кода, функции по описанию и исправление ошибок. Copilot основан на модели OpenAI Codex и запущен в 2022. Он быстро стал популярен: уже к началу 2023 более 30% нового кода на GitHub создавалось с его подсказок (Meet Your New Legal Assistant: Harvey the Chatbot - AI Business). Доступность: Copilot – платный сервис ($10/мес или $100/год), доступный через подписку GitHub. Официально GitHub не объявлял об отключении России, и многие российские разработчики, подключившиеся раньше, продолжают им пользоваться. Однако новые пользователи столкнутся с проблемой оплаты – нужна международная карта. Кроме того, GitHub контролируется Microsoft, которая соблюдает санкции: были случаи блокировки аккаунтов разработчиков из РФ на GitHub. Хотя сам Copilot не имеет проверки локации, купить его непросто. Некоторые используют Copilot через студенческую бесплатную подписку (GitHub Education) – если есть подтверждённый .edu-адрес. Альтернативы: после успеха Copilot, другие компании выпустили своих помощников. Amazon CodeWhisperer – аналогичный AI для IDE от AWS, причём бесплатный для индивидуальных разработчиков. Он поддерживает множество языков программирования и даже демонстрирует примеры использования API на основе репозитория Amazon (Программистский чат GPT). CodeWhisperer требует учётной записи AWS – а Amazon прекратил регистрацию новых клиентов из РФ. Но если аккаунт был или есть способ зарегистрировать через дружественную юрлицо, этот сервис может быть использован. Также в 2023 году появилась модель Code Llama – открытая модель специально для генерации кода, которую можно запускать локально. Её включают в инструменты как ChatGPT Code, она стала доступна всем и, конечно, россиянам Таким образом, глобально у разработчиков теперь есть выбор: либо коммерческие инструменты, либо open-source. Поддержка русского: в случае кодовых ассистентов язык программирования – английский по синтаксису, но комментарии и подсказки Copilot может выдавать и на русском. Впрочем, для программирования этот аспект не критичен. Российские разработчики ценят Copilot за экономию времени и качество предложений, и продолжают использовать по возможности. Но если доступа к нему нет, их выручают либо «общие» чат-боты, либо вышеупомянутые открытые модели, встроенные через плагины. Пример: плагин IntelliCode от JetBrains теперь может подключать локальный LLM.

Юридические AI. За рубежом громко заявил о себе стартап Harvey AI – «виртуальный юрист», разработанный на базе GPT-4 специально для нужд адвокатских компаний. Harvey обучили на корпусе судебных решений, законов и др., в сотрудничестве с OpenAI (Legal - Harvey AI). Крупнейшая международная юридическая фирма Allen & Overy первой внедрила Harvey для 3500 своих юристов. Возможности: анализ и резюме судебных документов, проверка контрактов на типичные проблемы, подбор аргументов из базы прецедентов. То есть ассистент скорее помогает юристу в рутинной работе, чем полностью консультирует клиента. Доступность: Harvey – узкоспециализированный корпоративный продукт. Отдельному человеку его не получить; продаётся крупными контрактами фирмам. Очевидно, в Россию Harvey поставляться не будет. Но интересен прецедент: на базе GPT можно создать качественного юр. помощника. Аналогично, компании Thomson Reuters, LexisNexis анонсировали интеграцию GPT-моделей в свои правовые системы. В России эти продукты не представлены. Вывод: российским юристам зарубежные AI не доступны ни юридически, ни практически. Поэтому у нас логично появляются свои аналоги (как описанный «Вова AI»). Кстати, в США был проект DoNotPay – «бот-адвокат» для оспаривания штрафов, но он столкнулся с юридическими претензиями и был свёрнут. Это показывает, что регулирование – серьёзный фактор: использование AI для советов в чувствительных областях может запрещаться, если нет контроля качества. Потому внедрение идёт через помощь профессионалам, а не напрямик клиентам.

Медицинские чат-боты. За рубежом крупные IT-компании также начали адаптировать LLM для медицины. Google разработала модель Med-PaLM 2 – версию PaLM, обученную на медицинских вопросах и данных (AI in healthcare: Google's Med-PaLM 2 chatbot enters testing phase). Её тестируют в клинике Mayo, США для ответов на вопросы врачей и пациентов. Пока она не доступна широко, идёт проверка точности. Стартап Glass Health создал ИИ для врачей, помогающий составлять дифференциальный диагноз по описанию симптомов. Вводя подробный анамнез, врач получает от AI список из 5–10 возможных диагнозов для рассмотрения. Glass Health подчёркивает, что это лишь подсказка, а решение остаётся за доктором. В теории такая система ускоряет диагностический процесс, не давая пропустить редкие варианты. Однако, как и у всех медицинских AI, остаётся проблема ошибок – модель может уверенно выдать неверный диагноз. Например, известны случаи, когда GPT-4 «назначал» неподходящее лечение при тестировании, из-за чего подобные приложения не выпускают напрямую пациентам. Доступность: Med-PaLM 2, Glass Health и подобные – не публичные, а закрытые пилотные проекты. Обычный пользователь их не попробует. Для интересующихся есть опосредованный вариант: спросить у ChatGPT медицинский вопрос. GPT-4 часто даёт полезный ответ, но сопровождает его предупреждением: «я не врач, обратитесь к специалисту». Сам OpenAI не позиционирует ChatGPT как медицинский инструмент, но известно, что он иногда помогал врачам в сложных случаях. Российский контекст: прямого доступа к таким моделям нет, но и большой потери здесь нет – медицина очень национально специфична. Русскоязычных медицинских датасетов мировые модели не видели. Поэтому российские врачи, если и будут пользоваться AI, скорее возьмут англоязычную модель для чтения зарубежных исследований или сбора мнений, но адаптировать лечение к нашим реалиям им придётся самим.

Аналитические и бизнес-ассистенты. В экономике примером специализированной модели является BloombergGPT – большая языковая модель (50 млрд параметров), созданная специально для финансового сектора (Introducing BloombergGPT, Bloomberg's 50-billion parameter large). Она обучена на массиве данных Bloomberg: биржевых котировках, финансовых новостях, отчётах и пр. Цель – поддерживать задачи, важные для финансов: анализ тональности новостей, ответ на вопросы про компании, классификация экономических событий. BloombergGPT не открыт широкой публике – он предназначен для улучшения терминалов Bloomberg и работы аналитиков внутри компании. Это отражает тренд: многие крупные фирмы создают собственные LLM, «скармливая» им внутренние данные. Например, JPMorgan анонсировал работу над аналогом ChatGPT для консультантов банка, а Morgan Stanley внедряет OpenAI GPT-4 для помощи своим финансовым советникам. В других отраслях – биотехнологии – компании обучают модели на геномных данных и статьях, чтобы ускорить поиск лекарств. В научной сфере Meta пыталась выпустить модель Galactica для генерации обзоров литературы, но проект критиковали за выдуманные факты и закрыли. Тем не менее, нишевые научные AI (для химиков, физиков) развиваются, хотя о них меньше новостей. Что касается России: доступ к таким узким моделям внешне ограничен. Но наши компании могут использовать похожие подходы: взять открытый LLM и обучить на собственных данных.

Вывод: Зарубежные специализированные AI-системы демонстрируют, как большие языковые модели можно адаптировать под конкретные нужды. Основное преимущество – повышенная точность и релевантность в своей области по сравнению с универсальными ботами. Например, юридический бот знает тонкости законов лучше, а кодовый – понимает структуру программ лучше. Однако для пользователей из России прямой пользы от большинства таких систем пока мало. Многие из них либо закрыты, либо не поддерживают русский язык и данные. Даже если бы они были доступны, применимость их к российским реалиям низкая: Harvey не знает законодательства РФ, Med-PaLM не читал учебники по медицине на русском, BloombergGPT не понимает наш рынок. Потому в краткосрочной перспективе российским профессионалам проще опираться на универсальные модели + свой опыт, чем ждать локализации узких западных AI. Пример: юристы могут использовать ChatGPT для чернового перевода англоязычного договора, но проверять его с точки зрения российского права должны сами. В медицине – врач может попросить GPT-4 подсказать варианты диагноза, но затем сопоставить с российскими протоколами. Доступность и санкции: большинство профильных моделей интегрированы в сервисы компаний, которые прекратили работу в РФ, так что даже косвенного доступа нет. Иные (Google Med-PaLM) – экспериментальные, не выйти за пределы США. Возможность подключения через API: практически нулевая для таких конкретных AI, они не выложены как отдельный API-продукт. Исключение – разве что кодовые помощники (Copilot) и, частично, некоторые научные модели, выложенные в открытом доступе. Но эти детали выходят за рамки запроса.

В итоге, иностранные специализированные чат-боты интересны как ориентир и показатель возможностей. Их развитие показывает, что любую профессию, работающую с текстовой информацией, можно облегчить с помощью ИИ. Российские компании могут перенимать этот опыт. Но непосредственно воспользоваться зарубежными готовыми решениями российским пользователям крайне затруднительно. Поэтому ожидаемо, что в России будут появляться свои аналоги. Мы уже видим зачатки – кодовые модели (TropicalMango выпустил RuCodeLM, Сбертех –CodeGeeX на мультиязычном коде), юридические боты (вышеупомянутый «Вова»). Можно прогнозировать, что через 1–2 года на отечественном рынке появятся коммерческие продукты на базе наших LLM для конкретных отраслей – благо открытые исходники позволяют это сделать без обращения к западным API.

API и SDK-доступ

Интеграция возможностей больших языковых моделей в приложения – огромный тренд за рубежом. OpenAI и конкуренты предлагают API, позволяющие разработчикам использовать мощь GPT в своих продуктах – от чат-ботов до аналитических систем. Здесь рассмотрим, какие API существуют, и как обстоят дела с их доступностью из России.

OpenAI API. Самый востребованный интерфейс – OpenAI API, предоставляющий доступ к моделям GPT-3, GPT-3.5-turbo, GPT-4, а также эмбеддингам, DALL-E и др. Тысячи стартапов и приложений по всему миру используют его. С помощью простого HTTP-запроса разработчик может получить ответ ChatGPT и встроить его в свой сервис. Однако, с июля 2024 OpenAI отключила API для «unsupported regions» одновременно с веб-версией (OpenAI Drops ChatGPT Access for Users in China, Russia, Iran). То есть официально Россия не поддерживается и использование API нарушает ToS OpenAI. На практике, это означает: если бэкенд вашего приложения находится в РФ или вы используете ключ OpenAI с российского IP, то запросы будут отклоняться. Более того, OpenAI стала отслеживать даже косвенные запросы: разработчики, использующие Vercel для своих ботов, сообщали, что им пришли уведомления об отключении сервиса из-за того, что конечный пользователь был из неподдерживаемого региона. То есть OpenAI достаточно серьёзно относится к ограничениям. Поэтому российским разработчикам пользоваться их API крайне сложно. Решения – подключаться опосредованно через внешний сервер: например, можно арендовать сервер в Европе, там держать свой сервис, а пользователи в РФ подключаются к нему. Но это работает, пока OpenAI не узнает, что конечные клиенты – из РФ. Оплата опять же – только иностранной картой, счетами в USD. Таким образом, для легальных лиц в РФ OpenAI API недоступен. Многие проекты, бывшие партнёрами OpenAI в России, прекратили работу или перешли на локальные модели.

API Anthropic Claude. Anthropic предоставляет API к своим моделям Claude и Claude Instant. Его используют, например, разработчики поисковых систем. Однако Anthropic прямо запрещает использование в странах под санкциями и, вероятно, реализует гео-блок. Новый инвестор Anthropic – Google, так что их политика будет схожа с OpenAI. Для РФ это значит – нет официального доступа. И даже прокси-серверы не всегда помогут, если нужно заключать соглашение.

Google PaLM API (Vertex AI). Google открыла доступ к своим большим моделям (PaLM 2, модель кода Codey, модель измерений Embeddings) через облачную платформу Google Cloud Vertex AI. Это, по сути, аналог OpenAI API, но от Google. Поддерживаются текстовая генерация, чат, код, эмбеддинги. Однако, Google Cloud с 2022 года не обслуживает новых клиентов из России – зарегистрироваться в GCP с российскими данными невозможно, старые аккаунты частично закрыты. Кроме того, Google Cloud требует привязки карты и не хочет нарушать санкции. Поэтому, практически, воспользоваться Vertex AI API российский разработчик не сможет. Тут даже VPN не поможет, нужен аккаунт на организацию вне РФ.

Другие API моделей. На рынке есть и независимые провайдеры LLM по API: Cohere (предлагает свои модели типа Command и Xlarge для генерации и классификации), AI21 Labs (модель Jurassic-2), Aleph Alpha (немецкая модель Luminous), OpenAI на Azure (тот же GPT-4, но через инфраструктуру Microsoft) и т.д. Все они, однако, находятся в юрисдикциях, соблюдающих санкции. Cohere и AI21, как канадская и израильская компании, вероятно, также не предоставляют услуги в РФ напрямую – помимо оплаты, у них могут быть ограничения в Terms. Microsoft Azure OpenAI тоже недоступен российским компаниям. Таким образом, большинство зарубежных AI API сейчас недостижимы для разработчиков из РФ официально.

Но есть и положительная сторона: API к открытым моделям. Платформы вроде HuggingFace предлагают Inference API для множества open-source моделей. Например, можно через запрос к HuggingFace бесплатно или за небольшую плату вызвать ту же Llama 2 или Bloom и получить ответ. HuggingFace не вводил ограничений против России, поэтому этот путь открыт. Кроме того, появились сервисы-агрегаторы, например ОpenRouter.ai, которые предоставляют унифицированный API для разных моделей. Некоторые из них лояльно относятся к пользователям из РФ, хотя, конечно, OpenAI-модели там всё равно потребуют ключ, а вот для open-source – нет. Ещё вариант: свой API на локальной модели – используя библиотеки (FastAPI + Transformers), разработчик может развернуть REST API для любой скачанной модели и вызывать её как «свой ChatGPT». Это полностью исключает внешнюю зависимость, но требует серверных мощностей и оптимизации.

Вывод: До 2022 года российские разработчики активно пользовались западными AI API, сейчас же прямой доступ почти ко всем закрыт. OpenAI API, будучи самым мощным, к сожалению вне досягаемости из РФ без серьёзных нарушений правил. Google/Anthropic API – аналогично. Другие – либо тоже ограничены, либо маломощны. В итоге основной упор делается на open-source. Это стимулировало появление российских API и заставило разработчиков обучаться работе с моделями оффлайн. С одной стороны, это замедляет внедрение, с другой – повышает независимость.

Для пользователей же это означает, что многие зарубежные приложения с ИИ просто перестали работать в России – например, интеграции ChatGPT в иностранные сайты, которые раньше открывались, теперь недоступны. Зато отечественные сервисы на открытых моделях выходят на первый план.

Корпоративные и on-premise решения

В мировой практике крупные организации всё чаще хотят иметь корпоративные версии AI – либо размещать модели в своем приватном облаке, либо получать «коробочные» решения для установки в своей сети. Это связано с требованиями конфиденциальности, контроля и кастомизации. Рассмотрим, что предлагают ведущие игроки и что из этого применимов России.

OpenAI ChatGPT Enterprise. В августе 2023 OpenAI запустила продукт ChatGPT Enterprise – это улучшенная версия ChatGPT для компаний, с гарантией неиспользования данных клиентов для обучения и рядом расширенных возможностей (OpenAI Drops ChatGPT Access for Users in China, Russia, Iran). Однако технически это по-прежнему облачный сервис на серверах OpenAI. Он не предполагает локального развёртывания, просто предоставляет компаниям уверенность в приватности. Для российских организаций этот сервис недоступен по тем же причинам, что и обычный ChatGPT. Кроме того, OpenAI анонсировала, что работает над версией ChatGPT для облачных окружений Azure (Azure OpenAI для правительства США), но локально на своих серверах OpenAI пока модель не ставит. Таким образом, полностью on-premise версию GPT-4 от OpenAI купить нельзя даже западным компаниям – они могут лишь использовать её через API с особыми условиями.

Microsoft Azure OpenAI. Microsoft предлагает доступ к GPT-3.5, GPT-4, Codex и др. через свой облачный сервис Azure OpenAI. Фишка в том, что данные остаются внутри тенанта компании в Azure, можно выбрать регион размещения, и Microsoft обеспечивает фильтрацию контента и надежность. Более того, для крупных клиентов анонсирована возможность развёртывать контейнеры с моделью на своей инфраструктуре через Azure Arc. Фактически, это и есть вариант on-premise: модель OpenAI может работать в среде клиента, но с контролем лицензии Microsoft. Однако, Azure OpenAI доступен только по заявкам и лишь компаниям из поддерживаемых стран. Для России этот путь закрыт после ухода Microsoft.

IBM watsonx. IBM, имеющая долгую историю в AI, в 2023 представила платформу Watsonx – набор инструментов для работы с фундаментальными моделями, включая собственные большие модели IBM и open-source модели. Watsonx позиционируется как enterprise-ready решение: компании могут запускать модели в IBM Cloud, в других облаках или on-premise с помощью IBM Watsonx. IBM делает упор на поддержку и соответствие требованиям бизнеса. Технически Watsonx поддерживает и многозадачные разговорные модели, и специализированные. Для России данный продукт недоступен – IBM ушла из РФ в 2022. Но концептуально Watsonx демонстрирует тенденцию: крупные корпорации хотят иметь AI под полным контролем, с возможностью работы в закрытых сетях.

NVIDIA и NeMo. NVIDIA, как лидер в AI-оборудовании, запустила несколько инициатив для корпоративного AI. Их платформа NeMo позволяет обучать и донастраивать LLM, есть сервис NeMo LLM Service в облаке (NVIDIA NeMo for Enterprise-Ready LLMs), а также готовые модели типа NVIDIA Llama-2 Nemotron для использования в бизнес-приложениях. NVIDIA совместно с партнёрами (Dell, Hewlett Packard Enterprise и др.) предлагает готовые стойки и серверы (DGX) с предустановленным ПО, на которых можно развернуть собственный «GPT» в пределах компании. Это сильно ориентировано на тех, кто купит дорогостоящее железо. В России закупка нового оборудования NVIDIA сейчас ограничена санкциями. Но крупные организации, имеющие такие серверы, могут теоретически использовать программные наработки NVIDIA. Например, библиотека NeMo Megatron для распределённого обучения – она открыта на GitHub и может быть использована российскими командами для обучения своих моделей.

Продукты Big Tech. Другие гиганты тоже внедряют AI для корпоративных клиентов. Google планирует предлагать Gemini через Google Cloud с опцием изоляции. Meta сделала ход, открыв Llama 2 под либеральной лицензией: благодаря этому компании могут бесплатно брать Llama 2 и запускать на своих серверах. Многие так и делают – Llama 2 стала основой множества корпоративных пилотов, особенно в Европе, где осторожно относятся к отправке данных в США. Salesforce представила Einstein GPT – интеграцию моделей OpenAI и open-source в свою CRM, чтобы клиенты могли получать AI-функционал внутри Salesforce. Oracle сотрудничает с Cohere и Anthropic, добавляя их модели в облако Oracle, обещая клиентам полную конфиденциальность.

Ключевой тренд: для корпоративных нужд зачастую выбираются open-source модели или модели с доступом к внутреннему управлению, нежели полностью внешние API. Причины – контроль, возможность настроить под свои данные и отсутствие рисков отключения. Западные компании могут легально лицензировать модели вроде Llama 2, Bloom, StableLM и самостоятельно хостить их. Российские компании, по сути, делают то же самое – благо лицензии позволяют. В этом смысле подходы совпадают, только на Западе это дополняется сервисами от OpenAI/IBM, которых у нас нет.
Вывод: Глобально предприятия стремятся вписать AI-модели в свою инфраструктуру на своих условиях. Организации, которым критична приватность, не хотят отправлять запросы в общедоступный ChatGPT – они хотят «свой ChatGPT» внутри. Им идут навстречу: Microsoft, IBM, NVIDIA и др. предлагают решения для частного развертывания, пусть даже и в рамках своего стека технологий. В России аналогичный спрос решается с помощью отечественных открытых моделей и локальных мощностей. Разница в том, что западные компании могут купить прямую поддержку от создателей моделей, а российские – вынуждены полагаться на собственные силы или сервисы локальных провайдеров.

Что касается доступности через VPN/гео-блок – корпоративные продукты обычно продаются индивидуально, тут вопрос не стоит. Но заметим: например, Watsonx или Azure OpenAI просто недоступны российским юрлицам по политическим причинам, никакой VPN не поможет подписать контракт. То есть, если обычный пользователь ещё может «притвориться» иностранцем и получить доступ к боту, то компании в РФ этого сделать не могут, им нужны легальные решения. Поэтому российский бизнес фактически отрезан от западных корпоративных AI-продуктов. Это и вызвало бум импортозамещения в этой сфере.

Вывод по зарубежным решениям: В мировом AI-секторе сформировалась богатая палитра технологий – от свободных моделей до закрытых SaaS – которыми пользуются миллионы людей и тысячи компаний. Однако из-за санкций и геополитики, для российских пользователей прямая доступность большинства таких решений крайне ограничена. Универсальные чат-боты – лидируют по качеству, но работают в РФ только через VPN, а кое-что и вовсе заблокировано на уровне регистрации. Специализированные иностранные боты либо недоступны, либо бесполезны без локализации. API крупнейших моделей отключены для РФ, что заставляет разработчиков переходить на открытые альтернативы. Корпоративные предложения западных компаний также не продаются в РФ. Тем не менее, доступ к передовым достижениям ИИ для россиян полностью не закрыт. Китайские проекты открыто доступны и предоставляют уровень, близкий к лучшим образцам. Открытые модели позволяют воспроизводить функциональность топ-моделей локально, пусть и с некоторыми компромиссами. Таким образом, российские пользователи и организации, желающие использовать современные AI-системы, имеют два пути: либо использовать отечественные или дружественные аналоги, либо прибегать к VPN и частичным обходам для работы с западными сервисами. Первый путь сейчас становится основным – благо появились сильные российские решения (описанные в первой части обзора), а второй постепенно теряет популярность из-за усложнения обходных мер. В конечном счёте, несмотря на технологическое эмбарго, российский сектор ИИ не остаётся на обочине: поддерживаются и развиваются актуальные наработки, хотя и другим путём. Кратко говоря, зарубежные AI-системы задали высокую планку, но их недоступность ускорила развитие собственных решений в России, что, возможно, в долгосрочной перспективе пойдёт на пользу независимости и безопасности технологий.

Об авторе

■ Другие статьи по теме Архитектура

Показать еще

■ Другие статьи по теме Интеграция

■ Другие статьи на тему Базы данных

Показать еще

■ Другие статьи на тему User Stories и Use Cases

■ Другие статьи на тему Требований

Показать еще

■ Другие статьи на тему Бизнес-анализ

■ Другие статьи на тему Профессия и трудоустройство

Показать еще

■ Другие статьи на тему Проектное управление

■ Другие статьи на тему Менеджмент и архитектура предприятия

Показать еще

■ Другие статьи на тему Дизайн интерфейсов и исследования