Школа
системного анализа
и проектирования

Обзор AI-агентов
для расшифровки встреч

Автор: Алина Богачёва

О чём статья

Автоматическая расшифровка рабочих встреч — это стремительно развивающаяся область: современные AI-агенты способны не только точно транскрибировать речь в текст, но и выполнять аналитику разговоров, генерировать краткие итоги (саммари), фиксировать список задач и интегрироваться с корпоративными системами (например, CRM).

Ниже представлен структурированный обзор решений как на российском, так и на зарубежном рынке, сгруппированных по типу функциональности. Особое внимание уделяется уровню поддержки русского языка (отлично, хорошо, частично или отсутствует) в каждом продукте, а также модели оплаты (бесплатно, платно, гибридно) и ориентации (массовый рынок или корпоративный сегмент).

Российские решения

Сервисы транскрибации речи
(только расшифровка аудио/видео)

Эти сервисы позволяют преобразовать аудио- или видеозапись встречи в текст, без автоматического участия в самой встрече. Обычно они предоставляют онлайн-платформу для загрузки файла и получения расшифровки.

Teamlogs.ru — онлайн-сервис для автоматической транскрибации аудио и видео. Поддерживает русский и английский языки, заявленная точность до 95% при хорошем звуке (Полный гайд по Teamlogs). Умеет автоматически расставлять знаки препинания и разделять по спикерам. Интерфейс позволяет редактировать текст и прослушивать аудио фрагментами. Предоставляет 15 минут бесплатной транскрибации новым пользователям, далее оплата поминутно. Ориентирован на массовое использование: подходит журналистам, контент-менеджерам, студентам. Плюсы: удобный веб-интерфейс, поддержка популярных форматов аудио, экспорт результатов в DOCX/XLSX/SRT. Минусы: функциональность ограничена расшифровкой; нет автоматического саммари или задач, только текст стенограммы.

Charla.ai — российский AI-сервис для преобразования аудио/видео в текст. Заявлена высокая точность до 93% и очень быстрая обработка: час записи за 2 минуты (Charla AI — расшифровка и перевод аудио в текст с помощью нейросети). Поддерживается более 100 языков, включая русский, качество на всех языках удерживается на высоком уровне. Имеется бесплатный тестовый период 5 дней полного функционала после регистрации. В дальнейшем — гибридная модель: ограниченный бесплатный тариф и платные планы. Ориентирован скорее на массовый рынок, в том числе на образование. Особенности: помимо транскрипции может выполнять перевод расшифрованного текста на другие языки. Плюсы: поддержка множества языков, отсутствие лимита на размер/длину файла. Минусы: нет интеграций или аналитики — это чисто сервис расшифровки.

Выводы: Оба приведённых сервиса гарантируют высокое качество распознавания русской речи. Teamlogs предоставляет удобство командной работы, тогда как Charla выделяется мультиязычностью. Оба решения платные при значительных объёмах, но доступны для индивидуального использования. Ни один из них не создает автоматических резюме встречи или списка задач — на выходе даётся полный транскрипт разговора.

Системы-ассистенты для онлайн-встреч
(реальное время, авто-расшифровка)

Эта категория включает AI-агентов, которые подключаются в реальном времени к видеоконференции и выполняют расшифровку речи «на лету». Обычно они выступают как виртуальный участник встречи или интегрируются через календарь.

FollowUP.tech — «AI-секретарь» для онлайн-встреч. Сервис интегрируется с календарями (Google, Яндекс, Outlook) и автоматически подключается ко всем встречам, где есть ссылка на ВКС (FollowUP — Автоматический протокол встречи Zoom / Google Meets / Яндекс.Телемост). Во время встречи бот записывает разговор и транскрибирует всю речь участников, а по окончании генерирует материалы встречи. FollowUP сразу после созвона рассылает протокол с тайм-кодами и краткое саммари с основными итогами всем участникам, а также фиксирует выявленные задачи, дедлайны и ответственных. Поддержка русского языка — отличная. Сервис разработан в РФ, использует собственные модели ASR; качество сопоставимо с конкурентами. Также работает с английским, есть англоязычный интерфейс. Доступна бесплатная проба, далее поминутная оплата. Предусмотрены корпоративные условия и даже on‑premise версия — ориентир на корпоративный сегмент. Плюсы: полностью автоматическое подключение без действий пользователя, доставка итогов в удобные каналы, глубокая интеграция в бизнес-процессы. Минусы: сервис платный при регулярном использовании; расшифровка многоязычных встреч с переключением языка не поддерживается — язык надо выбирать заранее.

MyMeet.ai — AI-агент для онлайн-встреч, ориентированный в том числе на продажи и работу с клиентами. Может подключаться к звонку в Zoom, Google Meet или Яндекс.Телемост и автоматически записывать и расшифровывать разговор (ИИ-ассистент для встреч | Саммари, задачи и отчеты с mymeet.ai). MyMeet делает упор на русский язык — заявлена транскрибация русского с высокой точностью (поддерживается также 70+ языков для распознавания). Во время встречи сервис фиксирует контекст, по завершении предоставляет точный транскрипт, а также рассказывает об итогах и фиксирует задачи. Есть функция AI-чата для анализа протокола: пользователи могут задавать вопросы по содержанию встречи, и ИИ найдет ответы и инсайты в тексте. MyMeet интегрируется с популярными инструментами: умеет работать с Zoom/Meet/Телемост, а также выгружать данные в amoCRM и даже рассылать через Telegram. Модель распространения — условно-бесплатная, free-trial, далее подписка per user. Ориентирован на корпоративных пользователей и команды, которым нужны не просто расшифровки, но и аналитика встреч. Плюсы: широкие возможности пост-анализа, улучшение звука. Минусы: для полностью автоматической работы требуется настроить интеграцию с календарем вручную; часть продвинутых функций доступна только на платных тарифах.

Выводы: На российском рынке почти все решения-«боты» для встреч обладают расширенной функциональностью (генерация итогов, задач и т.п.), поэтому их трудно отнести строго к категории «только транскрипция в реальном времени». FollowUP и MyMeet — яркие примеры гибридных возможностей, но в данном разделе акцент на их умении присутствовать на встрече в режиме реального времени. Оба дают русскоязычные стенограммы отличного качества, работая примерно на уровне иностранных аналогов. Бесплатные планы у них ограничены, поэтому для регулярного использования в компании потребуется бюджет.

Платформы видеосвязи
со встроенной функцией расшифровки

Ряд популярных сервисов видеоконференций интегрировали AI-расшифровку прямо в платформу. Это удобно: не нужен внешний бот, достаточно включить функцию записи/стенограммы. В России, в условиях курса на импортозамещение, появились отечественные аналоги Zoom с подобным функционалом.

Яндекс.Телемост (корпоративная версия в Яндекс 360) — с 2024/2025 года «Телемост» для бизнеса предлагает автоматическую расшифровку каждой видеовстречи и создание ИИ-конспекта по итогам (Яндекс 360 добавил ИИ-конспекты встреч в Телемост для бизнеса | Компьютерра). Функциональность реализована на базе технологии распознавания речи Яндекса и нейросети YandexGPT, обученной подводить итоги созвонов. Когда встреча завершается, организатор и участники мгновенно получают стенограмму с тайм-кодами и краткие выводы по беседе на 1 страницу. Русский язык поддерживается идеально; для других языков поддержки пока может не быть или она ограничена. Доступно в платных тарифах Яндекс 360 для бизнеса. Для конечных пользователей Телемоста эта AI-функция недоступна. Ориентация: корпоративные клиенты, которым важно хранить встречи в экосистеме Яндекса. Особенности: удобное включение записи в интерфейсе , фокус на безопасности. Плюсы: экономия времени на оформление «минуток» (~10 минут с каждой встречи экономится благодаря автоконспекту), глубокая локализация под русский язык. Минусы: функция не бесплатна; используется только внутри Телемоста.

МТС Линк — отечественная платформа для видеосвязи от компании МТС. Также реализована AI-расшифровка всех онлайн-совещаний: после встречи пользователям доступна полная текстовая расшифровка аудио и краткое саммари ключевых моментов («МТС Линк» поможет в цифровизации Таймыра — CNews). Например, в кейсе администрации Таймырского района этот функционал избавил сотрудников от ручного составления протоколов — теперь автоитоги формируются ассистентом на основе ИИ. Поддержка русского — отличная; про другие языки не заявлено. Сервис встроен в экосистему МТС, доступен корпоративным пользователям. Ориентирован на госсектор, образование, бизнес — тех, кто ищет замену Zoom/Teams внутри РФ. Плюсы: помимо стенограмм, умная поисковая навигация по записям. Минусы: вне экосистемы МТС малоизвестен; вероятно, доступ по подписке или контракту.

Sber Салют Jazz — платформа видеоконференций от Сбера. Также обладает всеми базовыми функциями ВКС и, по данным разработчиков, умеет расшифровывать речь в реальном времени (Управление для участника в SaluteJazz — Sber Developer). Вероятно, используется движок распознавания речи Sber (облачная платформа Speech Technology) с хорошим качеством для русского языка. Интеграция в экосистему Сбера: продукт позиционируется для бизнеса. Поддержка русского: отличная по умолчанию; про другие языки данных мало. Плюсы: единое решение «все в одном» — видеовстречи, чат, доска, запись и транскрипция. Минусы: требуется переход на новую платформу ВКС; не столь широко распространена, как Zoom/Teams.

Контур.Толк — решение для видеосвязи от российской ИТ-компании СКБ «Контур». Предназначено для корпоративных клиентов, особенно гос. сектора. Имеет функцию записи встреч; вероятно, реализована и транскрибация (этот продукт упоминается среди российских ВКС с AI-функционалом (Что умеют AI-driven системы расшифровки встреч, и как их внедрять в компанию — статья в блоге ScrumTrek). Детали публично не раскрыты, но учитывая компетенции Контура, русский язык поддерживается на высоком уровне.

TrueConf — отечественный софт для видеоконференций. В 2024 году начал тестировать встроенную транскрибацию (бета-версия). Однако, по отзывам, качество расшифровки пока уступает специализированным решениям. Тем не менее TrueConf активно развивается, и можно ожидать улучшений. Пока что эту функцию можно считать частичной поддержкой.

Выводы: Все перечисленные платформы ориентированы на корпоративное использование и предлагают встроенную расшифровку на русском языке. В отличие от универсальных сервисов, эти решения «привязаны» к своей экосистеме: например, Телемост и МТС Линк обеспечивают полный цикл от звонка до отчета, но не могут расшифровывать встречи, проведенные в других системах. Их преимущества — бесшовность и безопасность данных. Недостаток — меньшая гибкость: для использования функции придется провести встречу именно на данной платформе. С точки зрения цены: обычно требуется корпоративная подписка.

Для массового рынка, привычного к Zoom/Meet, эти опции менее доступны — поэтому рассмотрим и иностранные видеосервисы.

Комплексные AI-платформы для встреч (транскрибация + аналитика + саммари + интеграции)

К этой группе относятся многофункциональные сервисы, которые не ограничиваются текстовой стенограммой. Они дают добавленную ценность: анализируют разговор, выделяют темы, задачи, могут автоматически заполнить CRM или дать советы по улучшению переговоров. Многие решения из предыдущей категории «ассистентов» фактически относятся и сюда.

Timelist (Таймлист) — российская платформа, изначально созданная для расшифровки и автопротоколирования встреч. Позволяет загрузить запись встречи или интегрироваться с ВКС. После обработки Timelist выдает точный транскрипт с определением спикеров, а также формирует авто-протокол – список ценных мыслей, важных тезисов и принятых решений. Отдельно фиксируются задачи по итогам (action items). Таким образом, пользователь получает не просто текст, а структурированный отчёт. Все расшифровки и протоколы хранятся в базе знаний для последующего поиска. Например, можно найти нужный фрагмент по ключевому слову и сразу перейти к соответствующему месту аудио (Транскрибация видео и аудио в текст — протокол встречи — Таймлист 1С). Русский язык поддерживается отлично, платформа обучена на русском, учитывает грамматику, орфографию, узнает аббревиатуры. Оплата: вероятно подписка или по объёму. Timelist сотрудничает с 1С и ориентируется на корпоративный сегмент, есть интеграции с 1С:Документооборот, Битрикс24 и системами ВКС. Плюсы: повышенная точность для бизнес-речи, возможность работы on-premise. Минусы: интерфейс и материалы заточены под корпоративных пользователей; интеграция live-бота в ВКС появилась недавно и ещё совершенствуется.

FollowUP / MyMeet — (описаны выше как ассистенты). Оба сервиса относятся к комплексным AI-платформам, т.к. помимо транскрибирования выполняют аналитику встречи.

FollowUP формирует не только саммари, но и детально оценивает качество онлайн-встреч — например, для отдела продаж может проанализировать разговор и дать рекомендации руководителю, для HR – оценить интервью с кандидатом, для внутреннего совещания – рекомендации по улучшению коммуникаций (FollowUP – Автоматический протокол встречи Zoom / Google Meets / Яндекс.Телемост).

MyMeet предлагает AI-чат для поиска инсайтов, а также формирует итоговые отчёты и списки задач. Таким образом, оба инструмента выходят за рамки простой расшифровки и выполняют роль своеобразного цифрового секретаря/аналитика. Интеграции: FollowUP имеет API и может рассылать данные в мессенджеры; MyMeet интегрирует встречи с CRM и другими приложениями. Отличия: FollowUP делает упор на протокол и краткое резюме для всех участников, тогда как MyMeet больше ориентирован на индивидуальный анализ. Можно отметить, что MyMeet генерирует расширенный «обзор» встречи (близкий к подробным заметкам) и список Action Items, а Timelist — только Action Items и краткий протокол в виде пунктов. FollowUP же присылает и полный транскрипт, и короткое резюме на email каждому. Все три сервиса хорошо работают с русским языком, и все платные. Плюсы: экономия времени руководителей, прозрачность договорённостей. Минусы: возможны вопросы информационной безопасности — данные встреч хранятся в облаке сервиса; разработчики заявляют, что используют свои серверы и не отправляют данные в публичные модели, но компании всё равно внимательно относятся к конфиденциальности.

Teamlogs — хотя изначально Teamlogs позиционируется как сервис транскрибации, в контексте встреч его тоже можно рассматривать как платформу: он позволяет нескольким пользователям совместно работать с редактированием расшифровки, что приближает его к протоколированию. Однако функции именно авто-резюме или выделения задач у Teamlogs нет, поэтому его скорее относят к простым транскрибаторам.

Выводы: Внутри российской линейки решений наблюдается такая тенденция: продукты нового поколения (MyMeet, FollowUP, Timelist) стремятся предоставить полный цикл — от записи разговора до получения ценных инсайтов. Отличия между ними в нюансах: одни ориентируются на удобство интеграции и автоматизацию (FollowUP — календарь, рассылки; Timelist — связь с 1С), другие — на интеллектуальную обработку (MyMeet — AI-помощник для поиска по встрече). Все три конкурируют друг с другом; выбор зависит от потребностей: например, для протоколирования продаж и последующей загрузки в CRM подойдут FollowUP или MyMeet, а для внутрикорпоративных совещаний с документацией решений — Timelist.

Зарубежные решения

Сервисы для транскрибации речи
(offline-перевод аудио/видео в текст)

На мировом рынке давно существуют сервисы, предоставляющие автоматическую расшифровку записей на разных языках. Они полезны, когда нужно расшифровать встречу задним числом, по аудиофайлу или видеозаписи.

Sonix.ai — облачный сервис транскрипции, известный поддержкой множества языков. Заявляет 49+ языков распознавания с высокой точностью, в том числе русский (Fireflies vs. Microsoft 365 Copilot: A Comparative Study). Пользователь загружает запись, через некоторое время получает текст и может его отредактировать в браузерном редакторе. Русский язык: поддерживается хорошо. Ориентация: массовый рынок. Особенности: автоматический перевод транскрипта на другие языки, возможность импорта записей из Zoom облака напрямую. Плюсы: высокая скорость, API для разработчиков, интеграции. Минусы: стоимость в пересчете на минуты может быть высокой; при акцентированной русской речи могут быть неточности.

Happy Scribe — европейский сервис транскрипции. Поддерживает более 120 языков и диалектов (Happy Scribe vs Otter.ai | Service Review), включая русский. Предлагает как авто-расшифровку, так и дополнительно оплачиваемые услуги редакторов-людей для идеального результата. Русский язык — поддержка хорошая (использует современные модели ASR). Happy Scribe часто выбирают для создания субтитров, транскриптов интервью и пр. Плюсы: удобный редактор с расстановкой имен говорящих, экспорт в множество форматов; минусы: цена выше среднего, нет реального времени.

Trint — один из пионеров AI-транскрипции. Поддерживает 30+ языков, в том числе русский. Предлагает веб-интерфейс для редактирования, совместной работы и даже простого анализа текста. Ориентация: медиа, бизнес (среди клиентов — BBC, Forbes и т.п.). Особенности: интеграции с Adobe Premiere, возможность создавать статьи на базе транскриптов. Плюсы: надежность, безопасность (соответствие GDPR). Минусы: сравнительно высокая цена, ограниченные объемы в базовом плане.

Google Cloud Speech-to-Text / AWS Transcribe / Azure Speech — облачные платформы от крупных вендоров. Не пользовательские приложения, а API для разработчиков, но упомянуть стоит. Поддерживают русский язык: Google — отлично (В Google Meet появилась опция автоматической расшифровки устной речи / Хабр), Microsoft — хорошо, AWS — хорошо; могут лечь в основу многих сервисов. Например, некоторые продукты (тот же Sonix или Otter.ai) могли использовать Google STT. Напрямую конечному пользователю эти API не слишком дружелюбны, так как требуют навыков программирования или использования через интеграции.

Выводы: В целом, иностранные сервисы транскрибации многоязычны. Уровень поддержки русского у ведущих решений — хороший, хотя исторически они более оптимизированы под английский. Так, Sonix, HappyScribe, Trint используют современные нейросети и показывают точность >90% на русском при четком аудио. По ценам все решения коммерческие,чаще платные с поминутной тарификацией, хотя почти все дают небольшой бесплатный пробник. Ориентированы они на массового зарубежного пользователя, но могут применяться и в российских компаниях, если нет ограничений на вынос данных за рубеж. Главный минус — эти сервисы не дают саммари или анализа, только текст. Для таких функций нужны специализированные ассистенты.

Системы авто-расшифровки для онлайн-встреч

В мире существует ряд популярных AI-ассистентов, аналогичных описанным российским. Они подключаются к Zoom/Teams/Meet и выполняют расшифровку, часто дополняя её умными функциями (саммари, заметки). Перечислим наиболее известные:

Otter.ai — один из пионеров в этой области. Это виртуальный ассистент, который может присоединяться к встречам в Zoom, Microsoft Teams или Google Meet и в реальном времени отображать субтитры и расшифровку разговора. После встречи Otter сохраняет стенограмму и может сгенерировать краткое резюме. Ограничение: исторически Otter поддерживал только английский язык (Happy Scribe vs. Otter.ai Comparison — Notta), поэтому поддержка русского отсутствует либо находится в начальной стадии. Отчасти поэтому Otter не столь полезен для русскоязычных команд. Ориентация: массовый рынок (особенно англоязычные пользователи, студенты, бизнес). Плюсы: удобство (мобильное приложение, веб, интеграция календаря), возможность совместного ведения заметок прямо во время встречи. Минусы: отсутствие поддержки русского и других языков серьёзно ограничивает применение; многие продвинутые функции доступны только в дорогих планах.

Fireflies.ai — облачный AI-нотариус встреч. Fireflies присоединяется к звонкам, записывает и транскрибирует речь на более чем 60 языках, включая русский. Качество распознавания русского весьма достойное — по оценкам, транскрипты Fireflies на русском не сильно уступают специализированным российским решениям (Что умеют AI-driven системы расшифровки встреч, и как их внедрять в компанию — статья в блоге ScrumTrek). После встречи Fireflies генерирует различные артефакты: краткий Overview, подробные Notes и список Action Items. Есть и удобства вроде поиска по всем прошлым встречам, настройка кастомных словарей, интеграция с CRM и Slack. Ориентация: команды продаж, проекта и т.д. Плюсы: очень широкая языковая поддержка, включая возможность переключать язык встречи; богатый функционал AI-аналитики. Минусы: англоязычный интерфейс, возможны мелкие ошибки в определении русских имен собственных; для интеграций/API нужен более дорогой тариф.

Airgram.io — относительно новый стартап, функциями напоминающий Otter. Бот Airgram также подключается к Zoom/Meet/Teams и стенографирует разговор. Поддерживается 8 языков, включая русский (Транскрипция с русского для Teams, Zoom и Google Meet). Сервис умеет в реальном времени выделять ключевые сущности в тексте и позволяет сохранять клипы из записи. Интегрируется с Slack, Notion, Google Docs для экспорта заметок. Поддержка русского: хорошая, хоть и не идеальная. Плюсы: удобное Chrome-расширение, возможность запланировать участие бота заранее. Минусы: менее известный бренд, пока небольшое сообщество, ограниченные языки по сравнению с конкурентами.

tl;dv — название происходит от интернет-мема «too long; didn’t view». Это плагин для Zoom и Google Meet, позволяющий записывать и расшифровывать встречи. Отличается щедрым бесплатным планом: неограниченные записи, расшифровки и даже автоматические AI-заметки и резюме (Лучшее программное обеспечение для расшифровки совещаний в 2025 году — tl;dv). Поддержка языков – широкая, русский присутствует, хотя в маркетинге упор на английский. tl;dv также предоставляет функции AI-отчётов по нескольким встречам (то есть анализ сразу серии совещаний, чтобы, к примеру, отследить обсуждение определённой темы). Есть интеграции с HubSpot, Salesforce, например, для авто-заполнения CRM полей с диалога. Русский язык: поддерживается, но официальных заявлений по качеству мало — вероятно, используется трансформер-модель с достойной точностью. Ориентация: стартапы, продажи, все, кто хочет бюджетно повысить осведомлённость о встречах. Плюсы: практически полный набор функций бесплатно, шаблоны заметок под разные сценарии. Минусы: относительно молодой продукт — возможны сырости; интерфейс на английском, поддержка русского не столь отлажена как у российских аналогов.

MeetGeek.ai — AI-ассистент для встреч, близкий по возможностям к Fireflies. Поддерживает 30+ языков, в том числе русский (MeetGeek 2025 Pricing, Features, Reviews & Alternatives — GetApp), может автоматически записывать Zoom/Teams/Meet и создавать саммари, список ключевых моментов и задач. MeetGeek привлекает наличием бесплатного плана и удобным интерфейсом. Также он предоставляет функцию авто-детекции языка и переключения моделей под язык встречи . Поддержка русского: хорошая, многие пользователи отмечают корректность распознавания. Особенности: интеграции с Trello, Asana (может превращать action items сразу в задачи).

Sembly AI — ещё один международный стартап с основателями из РФ/США. Позиционируется как AI-помощник для совещаний. Мультиязычная поддержка: 20+ языков, русский есть (Personal — Sembly AI). Sembly не только транскрибирует, но и делает Smart Summary, выделяет решения, вопросы и действия. Интегрируется с календарями, MS Teams, Jira, Slack. Есть бесплатный тариф для личного пользования, ограниченные часы в месяц. Поддержка русского: на хорошем уровне. Отличие: Sembly позволяет искать по встречам с помощью естественного языка, например: «что решили насчёт бюджета на прошлой планёрке?» — и AI найдёт ответ в записях.

Выводы: Иностранные ассистенты для встреч достаточно разнообразны. Поддержка русского языка у них в целом варьируется от отличной до нулевой: например, Fireflies, tl;dv, MeetGeek, Sembly, Airgram — поддерживают и довольно качественно транскрибируют русский, а вот Otter — практически нет. Поэтому русскоязычным пользователям следует выбирать те продукты, которые декларируют multi-language.

С точки зрения финансовой модели, многие зарубежные решения привлекают свободными тарифами: tl;dv — вообще бесплатен с полным функционалом, MeetGeek и Otter/Fireflies — дают ограниченно бесплатно. Платные планы из-за большого рынка у них, как правило, дешевле аналогичных российских: ~10–20 USD в месяц с человека. Однако, стоит учесть, что хранение данных происходит за рубежом.

Функционально большинство предоставляет автоматические саммари и выделение action items. Различия — в дополнительных нишевых возможностях: tl;dv и Fireflies добавили коучинг для продавцов на базе анализа переговоров, Airgram – парсинг сущностей (цены, даты), Sembly — умный поиск по встречам. В итоге выбор зависит от приоритетов команды. Но в целом конкуренция высокая, и все они развиваются быстрыми темпами.

Встроенные функции в платформах видеосвязи

Крупные международные сервисы видеоконференций также внедрили функции расшифровки и даже перевода речи:

Zoom — популярнейший сервис ВКС. Имеет функцию автосубтитров Live Transcription на базе AI. Изначально она работала только для английского, но сейчас Zoom поддерживает транскрибацию записей на 18 языках, включая русский (Using audio transcription for cloud recordings). Однако качество русской расшифровки в Zoom считается посредственным: отмечалось, что сторонние решения, например, Fireflies, дают существенно более точный транскрипт русского по сравнению с Zoom AI Companion. Live-транскрипция Zoom доступна бесплатно для английского, а многоязычные переводы и транскрипты — в платных планах. Ориентация: массовый рынок и бизнес. Плюсы: интегрирована прямо в приложение, есть даже перевод субтитров с одного языка на другой в реальном времени (Enabling and configuring translated captions — Zoom Support). Минусы: качество на русском уступает специализированным решениям; для постоянного хранения стенограмм нужен облачный аккаунт.

Microsoft Teams — корпоративная платформа из Microsoft 365. Уже с 2021 г. поддерживает авто-стенограммы встреч. На момент запуска русский не поддерживался, но к 2023–2024 гг. Microsoft добавила ряд языков. Сейчас в Teams доступны живые субтитры на русском — эту опцию можно включить в настройках встречи (Audio Conferencing supported languages — Microsoft Teams). Кроме того, в 2023 г. появился Teams Premium с Intelligent Recap – продвинутый ИИ-аналитик, который после встречи выдаёт тезисное summary, выделяет задания, помечает упоминания участников, но пока только для английских встреч. Поддержка русского: Live captionsхорошо, автосаммаричастично/нет. Ориентация: корпоративный сектор, особенно там, где уже используют Microsoft. Плюсы: безопасность и хранение внутри тенанта компании, интеграция с календарем Outlook. Минусы: функции ИИ, в том числе многоязычный перевод субтитров доступны только в дорогих лицензиях; качество русского может падать при использовании специфических терминов.

Google Meet — сервис видеосвязи Google. Имеет субтитры и в конце 2022 получил функцию авто-расшифровки встреч (В Google Meet появилась опция автоматической расшифровки устной речи / Хабр). Но важный нюанс: русский язык пока не поддерживается для этой функции. На октябрь 2022 транскрибация работала только для английского, Google обещал добавить французский, немецкий, испанский, португальский — русского в списке нет. Таким образом, Meet в реальном времени русский голос в текст не преобразует. Зато Google внедряет перевод субтитров: можно, например, английскую речь сразу показывать на французском тексте и наоборот. Ориентация: массовый рынок. Плюсы: простота включения, интеграция с Google Docs. Минусы: для русскоязычных пользователей пользы мало до появления поддержки языка.

Cisco Webex — корпоративная платформа для видеоконференций. Cisco еще в 2020 анонсировала, что Webex научится делать синхронный перевод речи с английского на русский и составлять протокол встречи на русском (Лёгкости перевода. Cisco Webex получит поддержку русского языка — spbit.ru). К 2021 эта функция вышла: Webex предлагает Real-time Translation на 100+ языков, включая русский, и умеет после встречи выдавать стенограмму и summary. Поддержка русского: отлично как язык оригинала, так и язык для перевода субтитров. Ориентация: крупный бизнес, государственные организации. Плюсы: комплексное решение «из коробки», можно сразу получить двуязычные субтитры — например, человек говорит по-английски, а русским участникам показывается перевод на русский внизу экрана. Минусы: Webex — платформа не бесплатная, для использования нужен корпоративный аккаунт; после 2022 новых внедрений в РФ почти нет из-за ограничений, однако у существующих заказчиков функционал работает.

Выводы: Среди зарубежных ВКС-платформ самый массовый в РФ — это по-прежнему Zoom, его используют ~77% опрошенных россиян в 2022. Zoom дает базовые субтитры, но многоязычный транскрипт — лишь частично и не столь качественно. Teams широко используется в компаниях, и там расшифровка на русском стала реальностью. Google Meet пока отстает по локализации. Webex технологически очень силён, но из-за корпоративного характера менее доступен широкому кругу. Для русскоязычных пользователей, которым нужна простая и бесплатная расшифровка встреч, ни одна из этих платформ не даст полного решения — тут и возникают на сцене специализированные ассистенты из предыдущего раздела, которые можно прикрутить к той же встрече в Zoom для получения русской стенограммы.

Комплексные AI-платформы

Эта категория — о решениях «надстройках», которые особенно популярны в сфере продаж и клиентского сервиса. Их часто называют платформами Conversation Intelligence. Они не только транскрибируют созвоны, но и дают бизнес-метрики: анализируют эмоции, выявляют упоминания конкурентов, измеряют разговорное время менеджера и клиента и т.д. Также сюда относятся универсальные ассистенты, интегрированные с корпоративными системами.

Gong.io — одна из самых известных CI-платформ для отделов продаж. Gong подключается к системам звонков, расшифровывает разговор и далее запускает свой аналитический движок. Он способен определять этап сделки, настроения клиента, предупреждать менеджера о рисках (например, клиент упомянул конкурента или выразил сомнение). По сути Gong служит «вторыми ушами» директора по продажам — можно прослушать проблемные звонки, не участвуя лично. Поддержка языков: изначально Gong был ориентирован на английский, но сейчас поддерживает свыше 70 языков (Gong — Revenue AI Platform). Вероятно, русский язык входит в этот список. Однако основная аналитика у Gong все же настроена под англоязычные продажи. Доступность: Gong — только корпоративный продукт; индивидуально им не воспользоваться. Ориентация: большие отделы продаж, службы поддержки. Плюсы: уникальные инсайты (например, «менеджер слишком много говорил — 70% времени, нужно улучшить навык слушания»), интеграция с Salesforce. Минусы: очень высокая цена; слабая применимость вне англоязычных продаж .

Chorus.ai — близкий конкурент Gong. Предлагает схожий набор функций: запись и анализ звонков, автоматическое заполнение CRM, библиотека лучших разговоров для обучения. Русский язык: официально не анонсировался, но возможно частично поддерживается. Вероятно, поддержка частичная или отсутствует – продукт фокусируется на рынке США. В целом, Chorus — это альтернатива Gong с чуть меньшей ценой, но похожими ограничениями для русского пользователя.

Avoma — AI-платформа для управления встречами. Автоматически записывает и транскрибирует созвоны, создаёт конспект с решениями и задачами, может разослать его участникам. Сильна интеграциями: Avoma соединяется с календарями, Google Docs, Slack, HubSpot CRM и др. Поддержка русского: частичная. Ориентация: команды в сфере успеха клиентов, продуктовые команды. Плюсы: сочетание ручных и AI-инструментов, относительно доступная цена. Минусы: меньше фокуса на многоязычности; некоторые функции заточены под английскую речь.

Fireflies / tl;dv / MeetGeek (бизнес-функции) — упомянутые ранее универсальные ассистенты также относятся к комплексным платформам. Например, Fireflies в платном варианте предоставляет API, интеграции с CRM, поддержку рабочих процессов. tl;dv предлагает готовые шаблоны заметок под разные департаменты, что превращает его в платформу повышения эффективности. MeetGeek и Sembly также имеют бизнес-возможности для выгрузки задач в проектные системы и контроль выполнения решений между встречами. Таким образом, граница между «просто ботом» и «AI-платформой» размыта — многие инструменты совмещают функции.

Выводы: Зарубежные комплексные платформы делятся условно на универсальные, которые подходят разным отраслям, дают общие выводы, и нишевые (специализированные) — прежде всего, для продаж. Для русскоязычных пользователей практически все нишевые решения (Gong, Chorus) не принесут полной отдачи — хотя они и могут распознать русскую речь, их «интеллект» заточен под другие языки и реалии. Зато универсальные инструменты (Fireflies, Sembly и др.) достаточно хорошо работают с русским и дают ценность в виде протоколов, саммари, интеграций. По цене: продукты типа Gong — дорогие и доступны только крупным предприятиям; массовые же ассистенты гораздо дешевле или вовсе бесплатны в базовой версии.
Если компании нужен именно глубокий анализ продаж, есть смысл смотреть в сторону международных лидеров (Gong), но придётся мириться с англоязычными интерфейсами и обучить модель на своих русскоязычных данных, что непросто. Если же задача — протоколировать и резюмировать встречи на русском с умеренной аналитикой, оптимально выбрать одного из многоязычных ассистентов и интегрировать его в свои процессы.

Заключение

При выборе AI-агента для расшифровки встреч важно учитывать не только наличие поддержки русского языка, но и конкретные потребности: нужен ли просто текст или же автоматический «протокол» с выводами и задачами? Для получения простой стенограммы можно использовать облачные сервисы транскрибации или встроенные функции Zoom/Teams, но они дают сырые данные. Если требуется сэкономить время на написании отчётов и занесении результатов встречи в системы — стоит присмотреться к специализированным ассистентам. Российские решения обеспечивают лучшую локализацию и соответствие требованиям безопасности, в то время как иностранные часто выигрывают по цене или дополнительным фишкам.

В 2025 году рынок таких AI-агентов весьма насыщен и продолжает развиваться. В частности, появляются гибридные функции, например, перевод + транскрипт, генерация ответов на основе содержания встречи и т. д. При внедрении системы расшифровки в компании стоит провести пилот на нескольких вариантах и сравнить точность распознавания, удобство интеграции в ваш рабочий поток, а также реакцию сотрудников. Грамотно подобранный AI-агент способен повысить прозрачность коммуникаций и сэкономить часы рутины, но подходить к выбору нужно с учётом всех перечисленных нюансов и особенностей каждого решения.

Об авторе

■ Другие статьи по теме Архитектура

Показать еще

■ Другие статьи по теме Интеграция

■ Другие статьи на тему Базы данных

Показать еще

■ Другие статьи на тему User Stories и Use Cases

■ Другие статьи на тему Требований

Показать еще

■ Другие статьи на тему Бизнес-анализ

■ Другие статьи на тему Профессия и трудоустройство

Показать еще

■ Другие статьи на тему Проектное управление

■ Другие статьи на тему Менеджмент и архитектура предприятия

Показать еще

■ Другие статьи на тему Дизайн интерфейсов и исследования