Голосовые сообщения в текст.100+ языков, любой формат оператора.

Загрузите голосовую запись из Google Voice, Twilio, RingCentral или мобильного оператора. Получите временную метку с отформатированными номерами телефонов, автоматическим определением языка — MP3, WAV, OGG или AMR.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Посмотрите, что на выходе

Аудиофайл на входе. Текст для поиска на выходе.

Голосовые сообщения — узкополосное аудио одного говорящего — обычно 8 кГц, часто с уличным шумом или звуками кафе. Мы настраивают распознаватель для коротких телефонных записей, поэтому номера и обратные вызовы действительно распознаются.

voicemail-0427-1142.mp3REC 1 говорящий · 0:38
auto-detected en-US8 кГц моно · μ-law
~90s
Транскрипция · прямая трансляция89% точность
S1

Привет, этоジанет из Westfield Property Management. Звоню по поводу продления договора аренды квартиры на улице Ларкин.

S1

Мы отправили документы во вторник — хотели подтвердить, что вы их получили до 30-го.

S1

Лучший номер для связи со мной — 415-555-0188, добавочный 204.

S1

Спасибо, перезвоните, когда будет время.

89% на 8 кГц моноTXT · DOCX · JSON · SRT

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Три реальные опции · честное сравнение

Google Voice встроенный. YouMail. Или мы.

Google Voice предоставляет бесплатные транскрипции для каждого сообщения — достаточно для общего смысла. YouMail — это приложение визуального голосовой почты для потребителей. Мы обрабатываем экспортированный вами файл — любой оператор, любой формат, с форматированием и экспортом для вставки в CRM.

Option 01

Google Voice / Gmail встроенный

Бесплатная автотранскрипция каждого сообщения Google Voice. Только английский язык и текстовый дамп в одну строку.

ТребуетНомер Google Voice
ЯзыкиТолько английский
Форматирование номеров телефоновВстроенное, часто нарушено
Массовая загрузкаНет — только по сообщениям
ЭкспортТекст письма
СтоимостьБесплатно
Best forОдиночные пользователи Google Voice, которым нужно только грубое англоязычное резюме в папке входящих.
Option 02

Transcription.Solutions

Загрузите WAV, MP3, OGG или AMR. Получите отформатированный текст — любой оператор, любой язык.

ТребуетПросто аудиофайл
Языки100+, автоматическое определение
Форматирование номеров телефоновНормализованный E.164 + местный
Массовая загрузкаЗагрузите папку, выполняется параллельно
ЭкспортTXT · DOCX · JSON · SRT
Стоимость · за мин$0.03
Best forКаждый, кто пакетирует голосовые сообщения с АТС, поддерживает англоязычные абонентов или передает текст в CRM.
Option 03

YouMail

Приложение визуального голосовой почты для потребителей. Полностью заменяет голосовую почту оператора — не инструмент на основе файлов.

ТребуетУсловная переадресация оператора
ЯзыкиПреимущественно английский
Форматирование номеров телефоновТолько Caller ID
Массовая загрузкаНет — только прямая переадресация
ЭкспортВ приложении + по электронной почте
Стоимость$5–18/мес за номер
Best forМобильные пользователи, которые хотят заменить голосовую почту оператора единым почтовым ящиком.

Цены актуальны на май 2026 года. Доступность транскрипций Google Voice зависит от региона и типа учетной записи.

Особенно для голосовых сообщений

Три проблемы универсальных инструментов транскрипции.

Голосовые сообщения — не встреча. Стандартные настройки, которые работают для подкастов, испортят 30-секундный обратный вызов.

Что идет не так

  1. 1Номера телефонов, произнесенные быстро, транскрибируются как слова («четыре один пять пять пять пять ноль один восемь восемь») вместо отформатированных цифр — бесполезно для вставки в CRM.
  2. 2Имена звонящих бормочут один раз в начале. Универсальные модели пропускают написание, и остальная часть сообщения не имеет якоря.
  3. 3AMR / OGG файлы из IP-PBX систем прямо отклоняются инструментами, разработанными для MP4 аудио подкастов.

Что переключить здесь

  1. 1Включите Форматирование номеров телефонов в форме задачи. Мы нормализуем цифры в E.164 (+14155550188) и читаемый местный формат в одной строке.
  2. 2Вставьте вероятные имена звонящих и условия вашей компании в Пользовательский словарь. Даже список из 10 имен резко улуч��ает восстановление собственных имен на коротком аудио.
  3. 3Загрузите файл как есть. Мы принимаем WAV, MP3, OGG, AMR, M4A, FLAC, μ-law, A-law — этап перекодирования не требуется.

Рекомендуемые параметры задачи для голосовых сообщений

Загрузите файл голосового сообщения — эти параметры включаются по умолчанию. Переопределяйте для каждой задачи в форме.

Модель говорящего
Один говорящий · монолог
Профиль аудио
Телефонная 8 кГц узкополосное
Язык
Автоматическое определение · 100+ языков
Номера телефонов
Форматировать как E.164 + местный
Слова-паразиты
Сохранены (тон важен)
Экспорт
TXT · DOCX · JSON (готово для CRM)

Accuracy · real-world numbers

92% при чистом VoIP. Держится и на PSTN медной линии.

Голосовые сообщения — самое сложное аудио, что мы видим — 8 кГц узкополосное, один микрофон, часто с шумом дороги или кафе. Эти цифры из реальных производственных пакетов голосовой почты, а не из тщательно подобранных примеров.

92%
Google Voice / Teams Phone MP3

Широкополосная запись 16 кГц, MP3 на 64 кбит/с+. Спокойный звонящий в помещении. Номера и собственные имена захватываются четко.

89%
Twilio / RingCentral WAV

Стандартная запись VoIP 8 кГц μ-law. Большинство корпоративных голосовых сообщений попадают сюда. Номера телефонов нормализуются правильно.

83%
Mobile carrier OGG / AMR

AMR-NB на 4.75–12.2 кбит/с из IP-PBX или визуального голосового ящика оператора. Артефакты сжатия на сибилянтах и цифрах.

76%
PSTN медная линия, фоновый шум

Старая медная линия, звонящий в машине или по громкой связи. Слова понятны, иногда промахи по номерам и именам.

Часто задаваемые вопросы

8 основных вопросов о транскрипции голосовых сообщений.

01Можете ли вы вытащить голосовые сообщения прямо из Google Voice или Gmail?+
Нет через API — Google не предоставляет голосовые сообщения таким образом. Скачайте MP3 вложение из уведомления по электронной почте или используйте загрузку Google Voice для каждого сообщения. Загрузите файл в нашу панель управления или пакетно загрузите папку.
02Вы поддерживаете AMR файлы из старых IP-PBX систем?+
Да. Работают AMR-NB и AMR-WB, а также WAV (μ-law, A-law, PCM), MP3, OGG, M4A и FLAC. Мы обрабатываем кодек внутри — не нужно сначала перекодировать в WAV.
03Номера телефонов в сообщении будут отформатированы правильно?+
Да, если Форматирование номеров телефонов включено. Мы обнаруживаем произнесенные цифры и выводим как E.164 (+14155550188), так и читаемый местный формат в одной строке. Работает в 40+ странах с разными соглашениями о номерации.
04Как вы обрабатываете очень короткие сообщения — менее 10 секунд?+
Отлично. Нет минимальной длины. Сообщения менее 10 секунд оплачиваются при минимуме 6 секунд ($0.003 за файл). Точность держится потому, что модель не ждет контекста — голосовое сообщение это монолог, а не разговор.
05Что насчет испанского или многоязычных голосовых сообщений?+
Автоопределение работает на 100+ языках и выбирает доминирующий. Для голосовых сообщений, которые переключаются в середине сообщения (англоязычное приветствие, испанский текст), включите многоязычный режим — мы транскрибируем оба сегмента на их собственном языке без принуждения одному.
06Можем ли я массово загрузить 200 голосовых сообщений сразу?+
Да. Перетащите папку на панель управления или ОТПРАВЬТЕ на наш пакетный endpoint. Задачи выполняются параллельно, вы получаете CSV индекс с названием файла, языком, длительностью и ссылкой на каждую транскрипцию. Без дополнительной платы за пакет.
07Можны ли транскрипции отправляться прямо в HubSpot или Salesforce?+
Мы еще не поставляем прямой коннектор CRM. Экспорт JSON включает Caller ID (если вы передадите его в метаданных), отформатированные номера телефонов и полную транскрипцию — большинство команд передают это через Zapier или 20-строчный скрипт в запись контакта в их CRM.
08Голосовые сообщения часто содержат PII или медицинскую информацию — как вы это обрабатываете?+
Исходное аудио окончательно удаляется в течение 24 часов. Транскрипции остаются в вашей панели управления до тех пор, пока вы их не удалите. Мы сегодня не являемся ассоциированным лицом HIPAA — если вам нужно подписанное соглашение BAA, обсудите это с нами перед загрузкой PHI.

Загрузите файл голосового сообщения. Посмотрите, что получится.

30 бесплатных минут каждый месяц. Без карты. Форматирование номеров телефонов, 100+ языков, все экспорты включены.

Начать бесплатно