Транскрибируйте длинные аудиофайлы.До 10 часов. Без таймаутов.

Загрузите длинный аудиофайл — до 10 часов, 5 ГБ на Business. Мы разбиваем параллельно, сохраняем идентификаторы докладчиков согласованными от начала до конца и возвращаем один транскрипт вместо нумерованной папки.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Файл на 5 часов, середина транскрипта

Часы работают. На выходе — один чистый файл.

Большинство инструментов теряют время примерно на отметке 90 минут или разбивают вашу длинную запись на нумерованные части, которые вы склеиваете сами. Мы разбиваем на 12-минутные перекрывающиеся окна, обрабатываем их параллельно и собираем заново с глобальным проходом по докладчикам.

Заседание совета по стратегииREC 3 докладчика · 5:14:22 · 3.1 GB
auto-detected en-GB44.1 kHz stereo · 192 kbps
~90s
Транскрипт · один файл92% точности · t=3:14:08
S1

Мы уже три часа работаем — давайте вернемся к вопросу цепочки поставок из утренней сессии.

S2

Согласен, сдвиг производства во Вьетнам. Думаю, мы вскользь рассмотрели риск сроков доставки.

S1

Сроки доставки выросли с 14 до 31 дня после изменения тарифов.

S3

И это еще без учета перегруза в порту Long Beach.

92% по всему файлу 5чDOCX · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Три реальных варианта · честное сравнение

Otter Pro. Самостоятельное разбиение Whisper. Или мы.

Потребительские инструменты ограничивают длину файла и молчаливо усекают. Whisper API имеет потолок в 25 МБ за запрос, поэтому вы сами строите разбиватель. Мы принимаем весь файл на 10 часов и возвращаем один транскрипт.

Option 01

Otter Pro

Ограничивает длинные файлы на 4 часа за запись. Метки докладчиков смещаются после 2-часовой отметки.

Макс. длина файла4 часа (уровень Pro)
Макс. размер файла~1.5 GB загрузка
ID докладчиков от начала до концаСмещаются после 2 часов
Выход длинного файлаОдин документ, обрезан на лимите
Стоимость$16.99/пользователь/месяц
Возобновляемая загрузкаНет
Best forКороткие встречи до 2 часов. На пассивирует на записях длиной в день.
Option 02

Transcription.Solutions

10 часов per file. Параллельное разбиение, глобальный проход по докладчикам, один DOCX на выходе.

Макс. длина файла10 часов (Pro & Business)
Макс. размер файла2 GB Pro · 5 GB Business
ID докладчиков от начала до концаГлобальный проход embedding
Выход длинного файлаОдин файл · DOCX/SRT/TXT
Стоимость за минуту$0.03 flat независимо от длины
Возобновляемая загрузкаMultipart, переживает разрывы
Best forПолнодневные воркшопы, показания, встречи совета, устные истории — все, что после 90-минутного потолка.
Option 03

Whisper API + самостоятельное разбиение

Дешевле за минуту. Вы строите разбиватель, склейку докладчиков и логику повторных попыток.

Макс. длина файла25 MB за запрос (~25 мин)
Макс. размер файла25 MB жесткий лимит
ID докла��чиков от начала до концаОтсутствуют — нет диаризации
Выход длинного файлаНумерованные части, вы склеиваете
Стоимость за минуту$0.006 (OpenAI Whisper)
Время инженерииЧасы-дни на конвейер
Best forИнженеры, которые хотят сырой текст за chunk и не нуждаются в докладчиках, резюме или едином выходе.

Цены и лимиты актуальны на май 2026. Лимит длины Otter Pro последний раз проверялся на их публично доступной странице цен.

Специфично для д��инных файлов

Три способа, как универсальные инструменты отказывают после 90 минут.

Большинство конвейеров были построены для одночасовых встреч. Длинное аудио ломает их предсказуемым образом — вот что мы делаем иначе.

Что идет не так

  1. 1Молчаливый таймаут на 90 минут. Задача вращается час, затем падает без полезной ошибки. У вас нет ничего для повторной попытки.
  2. 2ID докладчиков смещаются между фрагментами. Докладчик 1 на час 1 становится Докладчиком 4 на час 3, потому что каждый фрагмент диаризируется в изоляции.
  3. 3Выход — нумерованная папка. `transcript_part_01.txt` через `transcript_part_24.txt` с сбросом временно меток на каждой границе фрагмента. Вы склеиваете сами.

Что переключить здесь

  1. 1Возобновляемая multipart загрузка. Соединение разрывается на час 2 загрузки? Возобновляется с последнего завершенного части. Без re-upload 4 GB.
  2. 2Глобальный проход embedding по докл��дчикам. После диаризации per-chunk мы кластеризуем голоса по всему файлу, поэтому Докладчик 3 — это один и тот же человек на минуте 12 и минуте 487.
  3. 3Один DOCX с почасовыми маркерами. Один файл, непрерывные временные коды, опциональный разрыв главы каждые 60 минут. Без склейки.

Рекомендуемые параметры задачи для длинных файлов

Загрузите что-либо свыше 90 минут и эти параметры включаются автоматически. Переопределите per-job из формы.

Стратегия разбиения
12 мин окна · 10s перекрытие
Диаризация
Глобальный проход по всем фрагментам
Модель докладчика
Длинное пояснение · 2-20 докладчиков
Загрузка
Возобновляемая multipart
Очередь
Приоритет (план Business)
Экспорт
Один DOCX · почасовые маркеры включены

Accuracy · real-world numbers

92% держится на протяжении всего 5-часового файла. Качество остается ровным час за часом.

Сложность с длинным аудио не в модели — это удержание точности от минуты 1 до минуты 600. Смещение докладчиков и ошибки на границах фрагментов — вот что убивает большинство конвейеров. Числа ниже измерены на полных файлах реальных клиентов, а не на первых 10 минутах.

95%
Студийное длинное пояснение, один докладчик

Аудиокнига, объяснил, соло-подкаст, диктофон рукопись. 6-10 часов чистого голоса без шума помещения. Диаризация не требуется.

92%
Переговорная, 2-6 докладчиков

Конференц-стол, приличный микрофон, 3-5 часов. Глобальный проход по докладчикам удерживает ID стабильными по всему файлу.

88%
Полнодневный воркшоп, петличные микрофоны

7-9-часовой день обучения с подачей микрофона и вопросами из аудитории. Имена нуждаются в 5-минутном проходе по докладчику.

82%
Полевой круглый стол, 8+ докладчиков

Длинная устная история, focus group или панель с перекрывающимися голосами и фоновым шумом. Годится, но ожидайте очистки.

Частые вопросы

8 вещей, которые люди спрашивают о транскрибировании длинного аудио.

01Какой реальный лимит длины и размера файла?+
10 часов per file на обоих Pro и Business. Pro ограничивает размер файла на 2 GB, Business — на 5 GB. Если у вас есть что-либо длиннее 10 часов, разбейте один раз на ес��ественный разрыв — мы удержим ID докладчиков согласованными, если вы загрузите их обратно друг за другом в одном проекте.
02Я получаю один транскрипт или папку нумерованных частей?+
Один файл. Всегда. DOCX, SRT, TXT или JSON — на ваш выбор. Временные коды работают непрерывно от 00:00:00 до конца записи, не сбрасываются на каждой границе фрагмента.
03Как долго 6-часовой файл возвращается?+
Примерно 18-25 минут на очереди Pro, 8-12 на приоритете Business. Мы обрабатываем 12-минутные фрагменты параллельно, поэтому реальное время масштабируется sub-linearly с длиной файла, не minute-for-minute.
04ID докладчиков остаются согласованными от начала до конца?+
Да. После диаризации per-chunk глобальный проход embedding кластеризует голоса по всему файлу. Докладчик 3 на минуте 12 — это один и тот же Докладчик 3 на минуте 487. Это главное, что DIY Whisper конвейеры делают неправильно.
05Что происходит, если моя загрузка разрывается на час 3 из 4 GB файла?+
Возобновляемая multipart загрузка возобновляет с последнего завершенного части. Вы не переза грружаете первые 3 GB. Работает на шаткой отельной Wi-Fi и на тетеринге сотовой сети — мы проверили оба.
06Почему Whisper API задыхается на длинных файлах?+
Конечная точка OpenAI Whisper имеет жесткий лимит 25 MB за запрос — примерно 25 минут сжатого аудио. Все, что длиннее, требует от вас разбиения, транскрибирования параллельно, затем склейки транскриптов и выравнивания докладчиков самостоятельно. Мы делаем все это server-side.
07Цена per-minute одинакова на 10-часовом файле, что и на 10-минутном?+
Да. $0.03 за минуту flat, независимо от длины. 10-часовой файл стоит $18. Мы не по взимаем длинные файлы так же, как Rev ($1.50/min human × 10 часов = $900).
08Я могу получить маркеры глав или полные временные нотации каждый час?+
Включите 'Hour markers' в форме задачи и DOCX экспортируется с разрывом heading каждые 60 минут. SRT сохраняет непрерывный timecode. JSON имеет оба — массив глав плюс word-level временные метки.

Загрузите ваш длинный файл. Получите один транскрипт обратно.

30 бесплатных минут каждый месяц. Без карты. Файлы до 10 часов, метки докладчиков, которые остаются согласованными, экспорт в один файл.

Начать бесплатно