Транскрибируйте аудиофайлы до 10 часов — длинное аудио в текст без таймаутов

Транскрибируйте длинные аудиофайлы.До 10 часов. Без таймаутов.

Загрузите длинный аудиофайл — до 10 часов, 5 ГБ на Business. Мы разбиваем параллельно, сохраняем идентификаторы докладчиков согласованными от начала до конца и возвращаем один транскрипт вместо нумерованной папки.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Часы работают. На выходе — один чистый файл.

Большинство инструментов теряют время примерно на отметке 90 минут или разбивают вашу длинную запись на нумерованные части, которые вы склеиваете сами. Мы разбиваем на 12-минутные перекрывающиеся окна, обрабатываем их параллельно и собираем заново с глобальным проходом по докладчикам.

Заседание совета по стратегииREC 3 докладчика · 5:14:22 · 3.1 GB

auto-detected en-GB44.1 kHz stereo · 192 kbps

~90s

Транскрипт · один файл92% точности · t=3:14:08

Мы уже три часа работаем — давайте вернемся к вопросу цепочки поставок из утренней сессии.

Согласен, сдвиг производства во Вьетнам. Думаю, мы вскользь рассмотрели риск сроков доставки.

Сроки доставки выросли с 14 до 31 дня после изменения тарифов.

И это еще без учета перегруза в порту Long Beach.

92% по всему файлу 5чDOCX · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Otter Pro. Самостоятельное разбиение Whisper. Или мы.

Потребительские инструменты ограничивают длину файла и молчаливо усекают. Whisper API имеет потолок в 25 МБ за запрос, поэтому вы сами строите разбиватель. Мы принимаем весь файл на 10 часов и возвращаем один транскрипт.

Option 01

Otter Pro

Ограничивает длинные файлы на 4 часа за запись. Метки докладчиков смещаются после 2-часовой отметки.

Макс. длина файла4 часа (уровень Pro)

Макс. размер файла~1.5 GB загрузка

ID докладчиков от начала до концаСмещаются после 2 часов

Выход длинного файлаОдин документ, обрезан на лимите

Стоимость$16.99/пользователь/месяц

Возобновляемая загрузкаНет

Best forКороткие встречи до 2 часов. На пассивирует на записях длиной в день.

Option 02

Transcription.Solutions

10 часов per file. Параллельное разбиение, глобальный проход по докладчикам, один DOCX на выходе.

Макс. длина файла10 часов (Pro & Business)

Макс. размер файла2 GB Pro · 5 GB Business

ID докладчиков от начала до концаГлобальный проход embedding

Выход длинного файлаОдин файл · DOCX/SRT/TXT

Стоимость за минуту$0.03 flat независимо от длины

Возобновляемая загрузкаMultipart, переживает разрывы

Best forПолнодневные воркшопы, показания, встречи совета, устные истории — все, что после 90-минутного потолка.

Option 03

Whisper API + самостоятельное разбиение

Дешевле за минуту. Вы строите разбиватель, склейку докладчиков и логику повторных попыток.

Макс. длина файла25 MB за запрос (~25 мин)

Макс. размер файла25 MB жесткий лимит

ID докла��чиков от начала до концаОтсутствуют — нет диаризации

Выход длинного файлаНумерованные части, вы склеиваете

Стоимость за минуту$0.006 (OpenAI Whisper)

Время инженерииЧасы-дни на конвейер

Best forИнженеры, которые хотят сырой текст за chunk и не нуждаются в докладчиках, резюме или едином выходе.

Цены и лимиты актуальны на май 2026. Лимит длины Otter Pro последний раз проверялся на их публично доступной странице цен.

92% держится на протяжении всего 5-часового файла. Качество остается ровным час за часом.

Сложность с длинным аудио не в модели — это удержание точности от минуты 1 до минуты 600. Смещение докладчиков и ошибки на границах фрагментов — вот что убивает большинство конвейеров. Числа ниже измерены на полных файлах реальных клиентов, а не на первых 10 минутах.

8 вещей, которые люди спрашивают о транскрибировании длинного аудио.

01Какой реальный лимит длины и размера файла?+

10 часов per file на обоих Pro и Business. Pro ограничивает размер файла на 2 GB, Business — на 5 GB. Если у вас есть что-либо длиннее 10 часов, разбейте один раз на ес��ественный разрыв — мы удержим ID докладчиков согласованными, если вы загрузите их обратно друг за другом в одном проекте.

02Я получаю один транскрипт или папку нумерованных частей?+

Один файл. Всегда. DOCX, SRT, TXT или JSON — на ваш выбор. Временные коды работают непрерывно от 00:00:00 до конца записи, не сбрасываются на каждой границе фрагмента.

03Как долго 6-часовой файл возвращается?+

Примерно 18-25 минут на очереди Pro, 8-12 на приоритете Business. Мы обрабатываем 12-минутные фрагменты параллельно, поэтому реальное время масштабируется sub-linearly с длиной файла, не minute-for-minute.

04ID докладчиков остаются согласованными от начала до конца?+

Да. После диаризации per-chunk глобальный проход embedding кластеризует голоса по всему файлу. Докладчик 3 на минуте 12 — это один и тот же Докладчик 3 на минуте 487. Это главное, что DIY Whisper конвейеры делают неправильно.

05Что происходит, если моя загрузка разрывается на час 3 из 4 GB файла?+

Возобновляемая multipart загрузка возобновляет с последнего завершенного части. Вы не переза грружаете первые 3 GB. Работает на шаткой отельной Wi-Fi и на тетеринге сотовой сети — мы проверили оба.

06Почему Whisper API задыхается на длинных файлах?+

Конечная точка OpenAI Whisper имеет жесткий лимит 25 MB за запрос — примерно 25 минут сжатого аудио. Все, что длиннее, требует от вас разбиения, транскрибирования параллельно, затем склейки транскриптов и выравнивания докладчиков самостоятельно. Мы делаем все это server-side.

07Цена per-minute одинакова на 10-часовом файле, что и на 10-минутном?+

Да. $0.03 за минуту flat, независимо от длины. 10-часовой файл стоит $18. Мы не по взимаем длинные файлы так же, как Rev ($1.50/min human × 10 часов = $900).

08Я могу получить маркеры глав или полные временные нотации каждый час?+

Включите 'Hour markers' в форме задачи и DOCX экспортируется с разрывом heading каждые 60 минут. SRT сохраняет непрерывный timecode. JSON имеет оба — массив глав плюс word-level временные метки.