Транскрипция для учёных-исследователей.IRB-совместима, готова к CAQDAS, 100+ языков.

Загрузите научное интервью или запись фокус-группы. Получите текст с метками участников и временными отметками, готовый для NVivo, Atlas.ti или MaxQDA — аудио удалится за 24 часа.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Смотрите, что получается

Запись с места. Текст, готовый к кодированию.

Мы отмечаем каждый ход участника временной меткой в начале, сохраняем слова-паразиты, если вы просите дословный режим, и экспортируем DOCX со стилями говорящих, которые ваш CAQDAS-инструмент сразу распознаёт.

Полуструктурированное интервью · .wavREC 2 говорящих · 1:08:24
автоопределение en-GB44.1 кГц, моно · петличный микрофон
~90s
Транскрипт · потоковая передача94% точность · дословный режим
S1

Расскажите, когда вы впервые заметили изменения в районе?

S2

М, наверное, в 2019 — пекарня на углу закрылась, и вот тогда до меня дошло.

S1

И как это было — наблюдать, как это менялось месяц за месяцем?

S2

Честно? Как будто место, которое я знал тридцать лет, исчезало кусочек за кусочком.

94% на петличной интервьюDOCX (CAQDAS) · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Три реальных варианта · честное сравнение

Rev с человеком. NVivo Transcription. Или мы.

Rev с человеком — исторический стандарт для цитат на уровне диссертации. NVivo встраивает AI-транскрипцию прямо в CAQDAS-инструмент. Мы располагаемся между ними — быстрее, чем Rev, точнее и IRB-дружественнее, чем встроенный сервис NVivo.

Option 01

Rev (человеческая транскрипция)

Люди печатают вручную. Медленно, дорого, но золотой стандарт для опубликуемого дословного текста.

Время выполнения12–24 часа (типично)
Стоимость · за минуту$1.50 человек / $0.25 AI
Метки говорящихДа, размеченные вручную
Хранение аудиоНа серверах Rev
ЯзыкиEN человек · ~30 AI
Экспорт CAQDASDOCX, TXT (вручную)
Best forЕдиничные критические интервью, предназначенные для прямого цитирования в статье, где бюджет не ограничивает.
Option 02

Transcription.Solutions

AI-транскрипт за минуты, аудио удаляется за 24 часа, DOCX стилизован для импорта в NVivo и Atlas.ti.

Время выполнения~5 мин для 60-минутного файла
Стоимость · за минуту$0.03
Метки говорящихДиаризованы, переименовать в приложении
Хранение аудиоУдаляется в течение 24 часов
Языки100+, автоопределение
Экспорт CAQDASDOCX стили заголовков + TXT
Best forИсследователи, проводящие 20+ интервью, нуждающиеся в быстрых черновиках, затем ручная проверка 5% цитат для публикации.
Option 03

NVivo Transcription / Otter

AI-транскрипция встроена в CAQDAS-инструмент или заметник. Удобно, ориентировано на английский, меньше контроля.

Время выполненияСопоставимо (AI)
СтоимостьКредитные пакеты · ~$0.30/мин
Метки говорящихАкустические, разработано для EN
Хранение аудиоПривязано к подписке
ЯзыкиТочность non-EN снижается
Экспорт CAQDASВстроена только в NVivo
Best forСтуденты PhD, работающие на английском в одной CAQDAS-экосистеме, которым нужен один счёт.

Цены и возможности актуальны на 2026 год. Разделение Rev на AI/человека и цены кредитов NVivo варьируются по регионам и академическим лицензиям.

Специфично для качественного исследования

Три проблемы исследователей с универсальными инструментами транскрибирования.

Включите нужные параметры перед загрузкой — и транскрипт импортируется прямо в ваш CAQDAS-проект.

Что идёт не так

  1. 1Слова-паразиты удаляются молча. Универсальный AI стирает «м», «типа», ложные начала — нормально для заметок совещания, смертельно для анализа разговора или дискурс-анализа.
  2. 2Терминология предметной области (теоретические рамки, названия препаратов, топонимы, термины родства) транскрибируется фонетически. При кодировании нужен проход поиска и замены.
  3. 3Аудио лежит на серверах поставщика неопределённо долго. Большинство IRB-планов требуют удаления или контролируемого хранения — поставщики редко это чётко документируют.

Что переключить здесь

  1. 1Включите режим Дословность в форме задания. Мы сохраняем паразиты, ложные начала, повторения и смеховые маркеры — режим очистки — это opt-in, не стандарт для исследователей.
  2. 2Вставьте свои термины кодовой книги и имена собственные в пользовательский словарь. Мы передаём это как подсказку распознавателю, не жёсткую замену — контекст всё ещё побеждает.
  3. 3Аудио удаляется в течение 24 часов после завершения задания. Транскрипт остаётся в аккаунте. Мы выдадим подтверждение удаления для вашего IRB-файла по запросу.

Рекомендуемые параметры для исследовательских интервью

Загрузите полевую запись — эти параметры включены по умолчанию. Переопределяйте в форме для каждого задания.

Режим
Дословность (паразиты + ложные начала включены)
Модель говорящего
Интервью · 2–8 говорящих
Язык
Автоопределение · толерантна к акцентам
Временные метки
На каждый ход участника
Хранение ауди��
Удалить в течение 24 часов
Экспорт
DOCX (стили CAQDAS) · TXT · SRT

Accuracy · real-world numbers

94% на чистой петличной записи. Честно о том, что ломает полевую работу.

Полевое аудио — сложная категория в транскрипции — открытые помещения, акцентированный английский, перекрывающаяся речь в фокус-группах. Диадические интервью с петличным микрофоном достигают потолка; звукозаписи в окружающей среде и большие фокус-группы ухудшаются быстрее. Данные ниже — из реальных загрузок исследователей, не из синтетических эталонов.

95%
1-на-1, петличный или USB-микрофон

Тихая комната, один L2 или носитель языка, рекордер на столе. Лучший сценарий для полуструктурированных интервью — большинство диадических исследований попадают сюда.

91%
Портативный рекордер, 2–3 говорящих

Zoom H4n или диктофон посередине стола. Позиции стульев определены по направлению. План: 5 минут прохода переименования.

85%
Полевое интервью, окружающий шум

Кафе, рынок, прогулочное интервью. Фоновые разговоры и шум влияют на короткие ответы; основные реплики остаются кодируемыми.

80%
Фокус-группа, 5–8 участников

Перекрывающаяся речь и общий микрофон. Диаризация объединит несколько тихих голосов — уточнение в процессе кодирования.

Частые вопросы

8 вопросов исследователей об академической транскрипции.

01Это приемлемо по стандартному IRB-плану управления данными?+
Большинство планов, которые мы видели, одобряют нас, прочитав два факта: аудио удаляется в течение 24 часов после завершения, и транскрипты остаются только в аккаунте исследователя. Мы не сами IRB — окончательное решение за вашей комиссией — но выдадим письменное описание обработки для вашего протокола по запросу.
02Вы сохраняете моё интервью?+
Нет. Аудиофайл удаляется в течение 24 часов после завершения задания. Остаётся только транскрипт в аккаунте — вы можете удалить его в любой момент. Мы не используем исследовательское аудио для обучения моделей.
03Делаете ли вы настоящую дословность — с паразитами, ложными началами и перекрытиями — для анализа разговора?+
Да. Включите режим Дословность в форме задания — мы сохраняем «м», «э», повторения, ложные начала и смеховые маркеры. Перекрытие отмечается символом скобки на границе хода. Нотацию Джефферсона мы не делаем автоматически — это требует человеческого прохода.
04Импортируется ли DOCX чисто в NVivo, Atlas.ti или MaxQDA?+
Да. Наш DOCX использует стили заголовков и говорящих, которые ожидает каждый инструмент для автокодирования по говорящему. В NVivo: File → Import → Transcripts. В Atlas.ti и MaxQDA структура говорящего-параграфа сохраняется, поэтому автокодирование по говорящему работает сразу.
05Как это обрабатывает акцентированный английский или многоязычные интервью?+
Поддерживаем 100+ языков с автоопределением, включая переключение кода внутри одной записи. Тяжелые L2-акценты дают 85–90% на чистом аудио. Для языков меньшинств с редкими данными обучения (некоторые африканские и коренные языки) точность ниже — об этом говорим в выборе языка.
06Фокус-группы с 6–8 участниками — диаризация де��ствительно работает?+
Отчасти. Акустическая диаризация надёжно разделяет 4–5 различных голосов на общем микрофоне. Дальше модель обычно объединяет двух самых тихих участников. Исправление — проход переименования в редакторе транскрипта. Большинство фокус-групп требуют 10–15 минут очистки.
07Могут ли мой соруководитель и аспиранты получить доступ к транскриптам в одном проекте?+
Да. Рабочие пространства поддерживают общие папки с разрешениями на уровне пользователя — PI видит все интервью, ассистенты видят только назначенную им когорту. Полезно для многоцентровых исследований, когда вы не хотите, чтобы один студент экспортировал данные другого.
08Для прямых цитат для публикации, предлагаете ли вы проверку человеком?+
Пока нет, и мы не будем делать вид. Для цитат в диссертацию или статью: запустите AI-транскрипт первым, кодируйте в CAQDAS-инструменте, затем ручная проверка конкретных 30–60 секунд вокруг каждой цитаты против аудио перед удалением. Это рабочий процесс большинства наших пользователей-исследователей.

Загрузите одно интервью. Посмотрите, кодируется ли текст так, как вы кодировали бы.

30 бесплатных минут каждый месяц. Без карты. Дословный режим, 100+ языков, готовый к CAQDAS DOCX, аудио удаляется в течение 24 часов.

Начать бесплатно