Транскрибирование фокус-групп — дословная расшифровка фокус-групп с указанием каждого участника

Транскрибирование фокус-групп.Каждый говорящий помечен, каждое слово.

Загрузьте запись фокус-группы с 6, 8 или даже 10 голосами. Получите дословный транскрипт с каждым участником помеченным, перекрытием речи помеченным, и DOCX, который загружается прямо в NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Восемь участников — на входе. Помеченный дословный — на выходе.

Фокус-группы — самый сложный случай распределения ораторов в нашей очереди — похожая демография, похожие голоса, частое перекрытие речи. Мы помечаем перекрытие внутри строки вместо того, чтобы отбросить его, затем вы переименуете Говорящего 3 → 'Участник_F2' один раз и это распространится.

Запись фокус-группыREC Модератор + 7 участников · 1:23:14

автоматически определено en-USмикрофон границы 44 кГц · WAV

~90s

Транскрипт · потоковыйТочность 91% · 8 говорящих

Итак, когда вы впервые открыли упаковку — расскажите мне, что вы заметили.

Честно? Первое был запах. Как больница, что ли клиническо —

Да, то же самое. Я думал, это должна быть лаванда.

Верно, и ярлык говорит лаванда, но это действительно не —

91% на микрофоне комнаты с 8 говорящимиDOCX (готово к QDA) · SRT · TXT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev человеческий. Стандартный AI. Или мы.

Исследователи обычно выбирают между оплатой человеческого транскрибера (медленно, точно, дорого) или запуском файла через стандартный инструмент AI, который не был создан для комнат с 8 голосами. Мы сидим посередине — скорость AI, распределение ораторов настроено для исследовательских записей, и DOCX, который загружается в NVivo без переделок.

Option 01

Rev человеческий дословный

Человек печатает это. Высокая точность, но 24-часовой оборот и цена масштабируется линейно с часами.

Точность~99% (человеческий)

Время выполненияОбычно 12–24 часа

Перекрытие речиПомечено [перекрытие]

Экспорт QDADOCX, ручная очистка

Стоимость · за минуту$1.50 дословный

Группа из 90 минут~$135

Best forДиссертационная работа или нормативные исследования, где каждая дисфлюентность должна быть проверена человеком.

Option 02

Transcription.Solutions

Распределение ораторов настроено для 6-10 голосов, перекрытие речи помечено в строке, экспорт DOCX размером для NVivo, ATLAS.ti и Dedoose.

Точность88–94% на групповом аудио

Время выполнения~1× в реальном времени

Перекрытие речиПомечено, не отброшено

Экспорт QDADOCX с репликами говорящих

Стоимость · за минуту$0.03

Группа из 90 минут~$2.70

Best forИсследователи, проводящие несколько групп, которым нужен первый проход транскрипта в NVivo завтра с утра, а не на следующей неделе.

Option 03

Otter / Sonix

Стандартный AI, созданный для встреч. Приемлемо на 2-3 говорящих, разваливается свыше 5 — и экспорты не предусматривают программное обеспечение QDA.

ТочностьПадает свыше 5 говорящих

Время выполненияБыстро

Перекрытие речиЧасто отброшено

Экспорт QDAНет встроенного формата NVivo

Предел говорящихМягкий предел ~6

Стоимость$17–22/пользователь/месяц

Best forНебольшие интервью и 1-на-1, где запись имеет 2-3 голоса и находится в рабочем процессе календаря.

Цены точны на май 2026 года. Диапазоны точности поступают из нашего внутреннего образца файлов фокус-групп клиентов, а не из синтетических тестов.

94% на петличный микрофон на участника. Держится на 82% на одном микрофоне комнаты.

Точность фокус-группы ограничена топологией микрофона, а не моделью. Петличный микрофон на каждом участнике дает нам чистые каналы на одного говорящего — распределение ораторов становится тривиальным. Один микрофон на границе на столе конференции с 8 голосами — это сложный случай. Цифры ниже поступают из реальных записей исследований в нашем конвейере.

8 вещей, которые люди спрашивают о транскрибировании фокус-групп.

01Могу ли я переименовать Говорящего 1 на фактическое имя участника или ID?+

Да. Нажмите на любой чип говорящего в редакторе, введите имя или ID проверки (например 'P04_F_34'), и он распространяется на каждую реплику этого говорящего в транскрипте. Экспорт DOCX использует переименованные метки.

02Как вы обрабатываете перекрытие речи и перекрывающуюся речь?+

Мы помечаем это встроенными маркерами `[перекрытие]` и сохраняем высказывания обоих говорящих в транскрипте. Стандартные инструменты обычно выбирают один голос и отбрасывают другой — мы этого не делаем, потому что моменты перекрытия часто являются тем местом, где живут реальная динамика фокус-групп.

03Действительно ли DOCX чисто импортируется в NVivo и ATLAS.ti?+

Да. Мы экспортируем с метками говорящих как заголовки в стиле абзацев, которые NVivo автокодирует при импорте, и ATLAS.ti распознает как реплики говорящих. Dedoose принимает тот же DOCX через путь импорта транскрипта.

04Сколько говорящих вы можете распределить в один файл?+

Мягкий предел около 12. Свыше этого, акустическая кластеризация начинает объединять похожие голоса — что обычно означает 10-15 минутный проход переименования с вашей стороны. Установите 'Ожидаемые говорящие' явно в форме работы для лучших результатов.

05Дословно или очищено — могу ли я выбрать?+

Обе. Режим дословности сохраняет каждый 'ммм', ложное начало и повторяющееся слово для анализа дискурса. Очищенный удаляет дисфлюентности для читаемости. Вы выбираете за работу; по умолчанию для шаблона исследования является дословный.

06Что насчет требований IRB и конфиденциальности участников?+

Файлы обрабатываются в нашей инфраструктуре, не отправляются в API третьих сторон. Мы предлагаем флаг автоматического удаления после N дней за работу для протоколов IRB. Мы соответствуем SOC 2 Type II и GDPR; DPA находится на странице лицензии, если ваш IRB этого требует.

07Должен ли я записывать видео или только аудиозапись?+

Только аудиозапись в порядке — мы не используем видео для распределения ораторов. Если у вас есть видео для идентификации участников, сохраняйте его локально для собственного кодирования; загрузка только аудиодорожки быстрее и дешевле.

08Как стоимость сравнивается с Rev человеческой дословностью?+

Фокус-группа из 90 минут стоит около $2.70 здесь против примерно $135 на Rev дословный. Компромисс — это точность: мы приземляемся на 86-94% в зависимости от установки микрофона, человеческие транскрибры Rev достигают ~99%. Большинство исследователей используют нас для первого прохода и только повышают специфические группы до человека, если это необходимо.