Транскрибирование фокус-групп.Каждый говорящий помечен, каждое слово.

Загрузьте запись фокус-группы с 6, 8 или даже 10 голосами. Получите дословный транскрипт с каждым участником помеченным, перекрытием речи помеченным, и DOCX, который загружается прямо в NVivo.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Посмотрите, что получается

Восемь участников — на входе. Помеченный дословный — на выходе.

Фокус-группы — самый сложный случай распределения ораторов в нашей очереди — похожая демография, похожие голоса, частое перекрытие речи. Мы помечаем перекрытие внутри строки вместо того, чтобы отбросить его, затем вы переименуете Говорящего 3 → 'Участник_F2' один раз и это распространится.

Запись фокус-группыREC Модератор + 7 участников · 1:23:14
автоматически определено en-USмикрофон границы 44 кГц · WAV
~90s
Транскрипт · потоковыйТочность 91% · 8 говорящих
S1

Итак, когда вы впервые открыли упаковку — расскажите мне, что вы заметили.

S2

Честно? Первое был запах. Как больница, что ли клиническо —

S3

Да, то же самое. Я думал, это должна быть лаванда.

S2

Верно, и ярлык говорит лаванда, но это действительно не —

91% на микрофоне комнаты с 8 говорящимиDOCX (готово к QDA) · SRT · TXT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Три реальных варианта · честное сравнение

Rev человеческий. Стандартный AI. Или мы.

Исследователи обычно выбирают между оплатой человеческого транскрибера (медленно, точно, дорого) или запуском файла через стандартный инструмент AI, который не был создан для комнат с 8 голосами. Мы сидим посередине — скорость AI, распределение ораторов настроено для исследовательских записей, и DOCX, который загружается в NVivo без переделок.

Option 01

Rev человеческий дословный

Человек печатает это. Высокая точность, но 24-часовой оборот и цена масштабируется линейно с часами.

Точность~99% (человеческий)
Время выполненияОбычно 12–24 часа
Перекрытие речиПомечено [перекрытие]
Экспорт QDADOCX, ручная очистка
Стоимость · за минуту$1.50 дословный
Группа из 90 минут~$135
Best forДиссертационная работа или нормативные исследования, где каждая дисфлюентность должна быть проверена человеком.
Option 02

Transcription.Solutions

Распределение ораторов настроено для 6-10 голосов, перекрытие речи помечено в строке, экспорт DOCX размером для NVivo, ATLAS.ti и Dedoose.

Точность88–94% на групповом аудио
Время выполнения~1× в реальном времени
Перекрытие речиПомечено, не отброшено
Экспорт QDADOCX с репликами говорящих
Стоимость · за минуту$0.03
Группа из 90 минут~$2.70
Best forИсследователи, проводящие несколько групп, которым нужен первый проход транскрипта в NVivo завтра с утра, а не на следующей неделе.
Option 03

Otter / Sonix

Стандартный AI, созданный для встреч. Приемлемо на 2-3 говорящих, разваливается свыше 5 — и экспорты не предусматривают программное обеспечение QDA.

ТочностьПадает свыше 5 говорящих
Время выполненияБыстро
Перекрытие речиЧасто отброшено
Экспорт QDAНет встроенного формата NVivo
Предел говорящихМягкий предел ~6
Стоимость$17–22/пользователь/месяц
Best forНебольшие интервью и 1-на-1, где запись имеет 2-3 голоса и находится в рабочем процессе календаря.

Цены точны на май 2026 года. Диапазоны точности поступают из нашего внутреннего образца файлов фокус-групп клиентов, а не из синтетических тестов.

Специфично для фокус-групп

Три вещи, которые кусают исследователей на обычных инструментах AI.

Переключите правильные параметры в начале, и транскрипт загружается в NVivo без выходного дня очистки.

Что идет не так

  1. 1Перекрытие речи отбрасывается. Большинство потребительских инструментов выбирают одного говорящего во время перекрытия и отбрасывают остальные. Вы теряете ровно те моменты, где происходит консенсус или возражение.
  2. 2Говорящие сворачиваются в 3. Инструменты предполагают комнаты размером встреч и ограничивают кластеры распределения ораторов низко. Ваши восемь участников возвращаются как 'Говорящий 1' / 'Говорящий 2' / 'Говорящий 3'.
  3. 3Экспорт — это одна стена текста. Нет разрывов абзацев на реплику говорящего, нет структуры DOCX, которую NVivo может автокодировать при импорте.

Что здесь переключить

  1. 1Включите Помечать перекрывающуюся речь в форму работы. Перекрытие речи получает встроенные маркеры `[перекрытие]` и оба говорящих сохраняют свои высказывания.
  2. 2Установите Ожидаемые говорящие: 8-12 явно. Мы размещаем количество кластеров распределения ораторов в соответствии, а не угадываем низко.
  3. 3Выберите DOCX (готово к QDA) экспорт. Реплики говорящих становятся абзацами с префиксом метки — NVivo, ATLAS.ti и Dedoose все автоматически обнаруживают этот формат при импорте.

Рекомендуемые параметры работы для фокус-групп

Загрузьте файл фокус-группы с шаблоном 'research' и эти параметры включены по умолчанию. Переопределите за работу из формы.

Распределение ораторов
Акустический · ожидаемые 6-10 говорящих
Режим дословности
Полный — дисфлюентности сохранены
Обработка перекрытия
Помечать в строке [перекрытие]
Пользовательский словарь
Названия продуктов / брендов из проверки
Метки говорящих
Редактируемые после работы, распространять все
Экспорт
DOCX (готово к QDA) · timestamped TXT

Accuracy · real-world numbers

94% на петличный микрофон на участника. Держится на 82% на одном микрофоне комнаты.

Точность фокус-группы ограничена топологией микрофона, а не моделью. Петличный микрофон на каждом участнике дает нам чистые каналы на одного говорящего — распределение ораторов становится тривиальным. Один микрофон на границе на столе конференции с 8 голосами — это сложный случай. Цифры ниже поступают из реальных записей исследований в нашем конвейере.

94%
Петличный микрофон на участника

Каждый участник на своей дорожке, микшированной в многодорожечный WAV. Распределение ораторов пропущено — только ошибка текста. Лучший случай для работы диссертационного качества.

91%
Микрофон конференции, 4-6 участников

Микрофон на границе центрирован на столе, умеренная обработка комнаты. Голоса различимы, случайная путаница между участниками одного пола похожего возраста.

86%
Один микрофон комнаты, 7-10 участников

Перекрытие речи частое, похожие голоса сливаются при акустическом распределении ораторов. Ожидайте 10-минутный проход переименования и слияния на чипах говорящих перед анализом.

82%
Удаленная группа на моно Zoom

Сжатый монсмикс, разделение по каналам недоступно. Слова все еще можно использовать для кодирования по темам, но требования к дословности уровня дисфлюентности ослабевают здесь.

Частые вопросы

8 вещей, которые люди спрашивают о транскрибировании фокус-групп.

01Могу ли я переименовать Говорящего 1 на фактическое имя участника или ID?+
Да. Нажмите на любой чип говорящего в редакторе, введите имя или ID проверки (например 'P04_F_34'), и он распространяется на каждую реплику этого говорящего в транскрипте. Экспорт DOCX использует переименованные метки.
02Как вы обрабатываете перекрытие речи и перекрывающуюся речь?+
Мы помечаем это встроенными маркерами `[перекрытие]` и сохраняем высказывания обоих говорящих в транскрипте. Стандартные инструменты обычно выбирают один голос и отбрасывают другой — мы этого не делаем, потому что моменты перекрытия часто являются тем местом, где живут реальная динамика фокус-групп.
03Действительно ли DOCX чисто импортируется в NVivo и ATLAS.ti?+
Да. Мы экспортируем с метками говорящих как заголовки в стиле абзацев, которые NVivo автокодирует при импорте, и ATLAS.ti распознает как реплики говорящих. Dedoose принимает тот же DOCX через путь импорта транскрипта.
04Сколько говорящих вы можете распределить в один файл?+
Мягкий предел около 12. Свыше этого, акустическая кластеризация начинает объединять похожие голоса — что обычно означает 10-15 минутный проход переименования с вашей стороны. Установите 'Ожидаемые говорящие' явно в форме работы для лучших результатов.
05Дословно или очищено — могу ли я выбрать?+
Обе. Режим дословности сохраняет каждый 'ммм', ложное начало и повторяющееся слово для анализа дискурса. Очищенный удаляет дисфлюентности для читаемости. Вы выбираете за работу; по умолчанию для шаблона исследования является дословный.
06Что насчет требований IRB и конфиденциальности участников?+
Файлы обрабатываются в нашей инфраструктуре, не отправляются в API третьих сторон. Мы предлагаем флаг автоматического удаления после N дней за работу для протоколов IRB. Мы соответствуем SOC 2 Type II и GDPR; DPA находится на странице лицензии, если ваш IRB этого требует.
07Должен ли я записывать видео или только аудиозапись?+
Только аудиозапись в порядке — мы не используем видео для распределения ораторов. Если у вас есть видео для идентификации участников, сохраняйте его локально для собственного кодирования; загрузка только аудиодорожки быстрее и дешевле.
08Как стоимость сравнивается с Rev человеческой дословностью?+
Фокус-группа из 90 минут стоит около $2.70 здесь против примерно $135 на Rev дословный. Компромисс — это точность: мы приземляемся на 86-94% в зависимости от установки микрофона, человеческие транскрибры Rev достигают ~99%. Большинство исследователей используют нас для первого прохода и только повышают специфические группы до человека, если это необходимо.

Загрузьте запись фокус-группы. Посмотрите транскрипт в NVivo завтра.

30 бесплатных минут каждый месяц. Без карты. Метки говорящих, помечание перекрытия речи, экспорт DOCX готовый к QDA включен в каждый план.

Начать бесплатно