Транскрибирование интервью.Разные записи одинаковый результат.

Голосовая записка, звонок Zoom, петличный микрофон или портативный рекордер — загрузите запись интервью и получите текст с метками спикеров и временными метками, который можно цитировать.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

Sign up takes 30 seconds — recording opens right after, in the dashboard.

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

↓ Смотрите, что получится

Два голоса входят. Два голоса выходят с метками.

Большинство интервью проводятся двумя людьми на одном устройстве — телефон на столе, рекордер между вами. Мы разделяем звук интервью на журналиста и источник даже из одного моно-канала, затем добавляем временные метки на каждый ход для цитирования.

Портативный рекордер · WAVREC 2 спикера · 38:42
Автоопределение en-US48 кГц моно · 1411 кбит/с
~90s
Транскрипт · потоковая обработка94% точность
S1

Можете мне рассказать, что вы видели утром восемнадцатого?

S2

Я пришёл около шести часов. Дверь погрузочного отсека уже была открыта, а её не должно было быть открытой.

S1

И вы уже ранее докладывали о проблеме двери — кому?

S2

Дайане Окафор в отделе обслуживания, дважды в марте. У меня есть письма.

94% на полевом WAVDOCX · TXT · SRT · JSON

↓ This is the dashboard

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

Try it on your own file — it's free

Три настоящих варианта · честное сравнение

Rev человеческий. Otter или Trint. Или мы.

Rev отправляет ваш звук человеческим транскрибёрам — медленно и дорого, но высокая верность на сложных записях. Otter и Trint — AI-первые как мы, настроены для журналистов и исследователей. Вот где каждый подходит.

Option 01

Человеческое транскрибирование Rev

Люди печатают ваше интервью. Лучше всего на сложных записях, но вы ждёте и платите.

Время обработки12–24 часа типично
Точность на чистой речи99% (заявлено)
Метки спикеровРучные, включены
ЯзыкиEN человеческий · 30+ AI
Стоимость · за минуту$1.50 человеческий · $0.25 AI
ПриватностьЗвук отправляется подрядчикам
Best forСудебные или критические для публикации интервью на плохих записях, где нужно человеческое ухо и есть день на ожидание.
Option 02

Transcription.Solutions

AI-транскрипт, разделение по спикерам, готов за минуты. Один движок для голосовой записки, Zoom или портативного рекордера.

Время обработки~3 мин на час звука
Точность на чистой речи94–96%
Метки спикеровАвто · переименование в редакторе
Языки99, автоопределение
Стоимость · за минуту$0.03
ПриватностьЗвук удалён за 24 ч · без обучения
Best forЖурналисты, исследователи и продюсеры, которые делают несколько интервью в неделю и нуждаются в быстром цитируемом тексте без загрузки подрядчику.
Option 03

Otter / Trint

AI-транскрибирование с редактором ориентированным на исследования. Сильный английский, привязано к ежемесячным планам.

Время обработкиРеал-тайм до ~5 мин
Точность на чистой речи~90–93%
Метки спикеровДа · EN-настроены
ЯзыкиOtter только EN · Trint 30+
Стоимость$17–80/пользователь/месяц (подписка)
ПриватностьХранится в аккаунте по умолчанию
Best forКоманды, которые хотят хранилище каждого проведённого интервью и не возражают против ежемесячной платы за место на пользователя.

Цены и флаги функций точны на 2026 год. Время обработки человеческого Rev варьируется в зависимости от глубины очереди и длины звука.

Специфично для интервью

Три главные проблемы универсальных инструментов транскрибирования.

Звук интервью редко бывает чистым. Измените эти параметры и транскрипт выдержит цитирование.

Что идёт не так

  1. 1Перекрытие речи на одном канале. Когда источник говорит эмфатично и говорит через ваш вопрос, универсальная диаризация объединяет обе в один блок спикера.
  2. 2Имена и места источников (Okafor, Tigray, Maranello) возвращаются фонетически. Бесполезно для проверки фактов по транскрипту.
  3. 3Моменты без записи оказываются в одном транскрипте с цитируемым материалом — нет способа отметить регион как отредактированный.

Что изменить здесь

  1. 1Если ваш портативный рекордер записывает WAV с двумя каналами (один микрофон на дорожку), загрузите этот файл напрямую. Мы определяем каналы по-отдельности и пропускаем диаризацию полностью.
  2. 2Вставьте ваши заметки подготовки — имена источников, названия организаций, названия мест — в Пользовательский словарь на форме задачи. Распознаватель воспринимает их как известные собственные имена.
  3. 3После получения транскрипта отметьте регион как без записи в редакторе. Экспортируется как `[REDACTED 14:22–15:08]` в DOCX и TXT, исходный звук удаляется за 24 часа в любом случае.

Рекомендуемые параметры задачи для интервью

Загрузите файл интервью и эти параметры включены по умолчанию. Переопределяйте по заданиям из формы.

Диаризация
По каналам если стерео · акустическое иначе
Модель спикера
Интервью · 2–4 спикера
Язык
Автоопределение · переключение кодов включено
Слова-заполнители
Оставлены (режим дословный)
Резюме
Ключевые цитаты + индекс тем
Экспорт
DOCX с временными метками · обычный TXT · JSON

Accuracy · real-world numbers

96% на хорошем петличном микрофоне. Всё ещё читается на записи в кафе.

Точность интервью ограничена тем, что микрофон действительно слышал. Стерео с близким микрофоном на каждого спикера это потолок; телефон на шумном столе это пол. Цифры ниже из реальных файлов интервью, не синтетических тестов.

96%
Двойной петличный микрофон · студийная тишина

Один микрофон на спикера, отдельные каналы (Zoom H5/H6, Tascam DR-40). Диаризация тривиальна — ошибка только текстовая.

94%
Портативный рекордер на столе

Один конденсаторный микрофон между двумя спикерами, спокойная комната. Акустиче��кая диаризация разделяет голоса надёжно менее чем на 4 фута.

90%
Голосовая записка на телефоне · близко

Голосовая записка iPhone или Pixel на столе. Имена и номера иногда упускаются; ритм подходит для цитирования.

84%
Полевая запись · кафе или улица

Кофеварки эспрессо, трафик, третьи голоса рядом. Наихудший случай в наших данных — пригодно для навигации, проверьте цитаты по аудио.

Частые вопросы

8 вещей, которые люди спрашивают о транскрибировании интервью.

01Могу ли я использовать эти транскрипты в опубликованной статье без проверки по звуку?+
Для прямых цитат — нет, всегда проверьте по звуку. AI-транскрипты с 94% точностью всё ещё неправильно читают одно слово из 17 в среднем, и неправильное слово в цитате это исправление. Транскрипт для навигации и черновиков; звук это источник истины.
02Мой рекордер сохранил стерео WAV с одним микрофоном на спикера. Что мне делать?+
Загрузите этот файл прямо — не конвертируйте в моно сначала. Мы определяем оба канала и маршрутизируем каждый на его собственную дорожку диаризации, что самый точный путь, который у нас есть. Ожидайте 96%+ в спокойной комнате.
03А что насчёт интервью записанных через телефонный звонок?+
Телефонный звук это 8 кГц узкополосный, что ограничивает точность около 88% даже на чистой линии. Мы всё ещё разделяем двух участников используя разделение канала если ваше приложение рекордера захватило их отдельно (большинство делают). Звонки VoIP через WhatsApp или Signal звучат немного лучше чем PSTN.
04Могу ли я отредактировать разделы без записи перед тем как поделиться транскриптом?+
Да. В редакторе выберите диапазон времени и отметьте его `[REDACTED]`. Экспорт заменяет текст маркером редактирования но сохраняет временные метки так что документ всё ещё отслеживает звук.
05Вы тренируете модели на моих записях интервью?+
Нет. Исходный звук удаляется из нашей инфраструктуры в течение 24 часов после завершения, и мы не используем записи клиентов для тренировки моделей ни в каком плане. Текст транскрипта остаётся в вашем аккаунте пока вы его не удалите.
06Три или четыре человека на панельном интервью — диаризация всё ещё работает?+
До около шести различных голосов, да, но точность назначения спикера падает с каждым добавленным человеком и становится хуже когда два спикера звучат похоже. Планируйте 2–3 минутный проход переименования на чипах спикера после получения транскрипта.
07Можете ли вы транскрибировать интервью на языках кроме английского?+
99 языков, автоопределение. Переключение кодов (английский источник переходящий в испанский в середине предложения) обработан в 12 парах языков. Точность варьируется в зависимости от языка — европейские языки соответствуют английскому; низко-ресурсные африканские и центральноазиатские языки работают на 5–10 пунктов ниже.
08Я записываю на звонке Zoom — должен ли я использовать вашу страницу Zoom вместо этого?+
Один движок, один результат. Страница Zoom охватывает специфику облачной записи (звук на участника, деградация дозвона). Если вы проводите одно интервью за раз через Zoom, любой путь работает — загрузите MP4 здесь и метки спикеров получаются одинаковыми.

Загрузите вашу запись интервью. Смотрите, что получится.

30 бесплатных минут каждый месяц. Без карты. Метки спикеров, 99 языков, все экспорты включены.

Начать бесплатно