Транскрибирование интервью — транскрибируйте интервью с метками спикеров и временными метками

Транскрибирование интервью.Разные записи — одинаковый результат.

Голосовая записка, звонок Zoom, петличный микрофон или портативный рекордер — загрузите запись интервью и получите текст с метками спикеров и временными метками, который можно цитировать.

Drop a file, or pick one

MP3 · WAV · M4A · MP4 · MOV · MKV · OGG · OPUS · FLAC · WEBM — up to 100 MB anonymously

Paste a link, we’ll fetch the audio

YouTube · TikTok · Vimeo · Twitter · SoundCloud · Spotify · 50+ more

Record straight from your browser

No card required~90s per 60-min fileSRT · VTT · DOCX · TXTFiles auto-deleted in 24h

Два голоса входят. Два голоса выходят с метками.

Большинство интервью проводятся двумя людьми на одном устройстве — телефон на столе, рекордер между вами. Мы разделяем звук интервью на журналиста и источник даже из одного моно-канала, затем добавляем временные метки на каждый ход для цитирования.

Портативный рекордер · WAVREC 2 спикера · 38:42

Автоопределение en-US48 кГц моно · 1411 кбит/с

~90s

Транскрипт · потоковая обработка94% точность

Можете мне рассказать, что вы видели утром восемнадцатого?

Я пришёл около шести часов. Дверь погрузочного отсека уже была открыта, а её не должно было быть открытой.

И вы уже ранее докладывали о проблеме двери — кому?

Дайане Окафор в отделе обслуживания, дважды в марте. У меня есть письма.

94% на полевом WAVDOCX · TXT · SRT · JSON

This is what loads when the job finishes.

Same layout as the real dashboard — Summary, full Transcript, Speakers tab, Exports. Key points and action items extracted automatically. Auto-tags on every job.

app.transcription.solutions / interview-202.mp3Export

Summary 5Transcript 1,420Speakers 2Exports

interview-202.mp347:08128 kbps CBR2 speakersen-US auto-detected

Founders need post-call content, not just transcripts. Tools force them to stitch 5 apps together.

Sample preview from a founder interview about post-call workflow. Real transcripts look exactly like this — same tabs, same summary block, same key-points / action-items split, same auto-tag chips.

Key points

Gap exists between raw recordings and shippable content — tools stop at transcript.

Show notes, social clips, blog drafts all expected by call's end, not next-day.

Current tooling fragmented across 5 apps — no single pipeline.

Conversion-rate signal flipped a buyer-segment assumption at week 3.

40% of original hypothesis survived — the shape held, mechanics rebuilt.

Action items

Speaker 1Investigate single-pipeline approach to replace 5-app stitch.

Speaker 2Mock how show-notes draft could flow from the transcript.

Speaker 2Pull conversion-rate by segment, Monday EOD.

Speaker 1Map the 5-app stitch & list which steps actually need a human.

Auto-taggedfounder interviewpost-call contenttooling fragmentationsingle pipeline

Try it on your own file — it's free

Rev человеческий. Otter или Trint. Или мы.

Rev отправляет ваш звук человеческим транскрибёрам — медленно и дорого, но высокая верность на сложных записях. Otter и Trint — AI-первые как мы, настроены для журналистов и исследователей. Вот где каждый подходит.

Option 01

Человеческое транскрибирование Rev

Люди печатают ваше интервью. Лучше всего на сложных записях, но вы ждёте и платите.

Время обработки12–24 часа типично

Точность на чистой речи99% (заявлено)

Метки спикеровРучные, включены

ЯзыкиEN человеческий · 30+ AI

Стоимость · за минуту$1.50 человеческий · $0.25 AI

ПриватностьЗвук отправляется подрядчикам

Best forСудебные или критические для публикации интервью на плохих записях, где нужно человеческое ухо и есть день на ожидание.

Option 02

Transcription.Solutions

AI-транскрипт, разделение по спикерам, готов за минуты. Один движок для голосовой записки, Zoom или портативного рекордера.

Время обработки~3 мин на час звука

Точность на чистой речи94–96%

Метки спикеровАвто · переименование в редакторе

Языки99, автоопределение

Стоимость · за минуту$0.03

ПриватностьЗвук удалён за 24 ч · без обучения

Best forЖурналисты, исследователи и продюсеры, которые делают несколько интервью в неделю и нуждаются в быстром цитируемом тексте без загрузки подрядчику.

Option 03

Otter / Trint

AI-транскрибирование с редактором ориентированным на исследования. Сильный английский, привязано к ежемесячным планам.

Время обработкиРеал-тайм до ~5 мин

Точность на чистой речи~90–93%

Метки спикеровДа · EN-настроены

ЯзыкиOtter только EN · Trint 30+

Стоимость$17–80/пользователь/месяц (подписка)

ПриватностьХранится в аккаунте по умолчанию

Best forКоманды, которые хотят хранилище каждого проведённого интервью и не возражают против ежемесячной платы за место на пользователя.

Цены и флаги функций точны на 2026 год. Время обработки человеческого Rev варьируется в зависимости от глубины очереди и длины звука.

96% на хорошем петличном микрофоне. Всё ещё читается на записи в кафе.

Точность интервью ограничена тем, что микрофон действительно слышал. Стерео с близким микрофоном на каждого спикера это потолок; телефон на шумном столе это пол. Цифры ниже из реальных файлов интервью, не синтетических тестов.

8 вещей, которые люди спрашивают о транскрибировании интервью.

01Могу ли я использовать эти транскрипты в опубликованной статье без проверки по звуку?+

Для прямых цитат — нет, всегда проверьте по звуку. AI-транскрипты с 94% точностью всё ещё неправильно читают одно слово из 17 в среднем, и неправильное слово в цитате это исправление. Транскрипт для навигации и черновиков; звук это источник истины.

02Мой рекордер сохранил стерео WAV с одним микрофоном на спикера. Что мне делать?+

Загрузите этот файл прямо — не конвертируйте в моно сначала. Мы определяем оба канала и маршрутизируем каждый на его собственную дорожку диаризации, что самый точный путь, который у нас есть. Ожидайте 96%+ в спокойной комнате.

03А что насчёт интервью записанных через телефонный звонок?+

Телефонный звук это 8 кГц узкополосный, что ограничивает точность около 88% даже на чистой линии. Мы всё ещё разделяем двух участников используя разделение канала если ваше приложение рекордера захватило их отдельно (большинство делают). Звонки VoIP через WhatsApp или Signal звучат немного лучше чем PSTN.

04Могу ли я отредактировать разделы без записи перед тем как поделиться транскриптом?+

Да. В редакторе выберите диапазон времени и отметьте его `[REDACTED]`. Экспорт заменяет текст маркером редактирования но сохраняет временные метки так что документ всё ещё отслеживает звук.

05Вы тренируете модели на моих записях интервью?+

Нет. Исходный звук удаляется из нашей инфраструктуры в течение 24 часов после завершения, и мы не используем записи клиентов для тренировки моделей ни в каком плане. Текст транскрипта остаётся в вашем аккаунте пока вы его не удалите.

06Три или четыре человека на панельном интервью — диаризация всё ещё работает?+

До около шести различных голосов, да, но точность назначения спикера падает с каждым добавленным человеком и становится хуже когда два спикера звучат похоже. Планируйте 2–3 минутный проход переименования на чипах спикера после получения транскрипта.

07Можете ли вы транскрибировать интервью на языках кроме английского?+

99 языков, автоопределение. Переключение кодов (английский источник переходящий в испанский в середине предложения) обработан в 12 парах языков. Точность варьируется в зависимости от языка — европейские языки соответствуют английскому; низко-ресурсные африканские и центральноазиатские языки работают на 5–10 пунктов ниже.

08Я записываю на звонке Zoom — должен ли я использовать вашу страницу Zoom вместо этого?+

Один движок, один результат. Страница Zoom охватывает специфику облачной записи (звук на участника, деградация дозвона). Если вы проводите одно интервью за раз через Zoom, любой путь работает — загрузите MP4 здесь и метки спикеров получаются одинаковыми.