Как убрать «Субтитры сделал DimaTorzok»
Самый быстрый способ — вставить текст или загрузить файл субтитров в чистилку: она найдёт известные фразы-галлюцинации и удалит их, сохранив тайм-коды. Всё происходит в вашем браузере, файлы никуда не загружаются.
Telegram: расшифровка голосового
Если фраза появилась в тексте расшифрованного голосового — это глюк распознавания на тишине в начале/конце записи. В самом Telegram редактировать расшифровку нельзя, поэтому:
- скопируйте текст расшифровки;
- вставьте его в чистилку и нажмите «Найти галлюцинации»;
- скопируйте очищенный текст.
CapCut / Instagram «Эдитс» / DaVinci: автосубтитры
В видеоредакторах подпись попадает в дорожку субтитров как отдельный сегмент на паузе. Варианты:
- найдите сегмент субтитров на месте паузы и удалите его прямо в редакторе;
- либо экспортируйте субтитры в
.srt, прогоните через чистилку и импортируйте обратно.
Файл .srt или .vtt
- загрузите файл в чистилку (или перетащите его в поле);
- проверьте найденные строки — снимите галочку, если что-то нужно оставить;
- нажмите «Скачать чистый файл» — нумерация и тайм-коды пересчитаются автоматически.
Своя транскрибация на Whisper
Если вы транскрибируете сами и хотите, чтобы галлюцинации не появлялись в принципе:
- отфильтруйте тишину перед распознаванием (VAD, например Silero);
- повысьте порог
no_speech_thresholdи используйтеlogprob_threshold; - понизьте вероятность лишних токенов через
suppress_tokens; - почистите итоговый текст по списку известных фраз (как в этой чистилке).
Нужно настроить распознавание для бизнеса (боты, субтитры, медиа-мониторинг) без таких ошибок? Напишите — см. контакты.
Частые вопросы
Чистилка не удалит мой реальный текст?
Нет, если вы проверите список. Инструмент работает в режиме «покажи и дай решить»: он только подсвечивает подозрительные строки и удаляет лишь те, где галочка стоит. Уникальные подписи (DimaTorzok, Amara.org и т.п.) определяются точно; общие фразы вроде «спасибо за просмотр» удаляются только если ими занята вся строка целиком.
А если у меня фраза на другом языке?
Чистилка ловит сигнатуры на нескольких языках. Если вашей нет — добавьте её в поле «свои фразы», и инструмент уберёт и её.