Baidu тестирует сервис для конвертации аудио в текст с помощью ИИ
Интервьюеры спасены: китайский технологический гигант выпустил приложение для транскрибации SwiftScribe, основанное на нейросетях.
В мире умных гаджетов и общительных интерфейсов конвертация аудио в текст занимает колоссальное количество времени. Это не нравится многим: от журналистов и писателей до HR и полицейских. Китайский IT-гигант Baidu представил программу SwiftScribe, которая, вооружившись искусственным интеллектом, обещает решить эту проблему.
SwiftScribe вышла в закрытой бете, и пока компания приглашает к участию всего 50 фонотипистов. Дата полноценного релиза и стоимость продукта еще неизвестны. По словам проектного менеджера Baidu Тян Ву, уже сейчас SwiftScribe экономит в среднем 40% времени и неустанно обучается на пользовательских аудиофайлах.
SwiftScribe работает как веб-приложение для браузера Chrome и поддерживает файлы в форматах.mp3 и.wav продолжительностью до 60 минут (оценить программу на тестовом фрагменте можно тут). Демонстрационное видео:
Напомним, ранее мы писали, что Baidu открыла амбициозную Лабораторию дополненной реальности, а искусственный интеллект IBM вот-вот догонит человека в умении распознавать беглую речь.