Сможете ли вы отличить голос живого человека от новой системы озвучки Google?
Специалисты компании Google представили новую Text-to-Speech систему Tacotron 2, которая базируется на искусственном интеллекте. Они утверждают, что отличить речь живого человека от звукового файла Tacotron 2 практически невозможно. А получится ли это у вас?
Образец №1 Образец №2 Образец №3 Правильные ответы
Чтобы вы не сразу увидели правильные варианты ответов, мы напишем здесь, что Tacotron 2 в усредненной оценке разборчивости речи (Mean Opinion Score) набрала 4,53 балла, тогда как профессиональная начитка получила 4,58 балла. Высшая оценка в этой системе координат - 5 баллов. Система пока работает только с английским языком и доступна в женской озвучке.
Честно признаемся, что сами допускали ошибки. У нас не вышло с первого раза распознать верно, в каком же из вариантов текст произносит живой человек, а в каком текст начитывает бездушная машина Google.
В образце №1 живому человеку принадлежит первый вариант (А) начитки. В образце №2 человек говорит во втором случае (Б). В образце №3 вариант Б принадлежит человеческой речи.