Искусственный интеллект Samsung может создать видео из одной вашей фотографии
Представьте, что кто-то создает ваше фальшивое видео, просто за счет вашего профиля в Facebook. К счастью, у мошенников пока нет этой технологии. Но Samsung понял, как это сделать.
Программное обеспечение для создания глубоких подделок - сфабрикованных клипов, из-за которых люди, кажется, делают или говорят то, чего никогда не делали, - обычно требуют больших наборов данных изображений для создания реалистичной подделки. Теперь Samsung разработала новую систему искусственного интеллекта, которая может генерировать поддельный клип с помощью всего одного фото. Об этом сообщает Информатор Tech, ссылаясь на Cnet.
Лаборатория искусственного интеллекта Samsung в России разработала технологию, которая была подробно описана в статье на этой неделе. Но есть весомый недостаток: такие методы и их быстрое развитие также создают риски дезинформации, фальсификации выборов и манипуляций, по словам Хани Фарида, исследователя из Дартмута, который специализируется на криминалистике СМИ.
«Следуя тенденции прошлого года, эта и связанные с ней технологии требуют все меньше и меньше данных и создают все более сложный и убедительный контент», - сказал Фарид. Несмотря на то, что процесс Samsung может создавать визуальные глюки, эти результаты являются еще одним шагом в эволюции технологий, к созданию мультимедийного контента, который итоге будет неотличим от реального.
Как и Photoshop для видео, глубокое поддельное программное обеспечение производит подделки, используя машинное обучение, чтобы убедительно сфабриковать движущегося, говорящего человека. Несмотря на то, что компьютерные манипуляции с видео существовали десятилетиями, системы с глубоким поддельным делом не только облегчают создание подделанных клипов, но и затрудняют их обнаружение. Думайте о них как о фотореалистичных цифровых куклах.
Samsung окрестила свои творения реалистичными говорящими головами. Исследователи увидели, что их прорыв используется во множестве приложений, включая видеоигры, фильмы и телевидение. «Такая возможность имеет практическое применение для телеприсутствия, включая видеоконференции и многопользовательские игры, а также индустрию спецэффектов», - написали они.
Как правило, синтезированная говорящая голова требует реализации системы искусственного интеллекта на большом наборе данных изображений одного человека. Поскольку требовалось так много фотографий человека, подделывали обычно публичных людей, вроде знаменитостей и политиков. Но тут система начинается с длительного этапа метаобучения, на котором она смотрит много видео, чтобы узнать, как движутся человеческие лица. Затем он применяет то, что он выучил, к одному кадру или небольшому количеству фотографий, чтобы создать достаточно реалистичный видеоклип. Синтезированные видео имеют тенденцию сохранять некоторое подобие того, кто играл роль цифровой марионетки.
Как правило, система глубокой подделки направлена?? на устранение этих визуальных ошибок. Это требует значительных объемов обучающих данных как от входного видео, так и от целевой аудитории. Поэтому большая сеть может быть обучена на большом количестве видео, что занимает много времени. Такая система может быстро адаптироваться к новому целевому человеку, используя всего несколько изображений без дополнительной переподготовки. Достижения Samsung, вероятно, скоро попадут в руки большего количества людей.