Apple представила ИИ-модель MGIE для редактирования изображений
Apple в партнерстве с Калифорнийским университетом выпустила новую модель искусственного интеллекта с открытым исходным кодом под названием MGIE. Она позволяет редактировать фотографии через текстовые команды, которые пишет пользователь.
MGIE использует в своей работе мультимодальные большие языковые модели (MLLM) для интерпретации пользовательских команд и их выполнения. При помощи MGIE можно вносить глобальные и локальные изменения на изображении. Например, можно изменить яркость, контрастность и резкость, а также применить к снимку художественные эффекты.
ИИ позволяет менять форму, размер, цвет или текстуру определенных областей или объектов. Есть также возможность обрезки, изменения ориентации и размера изображения, и также добавления фильтров. Поменять фон или добавить/удалить объект на снимке тоже можно.
MGIE доступна на GitHub. Там есть код и предварительно обученные модели. Еще ИИ можно попробовать на сайте Hugging Face Spaces.