Инженеры Google научили нейросети сжимать фотографии лучше JPEG
Группе инженеров Google удалось впервые создать нейронные сети, опережающие по качеству сжатия изображений широко используемый алгоритм JPEG. Качество оценивалось по стандартным методам оценки MS-SSIM и PSNR-HVS, и в обоих вариантах нейросети показали лучший результат.
Нейронные сети были созданы с помощью системы машинного обучения TensorFlow, исходные коды которой Google опубликовала в прошлом году. В предыдущих работах некоторым исследователям уже удавалось получить нейросети, опережающие по качеству сжатия известные алгоритмы, но в большинстве случаев они работали с изображениями небольшого размера. Обучение нейросетей в новом проекте проводилось на коллекции из 6 млн случайно отобранных из Интернета фотографий размером 1280×720 точек. Их разбивали на участки размером 32×32 точки и выбирали те из них, на которых алгоритмы сжатия работают хуже всего. Таким образом, нейросеть обучалась прежде всего сжатию самых сложных участков.
Авторы рассчитывают, что им удастся опередить и алгоритмы сжатия, опирающиеся на методы, применяемые в сжатии видео - в частности, повторно использующие при сжатии фрагменты изображения, сжатые раньше.