Новый искусственный интеллект можно обучать даже на старом компьютере
Ученые из США представили чип, который может обеспечить большую вычислительную мощность для обучения ИИ. Пока он стоит несколько миллионов долларов, но в будущем станет дешевле и позволит независимым командам заниматься сложным обучением моделей.
Отчет OpenAI за 2018 год показал, что вычислительная мощность для обучения самых крупных моделей ИИ растет невероятно быстрыми темпами, удваиваясь каждые 3-4 месяца. Один из самых сложных методов обучения - это глубокое обучение, где ИИ учится на своих ошибках с помощью миллиона итераций во время симуляций. Таким образом, например, создатели видеоигр улучшают визуальное сопровождение.
Новое специализированное оборудование, Cerebras System’s Wafer Scale Engine, позволяет заменить множество мощных компьютеров и использовать один небольшой чип, который подходит для обучения ИИ. Однако пока его нельзя производить массово и исследователи отмечают, что он будет стоить несколько миллионов долларов.
"Это фантастическое достижение, которое позволит тысячам независимых исследователей достигать таких же мощных результатов, как и командам огромных корпораций. К тому же, вычислительные ресурсы, обычно нужные для проведения такого рода исследований, приводят к большому углеродному следу. Теперь нам удалось от него избавиться". Исследователи университета Южной Калифорнии
В этом методе агента ИИ помещают в симуляционную среду, которая обеспечивает вознаграждение за достижение определенных целей. Их модель использует в качестве обратной связи для дальнейшего обучения. Оно включает в себя три основных вычислительных задачи: моделирование среды и агента; принятие решения о том, что делать дальше на основе выученных правил и использование результатов этих действий для обновления своего поведения.
Это привело к значительному ускорению обучения по сравнению с другими подходами. Используя один компьютер, оснащенный 36-ядерным процессором, исследователи смогли обрабатывать примерно 140 тыс. кадров в секунду во время тренировок по видеоиграм Atari и Doom. В учебной 3D-среде DeepMind Lab они обеспечили тактовую частоту 40 тыс. кадров в секунду, что на 15% лучше обычного.