3D-чип выведет нейроморфные вычисления на новый уровень эффективности
Сотрудники Массачусетского университета и Информационного директората Исследовательской лаборатории ВВС США недавно сообщили о создании 3-мерной компьютерной микросхемы, которая оптимальна для реализации сложных алгоритмов машинного обучения, таких как сверточные нейронные сети (CNN).
Устройство, представленное ими в журнале Nature Electronics, состоит из восьми слоев мемристоров; электрических компонентов, регулирующих силу тока и, таким образом, позволяющих напрямую воплощать аппаратно весовые коэффициенты нейронных сетей.
Новая микросхема в корне отличается от прочих уже известных 3D-устройств, таких как флэш-память 3D NAND, поскольку в тех от слоя к слою меняется функциональная нагрузка (например, сенсорный слой, вычислительный слой, управляющий слой и т. д.).
Реализовать исключительно мемристорные 3D-архитектуры для крупномасштабных вычислительных приложений прежде не получалось: для этого требовались очень сложные технологические процессы и новые способы преодоления проблем, возникающих при работе больших и плотных вычислительных массивов.
Прорыв удалось совершить благодаря изобретению авторами уникальной топологии трехмерных схем, где каждый индивидуальный мемристор соединяется только с малым количеством таких же устройств в своей непосредственной окрестности. Использование "локальных соединений" привело к подавлению большей части помех между ячейками - так называемая проблема паразитных путей (sneaky path problem).
В отличие от традиционной перекрестной (crossbar) новая мемристорная архитектура оказалась практически идеальной для искусственных нейронных сетей, естественным образом имитируя локальные рецептивные области CNN и обеспечивая аппаратную реализацию стратегий прямого и обратного распространения ошибок.
Исследователи успешно использовали созданную ими 3D-схему для реализации CNN, распознающей рукописные цифры с точностью 98%, и другой, эффективно обнаруживающей края движущихся объектов в видео путем одновременной обработки различных пикселей.
В дальнейшем ученые из Массачусетса планируют интегрировать трехмерные нейросети с массивами датчиков, чтобы сделать возможным ввод двухмерных матриц данных - сегодня входные данные для большинства нейросетей имеют вид одномерных векторов.