Математики из России выяснили, что добавление аналога человеческого внимания в нейросети позволяет на 6-15% улучшить их способность ориентироваться в пространстве и искать оптимальную траекторию движения для роботов. Об этом сообщила пресс-служба НИУ ВШЭ.
"Исследователи из НИУ ВШЭ, НИТУ МИСИС и AIRI нашли способ эффективнее проводить обучение с подкреплением для нейросетей, заточенных на ориентацию в пространстве. С помощью механизма внимания эффективность работы графовой нейросети увеличилась на 15%", - говорится в сообщении.
Такой подход для обучения нейросетей был разработан группой российских математиков под руководством доцента НИУ ВШЭ (Нижний Новгород) Ильи Макарова. Он предназначен для повышения эффективности работы так называемых графовых сверточных нейронных сетей, особого подкласса алгоритмов, который пытается представить решаемую задачу в виде графа, математической структуры, состоящей из связанных друг с другом узлов и соединяющих их ребер.
Подобные алгоритмы, как предполагают ученые, хорошо подходят для создания систем ИИ, способных искать оптимальные траектории движения через сложно устроенные среды. Поиск маршрутов движения является особенно сложной задачей для "обычных" нейросетей, так как у них зачастую нет полной информации об их текущем окружении. При этом награда за определение оптимальной траектории к цели выдается не на каждом его шаге, а лишь в конце пути. Это все значительно замедляет процесс обучения.
Макаров и его коллега по НИУ ВШЭ Матвей Герасев выяснили, что работу подобных систем ИИ можно значительно ускорить и улучшить, если использовать графовые сверточные нейросети для поэтапного поиска маршрута, а также при этом добавить в них аналог человеческого внимания. По своей сути он представляет собой способность нейросети временно придавать большее значение определенным элементам в наборах данных, предположительно важным для решения задачи.
Работу этого подхода ученые проверили на двух классических задачах для навигации, в рамках которых робот должен выбраться из случайно составленного лабиринта, или же найти красный ящик в наборе из четырех связанных друг с другом комнат. Проведенные учеными расчеты показали, что добавление механизма внимания примерно на 6-15% улучшило эффективность работы графовой нейросети. Это ускорит их внедрение в работу систем доставки товаров и роботов со способностью к ориентации в пространстве.