Исследователи из Университета штата Северная Каролина разработали новый подход, помогающий беспилотным автомобилям лучше понимать, что их окружает. Эта новая установка, которую они назвали Multi-View Attentive Contextualization (MvACon), устраняет некоторые распространенные сбои, обнаруженные в современных системах искусственного интеллекта, преобразующих зрение, которые работают над обнаружением вещей в 3D с разных углов.
Они провели несколько тестов с использованием набора данных nuScenes — популярного для автономного вождения — и MvACon удалось повысить точность обнаружения в нескольких системах зрения высшего уровня. Когда они объединили его с системой BEVFormer, он показал явные улучшения в определении местоположения объектов, прогнозировании того, в какую сторону они направлены, и даже приблизительной оценке скорости их движения.
Команда обнаружила, что метод внимания MvACon, который фокусируется на кластерах, сохраняет четкость обнаружения транспортных средств и близлежащих структур. Они называют это «локальной системой координат, учитывающей контекст объекта», что означает, что система получает лучшее ощущение пространства, что очень помогает отслеживать, как вещи движутся и смотрят.
Одной из инновационных особенностей этой технологии является то, что ее можно легко добавить к текущим системам зрения автономных транспортных средств без необходимости в дополнительном оборудовании. И независимо от того, в какой конфигурации она используется, она будет последовательно улучшать производительность, независимо от того, как она реализована.
Тестирование показало, что система эффективно работает даже в сложных условиях с большим скоплением объектов.