ИИ теперь может перемещаться по незнакомой среде без карты

Исследователи из Facebook AI разрабатывают новый алгоритм обучения с подкреплением под названием DD-PPO. Он может перемещаться по сложным средам, используя только данные компаса, RGB-D камеру и GPS.

Разработка интеллектуальных машин, которые умно взаимодействуют с физическим миром, была долгосрочной целью сообщества ИИ. Главная задача состоит в том, чтобы научить эти машины так, чтобы они могли эффективно перемещаться по сложной, незнакомой среде без использования какой-либо карты.

Как правило, карты реального мира устаревают в течение нескольких месяцев, поскольку здания и сооружения меняются, а объекты перемещаются. Вот почему совершенно необходимо создать ИИ для физического мира, который может перемещаться без карты.

Помня об этом, исследователи из Facebook AI разработали новый алгоритм обучения с подкреплением (RL), который эффективно решает задачу точечной навигации с использованием только данных компаса, камеры RGB-D и GPS. Этот крупномасштабный алгоритм называется DD-PPO (децентрализованная распределенная проксимальная оптимизация политики).

Новая RL распределенная архитектура хорошо масштабируется

В настоящее время системы, основанные на машинном обучении, способны превзойти человеческих экспертов в различных сложных играх. Но поскольку эти системы опираются на огромный объем обучающих выборок, то их построение без масштабного, распределенного распараллеливания совершенно невозможно.

Современная распределенная архитектура обучения с усилением — включает в себя тысячи рабочих (ЦП) и сервер с одним параметром — плохо масштабируется. Вот почему исследователи предложили синхронную, распределенную технику обучения с подкреплением.

DD-PPO работает на нескольких машинах и не имеет сервера параметров. Каждый работник (ЦП) переключается между накоплением опыта в моделируемом окружении с ускорением на GPU и оптимизацией модели. В явном состоянии связи все работники синхронизируют свои обновления с моделью. Другими словами, распределение является синхронным.

Все работники моделируют агента, выполняющего навигацию по точечным целям, а затем оптимизируют модель и синхронизируют свои обновления | Вот как данные обмениваются во время обучения с DD-PPO

Используя этот подход, DD-PPO продемонстрировал почти линейное масштабирование: ему удалось добиться ускорения в 107 раз на 128 графических процессорах по сравнению с последовательной реализацией.

Почти идеальная точечная навигация

При навигации по точке-цели агент устанавливается в произвольном начальном положении / ориентации в незнакомой среде и получает задание перейти к целевым координатам без использования какой-либо карты. Он может использовать только компас, GPS и либо RGB или RGB-D камеры.

Исследователи использовали функцию масштабирования DD-PPO для обучения агента за 2,5 миллиарда шагов, что эквивалентно 80-летнему опыту человека. Вместо месяцев обучение было завершено менее чем за три дня с 64 графическими процессорами.

Результаты показали, что 90% пиковой производительности были получены в первые 100 миллионов шагов с меньшим количеством вычислительных ресурсов (8 графических процессоров). С миллиардами шагов опыта, агент достигает успеха 99,9%. Напротив, предыдущие системы достигли 92% успеха.

Агент отступает после выбора неправильного пути, чтобы добраться до своей целевой позиции

Применение

Эти агенты ИИ могут помочь людям в физическом мире. Например, они могут показывать соответствующую информацию пользователям, носящим очки дополненной реальности, роботы могут извлекать предметы со стола наверху, а системы искусственного интеллекта могут помочь людям с нарушениями зрения.

Модели, построенные в этом исследовании, могут работать в обычных условиях, таких как внутри лабораторий и офисных зданий, где дополнительные точки данных (карты и данные GPS) недоступны.

Несмотря на то, что модель ImageNet превосходит предварительно обученные сверхточные нейронные сети и может служить универсальным ресурсом, предстоит еще многое сделать для разработки систем, которые учатся ориентироваться в сложных средах. Исследователи в настоящее время изучают новые подходы к реализации точечной навигации по RGB.

Источник

( ! ) Warning: Invalid argument supplied for foreach() in /home/domains/malitikov.ru/public_html/wp-content/themes/malitikov/single.php on line 44
Call Stack
#	Time	Memory	Function	Location
1	0.0000	350536	{main}( )	.../index.php:0
2	0.0000	350816	require( '/home/domains/malitikov.ru/public_html/wp-blog-header.php )	.../index.php:17
3	0.1811	8502744	require_once( '/home/domains/malitikov.ru/public_html/wp-includes/template-loader.php )	.../wp-blog-header.php:19
4	0.1828	8527496	include( '/home/domains/malitikov.ru/public_html/wp-content/themes/malitikov/single.php )	.../template-loader.php:106

Мы рекомендуем

( ! ) Fatal error: Allowed memory size of 536870912 bytes exhausted (tried to allocate 67108872 bytes) in /home/domains/malitikov.ru/public_html/wp-includes/class-wpdb.php on line 2323
Call Stack
#	Time	Memory	Function	Location
1	0.0000	350536	{main}( )	.../index.php:0
2	0.0000	350816	require( '/home/domains/malitikov.ru/public_html/wp-blog-header.php )	.../index.php:17
3	0.1811	8502744	require_once( '/home/domains/malitikov.ru/public_html/wp-includes/template-loader.php )	.../wp-blog-header.php:19
4	0.1828	8527496	include( '/home/domains/malitikov.ru/public_html/wp-content/themes/malitikov/single.php )	.../template-loader.php:106
5	0.4990	22769104	WP_Query->__construct( $query = ['post_type' => 'post', 'post_status' => 'publish', 'fields' => 'ids', 'posts_per_page' => -1, 'no_found_rows' => TRUE, 'orderby' => 'none'] )	.../single.php:65
6	0.4990	22769104	WP_Query->query( $query = ['post_type' => 'post', 'post_status' => 'publish', 'fields' => 'ids', 'posts_per_page' => -1, 'no_found_rows' => TRUE, 'orderby' => 'none'] )	.../class-wp-query.php:4081
7	0.4990	22769104	WP_Query->get_posts( )	.../class-wp-query.php:3949
8	0.4995	22780968	wpdb->get_col( $query = 'SELECT wp_posts.ID\n\t\t\t\t\t FROM wp_posts \n\t\t\t\t\t WHERE 1=1 AND wp_posts.post_type = \'post\' AND ((wp_posts.post_status = \'publish\'))\n\t\t\t\t\t \n\t\t\t\t\t \n\t\t\t\t\t ', $x = ??? )	.../class-wp-query.php:3300
9	0.4995	22780968	wpdb->query( $query = 'SELECT wp_posts.ID\n\t\t\t\t\t FROM wp_posts \n\t\t\t\t\t WHERE 1=1 AND wp_posts.post_type = \'post\' AND ((wp_posts.post_status = \'publish\'))\n\t\t\t\t\t \n\t\t\t\t\t \n\t\t\t\t\t ' )	.../class-wpdb.php:3107