Искусственный интеллект (ИИ) научили определять характеристики объектов в виртуальном мире — в частности, их вес и количество.К такому открытию пришли разработчики из Google DeepMind.
Чтобы понять, чем отличаются одни предметы от других, компьютеру пришлось вступить в непосредственное взаимодействие с ними. Исследователи рассказали о результатах своей работы в статье, опубликованной на сайте ArXiv.
Авторы новой работы создали систему искусственного интеллекта на базе LSTM-нейросети, которая научилась определять вес и количество находящихся перед ней объектов. Эта нейросеть представляет собой подвид рекуррентных нейросетей, для которых характерно наличие обратной связи. Для ее обучения исследователи создали два разных виртуальных мира, в которых компьютер мог взаимодействовать с окружающими его предметами.
В первом мире перед ИИ находилось четыре одинаковых по размеру кубика, масса которых определялась случайным образом и менялась каждый раз, когда эксперимент начинался заново. ИИ мог двигать кубики по вертикали, прикладывая к ним определенную силу (разработчики не снабжали его виртуальным манипулятором, он взаимодействовал с предметами «напрямую»). Главная задача компьютера заключалась в том, чтобы научиться находить самый тяжелый кубик. Если он успешно справлялся с заданием, то получал вознаграждение, если нет — штраф. После многократного повторения эксперимента ИИ «понял», что для того, чтобы правильно найти самый тяжелый кубик, необходимо предварительно поднять все кубики, и только потом давать ответ.
Во втором виртуальном мире перед ИИ лежали пять кубиков, из которых была построена башня. Часть кубиков стояли друг на друге, создавая единый блок, в то время как другие кубики лежали отдельно. Искусственный интеллект должен был определить, сколько перед ним находится предметов, также взаимодействуя с ними и получая в зависимости от своего ответа положительную или отрицательную обратную связь от окружающей среды.
Со временем компьютер выбрал наилучшую стратегию определения правильного ответа: он стал разрушать башню и только потом оценивать количество всех кубиков. Исследователи не говорят о практическом применении созданной ими системы, однако предполагают, что в будущем она может быть использована для роботов, которым, например, будет необходимо перемещаться по неровным поверхностям. Кроме того, система может пригодиться роботам-помощникам, которым придется взаимодействовать с окружающим миром — например, кухонным роботам или роботам-космонавтам.