Исследователи спешат создать роботов с искусственным интеллектом. Но будут ли они работать?

Исследователи спешат создать роботов с искусственным интеллектом. Но будут ли они работать?

В нескольких словах

Исследователи работают над созданием роботов, управляемых искусственным интеллектом, но есть разногласия по поводу того, насколько успешными они будут. Основные проблемы включают в себя сбор данных из реального мира, моделирование сложных задач и необходимость фундаментальных исследований в области обработки пространства и времени нейронными сетями. Несмотря на скептицизм, эксперты полагают, что ИИ окажет значительное влияние на робототехнику, особенно в сфере автоматизации и помощи людям.


Искусственный интеллект может найти вам рецепт или сгенерировать изображение, но он не может повесить картину на стену или приготовить вам ужин.

Челси Финн хочет это изменить. Финн, инженер и исследователь из Стэнфордского университета, считает, что ИИ, возможно, находится на пороге новой эры в робототехнике. «В долгосрочной перспективе мы хотим разработать программное обеспечение, которое позволит роботам разумно действовать в любой ситуации», — говорит она.

Компания, соучредителем которой она является, уже продемонстрировала робота с ИИ общего назначения, который, помимо прочего, умеет складывать белье. Другие исследователи показали потенциал ИИ для улучшения способности роботов выполнять любые задачи: от сортировки посылок до гонок дронов. А Google только что представила робота с искусственным интеллектом, который может упаковать ланч.

Однако исследовательское сообщество разделилось во мнениях относительно того, смогут ли генеративные инструменты ИИ трансформировать робототехнику так же, как они трансформировали некоторую онлайн-работу. Роботы требуют данных из реального мира и сталкиваются с гораздо более сложными проблемами, чем чат-боты.

«Роботы не превратятся внезапно в научно-фантастическую мечту в одночасье», — говорит Кен Голдберг, профессор Калифорнийского университета в Беркли. «Очень важно, чтобы люди это понимали, потому что мы еще не достигли этого».

Мечты и разочарования

В науке и технике мало областей, в которых разрыв между ожиданиями и реальностью был бы больше, чем в робототехнике. Само слово «робот» было придумано чешским писателем Карелом Чапеком, который в 1920-х годах написал пьесу, в которой вообразил человекоподобных существ, способных выполнять любую задачу, поставленную их владельцем.

В действительности у роботов возникало много проблем даже с выполнением тривиальных задач. Машины лучше всего справляются с выполнением повторяющихся движений в тщательно контролируемой среде — например, на конвейере по сборке автомобилей на заводе, — но мир полон неожиданных препятствий и необычных объектов.

В лаборатории Финн в Стэнфордском университете аспирант Му Джин Ким демонстрирует, как роботы с искусственным интеллектом, по крайней мере, потенциально могут решить некоторые из этих проблем. Ким разрабатывает программу под названием «OpenVLA», что означает Vision, Language, Action (Зрение, Язык, Действие).

«Это один шаг в направлении ChatGPT для робототехники, но предстоит еще много работы», — говорит он.

Сам робот выглядит довольно невзрачно: всего лишь пара механических рук с захватами. Что делает его особенным, так это то, что находится внутри. Обычные роботы должны быть тщательно запрограммированы. Инженер должен написать подробные инструкции для каждой задачи. Но этот робот управляется обучаемой нейронной сетью ИИ. Нейронная сеть работает так, как, по мнению ученых, может работать человеческий мозг: математические «узлы» в сети имеют миллиарды связей друг с другом, подобно тому, как нейроны в мозге связаны друг с другом. «Программирование» такой сети заключается просто в усилении связей, которые имеют значение, и ослаблении тех, которые не имеют.

На практике это означает, что Ким может обучить модель OpenVLA выполнять множество различных задач, просто показывая ей.

К роботу прикреплены два джойстика, которые управляют каждой рукой. Чтобы обучить его, оператор-человек использует джойстики, чтобы «управлять» роботом, когда он выполняет желаемую задачу.

«В принципе, какую бы задачу вы ни хотели, чтобы он выполнял, вы просто продолжаете делать это снова и снова, 50 или 100 раз», — говорит он.

Этого повторения достаточно. Связи между узлами в нейронной сети ИИ робота усиливаются каждый раз, когда ему показывают действие. Вскоре он может повторить задачу без участия кукловода.

Для демонстрации Ким достает поднос с разными видами смеси орехов и сухофруктов. Он уже научил робота зачерпывать. Теперь я хочу немного смеси с зелеными M&M's и орехами, и все, что мне нужно сделать, это попросить.

«Зачерпни немного зеленых с орехами в миску», — набираю я. Очень медленно руки робота приходят в движение.

На видеопотоке OpenVLA ставит звездочку над правильным контейнером. Это означает, что первая часть модели, которая должна принять мой текст и интерпретировать его значение визуально, сработала правильно.

По словам Кима, так бывает не всегда. «Это та часть, где мы затаили дыхание».

Затем медленно, нерешительно, он протягивает клешню, берет совок и достает смесь.

«Похоже, это работает!» — взволнованно говорит Ким.

Это очень маленький совок. Но совок в правильном направлении.

Любые боты

Исследователь из Стэнфорда Челси Финн стала соучредителем компании в Сан-Франциско под названием Physical Intelligence, которая стремится вывести этот подход к обучению на новый уровень.

Она представляет себе мир, в котором роботы могут быстро адаптироваться для выполнения простых задач, таких как приготовление бутерброда или пополнение полок в продуктовых магазинах. Вопреки нынешнему мнению о робототехнике, она подозревает, что лучший способ добиться этого — обучить одну модель выполнять множество различных задач.

«На самом деле мы думаем, что попытка разработать системы-универсалы будет более успешной, чем попытка разработать систему, которая очень хорошо делает что-то одно», — говорит она.

Physical Intelligence разработала нейронную сеть ИИ, которая может складывать белье, зачерпывать кофейные зерна и собирать картонную коробку, хотя нейронная сеть, которая позволяет ей делать все это, слишком мощна, чтобы физически находиться на самом роботе.

«В этом случае у нас на самом деле была рабочая станция, которая находилась в квартире, которая вычисляла действия, а затем отправляла их по сети роботу», — говорит она.

Но следующий шаг — сбор данных для обучения программы ИИ робота — гораздо более сложная задача, чем простой сбор текста из Интернета для обучения чат-бота.

«Это действительно сложно», — признает Финн. «У нас нет открытого Интернета данных о роботах, и поэтому часто все сводится к сбору данных на роботах самостоятельно».

Тем не менее, Финн считает, что это выполнимо. По ее словам, помимо людей-тренеров, роботы также могут неоднократно пытаться выполнять задачи самостоятельно и быстро наращивать свою базу знаний.

Проблема данных

Но Кен Голдберг из Беркли более скептически относится к тому, что разрыв с реальным миром можно быстро преодолеть. Чат-боты с ИИ значительно улучшились за последние пару лет, потому что у них было огромное количество данных для обучения. Фактически, они собрали практически весь Интернет, чтобы научиться писать предложения и рисовать картинки.

Простое накопление данных из реального мира для роботов, эквивалентное Интернету, будет происходить гораздо медленнее. «При нынешних темпах нам потребуется 100 000 лет, чтобы получить столько данных», — говорит он.

«Я бы сказал, что эти модели не будут работать так, как они обучаются сегодня», — соглашается Пулкит Агравал, исследователь робототехники из Массачусетского технологического института.

Агравал является сторонником моделирования: помещения нейронной сети ИИ, управляющей роботом, в виртуальный мир и предоставления ей возможности повторять задачи снова и снова.

«Сила моделирования в том, что мы можем собирать очень большие объемы данных», — говорит он. «Например, за три часа моделирования мы можем собрать данные за 100 дней».

Этот подход хорошо сработал для исследователей из Швейцарии, которые недавно обучили дрон гонкам, поместив его мозг с ИИ в симулятор и прогоняя его по заранее заданному курсу снова и снова. Когда он попал в реальный мир, он смог пролететь курс быстрее и лучше, чем опытный человек-соперник, по крайней мере, часть времени.

Но у симуляции есть свои недостатки. Дрон довольно хорошо работал на крытом курсе. Но он не мог справиться ни с чем, что не было смоделировано, — ветер, дождь или солнечный свет — могли сбить дрон с курса.

И полет и ходьба — относительно простые задачи для моделирования. Голдберг говорит, что на самом деле брать предметы или выполнять другие ручные задачи, которые люди считают совершенно простыми, гораздо труднее воспроизвести на компьютере. «По сути, не существует симулятора, который мог бы точно моделировать манипуляции», — говорит он.

Понимание проблемы

Некоторые исследователи считают, что даже если проблема данных может быть преодолена, более глубокие проблемы могут преследовать роботов с ИИ.

«На мой взгляд, вопрос не в том, достаточно ли у нас данных… а в том, какова постановка проблемы», — говорит Мэтью Джонсон-Роберсон, исследователь из Университета Карнеги-Меллона в Питтсбурге.

Джонсон-Роберсон говорит, что при всех невероятных навыках, демонстрируемых чат-ботами, задача, которую им предлагается выполнить, относительно проста — посмотреть, что набирает пользователь-человек, а затем попытаться предсказать следующие слова, которые пользователь хочет увидеть. Роботам придется делать гораздо больше, чем просто составлять предложение.

«Предсказание следующего лучшего слова работает очень хорошо, и это очень простая задача, потому что вы просто предсказываете следующее слово», — говорит он. Перемещение в пространстве и времени для выполнения задачи — это гораздо больший набор переменных, которые нейронная сеть должна попытаться обработать.

«Сейчас неясно, смогу ли я взять 20 часов видео с Go-Pro и получить что-то осмысленное в отношении того, как робот перемещается в мире», — говорит он.

Джонсон-Роберсон говорит, что, по его мнению, необходимо провести более фундаментальные исследования того, как нейронные сети могут лучше обрабатывать пространство и время. И он предупреждает, что область должна быть осторожной, потому что робототехника уже обжигалась раньше — на гонке за созданием беспилотных автомобилей.

«Так много капитала пришло так быстро», — говорит он. «Это побудило людей давать обещания в сроки, которые они не могли выполнить». Большая часть капитала затем покинула эту область, и до сих пор остаются фундаментальные проблемы для беспилотных автомобилей, которые остаются нерешенными.

Тем не менее, даже скептики считают, что робототехника навсегда изменится благодаря ИИ. Голдберг стал соучредителем компании по сортировке посылок под названием Ambi Robotics, которая в начале этого года выпустила новую систему с искусственным интеллектом, известную как PRIME-1. Она использует ИИ для определения наилучших точек для роботизированной руки, чтобы поднять посылку. Как только ИИ определяет точку захвата, рука, которая управляется более традиционным программированием, выполняет захват.

Новая система значительно сократила количество случаев падения посылок, говорит он. Но он добавляет со смехом: «Если вы поставите эту штуку перед кучей одежды, она не будет знать, что с этим делать».

Вернувшись в Стэнфорд, Челси Финн говорит, что согласна с тем, что ожидания нужно держать под контролем.

«Я думаю, что технологии предстоит пройти еще долгий путь», — говорит она. Она также не ожидает, что универсальные роботы даже полностью заменят человеческий труд, особенно для сложных задач.

Но в мире со стареющим населением и прогнозируемым дефицитом рабочей силы она считает, что роботы с искусственным интеллектом могут восполнить часть этого пробела.

«Я представляю, что это действительно будет что-то, что дополняет людей и помогает людям», — говорит она.

Read in other languages

Про автора

Яна - журналист, специализирующийся на вопросах образования и науки в США. Её материалы о американских университетах и научных достижениях всегда актуальны и информативны.