Общ

Тази нова система за роботика може лесно да научи нова задача


Роботизирана система с изкуствен интелект е създадена, за да научи нова задача само като я види веднъж изпълнена. Компанията за изследвания с изкуствен интелект с нестопанска цел, OpenAI, е обучила системата за роботика само от симулация и я е приложила на физически робот. Мисията на компанията е да изгради безопасен изкуствен общ интелект и да гарантира, че ползите от него се разпределят открито.

[Източник на изображението: OpenAI]

Системата за роботика

Мрежа за зрение и имитационна мрежа захранват системата, което позволява на робота да научи ново поведение, демонстрирано от симулатор. След това роботизираната система може да възпроизведе това специфично поведение в различни настройки в реалния свят. Вградената камера в робота заснема изображение, което се поглъща от зрителната мрежа и впоследствие извежда състояние, представящо позицията на обекта. След предишната работа на изследователската група, мрежата за зрение се обучава със стотици хиляди виртуални изображения, които имат различни смущения на осветление, текстури и обекти. Мрежата за зрение обаче не практикува или тренира, използвайки реални изображения.

Имитационната мрежа работи точно както подсказва името му. Наблюдавайки демонстрация, мрежата обработва визуализирани движения, след което имитира намерението на задачата от начална конфигурация. Това позволява на мрежата да закръгли демонстрацията до нова настройка.

[Източник на изображението: OpenAI]

За всяка задача се използват хиляди демонстрации за обучение на имитационната мрежа. Тренировъчната сесия се състои от две демонстрации, които изпълняват абсолютно една и съща задача. Първата демонстрация се дава на мрежата, която след това трябва да наблюдава втората демонстрация само веднъж. Обучението под наблюдение е поставено на място, за да се предскаже действието на демонстранта при това наблюдение. Роботът е способен да предсказва действията ефективно, като се научи как да прави извода за основното същност на задачата, като използва първата демонстрация.

Чрез непрекъснатата работа на екипа, имитационната мрежа получи нов алгоритъм, наречен еднократно имитационно обучение. Този алгоритъм позволява на човек да измисли нова задача, като я изпълнява във Виртуална реалност. От една демонстрация системата за роботика може да реши същата задача, като започне от произволна конфигурация.

Задача за подреждане на блокове

Оборудван с мрежите за визия и имитация, роботът беше подложен на тест, като го накара да изпълнява рутинно подреждане, демонстрирано чрез виртуална реалност, контролирана от човек. Екипът предостави на робота данни за обучение, състоящи се от двойки траектории, които подреждат блокове в съответния набор от кули в същия ред, но започвайки от различно начално състояние.

Екипът трябваше да внесе известно количество шум в изходите на скриптова политика на системата, за да може имитационната мрежа да научи стабилна политика. Чрез използването на данни за шума, робототехническата система успя да демонстрира как да се прегрупира, когато нещо се обърка. Това доведе до по-интелигентна имитационна мрежа, която се справя с аномалиите и смущенията от несъвършената политика на скрипта.

Ако се интересувате от участие в този проект по роботика, можете да се присъедините към OpenAI в централата им в Сан Франциско.

Източник: OpenAI

ВИЖТЕ СЪЩО: Ще направи ли изкуственият интелект края на човешкия интелект?


Гледай видеото: Част втора. По-добро от Аудио книга - Силата на Настоящето от Екхарт Толе (Юни 2021).