Команда трансформерів

Команда трансформерів

Роботи різних розмірів і форм дедалі частіше з’являються на робочих місцях: від фабрик до операційних залів. Чимало з них використовують самонавчання і набувають навичок методом спроб і помилок. Новий метод дає змогу передавати такі навички поміж роботами різних конструкцій без необхідності навчання з нуля. “На практиці це важливо і становить цікаву, базову проблему, яку варто досліджувати”, — вважає Сінгʼю Лью, інформатик з Університету Карнегі-Меллона й головний автор досліджень, представлених минулого літа на Міжнародній конференції з питань машинного навчання — пише Метью Хатсон у журналі Scientific American.

Припустімо, що ми маємо плече робота з людською рукою. Ми навчили його п’ять пальців брати молоток і забивати кілок. Тепер хочемо, щоб те саме завдання виконав двопалий грейфер. Учені створили поміж ними різновид мосту із симулятивних роботів, між кожною парою яких поступово змінюється первісна форма команд. Кожен робот-посередник виконує визначене завдання, підлаштовуючи під нього штучну нейронну мережу, аж поки не досягне граничного показника ефективності, після чого код завдань передається до іншого робота в ланцюжку.

Для переходу поміж віртуальними вихідними й цільовими роботами група створила спільне “кінетичне дерево” — комплект вузлів, які репрезентують частини кінцівок, поєднаних відповідниками суглобів. Щоб передати вміння вдаряти молотком двопалому грейферу, учені мали пристосувати розміри й масу вузлів через брак трьох пальців. У кожному роботі-посереднику розміри й маса пальців були дещо меншими, а мережа, що їх контролювала, мала навчитися до цього пристосовуватись. Науковці розвинули також метод тренінгу, щоб стрибки поміж роботами не були надто великими чи малими. 

Система від Університету Карнегі-Меллона під назвою REvolveR (від Robot-Evolve-Robot) перевершує основні методи, які полягають у навчанні робота з нуля. Щоб досягнути 90-відсоткового показника ефективності грейфера при завданні з молотком та в інших ситуаціях, як-от штовхання м’яча чи відкривання дверей, найкращий альтернативний метод тренінгу вимагає від 29 до 108 % більше спроб, ніж REvolveR, попри те, що в альтернативному методі використовується більше зворотної тренінгової інформації. У подальших експериментах науковці протестували метод на інших типах віртуальних роботів, додаючи, наприклад, ноги до павукоподібного робота й навчаючи його ходити наново. 

“Гадаю, що це гарна ідея”, — вважає Віталій Курін, інформатик з Оксфордського університету, який вивчає роботехніку й машинне навчання, але не брав участі в описаних працях. Хоч спроби перенесення знань за допомогою штучного розуму не є чимось новим, але, як він твердить, такого трансферу, що використовує інтерполяцію поміж роботами, раніше він не брав до уваги.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься.


З ЦИМ МАТЕРІАЛОМ ЧИТАЮТЬ


Коридори для тварин Нагодувати думки