یک ربات لجن مانند را تصور کنید که می تواند به طور یکپارچه شکل خود را تغییر دهد و از طریق فضاهای باریکی که می تواند در داخل بدن انسان مستقر شود تا یک مورد ناخواسته را از بین ببرد.
در حالی که چنین رباتی هنوز در خارج از آزمایشگاه وجود ندارد، محققان در حال توسعه ربات های نرم قابل تنظیم مجدد برای کاربرد در مراقبت های بهداشتی، دستگاه های پوشیدنی و سیستم های صنعتی هستند.
اما چگونه میتوان رباتی را کنترل کرد که مفاصل، اندام یا انگشتان قابل دستکاری ندارد و بهجای آن میتواند کل شکل آن را بهشدت تغییر دهد؟ محققان MIT در حال کار برای پاسخ به این سوال هستند.
آنها یک الگوریتم کنترلی توسعه دادند که می تواند به طور مستقل یاد بگیرد که چگونه یک ربات قابل تنظیم مجدد را برای انجام یک کار خاص حرکت دهد، کشش دهد و شکل دهد، حتی زمانی که این کار به ربات نیاز دارد که مورفولوژی خود را چندین بار تغییر دهد. این تیم همچنین یک شبیهساز برای آزمایش الگوریتمهای کنترل برای رباتهای نرم قابل تغییر شکل در یک سری وظایف چالشبرانگیز و تغییر شکل ساختند.
روش آنها هر یک از هشت وظیفهای را که ارزیابی میکردند، در حالی که از سایر الگوریتمها بهتر بود، تکمیل کرد. این تکنیک به ویژه در کارهای چند وجهی به خوبی کار می کرد. به عنوان مثال، در یک آزمایش، ربات مجبور شد ارتفاع خود را کاهش دهد در حالی که دو پای کوچک خود را رشد میداد تا از طریق لولهای باریک بفشرد، و سپس آن پاها را از بین میبرد و بالاتنه خود را برای باز کردن درب لوله باز میکرد.
در حالی که ربات های نرم قابل تنظیم مجدد هنوز در مراحل ابتدایی خود هستند، چنین تکنیکی روزی می تواند ربات های همه منظوره را فعال کند که می توانند شکل خود را برای انجام وظایف مختلف تطبیق دهند.
وقتی مردم به رباتهای نرم فکر میکنند، تمایل دارند به رباتهایی فکر کنند که قابلیت ارتجاعی دارند، اما به شکل اولیه خود باز میگردند. ربات ما مانند لجن است و در واقع میتواند مورفولوژی آن را تغییر دهد. این بسیار شگفتانگیز است که روش ما بسیار خوب عمل کرده است، زیرا ما بویوان چن، دانشجوی فارغ التحصیل مهندسی برق و علوم کامپیوتر (EECS) و یکی از نویسندگان مقاله ای در مورد این رویکرد، می گوید که با چیز بسیار جدیدی سر و کار داریم.
نویسندگان مشترک چن عبارتند از سونینگ هوانگ، نویسنده اصلی، دانشجوی کارشناسی در دانشگاه Tsinghua در چین که این کار را در زمانی که دانشجوی مهمان در MIT بود، تکمیل کرد. Huazhe Xu، استادیار دانشگاه Tsinghua; و نویسنده ارشد وینسنت سیتزمن، استادیار EECS در MIT که رهبری گروه نمایش صحنه در آزمایشگاه علوم کامپیوتر و هوش مصنوعی را بر عهده دارد. این تحقیق در کنفرانس بینالمللی نمایشهای یادگیری ارائه خواهد شد.
کنترل حرکت پویا
دانشمندان اغلب به ربات ها می آموزند که وظایف خود را با استفاده از یک رویکرد یادگیری ماشینی معروف به یادگیری تقویتی انجام دهند، که یک فرآیند آزمون و خطا است که در آن ربات برای اقداماتی که آن را به هدف نزدیکتر می کند، پاداش می گیرد.
این می تواند زمانی موثر باشد که قسمت های متحرک ربات یکدست و به خوبی مشخص باشد، مانند یک گیره با سه انگشت. با یک گیره رباتیک، یک الگوریتم یادگیری تقویتی ممکن است یک انگشت را کمی حرکت دهد و با آزمون و خطا بفهمد که آیا این حرکت پاداشی برای آن به همراه دارد یا خیر. سپس به انگشت بعدی می رفت و به همین ترتیب.
اما رباتهای تغییر شکل، که توسط میدانهای مغناطیسی کنترل میشوند، میتوانند به صورت دینامیکی کل بدن خود را منقبض، خم یا دراز کنند.
چن می گوید: «چنین روباتی می تواند هزاران قطعه کوچک عضلانی برای کنترل داشته باشد، بنابراین یادگیری آن به روش سنتی بسیار سخت است.
برای حل این مشکل، او و همکارانش باید جور دیگری درباره آن فکر می کردند. به جای حرکت دادن هر عضله کوچک به صورت جداگانه، الگوریتم یادگیری تقویتی آنها با یادگیری کنترل گروه هایی از عضلات مجاور که با هم کار می کنند شروع می شود.
سپس، پس از اینکه الگوریتم با تمرکز بر گروههای ماهیچهای، فضای اقدامات ممکن را بررسی کرد، به جزئیات دقیقتری برای بهینهسازی خطمشی یا برنامه اقدام میپردازد. به این ترتیب، الگوریتم کنترل از یک روش درشت به ریز پیروی می کند.
Sitzmann میگوید: “درشت به ریز به این معنی است که وقتی یک عمل تصادفی انجام میدهید، آن عمل تصادفی احتمالاً تفاوت ایجاد میکند. تغییر در نتیجه احتمالاً بسیار قابل توجه است زیرا شما به طور درشت چندین عضله را همزمان کنترل میکنید.”
برای فعال کردن این کار، محققان با فضای عمل یک ربات یا نحوه حرکت آن در یک منطقه خاص مانند یک تصویر رفتار می کنند.
مدل یادگیری ماشینی آنها از تصاویر محیط ربات برای ایجاد یک فضای عمل دو بعدی استفاده می کند که شامل ربات و ناحیه اطراف آن می شود. آنها حرکت ربات را با استفاده از روشی به نام ماده-نقطه-روش شبیه سازی می کنند، جایی که فضای عمل توسط نقاطی مانند پیکسل های تصویر پوشیده شده و با یک شبکه پوشانده شده است.
همانطور که پیکسلهای نزدیک در یک تصویر با هم مرتبط هستند (مانند پیکسلهایی که یک درخت را در عکس تشکیل میدهند)، آنها الگوریتم خود را برای درک اینکه نقاط عمل نزدیک همبستگی قویتری دارند ساختهاند. نقاط اطراف “شانه” ربات با تغییر شکل به طور مشابه حرکت می کنند، در حالی که نقاط روی “پای” ربات نیز مشابه حرکت می کنند، اما به روشی متفاوت از نقاط روی “شانه”.
علاوه بر این، محققان از همان مدل یادگیری ماشینی برای نگاه کردن به محیط و پیشبینی اقداماتی که ربات باید انجام دهد استفاده میکنند که باعث کارآمدتر شدن آن میشود.
ساخت شبیه ساز
پس از توسعه این رویکرد، محققان به راهی برای آزمایش آن نیاز داشتند، بنابراین یک محیط شبیهسازی به نام DittoGym ایجاد کردند.
DittoGym دارای هشت وظیفه است که توانایی یک ربات قابل تنظیم مجدد را برای تغییر شکل پویا ارزیابی می کند. در یکی، ربات باید بدن خود را کشیده و منحنی کند تا بتواند موانع را دور بزند تا به نقطه هدف برسد. در دیگری، باید شکل خود را به تقلید از حروف الفبا تغییر دهد.
“انتخاب کار ما در DittoGym هم از اصول طراحی معیار یادگیری تقویتی عمومی و هم از نیازهای خاص ربات های قابل تنظیم مجدد پیروی می کند. هر کار برای نشان دادن ویژگی های خاصی طراحی شده است که ما مهم می دانیم، مانند توانایی حرکت در کاوش های افق طولانی، توانایی هوانگ می گوید: محیط را تجزیه و تحلیل کنید و با اشیاء خارجی تعامل کنید. “ما معتقدیم که آنها با هم می توانند درک جامعی از انعطاف پذیری ربات های قابل تنظیم مجدد و اثربخشی طرح یادگیری تقویتی ما به کاربران ارائه دهند.”
الگوریتم آنها از روش های پایه بهتر عمل کرد و تنها تکنیک مناسب برای تکمیل کارهای چند مرحله ای بود که به چندین تغییر شکل نیاز داشت.
چن میگوید: «ما ارتباط قویتری بین نقاط عملی که به یکدیگر نزدیکتر هستند، داریم و فکر میکنم این کلیدی است که این کار را به خوبی انجام میدهد.
در حالی که ممکن است سالها طول بکشد تا رباتهای تغییر شکل در دنیای واقعی به کار گرفته شوند، چن و همکارانش امیدوارند که کار آنها الهام بخش دانشمندان دیگر باشد نه تنها به مطالعه رباتهای نرم قابل تنظیم مجدد، بلکه در مورد استفاده از فضاهای عمل دو بعدی برای سایر مشکلات کنترلی پیچیده فکر کنند.