توضیحات
کنترل مشارکتی بهینه با استفاده از یادگیری تقویتی ساده شده برای دسته ای از سیستم های چند عاملی با دینامیک ناشناخته
عنوان اصلی مقاله:
Optimized Formation Control Using Simplified Reinforcement Learning for a Class of Multiagent Systems With Unknown Dynamics
شبیه سازی در محیط ام فایل متلب انجام شده است.
گزارش شبیه سازی ندارد.
مقدمه:
این مقاله یک کنترل مشارکتی پیرو بهینه را با استفاده از یک یادگیری تقویتی ساده شده (RL) معماری شناسه – منتقد – بازیگر برای یک کلاس از سیستمهای چندعاملی غیرخطی پیشنهاد میکند. به طور کلی، انتظار می رود که کنترل بهینه با حل معادله همیلتون-جاکوبی-بلمن (HJB) بدست آید، اما حل معادله مرتبط با یک سیستم غیرخطی با روش تحلیلی دشوار است. اگرچه می توان با استراتژی RL بر این مشکل غلبه کرد، اما الگوریتم های RL موجود بسیار پیچیده هستند زیرا قوانین به روز رسانی آنها با اجرای الگوریتم نزول گرادیان به مربع معادله تقریبی HJB (خطای باقی مانده بلمن) به دست می آید. برای یک سیستم چند عاملی، به دلیل مشکل کوپلینگ حالت، اجرای این روش ها دشوار خواهد شد. در طرح بهینهسازی شده پیشنهادی، قوانین بهروزرسانی RL از گرادیان منفی یک تابع مثبت ساده، که معادل معادله HJB است، مشتق شدهاند. بنابراین، الگوریتم کنترل به طور قابل توجهی ساده است. علاوه بر این، به منظور حل مشکل پویایی سیستم ناشناخته، یک شناسه تطبیقی در کنترل یکپارچه شده است. در نهایت، تئوری و شبیهسازی نشان میدهند که طرح شکلگیری بهینه میتواند عملکرد کنترل مورد نظر را تضمین کند.
توضیحات پروژه کنترل مشارکت
نتایج شبیه سازی شامل نتایج شکل 1 تا 8 مقاله است. در شکل 7 و 8 مقاله نتیجه مربوط به رفرنس 19 مقاله نیز ترسیم شده که در اینجا جز نتایج مقایسه ای بوده و شبیه سازی نشده است.
در زیر نتایج مربوط به شبیه سازی مقاله را مشاهده می کنید:
همانطور که مشاهده می شود نتایج مطلوبی بدست آمده است.
شاید به موارد زیر نیز علاقه مند باشید:
- کنترل غیرخطی مبدل تقویتی با استفاده از الگوریتم یادگیری تقویتی مبتنی بر رگرسیون مقاوم
- کنترل مشارکتی بهینه داده محور برای تیم کوادروتور با داینامیک ناشناخته
- استفاده از یادگیری تقویتی برای الگوریتم های رتبه بندی صفحات وب
- کنترل بهینه مبتنی بر یادگیری تقویتی برای سیستم غیرخطی محدود از طریق یک تبدیل جدید وابسته به حالت
- روش جدید برای کنترل و مسیر یابی سیستم های رباتیک چند عاملی
کلیدواژه:
Identifier–critic–actor architecture, Lyapounov function, neural networks (NNs), optimized formation control, simplified reinforcement learning (RL)
معماری شناسه, تابع لیاپونوف, شبکههای عصبی (NN), کنترل مشارکتی بهینه, یادگیری تقویتی ساده (RL)
کنترل مشارکتی بهینه با استفاده از یادگیری تقویتی ساده شده برای دسته ای از سیستم های چند عاملی با دینامیک ناشناخته با متلب
طبق توضیحات فوق توسط کارشناسان سایت متلبی تهیه شده است و به تعداد محدودی قابل فروش می باشد.
سفارش انجام پروژه مشابه
درصورتیکه این محصول دقیقا مطابق خواسته شما نمی باشد،.
با کلیک بر روی کلید زیر پروژه دلخواه خود را سفارش دهید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.