معرفی کنترل تطبیقی
به گفته متلبی,کنترل تطبیقی یک روش کنترلی است که در آن کنترلکننده باید به یک سیستم کنترلشده با پارامترهایی که متغیر هستند یا در ابتدا نامعلوم هستند، تطبیق پیدا کند. این روش به کنترلکننده امکان میدهد که عملکرد سیستم را در شرایط تغییری حفظ کند و به بهبود کیفیت و کارایی سیستم کمک کند. کنترل تطبیقی در بسیاری از زمینههای مهندسی، مانند هوافضا، رباتیک، صنعت، اتومبیل، و ارتباطات کاربرد دارد.
من، کنترل تطبیقی توسط وایتکر (Whitaker) و همکارانش در اوایل دهه ۱۹۵۰ میلادی برای حل مسئله کنترل خلبان خودکار هواپیماها معرفی شد. این روش بر اساس تخمین پارامترهای سیستم و تطبیق قانون کنترلی با آنها بنا شده است.
انواع کنترل تطبیقی
کنترل تطبیقی را میتوان به چندین روش دستهبندی کرد، بر اساس نوع کنترلکننده، نوع مدل، نوع تخمین، و نوع الگوریتم. در این بخش، برخی از روشهای رایج کنترل تطبیقی را معرفی میکنیم.
کنترلکنندههای تطبیقی دوگان
کنترلکنندههای تطبیقی دوگان بر اساس نظریه کنترل دوگان بنا شدهاند. در این روش، کنترلکننده از دو بخش تشکیل شده است: یک بخش کنترلی و یک بخش تخمینی. بخش کنترلی یک قانون کنترلی ثابت را دارد که بر اساس یک مدل مرجع طراحی شده است. بخش تخمینی یک مدل تخمینی از سیستم را دارد که بر اساس دادههای ورودی و خروجی سیستم بهروزرسانی میشود. هدف این روش این است که مدل تخمینی را به مدل مرجع نزدیک کند و در نتیجه عملکرد حلقه بسته را بهینه کند.
کنترلکنندههای تطبیقی دوگان را میتوان به دو دسته تقسیم کرد: کنترلکنندههای دوگان بهینه و کنترلکنندههای دوگان زیربهینه. کنترلکنندههای دوگان بهینه طوری طراحی میشوند که عملکرد حلقه بسته را با توجه به یک معیار بهینهسازی مانند کمینهکردن خطای مربعات یا کمینهکردن هزینه کنترل بهینه کنند. این کنترلکنندهها معمولا دشوارتر از کنترلکنندههای زیربهینه هستند و نیاز به حل معادلات غیرخطی یا بهینهسازی محدب دارند. کنترلکنندههای دوگان زیربهینه طوری طراحی میشوند که عملکرد حلقه بسته را با توجه به یک معیار سادهتر مانند کمینهکردن خطای مدل یا کمینهکردن هزینه تخمین بهبود بخشند. این کنترلکنندهها معمولا سادهتر از کنترلکنندههای بهینه هستند و نیاز به حل معادلات خطی یا بهینهسازی خطی دارند.
کنترلکنندههای تطبیقی غیردوگان
کنترلکنندههای تطبیقی غیردوگان از نظریه کنترل دوگان استفاده نمیکنند و به جای آن از روشهای دیگری برای تطبیق کنترلکننده با سیستم استفاده میکنند. برخی از روشهای رایج کنترل تطبیقی غیردوگان را متلبی به شرح زیر آورده است:
کنترل جایابی قطب تطبیقی یک روش کنترل تطبیقی غیردوگان است که در آن کنترلکننده از یک قانون کنترلی پایه استفاده میکند که بر اساس یک مدل مرجع طراحی شده است. این قانون کنترلی پایه میتواند یک کنترلکننده PID، LQR، یا هر نوع دیگری باشد. هدف این روش این است که قطبهای سیستم حلقه بسته را به قطبهای مدل مرجع نزدیک کند و در نتیجه عملکرد حلقه بسته را بهبود بخشد. برای این کار، کنترلکننده از یک الگوریتم تخمین پارامتر استفاده میکند که بر اساس دادههای ورودی و خروجی سیستم پارامترهای مدل سیستم را بهروزرسانی میکند. سپس، با استفاده از این پارامترها، کنترلکننده یک تابع انتقال تطبیقی را محاسبه میکند که برای تغییر قانون کنترلی پایه استفاده میشود. این تابع انتقال تطبیقی میتواند یک تابع نسبت، تفاضل، یا جمع باشد. برای اثبات پایداری این روش، معمولا از روشهای پایداری لیاپانوف یا بارو-اصول استفاده میشود.
- کنترل تطبیقی جستجوی اکسترمم:
کنترلکنندههای جستجوی اکسترمم یک روش کنترل تطبیقی غیردوگان است که در آن کنترلکننده به دنبال یافتن یک نقطه اکسترمم (بیشینه یا کمینه) برای یک تابع هدف است. این تابع هدف میتواند یک معیار عملکرد، یک معیار کیفیت، یا هر نوع دیگری باشد. برای این کار، کنترلکننده از یک الگوریتم جستجوی اکسترمم استفاده میکند که بر اساس دادههای ورودی و خروجی سیستم یک جهت بهبود را پیدا میکند و سپس قانون کنترلی را در آن جهت تغییر میدهد. این الگوریتمها میتوانند از روشهای مختلفی مانند روش گرادیان، روش نیوتن، روش هوک-جیوس، روش نلدر-مید، یا روشهای تکاملی استفاده کنند.
کنترلکنندههای جستجوی اکسترمم در برخی موارد میتوانند بهتر از کنترلکنندههای دوگان عمل کنند، زیرا نیازی به داشتن یک مدل مرجع یا یک مدل تخمینی ندارند و فقط بر اساس دادههای سیستم عمل میکنند. اما این کنترلکنندهها همچنین چالشهایی را نیز دارند، مانند انتخاب یک تابع هدف مناسب، تضمین پایداری و همگرایی، مقابله با عدم قطعیت و اختلال، و تنظیم پارامترهای الگوریتم جستجو.
- کنترل تطبیقی یادگیری تکراری
کنترل یادگیری تکراری یک روش کنترل تطبیقی غیردوگان است که در آن کنترلکننده از یک الگوریتم یادگیری استفاده میکند که بر اساس تکرار یک فرآیند کنترلی بهبود مییابد. این روش به کنترلکننده امکان میدهد که از تجربههای گذشته خود یاد بگیرد و قانون کنترلی خود را به طور مداوم بهینه کند. کنترل یادگیری تکراری در برخی موارد میتواند بهتر از کنترلکنندههای دوگان عمل کند، زیرا نیازی به داشتن یک مدل مرجع یا یک مدل تخمینی ندارد و فقط بر اساس دادههای سیستم عمل میکند. اما این کنترلکنندهها همچنین چالشهایی را نیز دارند، مانند انتخاب یک الگوریتم یادگیری مناسب، تضمین پایداری و همگرایی، مقابله با عدم قطعیت و اختلال، و تنظیم پارامترهای الگوریتم یادگیری.
- کنترل تطبیقی برنامهریزی سود
کنترل تطبیقی برنامه ریزی سود یک روش کنترلی است که در آن کنترلکننده از یک الگوریتم یادگیری استفاده میکند که بر اساس دادههای سیستم و بازار، اهداف و راهبردهای برنامه ریزی سود را بهروزرسانی میکند. این روش به کنترلکننده امکان میدهد که به سود مورد نظر برسد و به عوامل تغییری مانند تقاضا، رقابت، هزینه، و قیمت پاسخگو باشد. کنترل تطبیقی برنامه ریزی سود در برخی موارد میتواند بهتر از کنترلکنندههای ثابت عمل کند، زیرا نیازی به داشتن یک مدل دقیق از سیستم و بازار ندارد و فقط بر اساس دادههای واقعی عمل میکند. اما این کنترلکنندهها همچنین چالشهایی را نیز دارند،
کنترل تطبیقی مدل مرجع
کنترلتطبیقی مدل مرجع (MRAC) یک دسته از کنترلکنندههای تطبیقی فیدبک هستند که در آن یک مدل مرجع برای تعیین عملکرد مورد نظر حلقه بسته استفاده میشود. این کنترلکنندهها سعی میکنند خروجی سیستم را به خروجی مدل مرجع نزدیک کنند و در نتیجه عملکرد حلقه بسته را بهبود بخشند. برای این کار، کنترلکنندهها از یک الگوریتم تخمین پارامتر یا یک الگوریتم بهینهسازی گرادیان استفاده میکنند که بر اساس دادههای ورودی و خروجی سیستم، قانون کنترلی را بهروزرسانی میکنند. پایداری و همگرایی این کنترلکنندهها معمولا با استفاده از روشهای لیاپانوف یا بارو-اصول اثبات میشود.
- کنترل تطبیقی MRAC بهینهسازی گرادیان
این روش یکی از روشهای کنترل تطبیقی مدل مرجع است که در آن یک مدل مرجع برای تعیین عملکرد مورد نظر حلقه بسته استفاده میشود. این روش از یک الگوریتم بهینهسازی گرادیان استفاده میکند که بر اساس دادههای ورودی و خروجی سیستم، قانون کنترلی را بهروزرسانی میکند. هدف این روش این است که خروجی سیستم را به خروجی مدل مرجع نزدیک کند و در نتیجه عملکرد حلقه بسته را بهبود بخشد. این روش به عنوان مثال در قانون MIT استفاده میشود. پایداری و همگرایی این روش با استفاده از روشهای لیاپانوف یا بارو-اصول اثبات میشود.
- کنترل تطبیقی MRAC بهینهسازی پایداری
این روش یکی از روشهای کنترل تطبیقی مدل مرجع است که در آن یک مدل مرجع برای تعیین عملکرد مورد نظر حلقه بسته استفاده میشود. این روش از یک الگوریتم بهینهسازی پایداری استفاده میکند که بر اساس دادههای ورودی و خروجی سیستم، قانون کنترلی را بهروزرسانی میکند. هدف این روش این است که خروجی سیستم را به خروجی مدل مرجع نزدیک کند و در نتیجه عملکرد حلقه بسته را بهبود بخشد. این روش به عنوان مثال در قانون MRAC بهینهسازی شده با استفاده از روش لیاپانوف استفاده میشود. پایداری و همگرایی این روش با استفاده از روشهای لیاپانوف یا بارو-اصول اثبات میشود.
- کنترلکنندههای شناسایی مدل تطبیقی (MIAC)
کنترلکنندههای شناسایی مدل تطبیقی یک دسته از کنترلکنندههای تطبیقی هستند که در آن یک مدل تخمینی از سیستم تحت کنترل بر اساس دادههای ورودی و خروجی سیستم شناسایی میشود. این مدل تخمینی سپس برای طراحی قانون کنترلی مورد استفاده قرار میگیرد. این روش به کنترلکننده امکان میدهد که با تغییرات پارامترها، عدم قطعیتها، و اختلالهای سیستم سازگار شود. اما این کنترلکنندهها همچنین چالشهایی را نیز دارند، مانند انتخاب یک مدل مناسب، تضمین پایداری و همگرایی، و تنظیم پارامترهای الگوریتم شناسایی. این روش شناسایی سیستم را در حین اجرای سیستم انجام میدهد.
- کنترلکنندههای تطبیقی محتاط
کنترلکنندههای تطبیقی محتاط یک دسته از کنترلکنندههای تطبیقی هستند که در آن یک معیار محتاطی برای تنظیم پارامترهای کنترلکننده استفاده میشود. این معیار محتاطی میتواند بر اساس خطای تخمین، محدودیتهای فیزیکی، یا اطلاعات آماری باشد. هدف این روش این است که کنترلکننده را از تغییرات بیش از حد پارامترها جلوگیری کند و در نتیجه پایداری و عملکرد حلقه بسته را حفظ کند. این روش به عنوان مثال در کنترلکنندههای تطبیقی مدل مرجع با معیار محتاطی بر اساس خطای تخمین ارائه شده است.کنترلکنندههای تطبیقی محتاط از شناسایی سیستم فعلی برای تغییر قانون کنترلی استفاده میکنند، با در نظر گرفتن عدم قطعیت شناسایی سیستم.
- کنترلکنندههای تطبیقی معادل اطمینان
کنترلکنندههای تطبیقی معادل اطمینان یک دسته از کنترلکنندههای تطبیقی هستند که در آن یک معادل اطمینان برای تنظیم پارامترهای کنترلکننده استفاده میشود. این معادل اطمینان میتواند بر اساس خطای تخمین، محدودیتهای فیزیکی، یا اطلاعات آماری باشد. هدف این روش این است که کنترلکننده را از تغییرات بیش از حد پارامترها جلوگیری کند و در نتیجه پایداری و عملکرد حلقه بسته را حفظ کند. این روش به عنوان مثال در کنترلکنندههای تطبیقی مدل مرجع با معادل اطمینان بر اساس خطای تخمین ارائه شده است.
- کنترلکنندههای تطبیقی غیرپارامتری
کنترلکنندههای تطبیقی غیرپارامتری یک دسته از کنترلکنندههای تطبیقی هستند که در آن پارامترهای سیستم تحت کنترل به صورت مستقیم برآورد نمیشوند، بلکه از روشهای غیرپارامتری مانند رگرسیون نونپارامتریک، شبکههای عصبی، یا منطق فازی برای تخمین رفتار سیستم استفاده میشود. این روشها مزیت دارند که نیازی به فرض یک مدل ساختاری برای سیستم ندارند و میتوانند با سیستمهای پیچیده، غیرخطی، و عدم قطعیت بالا کار کنند. اما این روشها همچنین چالشهایی را نیز دارند، مانند تعیین تعداد و نوع پارامترهای غیرپارامتری، تضمین پایداری و همگرایی، و تنظیم پارامترهای الگوریتم یادگیری.
- کنترلکنندههای تطبیقی پارامتری
کنترلکنندههای تطبیقی پارامتری یک دسته از کنترلکنندههای تطبیقی هستند که در آن پارامترهای سیستم تحت کنترل به صورت پارامتری مدل میشوند و با استفاده از روشهای برآورد پارامتر تخمین زده میشوند. این روشها مزیت دارند که میتوانند با سیستمهای خطی یا غیرخطی کار کنند و میتوانند از روشهای مختلفی مانند حداقل مربعات بازگشتی، گرادیان نزولی، یا روشهای فضای حالت برای برآورد پارامترها استفاده کنند. اما این روشها همچنین چالشهایی را نیز دارند، مانند انتخاب یک مدل مناسب، تضمین پایداری و همگرایی، و تنظیم پارامترهای الگوریتم برآورد.
- کنترلکنندههای تطبیقی پارامتر صریح
کنترلکنندههای تطبیقی پارامتر صریح یک دسته از کنترلکنندههای تطبیقی پارامتری هستند که در آن پارامترهای سیستم تحت کنترل به صورت صریح مدل میشوند و با استفاده از روشهای برآورد پارامتر تخمین زده میشوند. این روشها مزیت دارند که میتوانند با سیستمهای خطی یا غیرخطی کار کنند و میتوانند از روشهای مختلفی مانند حداقل مربعات بازگشتی، گرادیان نزولی، یا روشهای فضای حالت برای برآورد پارامترها استفاده کنند. اما این روشها همچنین چالشهایی را نیز دارند، مانند انتخاب یک مدل مناسب، تضمین پایداری و همگرایی، و تنظیم پارامترهای الگوریتم برآورد.
- کنترلکنندههای تطبیقی پارامتر ضمنی
کنترلکنندههای تطبیقی پارامتر ضمنی یک دسته از کنترلکنندههای تطبیقی پارامتری هستند که در آن پارامترهای سیستم تحت کنترل به صورت ضمنی مدل میشوند و با استفاده از روشهای برآورد پارامتر تخمین زده میشوند. این روشها مزیت دارند که میتوانند با سیستمهای خطی یا غیرخطی کار کنند و میتوانند از روشهای مختلفی مانند حداقل مربعات بازگشتی، گرادیان نزولی، یا روشهای فضای حالت برای برآورد پارامترها استفاده کنند. اما این روشها همچنین چالشهایی را نیز دارند، مانند انتخاب یک مدل مناسب، تضمین پایداری و همگرایی، و تنظیم پارامترهای الگوریتم برآورد.
دسته بندی دیگر از کنترل تطبیقی:
انواع کنترل تطبیقی را میتوان به دو دسته کلی تقسیم کرد:
- کنترل تطبیقی روبه جلو یا پیشخور (feedforward): در این دسته، کنترلکننده بر اساس اختلالاتی که بر سیستم تأثیر میگذارند، عمل میکند. برای این کار، کنترلکننده به یک دانش قبلی از رابطه بین اختلال و خروجی سیستم نیاز دارد. این روش مزیت دارد که میتواند به طور پیشگیرانه به تغییرات سیستم پاسخ دهد.
- کنترل تطبیقی پسخور (feedback): در این دسته، کنترلکننده بر اساس خروجی سیستم عمل میکند. برای این کار، کنترلکننده به یک حسگر برای اندازهگیری خروجی سیستم نیاز دارد. این روش مزیت دارد که میتواند به طور واکنشی به تغییرات سیستم پاسخ دهد.
هر دو دسته کنترل تطبیقی را میتوان به دو زیر دسته تقسیم کرد:
- کنترل تطبیقی مستقیم: در این زیر دسته، کنترلکننده پارامترهای سیستم را به طور مستقیم برآورد میکند و از آنها برای تنظیم قانون کنترل استفاده میکند. این روش مزیت دارد که ساده و قابل پیادهسازی است. اما این روش چالشهایی را نیز دارد، مانند انتخاب یک مدل مناسب برای سیستم، تضمین پایداری و همگرایی، و تنظیم پارامترهای الگوریتم برآورد.
- کنترل تطبیقی غیرمستقیم: در این زیر دسته، کنترلکننده پارامترهای سیستم را به طور غیرمستقیم برآورد میکند و از آنها برای طراحی یک قانون کنترل استفاده میکند. این روش مزیت دارد که میتواند با سیستمهای پیچیدهتر کار کند و از روشهای مختلفی برای طراحی قانون کنترل استفاده کند. اما این روش چالشهایی را نیز دارد، مانند پیچیدگی و تاخیر در پیادهسازی، و وابستگی به دقت و سرعت الگوریتم برآورد.
نقات قوت کنترل تطبیقی
برخی از نقاط قوت کنترل تطبیقی عبارتند از:
- افزایش عملکرد و کارایی سیستم با تنظیم پارامترهای کنترلکننده به طور خودکار
- کاهش هزینههای طراحی و تست با استفاده از یک کنترلکننده برای چندین سیستم مختلف
- افزایش قابلیت اطمینان و ایمنی سیستم با پاسخگویی به تغییرات غیرمنتظره یا خرابیها
- امکان کار با سیستمهای پیچیده، خطی یا غیرخطی، چندمتغیره یا چندحالته
- امکان استفاده از روشهای مختلف برای طراحی قانون کنترل، مانند فضای حالت، کنترل بهینه، کنترل فازی، کنترل عصبی و غیره
شبیه سازی کنترل کننده تطبیقی با متلب
متلب دارای ابزارهای مختلفی برای طراحی، شبیه سازی، تست و ارزیابی کنترلکنندههای تطبیقی است. برخی از این ابزارها عبارتند از:
- جعبه ابزار کنترل تطبیقی (Adaptive Control Toolbox): این جعبه ابزار شامل توابع و رابطهای گرافیکی برای طراحی و شبیه سازی کنترلکنندههای تطبیقی مستقیم و غیرمستقیم است. این جعبه ابزار از روشهای مختلفی مانند حداقل مربعات بازگشتی، گرادیان نزولی، رگلاتور خودتنظیم، کنترل کننده فیدبک خروجی، کنترل کننده مدل مرجع و غیره پشتیبانی میکند.
- جعبه ابزار شناسایی سیستم (System Identification Toolbox): این جعبه ابزار شامل توابع و رابطهای گرافیکی برای شناسایی پارامترها و ساختار سیستمهای خطی و غیرخطی است. این جعبه ابزار از روشهای مختلفی مانند حداقل مربعات، حداقل مربعات بازگشتی، کمترین مربعات موثر، فیلتر کالمن، شبکههای عصبی، منطق فازی و غیره پشتیبانی میکند.
- جعبه ابزار کنترل رباتیک (Robotics Toolbox): این جعبه ابزار شامل توابع و رابطهای گرافیکی برای طراحی و شبیه سازی کنترلکنندههای تطبیقی برای رباتهای متحرک و دستهای رباتیک است. این جعبه ابزار از روشهای مختلفی مانند کنترل کننده مدل مرجع، کنترل کننده مدل مرجع بازخوردی، کنترل کننده مدل مرجع بازخوردی پیشبین، کنترل کننده مدل مرجع بازخوردی پیشبین با محدودیت و غیره پشتیبانی میکند.
نرم افزار متلب یکی از نرم افزارهای قدرتمند و منعطف در پیاده سازی انواع مسائل کنترلی از جمله انجام پروژه کنترل تطبیقی است. متلبی با داشتن تیمی متخصص و مجرب در زمینه انجام پروژه کنترل تطبیقی می تواند شما را یاری نماید.