Name: Discovering Interesting Rules from Biological Data Using Parallel Genetic Algorithm
SKU: g183
Availability: InStock

توضیحات

Discovering Interesting Rules from Biological Data Using Parallel Genetic Algorithm

ترجمه فارسی موضوع مقاله: کشف قوانین جالب از داده های بیولوژیکی با استفاده از الگوریتم ژنتیک موازی

مقدمه

در این مقاله سعی شده است یک روش استخراج قانون از یک مجموعه داده ارائه شود که بر اساس الگوریتم ژنتیک می باشد.

منظور از استخراج قانون بیرون آوردن رابطه بین ویژگی های موجود در یک مجموعه داده می باشد.

این قوانین دارای شکل کلی می باشند که در آنها X و Y دو زیرمجموعه از ویژگی ها می باشند که دارای اشتراک تهی هستند.

یکی از روش های مهم و پایه در این زمینه روش Apriori نام دارد که روش ارائه شده در این مقاله بر پایه این روش می باشد.

این روش دارای دو پارامتر می باشد که باید توسط کاربر مشخص شوند و الگوریتم به این دو پارامتر حساس می باشد.

این دو پارامتر به ترتیب minimum support و minimum confidence نام دارند.

Support یک قانون نشان دهنده این است که قانون مورد نظر چقدر در مجموعه داده گسترده است و می تواند موثر واقع شود و minimum support یک مقدار آستانه برای این مقدار می باشد.

میزان confidence یک قانون نیز نشان دهنده این مساله است که قانون مورد نظر در چند درصد مواقع با برقراری طرف اول رابطه طرف دوم را بدرستی پیش بینی می کند.

پارامتر minimum confidence یک مقدار آستانه برای این مقدار می باشد.

همانطور که اشاره شد اشکال روش پایه مجبور بودن کاربر برای تعیین دو پارامتر تعریف شده می باشد.

این مقاله این روش را طوری بهبود داده است که نیازی به این پارامترها نمی باشد.

روش پیشنهادی

این روش بر اساس الگوریتم ژنتیک است که در عمل بصورت موازی اجرا می شود که در ادامه قسمت های مختلف آن اجرا می شود که شکل شماره 1 فلوچارت این روش را نشان می دهد.

همانطور که در این شکل مشاهده می کنید قسمت محاسبه تابع fitness می تواند بصورت موازی انجام شود زیرا این بخش برای هر فرد موجود در جمعیت مستقل از افراد دیگر می باشد.

در این روش هر قانون به عنوان یک کروموزوم در نظر گرفته شده است.

مقاله ساختار قانون ها را بصورت سه مولفه ای در نظر گرفته است از این رو طول کروموزوم در واقع 3 می باشد که هر مولفه کروموزوم یک ویژگی از دیتاست و مقدار در نظر گرفته شده برای این ویژگی می باشد.

فایل اصلی برنامه با نام GA_RuleMining.m ذخیره شده است که در آن پارامترهای برنامه مشابه با گفته های مقاله مقدارگذاری می شود و سه تابع فراخوانی می شود.

تابع اول my_read_dataset نام دارد که دیتاست مورد استفاده را به داخل برنامه بارگذاری می کند.

تابع دوم my_GA_algorithm نام دارد و قسمت اصلی مقاله که یافتن قانون ها می باشد را انجام می دهد.

تابع سوم نیز my_accuracy_GA نام دارد که میزان کارایی قانون های استخراجی را محاسبه می کند و میزان دقت را نشان می دهد.

قطعه کد زیر این فایل را نشان می دهد.

…

در این کد maxloop حداکثر تعداد تکرارهای برنامه و تولید نسل را نشان می دهد.

PS و PC و PM به ترتیب احتمال selection ، cross over و mutation را نشان می دهد که طبق گفته مقاله مقدارگذاری شده اند.

حداکثر جمعیت نیز توسط مقدار MaxPopulationSize نشان داده شده است.

K نیز تعداد ویژگی های مورد اسافاده در هر قانون می باشد.

Alfa نیز شرط دوم همگرایی را نشان می دهد که یک مقدار آستانه برای اختلاف fitness بهترین و بدترین فرد موجود در یک نسل می باشد.

مقدار دقت در نهایت در متغیر Accuracy ذخیره می شود که یک بردار nبعدی می باشد که n تعداد کلاس های موجود در دیتاست می باشد که در دیتاست مورد استفاده مقاله برابر 3 بود.

دیتاست مورد استفاده

دیتاست مورد استفاده مقاله Post-Operative Patient نام دارد که دارای 90 داده می باشد که متعلق به سه کلاس می باشند.

تعداد ویژگی های مجموعه داده 8 ویژگی می باشد که مقاله ویژگی 8 را حذف کرده است زیرا این ویژگی دارای تعدادی missing value بوده است.

از این رو مقاله 7 ویژگی بعلاوه اندیس کلاس ها را استفاده کرده است که در زیر نشان داده شده است.

…

ادامه در گزارش آمده است.

نتایج آزمایش ها

آزمایش ها بر روی مجموعه داده معرفی شده به ازای دو مقدار MaxLoop=200 و MaxLoop=5000 انجام شده است.

از آنجا که روش های تکاملی و ژنتیک در اجراهای مختلف جواب های متفاوتی از خود نشان می دهند برنامه برای هر مقدار MaxLoop به تعداد 5 بار اجرا شده و جواب ها در جدول زیر آورده شده است:

MaxLoop=5000			MaxLoop=200			دقت
کلاس 3	کلاس 2	کلاس 1	کلاس 3	کلاس 2	کلاس 1	دقت
88	82	80	46	45	40	اجرای 1
85	86	80	47	48	44	اجرای 2
81	90	78	50	44	42	اجرای 3
82	88	83	49	46	47	اجرای 4
82	85	77	44	43	45	اجرای 5

کلید واژه : الگوریتم ژنتیک موازی

Apriori algorithm, Genetic algorithm, Parallel genetic algorithms, Association rule mining, Data mining

شبیه سازی مقاله Discovering Interesting Rules from Biological Data Using Parallel Genetic Algorithm

توسط کارشناسان سایت متلبی تهیه شده و به تعداد محدودی قابل فروش می باشد.

سفارش انجام پروژه مشابه

درصورتیکه این محصول دقیقا مطابق خواسته شما نمی باشد،. با کلیک بر روی کلید زیر پروژه دلخواه خود را سفارش دهید.

انجام پروژه متلب

توضیحات تکمیلی

نوع مقاله	ژورنال IEEE
سال ثبت مقاله	2012
نوع فایل شبیه سازی	ام فایل متلب
نوع گزارش	کامل دارد
الگوریتم	الگوریتم ژنتیک

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “Discovering Interesting Rules from Biological Data Using Parallel Genetic Algorithm”

متلبی با بیش از یک دهه تجربه و فعالیت در زمینه انجام پروژه های صنعتی, تجاری و آموزشی به صورت تخصصی با کلیه نرم افزارهای مهندسی فعالیت دارد.

سایت متلبی با ضمانت هزینه, سفارشات را با بهترین کیفیت و در کمترین زمان ممکن توسط بهترین متخصصین مربوطه انجام میدهد.

آنچه سایت متلبی را از سایرین متمایز می کند انجام پروژه به همراه آموزش و ارائه پشتیبانی قوی آن است.

بانک عظیم و منحصر بفرد مقالات شبیه سازی شده در قالب مباحث آموزشی و کمک آموزشی را در فروشگاه متلبی میتوان یافت, که با تضمین هزینه و پشتیبانی, قبل و بعد از خرید می باشد.

انجام پروژه متلب تنها یکی از خدمات نرم افزاری سایت متلبی است و تمامی سفارشات برنامه نویسی و شبیه سازی با کلیه نرم افزارها قابل انجام است.

ثبت شده در ستاد ساماندهی پایگاه های اینترنتی (مرکز فن آوری دیجیتال)

Discovering Interesting Rules from Biological Data Using Parallel Genetic Algorithm

توضیحات