توضیحات
An Improved Apriori Algorithm Based On the Boolean Matrix and Hadoop
طبقه بندي نيازها و درک رفتاركاربران نرم افزاري، استخراج قوانین انجمنی با استفاده از الگوریتم apriori
گزارش پروژه:
برنامه arffread
این برنامه فایل باینری با پسوند .arff را دریافت میکند و مشخصات آن را در محیط متلب نشان میدهد.
خروجی این فایل شامل یک سلول شامل رشته بیت باینری اطلاعات و یک سلول شامل اسم هر کدام از سلولها میباشد.
برنامه preprocessing
در این برنامه یک سری پیش پردازشهای دیگر بر روی دیتای ورودی انجام میشود.
برای مثال داده شده، 14 ستون از ماتریس باینری شامل 3 ایتم سن، 4 آیتم تحصیلات، 4 آیتم تقاضا و 3 آیتم زمانی میباشد که این مولفه ها به عنوان مشخصات افراد مورد آزمایش میباشند و در ماتریسی بنام data معرفی میشوند.
مابقی ستونهای ماتریس باینری اولیه شامل 17 سوال و هر سوال شامل 4 حالت میباشد.
پس در مجموع 17*4 یعنی 68 حالت میشود که در ماتریسس تحت عنوان Question به عنوان خروجی معرفی میشوند.
پس خروجی این برنامه دو ماتریس اطلاعات (سن، تحصیلات و …) و ماتریس سوالات (17 سوال و هر سوال 4 حالت) میباشد.
برنامه FindFrequent
این برنامه سعی میکند که حالتهای n-Frequent ماتریس بولی را استخراج کند.
برای مثال اگر مقدار minsup برابر با 2 انتخاب شود در این صورت از بین 14 حالت (سن، تحصیلات و …) آنهایی که بیش از 1 بار رخ دهند را نگه میدارد و آنهایی که کمتر از 2 هستند را حذف میکند.
برای مثال یا انتخاب minsup=2 درخواست نوع D و زمان نوع b تنها یک بار در دیتاست موجود هستند و بنابراین حذف میشوند و 12 حالت باقی میماند.
این برنامه قابل اجرا برای حالتهای ترکیبی نیز میباشد.
انجام پروژه متلب را به متخصصین متلبی بسپارید.
برای مثال اگر سن A و تحصیلا C و درخواست D کمتر از حد minsup باشند آنگاه در ترکیب 3 تایی این حالت حذف میشود.
ورودی این برنامه به ترتیب دیتاست باینری، ماتریس سوالات پاسخ داده شده (Question)، تعداد ترکیبات (مثلا اگر 2 باشد، سن با تحصیلات، یا سن با درخواست، یا در خواست با تحصیلات و …) و مقدار minsup میباشد.
خروجی این برنامه ردیفهایی از ماتریس باینری که n-frequent هستند (L)، احتمال پاسخها به ازای این حالتها میباشد.
احتمال پاسخها برای هر حالت یک ماتریس 17*4 است.
مثلا اگر سن A و تحصیلات B یک حالت 2-frequent باشند آنگاه به ازای این حالت یک ماتریس 4*17 داریم که این ماتریس احتمال M، I ، O ، A هر یک از 17 سوال در این حالت را مشخص میکند.
برنامه percentage
این برنامه یک رشته باینری را میگیرد و احتمال 17 سوال را برای چهار حالت M، I ، O ، A معرفی میکند.
نکته مهم این است که این چهار حالت در هر سوال، ترتیب خاصی یکسانی ندارند و از یک سوال به سوال دیگر متفاوت است.
مثلا در سوال اول ترتیب به صورت O,A,I,M و در سوال دوم بصورت M,A,O,I میباشد.
برنامه Main
بخشی از گزارش در اینجا نیامده و با خرید محصول قابل دریافت است.
در ادامه با استفاده از حلقه for به ازای حالتهای ترکیبی 2،3،4 تمام k-frequent ها را مییابیم و احتمالات آنها را محاسبه میکنیم.
در پایان به منظور نمایش نتایج خروجی از کاربر سوالاتی پرسیده میشود.
در پاسخ به سوالات از حروف بزرگ استفاده شود و در صورتی که آن حالت مد نظر نیست حرف ‘N’ تایپ شود.
برای مثال میخواهیم ماتریس احتمالات به ازای سن A و تحصیلات C را بیابیم.
پس در سوال ‘A’ ، در سوال دوم ‘C’ و در دو سوال دیگر حرف ‘N’ تایپ شود.
در نهایت یک ماتریس احتمال نمایش داده میشود که این ماتریس 17 سطر و 4 ستون دارد.
ستونها معرف حالت های M، I ، O ، A و ردیفها معرف شماره سوال میباشند.
نکته مهم این است که این چهار حالت در هر سوال، ترتیب خاصی یکسانی ندارند و از یک سوال به سوال دیگر متفاوت است.
مثال:
نمونهای از برنامه Run شده به ازای سن A و تحصیلات A
کلیدواژه:
,پروژه متلب,شبیه سازی با متلب,matlab project,پروژه matlab,پروژه های آماده متلب,Apriori algorithm, Boolean Marix, frequent item sets,Hadoop
شبیه سازی
An Improved Apriori Algorithm Based On the Boolean Matrix and Hadoop
به تعداد محدودی قابل فروش می باشد.
سفارش انجام پروژه مشابه
درصورتیکه این محصول دقیقا مطابق خواسته شما نمی باشد،.
با کلیک بر روی کلید زیر پروژه دلخواه خود را سفارش دهید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.