پروژه آماده داده کاوی با نرم افزار رپیدماینر (Rapid Miner)پنجشنبه 31, ژانویه 2019
پروژه آماده داده کاوی با نرم افزار رپیدماینر (Rapid Miner)
گروه همیارپروژه یک پروژه بسیارکاربردی را درحوزه داده کاوی با موضوع شرح الگوریتم های خوشه بندی و دسته بندی در نرم افزار رپیدماینر (Rapid Miner) انجام داده است که برای رشته های مهندسی نرم افزار و آی تی بسیار مفید و کاربردی می باشد.این پروژه به همراه گزارش کار کامل نیز می باشد.این پروژه در نرم افزار رپیدماینر (Rapid Miner) انجام شده است.
تشریح پروژه:
در این تمرین قصد داریم در مورد الگوریتم های خوشه بندی و دسته بندی آزمایشهایی را انجام دهیم. دسته بندی به کاربردی میگویند که در آن، داده های آموزشی دارای برچسب است و نیاز داریم مدلهایی را آموزش دهیم که بتواند برچسب داده ها را تشخیص دهد. الگوریتم های خوشه بندی، بر خلاف الگوریتم های دسته بندی، توجهی به برچسب ندارند و به صورت بی نظارت اقدام به گروه بندی داده ها بر اساس معیارهای شباهت میکنند.
دسته بندی:
دسته بندی یکی از روش هایی است که در کاربردهای طبقه بندی اطلاعات مورد استفاده قرار میگیرد. به عنوان مثال، در دسته بندی خبرها، نیاز است که یک خبر را بر اساس ویژگی هایی که دارد، در یک گروه خبری جای دهیم. خوشه بندی نیز کاربردهای فراوانی دارد که به عنوان مثال میتوان در سیستم های پیش نهاد دهنده از آن استفاده کرد. یکی از این کاربردها در شبکه های اجتماعی است که کاربران بر حسب ویژگی هایی که دارند، در گروه های مختلفی خوشه بندی میشوند و میبینیم که بعضی از این شبکه های اجتماعی قادر به معرفی افرادی به کاربر هستند که از لحاظ ویژگی ها، به کاربر نزدیک باشد. در کل الگوریتم های ذکر شده ، جزو الگوریتم های یادگیری ماشین هستند که به خودکارسازی سرویسها کمک میکنند.
هدف پروژه:
در این پروژه در ابتدا، در مورد دیتاست انتخابی توضیحاتی را خواهیم داد. سپس نحوه آماده سازی و پردازش داده ها را شرح میدهیم و در بخش بعدی الگوریتم هایی که در این تمرین مورد استفاده قرار میگیرند را معرفی خواهیم کرد. این الگوریتم ها در دو بخش دسته بندی و خوشه بندی مورد بحث قرار خواهند گرفت. در پایان آزمایشهایی که روی دیتاست انجام شده است را مورد تجزیه و تحلیل قرار میدهیم.
در نهایت هدف از این پروژه، شرح الگوریتم های دسته بندی و خوشه بندی است که روی یک دیتاست این کار انجام میدهیم تا بتوانیم مقایسه ای بین الگوریتمهای مختلف داشته باشیم.
دادگان (دیتاست):
برای این تمرین از داده های سایت UCI استفاده کرده ایم که مربوط به بحث تصاویر ماهواره ای است. لینک زیر مسیر داده ها را نشان میدهد.
https://archive.ics.uci.edu/ml/datasets/Statlog+%28Landsat+Satellite%29
آماده سازی داده ها:
داده ها به دلیل اینکه به صورت عددی هستند و در موقع جمع آوری به شکل صحیحی جمع آوری شده اند، درنتیجه نیازی به پیش پردازشهای خاصی ندارد و تنها باید داده ها را در نرم افزار بارگذاری کرد.
اما در مرحله بعد نیاز است که پردازشهایی روی این دادگان انجام شود. به عنوان مثال کنترل داده های گمشده (miss value)، حذف داده های خارج از محدوده (Outlier) و یا تبدیل خطی روی داده ها و کاهش ابعاد مسئله که در ادامه این موارد را شرح خواهیم داد.
الگوریتم های مورد استفاده:
ما در این پروژه از دو نوع الگوریتم استفاده کردیم که به شرح زیر می باشند:
الگوریتم های دسته بندی:
- شبکه عصبی
- ماشین بردار پشتیبان
- نزدیک ترین همسایگی
- درخت تصمیم
الگوریتم های خوشه بندی:
- روش Kmeans
- روش DBSCAN
- روش EM
جمع بندی:
در این بخش نتایج الگوریتم های دسته بندی و خوشه بندی را مورد بررسی قرار میدهیم. برای دسته بندی از معیار دقت دسته بندی استفاده خواهیم کرد و برای خوشه بندی به دلیل داشتن برچسب و به دلیل ابزارهایی که رپیدماینر در ترسیم خوشه ها در اختیار ما قرار میدهد، از شکل خوشه ها استفاده میکنیم.
نرم افزار مورد استفاده :
در این پروژه از نرم افزار رپیدماینر (Rapid Miner) استفاده شده است و همه نتایج در فایل گزارش نمایش داده شده است.
نمونه پروژه های داده کاوی در رپیدماینر:
گروه همیارپروژه پروژه های زیادی را شبیه به همین پروژه و با موضوع داده کاوی با رپیدماینر (Rapid Miner) انجام داده که میتوانید آنها را در لینک روبرو مشاهده نمایید: نمونه پروژه های داده کاوی با ریپدماینر
نحوه دریافت پروژه:
جهت دریافت این پروژه ابتدا باید هزینه آن را از طریق لینک خرید زیر در سایت واریز نمایید تا لینک دانلود برای شما ظاهر گردد.
خرابی لینک دانلود:
درصورت خرابی لینک دانلود موضوع را سریع از طریق شماره های ۰۹۱۱۷۹۸۳۷۰۹ – ۰۹۳۳۰۸۵۹۲۷۵ به اپراتور سایت ما اطلاع دهید تا از طریق دیگری فایل پروژه برای شما ارسال گردد.
دیدگاهتان را بنویسید