پروژه داده کاوی در رپیدماینر (Rapid Miner)سهشنبه 11, سپتامبر 2018
دانلود پروژه آماده پیاده سازی مدل های مختلف داده کاوی در رپیدماینر (Rapid Miner)
تیم همیارپروژه یک پروژه بسیار کاربردی را در حوزه داده کاوی در نرم افزار رپیدماینر (Rapid Miner) پیاده سازی نموده است که همراه با توضیحات و گزارش نحوع اجرا بصورت مفصل می باشد.توضیحات تکمیلی درمورد پروژه را در زیر بخوانید :
مقدمه ای در مورد داده کاوی:
امروزه فرایند استخراج اطلاعات معتبر، ناشناخته، قابل فهم و قابل اعتماد از مجموعه داده های بزرگ واستفاده از آن در تصمیم گیری و در فعالیت تجاری داده کاوی نامیده می شود. داده کاوي به طور خلاصه یافتن اطلاعات پنهان داده ها است. براي انجام اینکار داده ها با روش هایی مورد تجزیه و تحلیل قرار می گیرند. همواره در رابطه با تحلیل و بررسی داده های با حجم بالا، با مشکل ابعاد و پیچیدگی پایگاه داده مواجه هستیم علم داده کاوی شامل کاربرد ابزاری برای تحلیل داده های مصنوعی و کشف الگوهای ناشناخته ی معتبر و روابط بین مجموعه های داده وسیع می باشد. استفاده از این ابزار ها در مباحث مختلف صنعتی مدیریتی، مالی، مهندسی منجر به پیشرفت سازمان در تحلیل داده های وسیع شده است.
توضیح پروژه:
در این پروژه هدف انجام مدل های مختلف داده کاوی که شامل الگوریتم های دسته بندی و خوشه بندی و همچنین پیش پردازش داده ها است، می باشد. در واقع در راستای بررسی تفاوت ها و دقت مدل های مختلف داده کاوی یک دیتاست از مجموعه دادگان uci انتخاب شده و پس از انجام پیش پردازش روی داده ها، داادگان را جهت دسته بندی به الگوریتم های مختلف دسته بندی داده و روی هر کدام دقت را بدست آورده و در نهایت دقت آن ها را باهم در جدول و نمودار مقایسه نمودیم. سپس باری دیگر دادگان را برای خوشه بندی به الگوریتم های مختلف داده و از نظر عملکرد آن ها را با فاصله درون کلاسی بررسی می کنیم.
ویژگی داده ها:
در این پروژه از مجموعه دادگان car Evaluation استفاده شده است. این دیتاست متعلق به مجموعه UCI می باشد و ویژگی های آن به صورت زیر می باشد:
داده ها در رپیدماینر:
پیش پردازش داده ها:
همانطور که در شکل قسمت قبل دیده می شود داده ها داری مقادیر گمشده نمی باشند. به همین دلیل پیش پردازش داده ها را به یافتن مقادیر outlier اختصاص می نماییم. با توجه به اینکه تعداد ویژگی داده ها ۶ عدد می باشد نیازی به کاهش بعد با توجه به حجم بالای نمونه ها نیز نمی باشد. پس با استفاده از نود detect outlier نمونه های پرت را پیدا نموده و سپس آن ها را با نود filter Examples فیلتر می نماییم.
جهت خارج کردن ویژگی های اضافه که هنگام یافت outlier ها به ویژگی های اصلی داده ها اضافه شد از نود Select Attribute استفاده شده است.
برای تقسیم داد ها به دو بخش آموزش و تست از نود validation استفاده شده است در قسمت تنشیمات این نود ۰٫۷ داده ها برای آموزش و ۳۰ درصد باقی برای تست در نظر گرفته شده است.
جهت مشاهده ادامه توضیحات و دریافت فایل پروژه به همراه گزارش آن ابتدا باید آن را خریداری نمایید.
شما عزیزان می توانید از طریق لینک خرید زیر این پروژه بسیار کاربردی را دریافت نمایید.