دسته بندی مجموعه داده های خرده فروشی آنلاین با استفاده از الگوریتم KNNچهارشنبه 13, ژوئن 2018
پروژه آماده دسته بندی مجموعه داده های خرده فروشی آنلاین با استفاده از الگوریتم KNN
پروژه ای با موضوع دسته بندی با الگوریتم knn توسط تیم همیارپروژه انجام شده است که برای دانلود شما عزیزان با قیمتی مناسب در سایت همیارپروژه قرار گرفته است.
این پروژه با نرم افزار متلب نوشته شده و گزارش کاملی از توضیح کد و پروژه را دارا می باشد.
رخداد : مجموعه داده آنلاین خرده فروشی
این یک مجموعه داده فراملی است که حاوی تمام معاملات بین سال های ۲۰۱۰/۱۲/۰۱ و ۲۰۱۱/۱۲/۱۲ برای یک فروشگاه کوچک خرده فروشی آنلاین و ثبت شده در انگلستان است.این شرکت به طور عمده هدایای منحصر به فردی را به فروش می رساند.بسیاری از مشتریان این شرکت عمده فروشان هستند.
منبع داده های استفاده شده از سایت uci است و با استفاده از آن ها رخداد به صورت آماری تعریف شده است.
این رخداد براساس اطلاعات ثبت شده بصورت طبقه بندی و خوشه بندی تنظیم شده است و خصوصیات داده های آن چند متغیره،سریال ، سری زمانی است.
اطلاعات مشخص شده :
- رخداد مورد بررسی در این پروژه خرده فروشی آنلاین می باشد
- هدف تشخیص نام کشور مشتری با توجه به اطلاعات موجود در داده می باشد
- داده های مورد استفاده online Retail می باشد.
- این داده شامل ۵۴۱۹۱۰ نمونه است.
- هر نمونه ۷ ویژگی دارد.
مجموعه داده Online Retail برای این پروژه طبق عکس زیر می باشد :
فایل دیتاست را می توانید از طریق لینک روبرو دانلود نمایید : Online Retail
در این قسمت روی داده ها یک دسته بند نزدیکترین همسایه آموزش داده به این شکل که به ازای هر نمونه k تا از نزدیکترین همسایه های ان را پیدا نموده سپس به کلاس آنها نگاه میکنیم و کلاس نمونه را طبق کلاس همسایه های آن در نظر می گیریم.
به عبارت سادهتر این روش برچسب یا کلاسای را انتخاب میکند که در همسایگی انتخاب شده بیشترین تعداد نمونه منتسب به آن دسته باشند. بنابراین برچسب یا کلاسای که از همه برچسب یا کلاسها بیشتر در بین K نزدیکترین همسایه مشاهده شود، به عنوان برچسب یا کلاس نمونه جدید در نظر گرفته میشود.
در این قسمت روی داده ها یک دسته بند نزدیکترین همسایه آموزش داده به این شکل که به ازای هر نمونه k تا از نزدیکترین همسایه های ان را پیدا نموده سپس به کلاس آنها نگاه میکنیم و کلاس نمونه را طبق کلاس همسایه های آن در نظر می گیریم.
به عبارت سادهتر این روش برچسب یا کلاسای را انتخاب میکند که در همسایگی انتخاب شده بیشترین تعداد نمونه منتسب به آن دسته باشند. بنابراین برچسب یا کلاسای که از همه برچسب یا کلاسها بیشتر در بین K نزدیکترین همسایه مشاهده شود، به عنوان برچسب یا کلاس نمونه جدید در نظر گرفته میشود.
دیدگاهتان را بنویسید