totop

مدل سازی ترکیب گاوسی مبتنی بر تخمین ماتریس دقتچهارشنبه 23, مه 2018

مدل سازی ترکیب گاوسی - GMM

مدل سازی ترکیب گاوسی مبتنی بر تخمین ماتریس دقت

یک تحقیق جامع و کامل در مورد مدل سازی ترکیب گاوسی – GMM توسط تیم همیارپروژه انجام شده است که بصورت دقیق این مبحث را با استفاده از ترجمه چند مقاله مورد بررسی و مطالعه قرار داده است.

 

مقدمه و چکیده این گزارش در زیر آمده است :

در این مطالعه بر آن هستین تا با دنبال کردن دو هدف به بررسی مدل مخلوط گاووسی و ماتریس کواریانس بپردازیم . بر این اساس از مطالعه یک مدل پیشنهادی کمک گرفته ایم که  از ماتریس های  کوواریانس کامل در مدل های مخلوط گاوس (GMM) با تعداد محدودی از پارامترها و حجم پایین محاسبات مورد نیاز برای ارزیابی احتمالات استفاده کرده است . در مدل پیشنهادی، ماتریس های کوواریانس معکوس ( دقت)  با استفاده از بردار های ویژه اسپارس تقریب زده می شوند ،  به عنوان مثال هر یک از ورودی های خاص یک ماتریس کواریانس / دقت به عنوان یک ترکیب خطی از تعداد کمی از بردارهای کامل است.  نتایج تجربی در یک کار تشخیص گفتار نشان می دهد که با حفظ نرخ خطای کلمه نزدیک به آنچه که توسط GMM ها با ماتریس کامل کوواریانس به دست می آید، مدل پیشنهادی می تواند تعداد پارامتر ها را با ۴۵ درصد کاهش دهد.

ضمن بررسی مطالعه ای که به عنوان مبنا در نظر گرفته شده است [۱] همچنین با استناد به موارد تحقیقی دیگر به دنبال این هستیم تا بدانیم که مدل مخلوط گاوسی چیست و اهمیت ماتریس کواریانس در محاسبات چه چیزی است ، سپس به  بررسی روشهای تخمین ماتریس کواریانس یا دقت بپردازیم و بدانیم برای تخمین ماتریس کوواریانس چه روش هایی موجود است و هر روش به چه صورت عمل میکند. در ادامه با حفظ نگاه بر موارد گفته شده توضیحات را بر همین محور و با تفضیل و شرح برای پارامتر ها ادامه خواهیم داد.

  • چکیده :

خوشه بندی و بازیابی برخی از مهمترین ابزارهای یادگیری ماشین است که برای دسته بندی در دنیای خارج بسیار کمک کننده است ، بازیابی در تقریبا هر برنامه کاربردی و دستگاهی که با آن ارتباط برقرار می کنیم وجود دارد ، مانند ارائه مجموعه ای از محصولات مربوط به یک خریدار ، یا لیستی از افرادی که ممکن است بخواهید در یک پلت فرم رسانه های اجتماعی با آنها ارتباط برقرار کنید . خوشه بندی می تواند برای کمک به بازیابی مورد استفاده قرار گیرد، اما ابزار وسیع تر مفید است برای کشف خودکار ساختار در داده ها، مانند کشف گروه هایی از بیماران مشابه است . اما موضوع دیگری که در این بین نیز دارای اهمیت است و نوجه ویژه ای را نصیب خود کرده تشخیص صدا و  شناسایی خودکار گفتار  است ، از میان روش های متنوعی که برای این موضوع در نظر گرفته شده است ، در مقوله خوشه بندی و پیدا کردن نزدیک ترین همسایه یا تشابه از روش های متنوعی استفاده شده است . یکی از این روش های خوشه بندی مدل کامینز (k-meams) است در این خوشه بندی بر مبنای تراکم و فواصل مرکز دسته ا از یکدیگر خوشه بندی انجام می شود اما در ۳۰ سال گذشته، غالبا از رویکردهای مبتنی بر روش های آماری مانند مدل های پنهان مارکوف (HMM) و مدل های ترکیبی گاوسین(GMM)  برای بررسی تشخیص صدا و  گفتار‎ ‎ استفاده شده است. این به دلیل این واقعیت است که HMM ها و GMM ها نسبتا ساده هستند و می توانند به طور موثر با تغییرات زمانی و آکوستیکی گفتار به طور موثر مواجه شده و از پس انها برآیند، بر همین اساس در این مطالعه ما به بررسی خوشه بندی با کمک الگوریتم ‏GMM‏ اشاره میکنیم و اینکه چگونه بر اساس تراکم و حداکثر تشابه این کار را انجام می دهد .

اما یک HMM به این صورت توصیف می شود: تعداد حالت ها، احتمالات ، احتمال اولیه، احتمالات انتقال حالت و توزیع احتمالات مشاهده ، جایی که آن ها توسط GMM ها نشان داده می شوند . یک GMM یک مجموعه وزن دار گاوسین است که می تواند هر تابع چگالی احتمال را  مدل کند.

برای هر Gaussian: وزن (رتبه)، میانگین و کوواریانس منظور می شود . در مورد فضاهایی با ابعاد بزرگ، به علت درجه چهارگانه کوواریانس، تعداد پارامترهای کوواریانس به طور قابل توجهی بیشتر از اندازه فضا خواهد شد که می تواند منجر به روبرویی با مشکلات و مسایل در تخمین شود. علاوه بر این، محاسبه احتمال تشابه  می تواند وقت گیر باشد، که عامل محدود کننده ای در برنامه ها و الگوریتم های مختلف در حال اجرا است.

برای کاهش پیچیدگی  GMM رویکرد هایی نیز وجود دارد یکی از آنها روش یافتن ماتریس قطری کواریانس است که این خود دارای پیچیدگی محاسبات است ، دو روش وجود دارد که دقت مدل GMM را افزایش میدهند: یکی تقریب کوواریانس ها است و دیگری ماتریس های کوواریانس معکوس  می باشد . هر دو رویکرد، تعدادی از پارامترها را کاهش می دهند، اما رویکردهایی با پیچیدگی محاسبات را در مدل پایین می آورند و این خود یک عامل مهم است چرا که بررسی احتمالات گاوسین خود یک عملکرد مستقیم برای  دقت است.

مدل سازی ترکیب گاوسی - GMM

این گزارش شامل ۴۷ صفحه می باشد و منابع و رفرنس ها نیز بصورت کامل در آن قرار گرفته است.

جهت دریافت این مقاله میتوانید با هزینه مناسب آن را از همیارپروژه از طریق لینک زیر خریداری نمایید.

 


دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

حق نشر برای همیارپروژه ❤️ مرجع انجام پروژه دورکاری و آنلاین ✔️ سایت انجام پروژه و استخدام فریلنسر در همه حوزه ها ، مهارت ها ، نرم افزارها و پروژه های برنامه نویسی محفوظ است.