totop

ترجمه مقاله When Quering Meets Codingسه‌شنبه 12, دسامبر 2017

عنوان مقاله به فارسی “صف بندی مطابق کد گذاری: طرح بهینه – تاخیر بازیابی اطلاعاتدر انباره های ابر”

دانلود فایل انگلیسی مقاله از طریق لینک روبرو : دانلود فایل اصلی

ترجمه چکیده این فایل در زیر آماده است :

چکیده: ابرهای ذخیره سازی، مانند Amazon S3، به طور گسترده ای برای خدمات وب و برنامه های کاربردی اینترنت مورد استفاده قرار می گیرند. مشاهده شده است که تاخیر برای بازیابی داده ها و قرار دادن داده ها در ابرها کاملا تصادفی است و همبستگی ضعیفی بین درخواست های مختلف خواندن / نوشتن وجود دارد. این موضوع برای ما هدف بررسی یک مشکل کلیدی را می دهد : آیا ما می توانیم تاخیر را با ارسال تکرار داده ها به موازات یا با استفاده از کدهای پاک کردن قدرتمند کاهش دهیم؟

در این مقاله، مسئله کاهش تاخیر در بارگیری داده ها از سیستم های ذخیره سازی ابر با استفاده از چندین موازی سازی، با درنظر گرفتن اینکه داده ها به صورت کد شده  در ابرها با استفاده از کد های FEC با پارامترهای ( n، k) ذخیره شده اند ، انجام می شود . به این معنی که هر فایل به k کسر مساوی در اندازه تقسیم شده  و سپس تقسیم هر قسمت را به n تکه گسترش می دهد به گونه ای که هر k قسمت از n به اندازه کافی برای موفقیت در بازگردانی پرونده اصلی کافی است . این مدل را می توان به عنوان یک صف چند منظوره با ورود درخواست های بازیابی داده و یک سرور مربوط به یک نخ نشان داد. با این حال، این مدل معمولی صف بندی نیست، زیرا سرور می تواند ، بسته به زمانیکه سرورهای دیگر سرویس خود را تکمیل می کنند (به دلیل افزونگی که در میان موضوعات پخش می شود) عملیات خود را خاتمه دهد . از این رو، بر اساس بهترین اطلاعات ما، تجزیه و تحلیل این مدل صف بندی کاملا ناشناخته باقی مانده است.

ردیابی های اخیر آمازون S3 نشان می دهد که زمان بازیابی قطعه یک اندازه ثابت تصادفی است و می تواند به عنوان یک تاخیر ثابت به اضافه یک  i.i.d. متغیر تصادفی توزیع شده به صورت نمایی تقریب زده شود .برای امکان تجزیه و تحلیل نظری، ما فرض می کنیم که زمان دانلود قطعه i.i.d. به صورت توزیع نمایی است بر اساس این فرض، ما نشان می دهیم که هر طرح ، بهترین زمان برای بهینه سازی تاخیر در میان تمام برنامه های زمان بندی آنلاین است هنگامی که k = 1 باشد . هنگامی که k> 1 است ، ما یک طرح حریص ساده،را  که تمام موضوعات موجود را به سر خط درخواست اختصاص می دهد ،را پیدا میکنیم که  بهینه ترین مورد از نظر زمان تاخیر در میان تمام طرح های زمان بندی آنلاین است. همچنین برخی نتایج عددی را ارائه می دهیم که به محدودیت های پیش بینی اشاره دارد و مسیرهای تحقیق بیشتری را ارائه می دهد.

 

  • مقدمه

ذخیره سازی ابری، یک عنصر ضروری برای محاسبات ابر است، که به سرعت ، با حمایت غول های فن آوری مانند آمازون، گوگل، مایکروسافت، آی بی ام و اپل، و همچنین دیگر موارد که در حال حاضر محبوب شده و  شروع به کار کرده اند ، مانند Dropbox، Rack-Space و NexGen در حال گسترش است . انتظار می رود بازار کل ابر ذخیره سازی از ۵٫۶ میلیارد دلار در سال ۲۰۱۲ به ۴۶٫۸ میلیارد دلار تا سال ۲۰۱۸ با ذخیره انبوه ابر و سه طرح تخصیصی با رشد سالیانه ۴۰٫۲ درصد افزایش یابد [۱]. سیستم های ذخیره سازی ابر به کاربران دسترسی آسان، نگهداری کم، انعطاف پذیری و مقیاس پذیری را ارائه می دهند.

 

شکل ۱: مثال از چهار فایل با استفاده از کد های ‏FEC‏ با پارامترهای (۴،۲) در انباره ابر با سه خط تخصیص.

 

مانند سایر سیستم های ذخیره سازی، کارایی، قابلیت اطمینان و زمان تاخیر نیز برای سیستم های ذخیره سازی ابر مورد نیاز است. اگر چه تکرارهای ساده می تواند برای قابلیت اطمینان مورد استفاده قرار گیرد، کدهای ذخیره سازی امیدوار کننده تر هستند ، کد های اصلاح خطای پیش فرض (FEC)، مانند کد های حداکثر فاصله (MDS)، که انعطاف پذیری بیشتری نسبت به پاک کردن را فراهم می کند تا کپی برداری برای یک مقدار معین از افزونگی ، در این مقاله کد های FEC را با پارامترهای برنامه نویسی ثابت (n، k) در نظر می گیریم، یعنی هر پرونده به k تکه مساوی در  اندازه تقسیم می شود و سپس تقسیم بندی  به n تکه  گسترش می یابد به طوری که با هر k از n تکه ها به موفقیت کافی برای بازگرداندن قطعات اصلی k (از این رو، فایل خود) دست خواهیم یافت . شکل ۱ یک نمونه را نشان می دهد، که در آن n = 4 و k = 2. به طور خاص، چهار فایل A، B، C و D در طول ابر با استفاده از کدهای FEC با پارامترها (۴،۲) ذخیره می شوند. هر فایل x 2 {A، B، C، D} به دو تکه یکسان تقسیم می شود، [x1، x2] و چهار تکه های کدگذاری شده آن، [x1، x2، x1 + x2، x1 + 2×2]  در ابر ذخیره می شوند. یک فایل می تواند از دو قسمت از کل چهار قسمت آن بازیابی شود. به این ترتیب، با استفاده از تنظیم پارامترهای (n، k) FEC، سطوح کارایی و قابلیت اطمینان را می توان به دست آورد که در آن  k> 1 به طور کلی، در حالی که k = 1 به معنای تقلید داده است. برخی از شرکت های ذخیره سازی فایل آنلاین در حال حاضر مانند Wuala [2] کدهایی مانند FEC را پذیرفته اند.

در حالی که قابلیت اطمینان و کارایی در سیستم های ذخیره سازی ابر دقیقا مورد بررسی قرار گرفته است، به عملکرد آن از لحاظ تاخیر توجه بسیار کمتری شده است، هر چند که تاخیر یک مسئله مهم است که به طور قابل توجهی بر تجربه کاربر تاثیر می گذارد و می تواند نقش مهمی در پذیرش گسترده این سیستم های ذخیره سازی داشته باشد . مطالعات اندازه گیری نشان می دهد که نقص قابل توجهی در عملکردمحدود شده  I / O در شبکه وجود دارد [۳]. ارزیابی های اولیه آمازون S3 نشان می دهد که کمترین سرعت های  ۱۰ تا ۲۰ درصد از درخواست های خواندن / نوشتن ، بیش از ۵ برابر میانگین تاخیر را مشاهده می کنند (به عنوان مثال، نگاه کنید به [۴]). مطالعه تجربی آمازون S3 در [۳] روند مشابهی را نشان می دهد. به طور متوسط، تاخیر متوسط ​​خواندن یک فایل ۱ مگابایتی ۱۳۹msec است، با تاخیر ۸۰٪ به عنوان ۱۷۹msec و ۹۵ درصد با ۸۱۱msec به ترتیب است .

نشان داده شده است که تاخیر تأثیر زیادی بر تجربه کاربر و درآمد ارائه دهنده خدمات دارد، برای مثال، هر ۵۰۰ مگابایت اضافی تاخیر در سرویس، منجر به از دست دادن  ۱٫۲٪ کاربربرای Google و Amazon خواهد شد [۵]. بنابراین، مهم است که  انتشار تاخیر را کاهش دهیم، به طور مثال برش دنباله طولانی زمان سرویس.

معلوم شده است که تاخیر همبستگی ضعیفی بین وظایف مختلف خواندن را نشان می دهد [۳]، [۴]. بنابراین، تاخیر را می توان به راحتی با انتقال مکرر داده ها به صورت موازی کاهش داد . این باعث انگیزه ما برای بررسی مسئله مهمی در بهبود زمان تاخیر سیستم بازیابی اطلاعات می شود. به طور خاص، یک سوال کلیدی وجود دارد که ما می خواهیم به آن رسیدگی کنیم و این است که آیا ما می توانیم بار اضافی ارائه شده توسط FEC را برای قابلیت اطمینان و بهبود  تاخیر ‏عملکرد استفاده کنیم؟ فرض کنید یک کاربر برای بارگیری فایلها، یعنی تکه های کدگذاری شده، از سیستم های ذخیره سازی ابر با یک توزیع کننده درخواست می دهد . توزیع کننده این درخواست های دانلود را با تعدادی نخ ارائه می کند که در آن هر نخ می تواند برای بازیابی یک تکه در هر زمان استفاده شود. تعداد نخ هایی که به کاربر اختصاص داده شده براساس عملکرد سرویسی است که کاربر تمایل دارد آن را پرداخت کند – هرچه پرداخت بیشتر باشد، تعداد نخ هایی که به کاربر اختصاص داده شده بیشتر است. این مدل در شکل ۲ نشان داده شده است. سناریوی برنامه کاربردی به شرح زیر است: کاربر بازی آنلاین نیاز به بارگذاری و ذخیره (خواندن و نوشتن) داده های خود به ابرها با استفاده از کد های  FEC دارد.  کاربر با تعدادی نخ ها مختص می شود ، که تعداد نخ توسط  تمایل کاربر به صرف هزینه تعیین می گردد.

 

 

جهت دانلود ترجمه کامل این فایل باید از طریق لینک سبد خرید آن را خریداری نمایید.


دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

حق نشر برای همیارپروژه ❤️ مرجع انجام پروژه دورکاری و آنلاین ✔️ سایت انجام پروژه و استخدام فریلنسر در همه حوزه ها ، مهارت ها ، نرم افزارها و پروژه های برنامه نویسی محفوظ است.