ایران ترجمه – مرجع مقالات ترجمه شده دانشگاهی ایران

مدل هزینه دوهدفه بهینه سازی پرس و جوهای بانک اطلاعات در محیط چندابری

مدل هزینه دوهدفه بهینه سازی پرس و جوهای بانک اطلاعات در محیط چندابری

مدل هزینه دوهدفه بهینه سازی پرس و جوهای بانک اطلاعات در محیط چندابری – ایران ترجمه – Irantarjomeh

 

مقالات ترجمه شده آماده گروه کامپیوتر
مقالات ترجمه شده آماده کل گروه های دانشگاهی

مقالات رایگان

مطالعه ۲۰ الی ۱۰۰% رایگان مقالات ترجمه شده

۱- قابلیت مطالعه رایگان ۲۰ الی ۱۰۰ درصدی مقالات ۲- قابلیت سفارش فایل های این ترجمه با قیمتی مناسب مشتمل بر ۳ فایل: pdf انگیسی و فارسی مقاله همراه با msword فارسی -- تذکر: برای استفاده گسترده تر کاربران گرامی از مقالات آماده ترجمه شده، قیمت خرید این مقالات بسیار کمتر از قیمت سفارش ترجمه می باشد.  

چگونگی سفارش

الف – پرداخت وجه بحساب وب سایت ایران ترجمه (شماره حساب) ب- اطلاع جزئیات به ایمیل irantarjomeh@gmail.com شامل: مبلغ پرداختی – شماره فیش / ارجاع و تاریخ پرداخت – مقاله مورد نظر -- مقالات آماده سفارش داده شده عرفا در زمان اندک یا حداکثر ظرف مدت چند ساعت به ایمیل شما ارسال خواهند شد. در صورت نیاز فوری از طریق اس ام اس اطلاع دهید.

قیمت

قیمت این مقاله: ۲۸۰۰۰ تومان (ایران ترجمه - irantarjomeh)

توضیح

بخش زیادی از این مقاله بصورت رایگان ذیلا قابل مطالعه می باشد.

مقالات ترجمه شده کامپیوتر - ایران ترجمه - irantarjomeh

www.irantarjomeh.com

مدل هزینه دوهدفه بهینه سازی پرس و جوهای بانک اطلاعات در محیط چندابری

شماره      
۱۸۲
کد مقاله
COM182
مترجم
گروه مترجمین ایران ترجمه – irantarjomeh
نام فارسی
یک مدل هزینه دو هدفه برای بهینه سازی پرس و جوهای بانک اطلاعات در یک محیط چند ابری
نام انگلیسی
A bi-objective cost model for optimizing database queries in a multi-cloud environment
تعداد صفحه به فارسی
۷۳
تعداد صفحه به انگلیسی
۱۴
کلمات کلیدی به فارسی
مدل هزینه, فضای ابری, بهینه سازی پرس و جو, جریان داده یا اطلاعات
کلمات کلیدی به انگلیسی
Cost model, Cloud, Query optimization, Data flow
مرجع به فارسی
ژورنال نوآوری در اکوسیستم های دیجیتال
دانشگاه ارسطو، یونان
الزویر
مرجع به انگلیسی
JOURNAL OF INNOVATION IN DIGITAL ECOSYSTEMS; Aristotle University of Thessaloniki, Greece; Elsevier
سال
۲۰۱۵
کشور
یونان

مدل هزینه دوهدفه بهینه سازی پرس و جوهای بانک اطلاعات در محیط چندابری

 

یک مدل هزینه دو هدفه برای بهینه سازی پرس و جوهای بانک اطلاعات در یک محیط چند ابری
چکیده
مدل های هزینه به طور گسترده ای در پردازش پرس و جوها جهت حاصل آوردن پروسه بهینه سازی پرس و جو، پیش بینی دقیق زمان اجرای پرس و جو، زمانبندی وظایف پرس و جوی بانک اطلاعات، بکارگیری رویه های کنترل و پذیرش و همچنین حاصل آوردن ضروریات مربوط به منابع در ارتباط با برخی از سیستم های کاربردی مورد استفاده قرار گرفته اند. نقش اصلی مدل های هزینه، ارزیابی زمان مورد نیاز جهت اجرای پرس و جو بر روی یک ماشین خاص می باشد. در یک محیط چند ابری، مدل های هزینه را می بایست به آسانی برای محدوده گسترده ای از ماشین های فیزیکی مختلف کالیبره نمود، و ارزیابی های زمانی را می بایست با توجه به اطلاعات هزینه پولی تکمیل کرد، چرا که هر دو مؤلفه هزینه اقتصادی و عملکرد از اهمیت اولیه مهمی برخودار می باشند. هدف تحقیق جاری ارائه اولین پیشنهادات برای استفاده از یک مدل هزینه پرس و جوی دو هدفه می باشد که برای پرس و جوهای اجرا شده در منابع فراهم آمده به وسیله فراهم آورندگان بالقوه متعدد فضای ابری مناسب می باشد. ما نسبت به تسطیح تکنیک های مدل سازی کالیبره سازی کنونی برای برآوردهای زمانی اقدام نموده و چنین برآوردهایی را با اطلاعات هزینه پولی ترکیب ساخته تا از این طریق قابلیت تحت پوشش قرار دادن گزینه های مرتبط با شارژ اصلی برای کاربرد منابع ابری را داشته باشیم. به علاوه، ما این موضوع را توضیح می دهیم که چگونه مدل هزینه را می توان به عنوان بخشی از یک فرآیند بهینه سازی در نظر گرفت. رویکرد ما برای بسیاری از گراف های جریان اطلاعاتی ژنتیک قابل کاربرد می باشد، چرا که اجرای برنامه های آن الزاماً سبب به مخاطره انداختن ویژگی های مربوط به اپراتورهای رابطه ای نخواهد شد. در نهایت، ما یک مثال جامع در خصوص کاربرد پیشنهاد خود را عرضه داشته و دقت آن را از طریق مطالعات موردی حقیقی تحت ارزیابی و اعتبارسنجی قرار خواهیم داد.
کلمات کلیدی: مدل هزینه، فضای ابری، بهینه سازی پرس و جو، جریان داده یا اطلاعات.
 
۱- مقدمه
شرکت ها و سازمان های بصورت فزاینده ای حرکت به سمت زیر ساختارها و استفاده از برنامه های ابری را در دستور کار خود قرار می دهند. این مورد خود نشأ ت گرفته از چشم انداز فضای ابری جهت حاصل آوردن مقیاس های اقتصادی می باشد. یکی از جذابترین ویژگی های رایانش ابری آن است که این سیستم فراهم آورنده یک جایگزین مناسب برای تدارک منابع و مدیریت محاسباتی گران قیمت آنها می باشد، مولفه هایی که به ترتیب در ارتباط با سرمایه گذاری های چشمگیر و تلاش های قابل توجه نیروی انسانی در این زمینه بشمار می آید.
فناوری ابری به طور قابل توجهی رشد نموده است و امروزه به عنوان یک سیستم کاملاً مقاوم و مطمئن ارائه شده است. این سیستم قابلیت فراهم آوردن مؤلفه های مختلف رایانش توزیعی متعارف، نظیر مجازی سازی منابع و فراهم آوردن ماشین های مجازی (VM) را خواهد داشت و نوعاً چنین تسهیلاتی را با هزینه پولی نسبتاً مناسبی عرضه می دارد. این نوع از ماشین های مجازی منوط به فراهم آورنده خدمات مرتبط نامهای مختلفی دارند، به طور مثال گوگل آنها را تحت عنوان “انواع ماشین ـ machine types“، آمازون آن را تحت نام “انواع نمونه ـ instance types” می خوانند، در حالی که نام های دیگری نیز وجود دارند همانند “اندازه های سرورـ server sizes ” [۱]، اما در تمامی موارد آنها فراهم آورنده ترکیب سخت افزاری خاصی از کامپیوتر، حافظه، و منابع ورودی ـ خروجی (I/O) می باشند. منابع ابری محدود به صرف تقلید از استفاده از ماشین های فیزیکی در یک ردیف به صورت گروهی نمی باشند، آنها همچنین فراهم آورنده میان افزارهای نرم افزاری، بانک های اطلاعاتی و ابزارهای خاص هستند. تکثیر گزینه های ابری سبب بروز برخی از مشکلات شده است که کاربران ابری با آن رو به رو هستند: به طور مثال، کدام یک از فراهم آورندگان خدمات فضای ابری را می بایست انتخاب کرد تا قابلیت انجام یک فرآیند کاری خاص بر روی فضای ابری وجود داشته باشد؟ این مسئله نه تنها مهم بلکه پیچیده می باشد، مخصوصاً به هنگامی که منابع درخواستی به وسیله فراهم آورندگان متعددی عرضه می شوند. یک نقطه کلیدی در خصوص پاسخ دادن به این سئوال فراهم آوردن ارزیابی های مربوط به زمان اجرا و هزینه پولی می باشد و چنین مسئله ای دقیقاً به عنوان موردی می باشد که ما در این مبحث اقدام به مطالعه آن نموده ایم.
ما بر روی پرس و جوهای بانک اطلاعات و جریان های ـ داده ای ژنریک تمرکز می نماییم که قابلیت اجرای آنها بر روی منابع دوردست فراهم آمده به وسیله ارائه دهندگان خدمات متعدد وجود دارد [۲، ۳]. به طور مثال، در نظر بگیرید که یک پرس و جوی بانک اطلاعاتی که اقدام به حاصل آوردن داده ها از منابع مختلف ابری می نماید، اطلاعاتی که قابلیت گردآوری آنها بر حسب ویژگی های مختلفی همانند حصول اطلاعات بر مبنای سرشماری جمعیتی به صورت بی نام و یا داده های مختلف تجاری ارائه شده به وسیله مجموعه ای از سیستم های مختلف فراهم آورنده اطلاعات وجود دارد. و یا تحلیل داده های بیماران با استفاده از یکسری از خدمات ابری خاص، همانگونه که در مرجع [۴] تشریح شده است. در این نوع از سناریوها، به منظور تصمیم گیری نهایی ما می بایست قابلیت ارزیابی دقیق زمان اجرای وظایف بر روی منابع ابری و همچنین قیمت استفاده از این منابع را داشته باشیم.
ارزیابی زمان اجرای پرس و جو نقش مهمی را در برنامه ها و فرآیندهای مختلف به عهده دارد، شامل بهینه سازی پرس و جو، زمانبندی، کنترل پذیرش و تخصیص منابع [۵]. به طور نوعی، مدل های هزینه پرس و جو برای برنامه های اجرایی فیزیکی در نظر گرفته شده اند و در این زمینه اینگونه مفروض است که آن دسته از منابع فیزیکی که باید آنها را در یک برنامه اجرایی پرس و جو بکار گرفت می بایست قبلاً تعریف شده باشند. این مدل های هزینه یا آنکه اقدام به کپسوله سازی یک جزء جهت ارزیابی ویژگی های کاردینالیتی یا اعداد اصلی داده های پردازش شده می نمایند، یا آنکه چنین آمارهای کاردینالیتی را به عنوان ورودی در نظر می گیرند. در خروجی، آنها اقدام به تولید یک برآورد مربوط به زمان اجرای پرس و جو می نمایند. مثال های چنین مدل های هزینه ای در یک محیط توزیعی به وسیله مرجع [۶، ۷] ارائه شده است. یک محیط چند ابری، که فراهم آورنده اطلاعات صرفاً در خصوص زمان اجرا برای پردازشگرهای خاصی می باشد ناکافی تلقی می شود چرا که: (۱) ماشین های بکار گرفته شده به عنوان مواردی که قبلاً می بایست به حساب آمده باشند تلقی نگردیده و (۲) ارزیابی های زمانی را می بایست با توجه به اطلاعات هزینه پولی تکمیل نمود. ما به طور مستقیم کمبود دومی را مورد ملاحظه قرار می دهیم، در عین حال، برای اولین مورد، ما اقدام به مشخص سازی تکنیک های موجود خواهیم نمود که قابلیت ارائه راه حل های خاص برای کالیبره سازی مدل های هزینه کلی در زمینه ماشین های فیزیکی مختلف را خواهند داشت.
تعامل اصلی این مقاله ارائه پیشنهادی در ارتباط با مدل هزینه پرس و جوی بانک اطلاعاتی می باشد که فراهم آورنده برآوردهای مربوط به زمان مورد انتظار اجرا و هزینه اقتصادی وابسته به اجرای یک پرس و جوی خاص در ماشین های مجازی ارائه شده به وسیله یک یا چند فراهم آورنده خدمات ابری می باشد. مدل هزینه به صورت پیمانه ای تلقی شده و می توان آن را برای جریان های اطلاعاتی (گراف غیرچرخه ای جهت دار) DAG به صورت فرضی، صرف نظر از برنامه های ساده اجرایی پرس و جو، متشکل از عملگرهای رابطه ای، اعمال داشت. چنین موردی از مدل های اصلی شارژ هزینه داده ها پشتیبانی می نماید، که خود از رویکرد پرداخت در مقابل استفاده پشتیبانی می نماید. با این وجود، ویژگی پیمانه ای رویکرد پیشنهادی ما اجازه می دهد تا به آسانی قابلیت استفاده از مدل های دیگر برای برآورد زمان اجرا و هزینه را داشته باشیم، در عین آنکه چنین مدلی بطور خاص جهت ارائه خط مشی ها و سیاست های شارژ کاربران طراحی نشده است.  در این تحقیق، ما نشان  می دهیم که چگونه روش پیشنهادی ما را می توان جهت حاصل آوردن برآوردهای زمان اجرا و هزینه پولی با استفاده از یک مثال با جزئیات مربوطه و یک مطالعه موردی بررسی ویژگی ها و اعتبارسنجی های آن با استفاده از یک زیرساختار حقیقی فضای ابری مورد استفاده قرار داد. در دست آخر، ما این موضوع را نیز توضیح می دهیم که چگونه مدل هزینه را می توان برای یک حالت بهینه سازی جدید متناسب ساخت، که خود نیازمند برآوردهای زمان و هزینه برای گزینه های اجرایی مختلف خواهد بود.
دلیل آنکه ما بر روی دو موضوع تمرکز می نماییم آن است که زمان و هزینه اقتصادی به صورت ابتدا به ساکن در یک حالت ضد همبسته به شمار می آیند به روشی که مدلسازی آنها به صورت تحلیلی آسان نمی باشد. به طور مثال، ما نمی توانیم که ادعا نماییم که این دو مؤلفه سنجشی به صورت معکوس در تناسب با یکدیگر هستند که علت آن را می توان محدوده گسترده ای از عوامل برشمرد، نظیر انواع ماشین ها و خط مشی های شارژ مشتری. به طور کلی، کاربرد ماشین های فیزیکی متعدد جهت اجرای پرس و جوها به عنوان یک روش شناخته شده محسوب می شود که می تواند عملکرد بالاتری را حاصل آورد آن هم در صورتی که به صورت درست و قانونی از آن استفاده شود [۸، ۶]، البته با توجه به یک هزینه مرتبط با انرژی بیشتر [۹]، و در عین حال طرح این موضوع نیز قابل توجه می باشد که کاربرد ماشین های بیشتر سبب به بار آمدن هزینه های پولی بیشتری بر روی فضای ابری خواهد شد. روش مدل سازی ما قابلیت ایجاد نوعی رابطه بده بستان در این زمینه را خواهد داشت. معیارهای مرتبط دیگری نیز وجود دارند که عبارتند از: امنیت، پایایی، قابلیت دسترسی و موارد دیگر، اما ما شمولیت آنها را در مدل هزینه به عنوان یک مورد به جای مانده برای تحقیقات آتی در نظر می گیریم.
ادامه این مبحث به شرح ذیل سازماندهی شده است. در بخش بعدی، ما تحقیقات مرتبط را مورد بحث قرار می دهیم. بر این مبنا ویژگی های مربوط به سابقه را در بخش ۳ با توجه به مناسب ترین خط مشی های قیمت گذاری اتخاذ شده به وسیله ارائه دهندگان خدمات ابری مدرن در نظر گرفته، که به عنوان عواملی مطرح می باشند که بر روی هزینه مرتبط با زیرساختارهای ابری تأثیرگذار بوده و بر روی ویژگی بهینه سازی چند ابری که هدف مقاله ما نیز می باشد به طور مستقیم تأثیر گذار می باشد. در بخش ۴، ما جزئیات کاملی را در خصوص مدل هزینه ارائه می نماییم. بخش ۵ ارائه دهنده ارزیابی و اعتبارسنجی مطرح شده در مطالعات موردی می باشد. در نهایت نتیجه گیری در بخش ۶ ارائه خواهد شد.
این مقاله به عنوان یک نگارش کاملاً گسترش یافته و اصلاح شده مقاله ارائه شده در مرجع [۱۰] بشمار می آید. موارد اصلی اضافه شده شامل مؤلفه های ذیل هستند: (۱) افزونه هایی در زمینه ارزیابی آزمایشات حقیقی بیشتر جهت بررسی مجموعه های چند ابری (بحث شده در بخش ۵ـ۳)، (۲) افزونه هایی جهت بحث پیرامون چگونگی ترکیب مدل هزینه با بهینه سازها (بحث شده در بخش ۴ـ۳)، (۳) دسته بندی های مرتبط با فرضیه های ارائه شده و افزونه هایی در ارتباط با مدل هزینه جهت ملاحظه بهتر ویژگی های موازی سازی و همپوشانی در محدوده زمانی (بحث شده در بخش های ۴ـ۱ و ۴ـ۲ـ۲، به ترتیب)، و (۴) توصیف مدل های هزینه کنونی برای پرس و جوهای توزیعی (بحث شده در بخش ۲).
۲- تحقیقات مرتبط
مدل های هزینه سنتی برای پرس و جوهای توزیعی به صورت تک هدفه می باشند. آنها هزینه اقتصادی مرتبط را در نظر نگرفته و همچنین در ارتباط با آن دسته از سناریوهایی که برآوردها در واحدهای زمان تجریدی، به جای سعی در پیش بینی زمان اجرای حقیقی، برآورد می شوند دارای محدودیت می باشد. توجه داشته باشید که چنین موردی برای بهینه سازهای تک هدفه کفایت خواهد داشت که صرفاً بر مبنای واحدهای زمان تجریدی عمل نمایند، چرا که هدف آنها مقایسه نسبی برنامه های جایگزین بر حسب عملکرد می باشد، و به همین دلیل، مدل های هزینه بکار گرفته شده عمدتاً بر روی آمار داده ها، هیستوگرام ها و غیره تمرکز دارند [۱۱]. با این وجود، این ساده سازی خود سبب ایجاد محدودیت جدی به هنگام پیش بینی دقیق و حقیقی هزینه های پولی می شود، چرا که مورد متعاقب به عنوان تابعی از زمان اجرای حقیقی به شمار می آید.
۳- سابقه
قبل از کاوش جزئیات مدل هزینه، ما بررسی مختصری از خط مشی های قیمت گذاری اصلی که هم اکنون به وسیله فراهم آورندگان خدمات ابری عرضه می شوند و به نظر به وسیله مدل ما نیز پشتیبانی شده است را ارائه می نماییم. ما همچنین عوامل اصلی شامل شده در هزینه توسعه و حفظ زیر ساختار ابری را ارائه خواهیم نمود. در بخش آخر این مبحث، ما مدل های هزینه ای که اخیراً برای پرس و جوهای توزیعی عرضه شده اند را ارائه داده که در آنها هزینه های اقتصادی مدنظر نمی باشند. در نهایت، ما نشان می دهیم که چگونه مؤلفه های پیشنهادی ما در ارتباط با بهینه سازهای دو هدفه برای پرس و جوهای بانک های اطلاعاتی چند ابری مناسب هستند.
۳ـ۱٫ خط مشی ها و هزینه های قیمت گذاری ابری
فراهم آورندگان خدمات فضای ابری ارائه دهنده ماشین های مجازی با قیمت های خاصی می باشند. این قیمت ها منوط به چندین عامل شامل ویژگی های محاسباتی آن ماشین مجازی، زمان رزرو و مکانیزم آن، و این موضوع که آیا ماشین مجازی مورد بهره برداری دارای نرم افزار خاص نصب شده بر روی آن می باشد (همانند مجموعه های PaaS/SaaS که نوعاً ارائه می گردند) یا خیر. قیمت ماشین های مجازی نوعاً در بین فراهم آورندگان خدمات متغیر می باشد، حتی در صورتی که ماشین های مجازی ارائه شده از ویژگی های یکسانی برخوردار باشند.
۳ـ۱ـ۱٫ ویژگی های ماشین مجازی در ارتباط با شارژ نمودن هزینه
ویژگی اصلی که بر روی شارژ هزینه تأثیر می گذارد نوع دقیق حجم منابع محاسباتی می باشد که هر مشتری درخواست می کند. یک تفاوت اصلی در فرآیند قیمت گذاری منوط به سرعت پردازنده، حافظه و فضای ذخیره سازی می باشد. غالباً فراهم آورندگان خدمات دارای برخی از ترکیبات ثابت اجزای فوق هستند، به گونه ای که آنها ارائه دهنده گزینه های از قبل مشخص شده و کامل ماشین مجازی برای کاربران می باشند تا از این طریق محدوده گسترده ای از نیازها را تحت پوشش قرار دهند. به علاوه، برخی از فراهم آورندگان خدمات به مشتریان خود اجازه ساخت ترکیبات منابع خاص خود را می دهند، یعنی آنکه قابلیت بهینه سازی یا انجام رویه ها بر حسب نیازهای مشتریان در ماشین های مجازی وجود خواهد داشت. برخی از مثال ها در این زمینه شامل سرویس های وبی سایت آمازون، و کلادسیگما (CloudSigma) می باشند. در نهایت، برخی از فراهم آورندگان خدمات، نظیر آمازون و رک اسپیس (Rackspace) یک رویکرد ترکیبی را دنبال نموده و فضای ذخیره سازی بیشتری را با توجه به هزینه بیشتر برای نمونه های خاص ماشین های مجازی خود طلب می نمایند.
۳ـ۱ـ۲٫ هزینه های ابری
توسعه و حفظ زیر ساختارهای ابری نیازمند سرمایه گذاری مقادیر زیادی پول می باشد که استهلاک آن در بازه زمانی طولانی مدتی حاصل خواهد شد. به استثنای هزینه های خرید اولیه، قیمت خدمات مرکز داده ابری از نقطه فرآیندهای حفظ و نگهداری نیز گران قیمت تمام می شود. هزینه اصلی توسعه در این مبحث اکتساب و خرید سرورهای خام و زیرساخت های شبکه می باشد. به علاوه، مراکز داده ابری به انرژی بالایی نیاز داشته و بنابراین به زیر ساختارهای قدرتمند انرژی و همچنین فرآیندهای خنک سازی مطلوب نیازمند هستند که خود سبب به بارآمدن هزینه بیشتری خواهد شد [۲۲]. خرید مجوزها یا لیسانس های نرم افزاری، نظیر سیستم های عامل و نرم افزار مجازی سازی، خود سبب ایجاد هزینه های بیشتری در این زمینه می شود. در نهایت، هزینه مکان نیز از جمله مواردی است که می بایست آن را در نظر داشت یعنی جایی که مرکز داده از نقطه نظر فیزیکی در آنجا قرار می گیرد [۲۳]. مهمترین هزینه اقتصادی مرتبط با هزینه حفظ و نگهداری به واسطه مصرف قابل توجه نیروی برق می باشد. این میزان غالباً در حد ۱۵ الی ۲۰% کل بودجه است [۲۲، ۲۴]. هزینه های دیگر شامل هزینه های شبکه می باشد، که به عنوان هزینه های ارتباطاتی با کاربران نهایی تلقی شده و همچنین هزینه های پرداخت حقوق و دستمزد تکنسین های مرکز داده و بقیه مستخدمین که همگی در این راستا می بایست مورد توجه قرار گیرند.
۳ـ۱ـ۳٫ مدل های شارژ
روش های شارژ به صورت متعامد با ویژگی های ماشین مجازی و هزینه های توسعه و راه اندازی زیر ساختارهای ابری می باشد. با این وجود، ما مهمترین مدل های شارژ را که به وسیله مدل هزینه ما پشتیبانی می شوند ارائه می نماییم.
شایع ترین مدل شارژ تحت عنوان مدل “پرداخت در برابر استفاده” می باشد، که در آن مشتری با توجه به مدت حقیقی که از زیر ساختار ابری استفاده نموده است شارژ خواهد شد. دوره های کاربرد با توجه به ویژگی های تفکیکی مختلفی کنترل می شوند، یعنی آنکه فراهم آورندگان خدمات ممکن است دارای واحدهای زمانی حداقلی مختلف برای مسئله شارژ باشند. به طور مثال، یک واحد زمانی حداقلی برای یک فراهم آورنده خدمات ممکن است ۱ ساعت تلقی شود و برای فراهم آورنده دیگر پنج دقیقه باشد. بنابراین، در صورتی که شخصی زیر ساختار اولی را برای ۱ ساعت و ۲۳ دقیقه استفاده نمود، وی به گونه ای شارژ خواهد شد که گویی برای ۲ ساعت از این امکانات استفاده نموده است، در حالی که در مورد دوم صرفاً برای ۱ ساعت و ۲۵ دقیقه منظور خواهد شد. خط مشی ارائه شده در این زمینه در حقیقت حالت تفکیک سازی زمان جهت کاهش متعاقب و هزینه بر حسب دقیقه حتی بر مبنای دقایق منابع استفاده شده می باشد [۱].
۳ـ۲٫ چگونگی کاربرد مدل هزینه
مجموعه مورد نظر ما در شکل ۱ نشان داده شده است. ما در نظر می گیریم که یک بهینه ساز متمرکز وجود دارد که قابلیت ایجاد یک برنامه اجرایی در قالب یک درخت پرس و جو را خواهد داشت، یعنی رأس های این درخت مترادف با عملگرها و جریان های اطلاعاتی از انتها به ابتدا یا از بالا به پایین می باشد، گره ریشه نیز تولید کننده نتایج نهایی پرس و جو تلقی می شود. در این مرحله، هیچ گونه اطلاعات محلیت در خصوص آنکه چنین سیستمی بر روی کدام یک از ماشین های مجازی اجرا می شود وجود ندارد. بر این مبنا، برنامه اجرایی به پرس و جوهای کوچکتری تقسیم شده که در آن هر پرس و جوی فرعی متناظر با یک مرحله اجرایی می باشد. چنین مراحلی تحت عنوان “گام ها” خوانده می شوند. قبل از شروع هر گام، کلیه گام های سطح پایین تر را می بایست کامل نمود. در این شکل، ما یک حد مشخص برنامه پرس و جو را در چهار گام نشان داده ایم.

مدل هزینه دوهدفه بهینه سازی پرس و جوهای بانک اطلاعات در محیط چندابری

 

۴- مدل هزینه ما
این مدل که ما آن را ارائه می نماییم برای ارزیابی زمان و هزینه اقتصادی یک طرح پرس و جو اجرا شده بر روی ماشین های مجازی ابری ارائه شده است. به منظور حاصل آوردن چنین امری، ما اقدام به ایجاد مدل های هزینه تک هدفه توصیف شده در مراجع [۵، ۱۴] نمودیم، و در عین حال قابلیت کپسوله سازی مدل های تک هدفه بیشتری را نیز در نظر گرفتیم. به علاوه، مدل ما را می توان برای جریان های داده ای کلی تر بیشتری بکار گرفت که هنوز تحت عنوان DAGs توصیف می شوند. برای سادگی، ما این موضوع را در نظر می گیریم که فرآیند ما به عنوان یک پلن یا برنامه پرس و وجوی سنتی به شمار آمده و در انتهای این بخش ما ویژگی های مشخص شده آن را به طور کامل بیان خواهیم نمود.
۴ـ۱٫ فرضیه ها
قبل از آنکه توابع و ویژگی های منطقی مدل هزینه خود را تشریح نماییم، ما می بایست کار خود را با فرضیه های ارائه شده شروع کنیم:
  • شکل برنامه پرس و جو و رتبه بندی عملگر قبلاً به وسیله سیستم بهینه ساز متمرکز انتخاب شده است.
  • مکانیسمی وجود دارد که قابلیت تجزیه برنامه پرس و جو به گام های مشخص را خواهد داشت. این گام ها را می توان چه به صورت دستی و چه به صورت اتوماتیک تولید نمود، یعنی کاربرد رویکرد پارتیشن بندی یا تفکیک موارد همانگونه که در مرجع [۲۷] توصیف شده است. هر گام شامل رأس هایی می باشد که می توان آن را تحت عنوان زیر پرس و جوها در برنامه پرس و جوی اصلی در نظر گرفت که به عنوان گروه هایی از عملیات بانک اطلاعات ساده به شمار آمده، یا می توان آن را به عنوان عملیات مستقل برشمرد. مدل ما تمایزی بین این دو مورد در نظر نگرفته و هر رأس گام را به عنوان عملگر غیرقابل تفکیک مشخص می سازد.
۴ـ۲٫ مدل هزینه
مدل هزینه ما به صورت پیمانه ای می باشد و متشکل از اجزایی است که رویه مدل سازی خط مشی های شارژ، ویژگی های محاسباتی و زمان اجرای ارتباطات را به ترتیب مشخص می سازد. بر مبنای این اجزا، قیمت اقتصادی به شرح ذیل حاصل می شود.
۴ـ۲ـ۱٫ مدل سازی خط مشی های شارژ و حق الزحمه
در بخش اول، ما اقدام به مدل سازی خط مشی های شارژ که در بخش ۳ تشریح شده است نموده و آنها را با توجه به ویژگی های ارائه شده ماشین های مجازی خاص ترسیم می نماییم. ایده اصلی به شرح ذیل است:
۴ـ۲ـ۲٫ ارزیابی زمان اجرا
جهت برآورد زمانی که یک پرس و جو بر روی یک ماشین مجازی خاص اجرا می شود، ما از فرمول ذیل استفاده می کنیم:
۴ـ۲ـ۳٫ ارزیابی هزینه مالی
بخش سوم مدل ما ارزیابی هزینه پرس و جو در واحدهای پولی می باشد. به منظور ارزیابی این مهم، ما نیازمند ترکیب ویژگی های قیمت گذاری ارائه شده به وسیله فراهم آورندگان خدمات مختلف با توجه به ارزیابی زمانی مدل خود می باشیم. مجموع قیمت ارائه شده منوط به زمان اجرای هر عملگر و مبلغ مرتبط با آن می باشد:
۴ـ۳٫ یک مثال
به منظور حاصل آوردن یک نمای بهتر در خصوص این مدل، ما یک مثال ساده را ارائه می نماییم. در نظر بگیرید که دارای یک پرس و جوی q می باشیم که در دو گام به صورت ترتیبی اجرا می گردد به گونه ای که استفاده از معادله (۱) برای برآورد هزینه زمان مدنظر خواهد بود. این پرس و جو متشکل از دو عملگر یا اپراتور است، که هر کدام در هر گام مشخص می شوند. برای سادگی ما در نظر می گیریم که:
۴ـ۳ـ۱٫ تناسب مدل هزینه با استفاده از یک بهینه ساز
نقش بهینه ساز انتخاب مناسبترین ترکیب ماشین های مجازی می باشد، که در آن هر دو مؤلفه زمان و هزینه پولی در نظر گرفته می شود. مثال بحث شده فوق ساده است، اما درحد کفایت قابلیت فراهم آوردن بینش لازم در ارتباط با پیچیدگی مسئله به هنگام بررسی هر یک از ترکیب های ماشین های مجازی را فراهم می آورد. مهمتر آنکه، میانگین پیچیدگی زمانی برآوردها برای هر گام در تناسب با تعداد ویژگی های ارائه شده قیمتی، تعداد ماشین های مجازی موجود و تعداد رأس های هر گام می باشد. برآورد برنامه پرس و جوی کامل در تعداد گام ها به صورت نمایی خواهد بود. بنابراین، یک بهینه ساز که متکی به بررسی صراحت هر کدام از ترکیبات می باشد عمدتاً قابلیت کاربرد عملی نخواهد داشت.
۴ـ۴٫ تعمیم کلیات
مدل هزینه تشریح شده در این بخش را می توان به دو روش اصلی که قبلاً ارائه نشده اند تعمیم داد: پشتیبانی از جریان های تحلیل داده فرضی و موازی سازی داخل ـ اپراتور یا عملگر.
۵- مطالعه موردی اعتبارسنجی
در این بخش، ما نشان خواهیم داد که چگونه مدل هزینه را می توان در یک محیط چند ابری واقعی بکار گرفت. اولین بخش نشان دهنده این موضوع خواهد بود که چگونه قابلیت کالیبره نمودن مدل هزینه در یک زیر ساختار ابری واحد وجود داشته و چگونه می توانیم برآوردهای زمانی را انجام دهیم. برآوردهای هزینه مالی تحت پوشش قرار گرفته در مثال بخش ۴ـ۳ نیز مدنظر می باشند. ما متعاقباً مجموعه های پیچیده تری را عرضه می داریم که بکارگیرنده زیر ساختارهای متعدد ابری می باشند و به صورت مجزا از پرس و جوهای بانک های اطلاعاتی عمل می نمایند.
۵ـ۱٫ ویژگی های آزمایشی ساده و کالیبراسیون مدل
برای این آزمایشات، ما از okeanos استفاده نمودیم. IaaS به عنوان یک پلتفرم برای مؤسسات علمی یونان و جوامع تحقیقاتی مرتبط عمل می نماید [۲۹]. علی الخصوص، ما از سه ماشین مجازی با پیکربندی سخت افزاری ذیل استفاده نمودیم:
  • دو ماشین مجازی (VM۱ و VM۳): دیسک ۶۰ گیگابایتی، رم ۴ گیگابایتی، پردازنده تک هسته ای ۲ـ۱ گیگاهرتزی
  • یک ماشین مجازی (VM۲): دیسک ۴۰ گیگابایتی، رم ۲ گیگابایتی، پردازنده تک هسته ای ۲ـ۱ گیگاهرتزی.
ویژگی های نرم افزاری ما شامل نصب سیستم PostgreSQL 9.1.11 بر روی کرنل یونیکس ۳٫۲٫۰-۵۸-generic می باشد. داده هایی که ما از آنها استفاده نمودیم خود حاصل آمده از معیارهای پشتیبانی تصمیم TPC-H بوده و اندازه بانک اطلاعاتی آن برابر با ۲۶ گیگابایت می باشد.
۵ـ۲٫ برآوردهای زمان اجرا
در این آزمایشات، ما سعی در ارزیابی این موضوع نموده ایم که آیا مدل هزینه ما می تواند با دقت کافی اقدام به پیش بینی زمان اجرای یک پرس و جو نماید. ما از بانک اطلاعات PostgreSQL برای عملگرهای گام های پایین استفاده نمودیم. کلیه عملگرهای دیگر با استفاده از اسکریپت های یونیکس پیاده سازی شده اند. واحدهای هزینه c صرفاً جهت پیش بینی زمان اجرای عملگرهای PostgreSQL بکار گرفته شده اند. جهت محاسبه زمان عملگرهای پیاده سازی شده با اسکریپت ها، ما آنها را به عنوان جعبه های سیاه در نظر گرفته و با توجه به ورودی های مختلف اقدام به اجرای آنها و برآورد عملکرد مرتبط نمودیم.
۵ـ۳٫ ارزیابی کاربرد بانک های اطلاعات NoSQL چند ابری
آزمایشات قبلی نشان دهنده آن می باشند که دقت این مدل در یک مجموعه ابری واحد قابل توجه است. ما هم اکنون حرکت خود به سمت محیط چند ابری را ادامه داده و تمرکز خود را بر روی پرس و جوهایی جلب می نماییم که قابلیت دسترسی به HBase، یک سیستم NoSQL گسترده، را خواهد داشت. ما اقدام به پیاده سازی سه خوشه HBase می نماییم. نگارش HBase در هر خوشه به صورت ۲۰/۹۴/۰ بر روی سیستم HBase 1.2.1. می باشد. جهت تولید داده ها، ما اقدام به اصلاح جدول YCSB v0.1.3 جهت ایجاد رکوردها / ردیف های صد کیلوبایتی (۱۰ فیلد ۱۰ کیلوبیتی هر کدام در یک ردیف) نمودیم. این ردیف ها بر مبنای نواحی از قبل تعیین شده توزیع شده اند (یعنی به صورت پیش تقسیم شده می باشند). کلیه داده های ناحیه در حافظه اصلی جای گرفته به گونه ای که هیچ گونه دسترسی به دیسک به منظور کش نمودن اطلاعات مورد نیاز نخواهد بود.
۵ـ۳ـ۱٫ کالیبراسیون مدل
جهت کاربرد این مدل، ما می بایست قابلیت یافتن پارامترهایی برای انتقال داده و همچنین قابلیت خواندن محلی اطلاعات سرور HBase را حاصل آوریم. جهت اجتناب از تداخل در زمینه سرعت انتقال داده به واسطه دسترسی های متعدد به دیسک، ما یک ابزار iperf را بکار گرفتیم، که قابلیت برآورد حداکثر پهنای باند TCP را خواهد داشت. ما از یک فرمول مشابه همانند بخش ۵ـ۱ استفاده نمودیم (متناظر با نگارش تقریبی معادله (۴)). جهت محاسبه مقادیر a و a، ما اقدام به برآورد جمعی بازه های زمانی مختلف (یعنی ۱، ۲، ۵، ۱۰، ۲۰ ثانیه) با ده تکرار برای هر مرحله نموده و متعاقباً رگرسیون خطی را مورد استفاده قرار دادیم. فراخوانی هایی نیز به وسیله کلاینت به مستر هر کدام از خوشه های HBase ارسال شد (یعنی VM۸، VM۱۰ و VM۱۲ به ترتیب). نتایج آن در جدول ۹ نشان داده شده است.
۵ـ۳ـ۲٫ اجرای برآوردهای زمانی
در اولین مجموعه آزمایشات NoSQL، ما پرس و جوهای پویشی را بکار گرفتیم، که در آن کلاینت قابلیت فراخوانی داده ها از خوشه های HBase را دارد. جزئیات این آزمایشات به شرح ذیل هستند:
  1. SCAN-Experiment-1 (SE1): ما داده هایی را از یک سرور ناحیه ای، از هر کدام از بانک های اطلاعاتی ابری، همانگونه که در شکل ۵ (سمت چپ) نشان داده شده است درخواست نمودیم. اندازه ناحیه ۱ گیگابایت برای زیر ساختار ابری خصوصی، ۷۰۰ مگابایت برای okeanos و ۳۵۰ مگابایت برای profitbreaks مشخص شده است.
  2. SCAN-Experiment-2 (SE2): ما ۲ گیگابایت داده را از خوشه HBase درخواست نمودیم که بر روی زیر ساختار ابری خصوصی ما اجرا می شود، که خود مترادف با داده های خواندنی از دو سرور ناحیه ای می باشد، همانگونه که در شکل ۵ (سمت راست) نشان داده شده است.
  3. SCAN-Experiment-2 (SE3): ما ۷۰۰ مگابایت داده (یعنی اطلاعات از یک سرور ناحیه) را از خوشه HBase درخواست نمودیم که قابلیت اجرا بر روی زیر ساختار ابری okeanos را داشته و از ۳۵۰ مگابایت داده از خوشه HBase برخوردار است که در حال اجرا بر روی زیرساختار ابری profitbricks می باشد، به شکل ۶ (سمت چپ پ) رجوع شود.
  4. SCAN-Experiment-2 (SE4): ما داده هایی را از سرور ناحیه ای درخواست نمودیم که از هر کدام از بانک های اطلاعاتی HBase به صورت همزمان می باشد، شکل ۶ (سمت راست).

مدل هزینه دوهدفه بهینه سازی پرس و جوهای بانک اطلاعات در محیط چندابری

 

۶- نتیجه گیری
در این تحقیق، ما نسبت به ارائه یک مدل هزینه دو هدفه اقدام نمودیم که قابلیت ارائه برآوردهای هزینه مالی و زمانی برنامه های پرس و جو که بر روی ماشین های مجازی از سوی ارائه دهندگان خدمات متعدد ابری اجرا می شوند را دارد. مدل هزینه ما رویکردهای موجود با هدف ارزیابی های زمانی، و به هنگامی که وظایف بر روی ماشین های از قبل تعیین شده اجرا می گردند، را پشت سر گذاشته و یک سری از ویژگی های خاص محیط چند ابری را ارائه می نماید که در آن منابع با یک قیمت مشخص شده مورد استفاده قرار می گیرند. علی الخصوص، ما نسبت به تقویت پیشنهادات موجود برای فراهم آوردن برآوردهای زمانی اقدام نموده و مدلی را برای برآوردهای هزینه مالی عرضه داشته و در عین حال از خط مشی های شارژ اصلی ارائه دهندگان خدمات ابری که تاکنون عرضه شده اند پشتیبانی می کنیم. مدل هزینه همچنین برای وظایف جریان اطلاعاتی کلی نیز قابل کاربرد می باشد و با استفاده از یک مثال با جزئیات مربوطه و مطالعات اعتبارسنجی، ما نشان می دهیم که چگونه قابلیت بکارگیری چنین رویه ای در عمل وجود دارد. به علاوه، ما این موضوع را نیز تشریح می نماییم که چگونه چنین مدلی را به عنوان بخشی از یک فرآیند بهینه سازی پرس و جوی چند هدفه مدرن بکار گرفت، موردی که خود به عنوان ورودی نیازمند جفتی از مولفه های برآورد هزینه مالی و زمانی می باشد که به وسیله مدل ما عرضه می گردد.
پیشنهاد ما به عنوان اولین هزینه دو هدفه برای پرس و جوهای ابری به شمار می آید. با این وجود، این مورد از چندین محدودیت در رنج می باشد که می توان آن را در مطالعات آتی مورد خطاب قرار داد، چرا که فراهم آوردن برآوردهای زمانی و هزینه ای به عنوان یک مسئله پیچیده به شمار می آید. دو مورد از مهمترین ویژگی ها ایجاد مدل های هزینه ای می باشد که قابلیت مشخص سازی وظایف در ارتباط با هزینه مستهلک شده کاربرد زیر ساختارها (به جای شارژ قیمت) را داشته و به علاوه قابلیت انجام ویژگی های اعتبارسنجی بیشتری پس از توسعه آن و ارائه رویه های معیارسنجی مناسب را داشته باشد. در نهایت، با توجه به آنکه چندین هدف دیگر در ارتباط با بانک های اطلاعاتی ابری وجود دارند، شامل ویژگی های امنیتی، پایایی و کیفیت خدمات (QoS)، گسترش مدل ما به منظور پوشش دادن این موارد نیز قابل توجه می باشد.

مدل هزینه دوهدفه بهینه سازی پرس و جوهای بانک اطلاعات در محیط چندابری

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

لطفا به جای کپی مقالات با خرید آنها به قیمتی بسیار متناسب مشخص شده ما را در ارانه هر چه بیشتر مقالات و مضامین ترجمه شده علمی و بهبود محتویات سایت ایران ترجمه یاری دهید.
تماس با ما

اکنون آفلاین هستیم، اما امکان ارسال ایمیل وجود دارد.

به سیستم پشتیبانی سایت ایران ترجمه خوش آمدید.