مقالات ترجمه شده دانشگاهی ایران

سیستم ذخیره انبوه آنالیز تجربی

سیستم ذخیره انبوه آنالیز تجربی

سیستم ذخیره انبوه آنالیز تجربی – ایران ترجمه – Irantarjomeh

 

مقالات ترجمه شده آماده گروه کامپیوتر
مقالات ترجمه شده آماده کل گروه های دانشگاهی

مقالات

چگونگی سفارش مقاله

الف – پرداخت وجه بحساب وب سایت ایران ترجمه(شماره حساب)ب- اطلاع جزئیات به ایمیل irantarjomeh@gmail.comشامل: مبلغ پرداختی – شماره فیش / ارجاع و تاریخ پرداخت – مقاله مورد نظر --مقالات آماده سفارش داده شده پس از تایید به ایمیل شما ارسال خواهند شد.

قیمت

قیمت این مقاله: 48000 تومان (ایران ترجمه - Irantarjomeh)

توضیح

بخش زیادی از این مقاله بصورت رایگان ذیلا قابل مطالعه می باشد.

مقالات ترجمه شده کامپیوتر - ایران ترجمه - irantarjomeh
شماره      
۶۰
کد مقاله
COM60
مترجم
گروه مترجمین ایران ترجمه – irantarjomeh
نام فارسی
آنالیز تجربی سیستم ذخیره انبوه
نام انگلیسی
Experimental analysis of a mass storage system
تعداد صفحه به فارسی
۴۳
تعداد صفحه به انگلیسی
۲۲
کلمات کلیدی به فارسی
کنترلر RAID ، دیسک،IBM DS4300، IBM FAStT600، سیستم های ذخیره اطلاعات انبوه، محاسبه موازی، ارزیابی عملکرد، RAID
کلمات کلیدی به انگلیسی
RAID controller, disk, IBMDS4300, IBMFAStT600, mass storage systems, parallel computing, performance evaluation, RAID
مرجع به فارسی
دپارتمان مهندسیبرق، دانشگاه مهندسیو تکنولوژی، لاهور، پاکستان
دپارتمان انفورماتیک بیوپزشکی، دانشگاه اوهایو، آمریکا
مرکز سوپرکامپیوتر اوهایو
مرجع به انگلیسی
Department of Electrical Engineering, Biomedical Informatics, Ohio Supercomputer Center
کشور
ایالات متحده

آنالیز تجربی سیستم ذخیره انبوه

چکیده
سیستم های ذخیره انبوه (MSSs) نقش مهمی‌را در محاسبات موازی داده‌های فشرده بازی می‌کنند. اخیرترین کاربرد سیستمهای ذخیره انبوه در آرایه‌های افزونگی دیسکهای مستقل/ ارزان (RAID) به کار گرفته شد که در آن دیسک های وابسته در کنار یکدیگر همراه با سخت افزار کنترلر خاص قرار داده شده‌اند. پیش بینی عملکرد چنین سیستمهایی مشکل می‌باشد، چرا که غالب جزئیات داخلی رفتار کنترلر هنوز به صورت اطلاعات عمومی‌عرضه نشده‌اند. در این مقاله جهت ارزیابی تجربی عملکرد سیستمهای ذخیره انبوه از یک روش سیستماتیک بهره گرفته شده است که از طریق آن برآوردها و سنجش هایی بر روی یک سری از پیکربندیهای RAID با اندازه افزایشی و پیچیدگی فزاینده حاصل شده است. ما از این روش جهت بررسی سیستم ذخیره انبوه مرکز سوپر کامپیوتر اوهایو بهره گرفتیم. در این مرکز ۱۶ پردازنده ورودی و خروجی قرار داشته که هر کدام از آنها به چهار سیستم ۸+۱  RAID5  متصل بوده و بر این اساس قابلیت فراهم آوردن ۱۲۸ ترابایت (TeraByte) از فضای ذخیره سازی مهیا شده است (این مقدار فضا پس از فرمت ۱۱۶٫۸ TB را در اختیار قرار خواهد داد). روش بکار گرفته شده در این مبحث به طراحان سیستم ذخیره سازی اطلاعات اجازه می‌دهد تا با اطمینان قابل توجهی از نقطه نظر تجربی به ارزیابی عملکرد سیستم های خود بپردازند. با وجود آنکه آزمایشات خود را بر اساس محتویات یک سیستم خاص انجام داده‌ایم، روش بکار گرفته شده برای کلیه سیستم های ذخیره اطلاعات بزرگ قابلیت کاربرد را دارا خواهد بود. روالهای سنجش و اندازه گیری حاصل شده از طریق این روش به برنامه نویسهای کاربردی اجازه می‌دهد تا از محدودیت های عملکرد کدهای برنامه های خود آگاه شوند.

کلمات کلیدی: کنترلر RAID ، دیسک،IBM DS4300، IBM FAStT600، سیستم های ذخیره اطلاعات انبوه، محاسبه موازی، ارزیابی عملکرد، RAID

 

سیستم ذخیره انبوه آنالیز تجربی

 

۱- مقدمه
کاربردهای سطح بالای محاسبات کنونی و مقوله‌های ارائه شده در رشته‌های فیزیک، نجوم و بیوانفورماتیک که بصورت فزآینده و گسترده‌ای مطرح شده‌اند، دسترسی پایدار به مجموعه‌های اطلاعاتی در محدوده پتابایت (petabyte) را طلب می‌نمایند. در مبحث ذخیره سازی انبوه چنین نیازهایی را تنها با بهره گیری از مجموعه‌ای از دیسک های بزرگ می‌توان پاسخگو بود که تحت عنوان آرایه‌های افزونگی دیسکهای مستقل/ ارزان (RAID) خوانده می‌شوند. اغلب دیسک های RAID با عملکرد و ظرفیت بالا از کنترلرهای قدرتمندی استفاده می‌کنند، با این حال پیش‌بینی میزان عملکرد آنها مشکل می‌باشد، چرا که اطلاعات اندکی در خصوص جزئیات داخلی چنین کنترلرهایی، بوسیله سازندگان آن، در اختیار عموم قرار گرفته است. کاربران این سیستمها نمی‌توانند اطمینان داشته باشند که آیا عملکرد حاصل شده از طریق چنین سیستمهایی را می‌توان براستی به عنوان حداکثر توانایی مطلوبی بشمار آورد که سخت افزارهای آنها می‌توانند انجام دهند یا خیر. علاوه بر این، در صورتی که سخت افزارهای حاضر قابلیت بکارگیری چنین سیستمهایی را نداشته باشند سوال پیش روی اینگونه مطرح خواهد شد که تنگنا و مشکل مربوطه در چه قسمتی بوجود می‌آید؟

 

این مقوله روشی را عرضه می‌دارد تا بر اساس آن بتوان نسبت به ارزیابی تجربی سیستمهای ذخیره سازی انبوه (MSSs) اقدام نمود. انگیزه تحقیقات ما نیز بر پایه نیاز جهت درک عملکرد سیستم ذخیره انبوه، در مرکز سوپر کامپیوتر اوهایو (OSC)، استوار بوده است. این سیستم بر مبنای یک مخزن کنترلرهای ذخیره سازی IBM FAStT600/DS4300 همراه با ۱۶ پردازشگر اختصاصی  (ورودی / خروجی (xio)) اینتل پنتیوم ۴ و ۵۷۶ دیسک مکستور (Maxtor) با فضای ۱۱۶٫۸ TB بنیان شده است. با این وجود روشی که تشریح می‌کنیم برای کلیه آرایه‌های RAID قابل استفاده می‌باشند.
این مقاله به شکل ذیل طبقه بندی شده است. بخش ۲ مشکلات مربوط به پیش بینی عملکرد RAID را مورد بررسی قرار داده و بر این اساس یک اسلوب سه مرحله‌ای پیشنهادی را عرضه می‌دارد. بخشهای۳،۴و۵ چگونگی کاربرد روش سه مرحله‌ای ما برای مخزن OSC FAStT600 را تشریح می‌کند و در نهایت بخش ۶ نتیجه گیری موارد فوق الذکر را ارائه می‌دارد.

سیستم ذخیره انبوه آنالیز تجربی

 

۲- روش شناسی
۱-۲ عملکرد آرایه های RAID
تکنولوژی RAID بسرعت در اوایل دهه ۱۹۹۰ توسعه یافت، از این تکنولوژی برای ساخت حافظه ثانویه دارای سرعت و حجم بالا و مطمئن در دیسک‌های سخت ارزان قیمت استفاده شده است. این مبحث موارد ذیل را در بر می‌گیرند. بحث مدلسازی عملکرد درایو دیسک، بررسی موارد و ارتقای حاصل شده اخیر،  نرخ‌های کارای خواندن و نوشتن دستگاههای RAID با انواع مختلف اندازه های متفاوت.
اخیراً آرایه های دارای عملکرد بالا و ظرفیت بالای RAID در زمینه های سخت افزار کنترلر به کار گرفته شده اند. قابلیتهای چنین کنترلرهایی غالباً به عنوان عامل قابل توجه جهت تشخیص عملکرد کلی یک سیستم مدنظر می‌باشد. متأسفانه، جزئیات داخلی چنین کنترلرهایی به ندرت به صورت آشکار برملا گردیده است و مستندات قابل توجهی درباره آنها وجود ندارد. در نتیجه، مدیران سیستمی ‌و کاربران آرایه های  RAID بزرگ غالباً از این موضوع اطمینان ندارند که آیا قادر به تحصیل حداکثر عملکرد ممکن با منابعی که در اختیار آنها می‌باشد خواهند بود یا خیر.
۲-۲ روش پیشنهادی
ما یک فرآیند سه مرحله‌ای را برای ارزیابی تجربی یک سیستم ذخیره انبوه پیشنهاد می‌کنیم.
  • بررسی معماری سیستم جهت مشخص نمودن اجزایی که عملکرد آنها را می‌توان به صورت مجزا تحت مطالعه قرار داد.
  • مشخص نمودن تنگناهای بالقوه در سیستم. در صورت امکان، بررسیهای ساده و کسب تجربه در زمینه اجزای واحد جهت مشخص نمودن تنگناهای وابسته بدان. بطور مثال، نرخ I/O ناخالص یک دیسک واحد را می‌توان به آسانی اندازه گیری نمود و از این طریق نسبت به مشخص نمودن موانع تئوریکی قابل توجه در زمینه عملکرد آن اقدام کرد. در این بررسی می‌توان یک یا دو جزء که به احتمال قوی به عنوان تنگناهای اساسی مدنظر می‌باشند را مورد بررسی قرار داد.
  • انجام یک سری از برآوردها بر روی آرایه های RAID دارای اندازه های مختلف، که در حول و حوش سخت افزار استفاده شده در سیستم مقصد، پیکر بندی گردیده‌اند.

سیستم ذخیره انبوه آنالیز تجربی

 

۳- مرحله ۱: مطالعه معماری
نگرش یک برنامه نویس کاربردی در زمینه OSC کلاستر اینتل پنتیوم ۴ زئون (XEON) در شکل ۱ مشخص شده است. چنین مقوله ای متشکل از ۲۵۶ گره کامپیوتری می‌باشد که به ۱۶ گره های xio متصل گردیده و ۱۱۲ نمونه از چنین  پردازشگرهایی به ۱۶ گره xio از طریق یک شبکه Infiniband سوئیچ شده با نرخ داده s-1 Gbit8 متصل گردیده‌اند. کلیه ۲۵۶ گره کامپیوتری نیز به ۱۶ گره  xio، از طریق یک سوئیچ اترنت گیگا بایت، متصل شده اند. هر گره xio می‌تواند یک دستگاه دیسک RAID چهار سویه را کنترل نماید. در حقیقت، هریک از این دیسکها در این ۰RAID به یک دستگاه ۵RAID 8+1 مپ شده‌اند که موارد مرتبط ذیلاً مورد بحث قرار می‌گیرند.
سیستم های ۵RAID دارای پارامترهای تعیین و تصحیح خطا می‌باشند. نرخ خواندن و نوشتن در ۵RAID، در عمل،  در حدود ۸ یا ۹ برابر سرعت هر یک از دیسکها به صورت منفرد می‌باشد. در حقیقت، اورهدهای سخت افزار کنترلر۶۰۰FAStT نرخهای تجمعی، بسیار متمایز از موارد ارائه شده در مضامین تئوریکی، را ارائه می‌دهند.
 
۱-۳ اجزای سیستم
۱-۱-۳  ۶۰۰FAStT
سرور ذخیره اطلاعات ۶۰۰FAStT  IBM(توربو) از جمله عنصر کلیدی مخزن اطلاعات OSC می‌باشد. این سرور قابلیت پشتیبانی از ۱۱۲ درایو سخت با مجموع ظرفیت ۴/۱۶ ترابایت را دارا می‌باشد. هریک از این سیستم های ۶۰۰FAStT دارای کنترلر دوبل بوده و آنها را می‌توان به گونه‌ای پیکربندی نمود تا پیکربندیهای RAID مختلفی را به جهان بیرون عرضه دارند. به طور مثال، شکل ۵ نشان دهنده یک ۶۰۰FAStT می‌باشد که آن را به شش روش مختلف برای اهداف تجربی خود پیکربندی نموده ایم (که بعداً در این مقاله تشریح خواهند شد). بکارگیری این پیکربندی، در یک کاربری معمولی در OSC، در انتهای این تصویر نشان داده شده است. در این مورد ۳۶ دیسک تحت ۴ دستگاه ۵RAID که هرکدام متشکل از ۹ دیسک می‌باشند در نظر گرفته شده و هریک از کنترلر ها به ۲ LUN تخصیص داده شده‌اند. علاوه بر این می‌توان از موارد نصب متفاوتی بهره گرفت، به طور مثال، دو سیستم ۵RAID 14 دیسکی را می‌توان در نظر داشت. معماری و عملکرد کنترلر۶۰۰FAStT بعداً مورد بحث قرار خواهد گرفت.
۲-۱-۳ دیرکتور سیسکو ۹۵۰۹  (Cisco Director)
دور سوئیچ کانال فیبری دیرکتور سیسکوی ۹۵۰۹ در سیستم OSC بکار گرفته شده‌اند تا آنکه بتوان واحدهای ۶۰۰FAStT را به پردازنده های xio مدنظر متصل نمود. چنین اتصالاتی به صورت ایستا بوده و تحت کنترل مدیران سیستم می‌باشند.
۳-۱-۳ دیسکهای مکستور
دیسکهای استفاده شده در مخزن ذخیره ۶۰۰FAStT در حقیقت مکستور ۷Y250M0 SATA می‌باشند (SATA مخفف «الحاق تکنولوژی پیشرفته سریال» است)، این دیسکها از ظرفیت ۲۵۰ گیگا بایتی برخوردار می‌باشند. جدول ۱ نشان دهنده پارامترهای اصلی این دیسک می‌باشد که مرتبط با مبحث جاری هستند. علاوه بر این این نکته قابل توجه می‌باشد که تکنولوژی «ثبت ناحیه‌ای» (Zone recording) در این دیسک بکار گرفته شده است. این امر بدان معناست که تعداد سکتورها در هر ترک با توجه به قطر آن متفاوت می‌باشد.  این موضوع خود بعنوان یک جبران برای افزایش محیط ترک ها با افزایش قطر آنها مطرح خواهد بود.  بر این اساس ۱۶ ناحیه بر روی هر سطح دیسک وجود دارد و تعداد ۵۱۲-Bسکتور نیز دیده می‌شود که از ۶۱۰ در ناحیه داخلی الی ۱۱۰۲ تا ناحیه بیرونی متفاوت می‌باشد (جدول ۲).
۲-۳ گره‌های xio
۱۶ پردازنده xio در مخزن ذخیره FAStT600 وجود دارند که هرکدام از آنها به آرایه  ۵RAID 8+1 چهار سویه متصل می‌باشند. این پردازنده‌ها در حقیقت پردازنده دوتایی اینتل پنتیوم ۴ زئون (Xeons) با سرعت ساعت  ۴/۲ گیگا هرتز و رم ۴ گیگابایت می‌باشند که تحت سیستم عامل لینوکس ۲٫۶٫۶ (زنجیره‌های هایپر) اجرا می‌شوند، بگونه‌ای که پردازنده های دوبل به نظر چهار پردازنده مجزا جلوه می‌نمایند. این امر یکی از نقاط قابل توجه برای برنامه نویسان می‌باشد چرا که چنین پدیده ای به معنای آن خواهد بود که کدینگ نوشته شده به وسیله ۴ الی ۸ زنجیره به خوبی بر روی این ماشین ها اجرا خواهد شد.

سیستم ذخیره انبوه آنالیز تجربی

 

۴- مرحله ۲: شناسایی تنگناهای بالقوه
تعداد زیادی از تنگناهای بالقوه بین پردازنده xio و رسانه مغناطیسی در دیسکها وجود دارند. این موارد در شکل ۴ نشان داده شده اند. بخش های ذیل مباحثی را در زمینه اهمیت هریک از تنگناهای بالقوه مطرح می‌سازند. انگیزه این مبحث رویارویی با این حقیقت می‌باشد که با وجود آنکه ۳۶ دیسک (که هریک از آنها با حداقل نرخ خواندن داده پایدار برآورد شده ۳۴٫۵ MBs-1 می‌باشند) متصل به هر یک از پردازنده‌های xio وجود دارند، نرخ خواندن داده‌ها به صورت پایدار در این پردازنده xio بیش از مقدار حدوداً ۳۰۰ MBs-1 نمی‌باشد، که بسیار کمتر از محدوده سقف تئوریکی (۳۶ × ۳۴٫۵ =) ۱٫۲۴۲ GB s-1 خواهد بود. برخی از عناصر این زنجیره بین رسانه مغناطیسی و پردازنده xio عملکردی مشابه با یک تنگنا را خواهند داشت. حال اجازه دهید تا هر یک از این احتمالات را مورد بحث قرار دهیم.
۱-۴٫ فایل سیستم
فایل سیستم ext3 بر روی گره‌های xio بدون شک بر عملکرد کلی سیستم تأثیرگذار می‌باشد. با این وجود، آزمایشی که در شکل ۳ تشریح شده است معرف این نکته است که چنین فایل سیستمی قابلیت پشتیبانی از نرخ انتقال نزدیک به نرخ های انتقال داده خام این دیسک به هنگامی‌که سیستم FAStT600 بای‌پاس می‌شود را خواهد داشت. از اینرو فایل سیستم ext3 را نمی‌توان به عنوان عامل اصلی تأثیرگذار بر روی عملکرد سیستم بشمار آورد.
۲-۴٫ پهنای باند باس
باس‌های داخلی پردازنده‌های xio بگونه‌ای طراحی شده‌اند که می‌توانند از پردازنده های ۴/۲ گیگاهرتز پنتوم ۴ پشتیبانی نموده و دارای پهنای باند مرتبه GB s1 می‌باشند. چنین موردی تا زمانی که I/O مد نظر می‌باشد را نمی‌توان عامل بوجود آورن تنگنا برای سیستم بشمار آورد.
۳-۴٫ لینک های کانال فیبری
دو لینک کانال فیبری بین کنترلرهای FAStT600 و هر یک از پردازنده‌های xio وجود دارند. هریک از این لینک ها دارای یک پهنای ۲۱۲٫۵ MB s-1 می‌باشند که به صورت ترکیبی پهنای باند ۴۲۵ MB s-1 برای پردازنده xio را بوجود می‌آورند. این امر به میزان قابل توجهی بیشتر از حداکثر نرخ های داده‌ای می‌باشد که ما نسبت به سنجش آنها از/ به دیسکها در طی بای‌پس نمودن FAStT600 اقدام نموده ایم.
۴-۴. سوئیچ Cisco
این سوئیچ در حقیقت یک سوئیچ غیر انسدادی می‌باشد که کاملاً قابلیت پشتیبانی ترافیک      ۲ GB s1در هر پورت را دارا می‌باشد. علاوه بر این، این سوئیچ به صورت آماری جهت اتصال FAStT600 به پردازنده‌های xio مورد استفاده قرار می‌گیرد، بنابراین هیچگونه رخدادهای وابسته به روال های تأخیری سوئیچینگ را شاهد نخواهیم بود. بر این اساس چنین سوئیچی قابلیت پشتیبانی ترافیک ۴۲۵ MB s1، که به وسیله لینک های کانال فیبری عرضه می‌شود، را خواهد داشت.
۵-۴ دیسک: لینک SATA ، مکانیکی و کنترلر
پیک نرخ داده  SATAبه میزان ۱۵۰MB s-1 می‌باشد (جدول ۱). نرخ ثابت داده احتمالاً بسیار کمتر خواهد بود. مشخصه‌های دیسک مکستور ۷Y250M0 در جدول ۲ نشان داده شده است که معرف نرخ های انتقال ثابت یا پایدار ۳۷–۶۷ MB s1 می‌باشد. آزمایشاتی که بر روی دیسکهایی که به صورت مستقیم متصل شده اند (شکل ۳) و موارد دیگر موکد نرخ های انتقال پایدار ۳۴٫۵–۶۰٫۵ MB s1 بوده اند. از آنجائیکه حداقل ۳۶ دیسک به هریک از کنترلرها متصل شده بود، ما به صورت جمعی نرخ حداقل (۳۴.۵ × ۳۶ =) ۱.۲۴۲ GB s1 به کنترلر FAStT600 را فراهم ساختیم. از اینرو، یک دستگاه دیسک (متشکل از لینک  SATA، کنترلر دیسک و رسانه مغناطیسی) را نمی‌توان به عنوان تنگنا در نظر گرفت.
۶-۴٫ کنترلر FAStT600
این دستگاه که دارای برچسب کنترلر FAStT600 می‌باشد در حقیقت از ۲ آداپتور باس میزبان تشکیل شده است که به دو کنترلر RAID متصل گردیده‌اند. رفتار داخلی کنترلر RAID ناشناخته می‌باشد و اینگونه تخمین می‌زنیم که چنین مواردی ممکن است به عنوان تنگناهای اساسی این سیستم در نظر گرفته شوند.

سیستم ذخیره انبوه آنالیز تجربی

 

۵- مرحله ۳: یکسری از روالهای اندازه گیری
۱-۵٫ شش پیکر بندی تجربی
در امتداد با روش تشریح شده در بخش های اولیه این مبحث، نسبت به انجام یک سری از آزمایشات، مشتمل بر ۶ مورد، بر روی RAID اقدام نمودیم که از نظر اندازه از دیسک های ۱ الی ۳۶ همانگونه که در شکل ۵ نشان داده شده است متفاوت بوده اند. جهت راحتی کار، از ایده nC:m(r) برای معرفی یک مجموعه مورد نظر با n کنترولر و m  LUN اقدام نمودیم و در این زمینه (r) معرف پیکربندی ۵RAID  در یک lun می‌باشد. به طور مثال، پیکربندی   ۱C:2 × (۸ + ۱)یک روال نصب کنترلر واحد با ۲ (۸+۱) RAID می‌باشد. هدف این سری از آزمایشات نشان دادن این نکته می‌باشد که عملکرد RAID های بزرگتر متوالی به صورت یکنواخت افزایش یافته است و همچنین حداکثر عملکرد ۲C:4 × (۸ + ۱) RAID)) نیز بوسیله RAID های کوچکتر پیش بینی شده است.
۲-۵ تجربه‌های مربوط به خواندن
جهت تست عملکرد خواندن،  ما در ابتدا با این مانع مواجه شدیم که چگونه می‌توانیم انواع مختلف حافظه cache یا حافظه پنهانی را خالی سازیم. برای فایلهای بحد کفایت بزرگ، این مورد در حقیقت یک مشکل حاد بشمار نمی‌آید چرا که در نهایت میزان کفایت حافظه cache وجود خواهد داشت، اما هدف ما حصول اطمینان کافی از عملکرد فایلهای کوچکتر نیز می‌باشد. از آنجا که نمی‌توانیم سیستم را مجدداً بوت نماییم یا آنکه فایل سیستم ها را مجدداً نصب و برپا کنیم، باید  گزینه دیگری را در نظر بگیریم. جهت خالی کردن cache کرنل، در ابتدا اقدام به نوشتن بر روی فایلی نمودیم که دو برابر اندازه رم ماشین بوده است و سپس آن فایل را از طریق دستور «sync»  بر روی دیسک ذخیره و بعدا پاک نمودیم. جهت اطمینان بعدی از آنکه cache کنترلر FAStT600 پاک شده است، از طریق یک فایل مجازی (dummy) ‌اقدام به خواندن نموده که این فایل نیز دو برابر اندازه رم کنترلر بوده است (به میزان یک گیگا بایت). …
۱-۲-۵٫ ۱C:1 × (۱): یک دیسک واحد
یک دیسک واحد متصل شده به یک FAStT600 نمی‌تواند یک سیستم RAID را تشکیل دهد. با این وجود، عملکرد اندازه‌گیری شده (شکل ۶) معرف بینش لازم در خصوص اورهدها در کنترلر FAStT600 می‌باشد. در این حالت، هیچگونه مزیتی در وجود حالت چند زنجیره‌ای، همانند مواردی که از این حالت جهت خواندن از یک دیسک اقدام می‌شود و منجر به بروز رقابت می‌گردد، متصور نخواهد بود. اندازه بافر دارای تأثیر اندکی می‌باشد. نرخ داده مشخص شده به میزان قابل توجهی با توجه به اندازه فایل افزایش خواهد یافت و حداکثر تحصیل شده به میزان ۴۳ MB s1 خواهد بود که بیشتر از نرخ داده خوانده شده مستقیم حداقل ۳۴٫۵ MB s1  (از خواندن تراک داخلی) که در شکل ۳ گزارش شده است، می‌باشد. دلیل این امر نیز بدین علت است که یک دیسک ۶۶ گیگا بایتی در حدود ۲۵% یک دیسک واحد  را تشکیل داده و از اینرو نمی‌تواند محدود به تراک های داخلی (نرخ داده اندک) باشد.
۲-۲-۵٫ ۱C:1 × (۴ + ۱) : دیسک ۵ تایی RAID5
 در این آزمایش (شکل ۷)، یک RAID5 متشکل از ۵ دیسک مشخص شده است (۴ دیسک داده و یک دیسک توازن). در اینجا یک تأثیر مثبت کوچک در زمینه افزایش اندازه بافر وجود دارد و یک مورد کاهش در عملکرد با توجه به افزایش چند زنجیره‌ای بچشم می‌خورد. حالت آخری از احتمال بیشتری برخوردار می‌باشد چرا که چنین سیستمی‌نمی‌تواند از درخواستهای چندگانه پشتیبانی به عمل آورد. میزان نرخ حداکثر خواندن داده ها در حدود ۸۵ MB s1 می‌باشد. این میزان در حقیقت نصف مقدار تئوریکی [(۴ + ۱) × ۳۴.۵] = ۱۷۲.۵ MB s1          (بر مبنای تراک داخلی، نرخ خواندن مستقیم) می‌باشد.
۳-۲-۵٫ نواحی داده و FAStT600
ما بر روی یک RAID  ۴+۱ ما تستی را جهت تعیین این موضوع که آیا زمانهای خواندن برای فایل هایی که قبلاً در یک فایل سیستم خالی در برابر فایل هایی که بعداً ساخته شده اند تفاوت خواهند داشت یا خیر انجام دادیم. بر روی یک دیسک واحد متصل شده به صورت مستقیم به یک  pc  یا کامپیوتر شخصی یک تنوع آشکار همانگونه که در شکل ۳ دیده می‌شود وجود دارد. فایلهای اولیه براساس انتظار در نزدیک ترکهای خارجی وجود آمده اند که خود موجب عمل خواندن سریعتر در مقایسه با فایلهای بعدی که در قسمت حلقه‌های داخلی تولید می‌شوند خواهد شد. ما ۱۶ فایل را بوجود آوردیم که پارتیشن مجازی۴+۱ RAID5 را به میزان ۱ ترابایت تحت پوشش قرار داده‌اند. هر یک از فایل ها با ظرفیت ۵/۵۴ گیگابایت در نظر گرفته شده و ۱۶ فایل به صورت جمعی میزان ۸۸۴ گیگا بایت از ۹۲۸ گیگا بایت کل فضای موجود را اشغال نموده اند (یعنی ۹۵%). با چنین استفاده بالایی، تأثیرات نواحی خوانده شده در صورت وجود کاملاً آشکار خواهند بود. …
۴-۲-۵٫ ۱C:1 × (۸ + ۱) : یک دیسک RAID5 9 تایی
دستگاه RAID5 که در این آزمایش مورد ارزیابی قرار می‌گیرد دارای ۹ دیسک می‌باشد (۸ دیسک داده و ۱ دیسک توازن) و همچنین این موارد به طور دقیق منطبق با یک چهارم از یک مورد چهارتایی کامل LUNها می‌باشند که در مخزن داده های FAStT600  بعنوان OSC مورد استفاده قرار گرفته اند. پیک یا حداکثر نرخ های خواندن حاصل شده به میزان ۸۰ MB s1 برای فایل های ۶۴ گیگا بایتی می‌باشد (شکل ۸) در اینجا تأثیر بسیار اندک اندازه بافر دیده می‌شود و از اینرو تنها اندازه بافر ۴ مگا بایت را نشان داده‌ایم و در طرح های جاری آن را بکار می‌بریم. در اینجا نیز هیچگونه مزیتی در زمینه مقوله چند زنجیره ای دیده نمی‌شود.
 
۵-۲-۵٫ ۱C:2 × (۸ + ۱): یک کنترلر و ۱۸ دیسک
این پیکربندی دارای دو RAID5 (1+8) می‌باشد که به یک کنترلر  متصل شده است (شکل ۸). عملکرد این سیستم به میزان قابل توجهی بهتر از عملکرد یک سیستم واحد (۸+۱) RAID5 می‌باشد. بعلاوه، افزایش اندکی در عملکرد دیده می‌شود که همزمان با افزایش سیستم زنجیره‌ای است که معرف این موضوع است که حالت چند زنجیره ای دارای تأثیر قابل توجهی در مشغول نمودن این دیسک ها دارد. البته یک ناهنجاری در سیستم تایمینگ چنین مقوله‌ای دیده می‌شود: نرخ های داده برای فایل های ۶۴ گیگا بایتی (که در کنار ستاره در شکل ۹ نشان داده شده اند) در حدود نصف موارد فایل های ۳۲ گیگا بایتی می‌باشند.
۶-۲-۵٫ ۲C:2 × (۸ + ۱): ۲ کنترلر و ۱۸ دیسک
این پیکربندی (شکل ۱۰) دارای یک محدوده مشخص از موارد ارتقا یافته است، اما این محدوده، در عین حال، در مقایسه با پیکربندی کنترلر- واحد از ارتقای زیادی برخوردار نمی‌باشد. هیچ گونه حالت بی قاعدگی از نوع بحث شده قبلی در اینجا دیده نمی‌شود، اما نرخهای داده برای اندازه‌های فایل بزرگ (۶۴-۸ گیگا بایت) به صورت کاملاً کلاسترشده‌ای می‌باشند که معرف آن است که چنین سیستمی‌حالت اشباع خود را آغاز نموده است. (در شکل ۱۰، طرح های مرتبط با ۱۶ و ۳۲ گیگا بایتی در بین طرح های ۸ و ۶۴ گیگابایتی قرار می‌گیرند اما به منظور اجتناب از بکار بردن تصاویر بیشتر از آنها اجتناب شده است.) برای  اندازه های فایل بزرگ، زمانی که تعداد زنجیره های از ۲ به ۴ افزایش می‌یابد، می‌توان ارتقای قابل توجهی را در عملکرد مشاهده نمود.
۷-۲-۵٫ ۲C:4 × (۸ + ۱): نوع کامل RAID5  ۳۶ دیسکی
شکل ۱۱ معرف عملکرد خواندن پایدار دستگاه (۱+۸) RAID5 چهار طرفه کامل می‌باشد. این نکته آشکار است که برای هریک از فایل های بزرگ (۶۴-۲ گیگا بایت ) حداکثر نرخ داده حاصل شده در محدوده ۲۵۰–۲۸۰ MB s1 می‌باشد.
۳-۵٫ آنالیز نتایج خواندن
نرخ های پیک خواندن که در بخش های قبلی حاصل شده اند تا اندازه‌ای ناامیدکننده می‌باشند، با این وجود، لازم است تا آزمایشاتی را در زمینه دستگاههای RAID دارای اندازه متفاوت از نقطه نظر پیوند با یکدیگر انجام داد. جهت پاسخ دادن به این سوال ما نرخ های خواندن به دست آمده از فایل های ۶۴ گیگا بایت را با استفاده از ۴ زنجیره و اندازه بافر ۶۴ مگا بایتی برای هریک از این آزمایش به کار گرفتیم. شکل ۱۳ نشان دهنده سطح بدست آمده می‌باشد نقاط این سطح مترادف با نقاطی است که از هر یک از این ۶ آزمایش بدست آمده است (چهار زنجیره، اندازه بافر ۴ گیگا بایت، اندازه فایل ۴ گیگا بایت). سطح شکل ۱۳ نشان دهنده پیشرفت منطقی در سرعت داده ها می‌باشد، آن هم به هنگامی که منابع سیستمی‌افزایش یافته و خود در نتیجه شکل قابل پذیرشی را فراهم آورده و هیچ گونه قطعی ناگهانی را بروز نخواهد داد. ما نقاط متمایز مترادف با پیکربندی های کنترلر تکی یا دوتایی را مشخص نمودیم. حالت انشعاب بوجود آمده در سطح بواسطه چنین تفاوتی می‌باشد.
۴-۵ آزمایشات نوشتاری
جهت تست عملکرد نوشتن، ما یکسری از آزمایشات بزرگ را در محیط ایزوله انجام داده‌ایم، که هریک از آنها داده های مجازی ‌را به یک فایل جدید واحد از یک زنجیره واحد نوشته‌اند و علاوه بر این اندازه فایل و اندازه بافر کاربردی نیز به منظور یافتن پیک عملکرد متفاوت در نظر گرفته شده است. دلایل متعددی باعث این انتخاب شده است تا از یک زنجیره واحد جهت نوشتن در فایل های جدید استفاده شود (بر خلاف استفاده از یک سری از زنجیرهای متغیر جهت بازنویسی بخش هایی از فایل های موجود). برای یک مورد، ما مشخص نمودیم که عملکرد، برای یک حالت نصب چهار سویه ۱+۸، به میزان ناکافی بوده است آن هم به هنگامی ‌که دو یا سه زنجیره، در مقایسه با استفاده از تنها یک زنجیره واحد، جهت بازنویسی بر روی بخش های موجود یک فایل مورد استفاده قرار گرفته اند. در وهله بعدی، به هنگامی‌که توجه خود را بر روی مورد یک زنجیره‌ای متمرکز نمودیم دریافتیم که به هنگامی‌که فایل های جدیدی را می‌سازیم، در برابر بازنویسی فایل های قدیمی، عملکرد بهتر می‌گردد. برای مشاهده بحث های بیشتر در خصوص آن که چرا تنها زنجیره واحد را می‌توان جهت بوجود آوردن فایل های جدید مورد استفاده قرار داد به (۱۲) رجوع شود.
۵-۵٫ تست خواندن موازی به ۱۶ روش
ما این تست را جهت ارزیابی پهنای باند انباشته حاصل شده بوسیله سیستم به هنگامی‌که کلیه ۱۶ پردازنده xio فعال بوده و هر به فایل سیستم خود دسترسی داشتند، انجام دادیم. این امر موکد سوئیچ کانال فیبری تا حداکثر ممکن آن می‌باشد. در این تست از ۴ زنجیره برای هر ماشین استفاده نموده و با استفاده از هم آوایی هر ۱۶ تست خواندن را انجام دادیم. نتایج حاصل شده در شکل ۱۵ نشان داده شدند و معرف این نکته می‌باشند که سرعت داده انباشته به میزان حداکثر ۴۲۶۲ MB s-1 می‌باشد که مترادف با سرعت میانگین هر ماشین ۲۶۶ MB s-1 است، آماری که کاملاً نزدیک به حداکثر میزان اندازه گیری شده بوسیله ما یعنی ۲۸۰ MB s-1 می‌باشد. آمار ۴٫۳ GB s-1 نیز به عنوان معیاری مدنظر می‌باشد تحت عنوان یک نقطه ارجاع برای کلیه کاربردهایی که برای این سیستم توسعه یافته اند محسوب می‌شود.

سیستم ذخیره انبوه آنالیز تجربی

 

۶- نتیجه گیری
در این مبحث یک روش سیستماتیک برای ارزیابی تجربی عملکردهای سیستم ذخیره‌سازی انبوه (MSS) ارائه شده است. این روش به منظور برآورد عملکرد نرخ های داده خواندنی و نوشتاری پایدار برای مخزن ذخیره سازی FAStT600 در OSC مورد استفاده قرار گرفت. ما نشان دادیم که سرعت های خواندن و نوشتن پایدار حداکثر، برای این سیستم بترتیب        ۲۸۰ MB s-1 و ۱۲۰ MB s-1 (برحسب گره ذخیره) می‌باشند. با این وجود، آمارهای نوشتاری کاملاً کمتر از فاکتورهای تئوریکی ۹/۸ برای نرخ خواندن می‌باشند. کنترلر FAStT600 به نظر تنگنا مربوطه در سیستم OSC می‌باشد.
توصیه‌های ما برای توسعه دهندگان برنامه های کاربردی جهت مخزن ذخیره FAStT600 OSC به شرح ذیل اعلام می‌گردد. (با وجود آنکه این رهنمودها برای یک MSS خاص می‌باشند، آنها احتمالاً مترادف با سیستم های دیگر خواهند بود).
  • زنجیره های چندگانه را باید برای خواندن مورد استفاده قرار داد. توسعه دهندگان می‌بایست ۴ الی ۸ زنجیره را تجربه نمایند تا آنکه شماره ای که بهترین نتایج را حاصل می‌سازد را مشخص کنند. از آنجائیکه که xio به صورت موثر یک ماشین ۴ پردازنده‌ای می‌باشد، به طور معمول جهت مشغول نگه داشتن کامل این ماشین به بیش از چهار زنجیره نیاز خواهیم داشت.
  • زنجیره های چندگانه ممکن است به هنگامی ‌که بخش هایی از یک فایل موجود بزرگ را آپدیت می‌کنیم مفید باشند. با این وجود، به هنگامی‌که یک فایل بزرگ را بوجود می‌آوریم، هیچ گونه گزینه ای مدنظر نخواهد بود، به غیر از استفاده از یک زنجیره واحد با یک عملکرد پایین.
  • نتایج خواندن در زمینه خواندن پایدار فایل های بسیار بزرگ (۱۶ الی ۶۴ گیگابایت) کاربرد دارد. برای فایل های کوچکتر، نرخ های پایدار خواندن احتمالاً کمتر خواهند بود. برای فایل های بسیار کوچک، این نرخ ها دوباره افزایش خواهند یافت چرا که تأثیرات کشینگ در بخش های مختلف سیستم وجود دارد.
در تحقیقات آینده ما روشی را بکار خواهیم گرفت که برای معماریهای ذخیره‌سازی دیگر شامل پیکربندی RAID3 کامل با استفاده از کانال فیبری یا دیسکهای SATA و پیکربندی کنترلر کم هزینه ضعیف RAID5 دیسک های SATA در این مبحث تشریح شده‌اند.
تلاش ما بر این اساس استوار بوده است تا ارزش روش خود را در زمینه طبقه بندی محدودیت های عملکرد سیستم های RAID بزرگ نشان دهیم. با ازدیاد بانک های اطلاعاتی بزرگ به سیستمهای ذخیره ساز انبوه بزرگ و بزرگتری نیاز خواهیم داشت تا از طریق طراحی و کاربرد آنها در آینده بتوانیم جوابگوی نیازهای خود باشیم. روش آنالیز تجربی تشریح شده و امتحان شده در این مقاله دارای ارزش قابل توجهی برای سیستم های آینده می‌باشد. سازمانی که طرحی را برای بکارگیری تعداد زیادی از کنترلرهای RAID داشته باشد و سعی در بکارگیری صدها یا هزاران دیسک نماید، می‌تواند دید و بینش با ارزشی را در زمینه عملکرد سیستم پیشنهادی، از طریق انجام سریع یک سری از آزمایشات، حاصل نماید، مقوله‌ای که در پی روش تحقیقاتی ما بر روی یک کنترلر واحد و دیسک های وابسته بدان حاصل آمده است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

Irantarjomeh
لطفا به جای کپی مقالات با خرید آنها به قیمتی بسیار متناسب مشخص شده ما را در ارانه هر چه بیشتر مقالات و مضامین ترجمه شده علمی و بهبود محتویات سایت ایران ترجمه یاری دهید.