آنالیز تجربی سیستم ذخیره انبوه
آنالیز تجربی سیستم ذخیره انبوه – ایران ترجمه – Irantarjomeh
مقالات ترجمه شده آماده گروه کامپیوتر
مقالات ترجمه شده آماده کل گروه های دانشگاهی
مقالات رایگان
قیمت
قیمت این مقاله: 20000 تومان (ایران ترجمه - irantarjomeh)
توضیح
بخش زیادی از این مقاله بصورت رایگان ذیلا قابل مطالعه می باشد.
شماره |
60 |
کد مقاله |
COM60 |
مترجم |
گروه مترجمین ایران ترجمه – irantarjomeh |
نام فارسی |
آنالیز تجربی سیستم ذخیره انبوه |
نام انگلیسی |
Experimental analysis of a mass storage system |
تعداد صفحه به فارسی |
43 |
تعداد صفحه به انگلیسی |
22 |
کلمات کلیدی به فارسی |
کنترلر RAID ، دیسک،IBM DS4300، IBM FAStT600، سیستم های ذخیره اطلاعات انبوه، محاسبه موازی، ارزیابی عملکرد، RAID |
کلمات کلیدی به انگلیسی |
RAID controller, disk, IBMDS4300, IBMFAStT600, mass storage systems, parallel computing, performance evaluation, RAID |
مرجع به فارسی |
دپارتمان مهندسیبرق، دانشگاه مهندسیو تكنولوژی، لاهور، پاكستاندپارتمان انفورماتیك بیوپزشكی، دانشگاه اوهایو، آمریكامركز سوپركامپیوتر اوهایو |
مرجع به انگلیسی |
Department of Electrical Engineering, Biomedical Informatics, Ohio Supercomputer Center |
سال |
2006 |
کشور |
ایالات متحده |
آنالیز تجربی سیستم ذخیره انبوه
دپارتمان مهندسی برق، دانشگاه مهندسی و تكنولوژی، لاهور، پاكستان
دپارتمان انفورماتیك بیوپزشكی، دانشگاه اوهایو، آمریكا
مركز سوپركامپیوتر اوهایو
2006
چکیده
سیستم های ذخیره انبوه (MSSs) نقش مهمیرا در محاسبات موازی دادههای فشرده بازی میکنند. اخیرترین کاربرد سیستمهای ذخیره انبوه در آرایههای افزونگی دیسکهای مستقل/ ارزان (RAID) به کار گرفته شد که در آن دیسک های وابسته در کنار یکدیگر همراه با سخت افزار کنترلر خاص قرار داده شدهاند. پیش بینی عملکرد چنین سیستمهایی مشکل میباشد، چرا که غالب جزئیات داخلی رفتار کنترلر هنوز به صورت اطلاعات عمومیعرضه نشدهاند. در این مقاله جهت ارزیابی تجربی عملکرد سیستمهای ذخیره انبوه از یک روش سیستماتیک بهره گرفته شده است که از طریق آن برآوردها و سنجش هایی بر روی یک سری از پیکربندیهای RAID با اندازه افزایشی و پیچیدگی فزاینده حاصل شده است. ما از این روش جهت بررسی سیستم ذخیره انبوه مرکز سوپر کامپیوتر اوهایو بهره گرفتیم. در این مرکز 16 پردازنده ورودی و خروجی قرار داشته که هر کدام از آنها به چهار سیستم 8+1 RAID5 متصل بوده و بر این اساس قابلیت فراهم آوردن 128 ترابایت (TeraByte) از فضای ذخیره سازی مهیا شده است (این مقدار فضا پس از فرمت 116.8 TB را در اختیار قرار خواهد داد). روش بکار گرفته شده در این مبحث به طراحان سیستم ذخیره سازی اطلاعات اجازه میدهد تا با اطمینان قابل توجهی از نقطه نظر تجربی به ارزیابی عملکرد سیستم های خود بپردازند. با وجود آنکه آزمایشات خود را بر اساس محتویات یک سیستم خاص انجام دادهایم، روش بکار گرفته شده برای کلیه سیستم های ذخیره اطلاعات بزرگ قابلیت کاربرد را دارا خواهد بود. روالهای سنجش و اندازه گیری حاصل شده از طریق این روش به برنامه نویسهای کاربردی اجازه میدهد تا از محدودیت های عملکرد کدهای برنامه های خود آگاه شوند.
کلمات کلیدی: کنترلر RAID ، دیسک،IBM DS4300، IBM FAStT600، سیستم های ذخیره اطلاعات انبوه، محاسبه موازی، ارزیابی عملکرد، RAID
1- مقدمه
کاربردهای سطح بالای محاسبات کنونی و مقولههای ارائه شده در رشتههای فیزیک، نجوم و بیوانفورماتیک كه بصورت فزآینده و گستردهای مطرح شدهاند، دسترسی پایدار به مجموعههای اطلاعاتی در محدوده پتابایت (petabyte) را طلب مینمایند. در مبحث ذخیره سازی انبوه چنین نیازهایی را تنها با بهره گیری از مجموعهای از دیسک های بزرگ میتوان پاسخگو بود که تحت عنوان آرایههای افزونگی دیسکهای مستقل/ ارزان (RAID) خوانده میشوند. اغلب دیسک های RAID با عملکرد و ظرفیت بالا از کنترلرهای قدرتمندی استفاده میکنند، با این حال پیشبینی میزان عملکرد آنها مشکل میباشد، چرا که اطلاعات اندکی در خصوص جزئیات داخلی چنین کنترلرهایی، بوسیله سازندگان آن، در اختیار عموم قرار گرفته است. کاربران این سیستمها نمیتوانند اطمینان داشته باشند که آیا عملکرد حاصل شده از طریق چنین سیستمهایی را میتوان براستی به عنوان حداکثر توانایی مطلوبی بشمار آورد که سخت افزارهای آنها میتوانند انجام دهند یا خیر. علاوه بر این، در صورتی که سخت افزارهای حاضر قابلیت بکارگیری چنین سیستمهایی را نداشته باشند سوال پیش روی اینگونه مطرح خواهد شد كه تنگنا و مشكل مربوطه در چه قسمتی بوجود میآید؟
این مقوله روشی را عرضه میدارد تا بر اساس آن بتوان نسبت به ارزیابی تجربی سیستمهای ذخیره سازی انبوه (MSSs) اقدام نمود. انگیزه تحقیقات ما نیز بر پایه نیاز جهت درک عملکرد سیستم ذخیره انبوه، در مرکز سوپر کامپیوتر اوهایو (OSC)، استوار بوده است. این سیستم بر مبنای یک مخزن کنترلرهای ذخیره سازی IBM FAStT600/DS4300 همراه با 16 پردازشگر اختصاصی (ورودی / خروجی (xio)) اینتل پنتیوم 4 و 576 دیسک مکستور (Maxtor) با فضای 116.8 TB بنیان شده است. با این وجود روشی که تشریح میکنیم برای کلیه آرایههای RAID قابل استفاده میباشند.
روش بکار گرفته شده در این مبحث شناسایی تنگناهای بالقوه در این سیستم و سپس انجام یک سری از برآوردها بر روی محدودهای از سیستم های RAID میباشد که از یک دیسک واحد آغاز میگردد و به سمت بزرگترین آرایههای ذخیره ساز که میتوان آن را بر روی یک سخت افزار موجود نصب نمود تداوم مییابد. عملکرد خواندن / نوشتن سیستم میبایست به صورت یکنواخت و آهسته و به هنگامی که اندازه سیستم افزایش مییابد مورد استنتاج و بررسی قرار گیرد. در عین حال، هر یک از موارد قطعی و آشكار در عملکرد سیستم بروز تغییرات در منابع میباشد. اشباع عملکرد نیز میبایست وابسته به یکی از تنگناهای بالقوه در این سیستم در نظر گرفته شود.
بطور مثال، در OSC MSS روال اندازه گیری خود را بر روی 6 پیکر بندی RAID انجام دادیم، که در محدودهای از یک دیسک، سیستم کنترلر – واحد بسمت 36 دیسک، سیستم کنترلر دوبل تداوم داشته است (مورد آخری مترادف آن دسته از پیکربندی میباشد که به صورت حقیقی در مرکز سوپر کامپیوتر اوهایو مورد استفاده قرار گرفته است). عملکرد اندازه گیری قابلیت پیش بینی با توجه به اندازه سیستم و منابع آن را امکان پذیر ساخته است و بنابراین اطمینان خاصی را برای ما در زمینه داده های تحصیل شده جهت کلیه پیکربندی های کامل به ارمغان آورده است.
روشی که در اینجا توسعه یافته است اطلاعات باارزشی را در اختیار طراحان MSSs، اشخاصی که همانند ما از دسترسی اندکی به جزئیات داخلی خصیصههای معماری کنترلر دیسک برخوردار میباشند، قرار خواهد داد و بنابر این جهت اطمینان از این موضوع که سیستمهای تحت بررسی در یک سطح مطلوب یا نزدیک بدان عمل مینماید، لازم است تا به سنجشها و برآوردهای تجربی رجوع شود. مشاهدات تجربی بدست آمده از طریق روش جاری برای برنامه نویسان کاربردی نیز کارگشا خواهد بود تا از این طریق بتواند نسبت به توسعه برنامههای کاربردی با قابلیت محاسباتی و عملکرد بالا با توجه به ضروریات ذخیره سازی خارج- از- هسته انبوه اقدام نمایند.
این مقاله به شکل ذیل طبقه بندی شده است. بخش 2 مشکلات مربوط به پیش بینی عملکرد RAID را مورد بررسی قرار داده و بر این اساس یك اسلوب سه مرحلهای پیشنهادی را عرضه میدارد. بخشهای3،4و5 چگونگی کاربرد روش سه مرحلهای ما برای مخزن OSC FAStT600 را تشریح میکند و در نهایت بخش 6 نتیجه گیری موارد فوق الذکر را ارائه میدارد.
2- روش شناسی
1-2 عملکرد آرایه های RAID
تکنولوژی RAID بسرعت در اوایل دهه 1990 توسعه یافت، از این تکنولوژی برای ساخت حافظه ثانویه دارای سرعت و حجم بالا و مطمئن در دیسکهای سخت ارزان قیمت استفاده شده است. این مبحث موارد ذیل را در بر میگیرند. بحث مدلسازی عملکرد درایو دیسک، بررسی موارد و ارتقای حاصل شده اخیر، نرخهای کارای خواندن و نوشتن دستگاههای RAID با انواع مختلف اندازه های متفاوت.
اخیراً آرایه های دارای عملکرد بالا و ظرفیت بالای RAID در زمینه های سخت افزار کنترلر به کار گرفته شده اند. قابلیتهای چنین کنترلرهایی غالباً به عنوان عامل قابل توجه جهت تشخیص عملکرد کلی یک سیستم مدنظر میباشد. متأسفانه، جزئیات داخلی چنین کنترلرهایی به ندرت به صورت آشکار برملا گردیده است و مستندات قابل توجهی درباره آنها وجود ندارد. در نتیجه، مدیران سیستمی و کاربران آرایه های RAID بزرگ غالباً از این موضوع اطمینان ندارند که آیا قادر به تحصیل حداکثر عملکرد ممکن با منابعی که در اختیار آنها میباشد خواهند بود یا خیر.
2-2 روش پیشنهادی
ما یک فرآیند سه مرحلهای را برای ارزیابی تجربی یک سیستم ذخیره انبوه پیشنهاد میکنیم.
-
بررسی معماری سیستم جهت مشخص نمودن اجزایی که عملکرد آنها را میتوان به صورت مجزا تحت مطالعه قرار داد.
-
مشخص نمودن تنگناهای بالقوه در سیستم. در صورت امکان، بررسیهای ساده و کسب تجربه در زمینه اجزای واحد جهت مشخص نمودن تنگناهای وابسته بدان. بطور مثال، نرخ I/O ناخالص یک دیسک واحد را میتوان به آسانی اندازه گیری نمود و از این طریق نسبت به مشخص نمودن موانع تئوریکی قابل توجه در زمینه عملکرد آن اقدام کرد. در این بررسی میتوان یک یا دو جزء که به احتمال قوی به عنوان تنگناهای اساسی مدنظر میباشند را مورد بررسی قرار داد.
-
انجام یک سری از برآوردها بر روی آرایه های RAID دارای اندازه های مختلف، که در حول و حوش سخت افزار استفاده شده در سیستم مقصد، پیکر بندی گردیدهاند.
3- مرحله 1: مطالعه معماری
نگرش یک برنامه نویس کاربردی در زمینه OSC كلاستر اینتل پنتیوم 4 زئون (XEON) در شکل 1 مشخص شده است. چنین مقوله ای متشکل از 256 گره کامپیوتری میباشد که به 16 گره های xio متصل گردیده و 112 نمونه از چنین پردازشگرهایی به 16 گره xio از طریق یک شبکه Infiniband سوئیچ شده با نرخ داده s-1 Gbit8 متصل گردیدهاند. کلیه 256 گره کامپیوتری نیز به 16 گره xio، از طریق یک سوئیچ اترنت گیگا بایت، متصل شده اند. هر گره xio میتواند یک دستگاه دیسک RAID چهار سویه را کنترل نماید. در حقیقت، هریک از این دیسکها در این 0RAID به یک دستگاه 5RAID 8+1 مپ شدهاند که موارد مرتبط ذیلاً مورد بحث قرار میگیرند.
سیستم های 5RAID دارای پارامترهای تعیین و تصحیح خطا میباشند. نرخ خواندن و نوشتن در 5RAID، در عمل، در حدود 8 یا 9 برابر سرعت هر یک از دیسکها به صورت منفرد میباشد. در حقیقت، اورهدهای سخت افزار کنترلر600FAStT نرخهای تجمعی، بسیار متمایز از موارد ارائه شده در مضامین تئوریکی، را ارائه میدهند.
1-3 اجزای سیستم
1-1-3 600FAStT
سرور ذخیره اطلاعات 600FAStT IBM(توربو) از جمله عنصر کلیدی مخزن اطلاعات OSC میباشد. این سرور قابلیت پشتیبانی از 112 درایو سخت با مجموع ظرفیت 4/16 ترابایت را دارا میباشد. هریک از این سیستم های 600FAStT دارای کنترلر دوبل بوده و آنها را میتوان به گونهای پیکربندی نمود تا پیکربندیهای RAID مختلفی را به جهان بیرون عرضه دارند. به طور مثال، شکل 5 نشان دهنده یک 600FAStT میباشد که آن را به شش روش مختلف برای اهداف تجربی خود پیکربندی نموده ایم (که بعداً در این مقاله تشریح خواهند شد). بكارگیری این پیکربندی، در یک کاربری معمولی در OSC، در انتهای این تصویر نشان داده شده است. در این مورد 36 دیسک تحت 4 دستگاه 5RAID که هرکدام متشکل از 9 دیسک میباشند در نظر گرفته شده و هریک از کنترلر ها به 2 LUN تخصیص داده شدهاند. علاوه بر این میتوان از موارد نصب متفاوتی بهره گرفت، به طور مثال، دو سیستم 5RAID 14 دیسکی را میتوان در نظر داشت. معماری و عملکرد کنترلر600FAStT بعداً مورد بحث قرار خواهد گرفت.
2-1-3 دیرکتور سیسکو 9509 (Cisco Director)
دور سوئیچ کانال فیبری دیركتور سیسکوی 9509 در سیستم OSC بكار گرفته شدهاند تا آنکه بتوان واحدهای 600FAStT را به پردازنده های xio مدنظر متصل نمود. چنین اتصالاتی به صورت ایستا بوده و تحت کنترل مدیران سیستم میباشند.
3-1-3 دیسکهای مکستور
دیسکهای استفاده شده در مخزن ذخیره 600FAStT در حقیقت مکستور 7Y250M0 SATA میباشند (SATA مخفف «الحاق تکنولوژی پیشرفته سریال» است)، این دیسکها از ظرفیت 250 گیگا بایتی برخوردار میباشند. جدول 1 نشان دهنده پارامترهای اصلی این دیسك میباشد كه مرتبط با مبحث جاری هستند. علاوه بر این این نکته قابل توجه میباشد که تکنولوژی «ثبت ناحیهای» (Zone recording) در این دیسک بکار گرفته شده است. این امر بدان معناست که تعداد سکتورها در هر ترک با توجه به قطر آن متفاوت میباشد. این موضوع خود بعنوان یک جبران برای افزایش محیط ترک ها با افزایش قطر آنها مطرح خواهد بود. بر این اساس 16 ناحیه بر روی هر سطح دیسک وجود دارد و تعداد 512-Bسکتور نیز دیده میشود كه از 610 در ناحیه داخلی الی 1102 تا ناحیه بیرونی متفاوت میباشد (جدول 2).
2-3 گرههای xio
16 پردازنده xio در مخزن ذخیره FAStT600 وجود دارند که هرکدام از آنها به آرایه 5RAID 8+1 چهار سویه متصل میباشند. این پردازندهها در حقیقت پردازنده دوتایی اینتل پنتیوم 4 زئون (Xeons) با سرعت ساعت 4/2 گیگا هرتز و رم 4 گیگابایت میباشند که تحت سیستم عامل لینوکس 2.6.6 (زنجیرههای هایپر) اجرا میشوند، بگونهای که پردازنده های دوبل به نظر چهار پردازنده مجزا جلوه مینمایند. این امر یکی از نقاط قابل توجه برای برنامه نویسان میباشد چرا که چنین پدیده ای به معنای آن خواهد بود که کدینگ نوشته شده به وسیله 4 الی 8 زنجیره به خوبی بر روی این ماشین ها اجرا خواهد شد.
4- مرحله 2: شناسایی تنگناهای بالقوه
تعداد زیادی از تنگناهای بالقوه بین پردازنده xio و رسانه مغناطیسی در دیسکها وجود دارند. این موارد در شکل 4 نشان داده شده اند. بخش های ذیل مباحثی را در زمینه اهمیت هریک از تنگناهای بالقوه مطرح میسازند. انگیزه این مبحث رویارویی با این حقیقت میباشد که با وجود آنکه 36 دیسک (که هریک از آنها با حداقل نرخ خواندن داده پایدار برآورد شده 34.5 MBs-1 میباشند) متصل به هر یک از پردازندههای xio وجود دارند، نرخ خواندن دادهها به صورت پایدار در این پردازنده xio بیش از مقدار حدوداً 300 MBs-1 نمیباشد، که بسیار کمتر از محدوده سقف تئوریکی (36 × 34.5 =) 1.242 GB s-1 خواهد بود. برخی از عناصر این زنجیره بین رسانه مغناطیسی و پردازنده xio عملکردی مشابه با یک تنگنا را خواهند داشت. حال اجازه دهید تا هر یک از این احتمالات را مورد بحث قرار دهیم.
1-4. فایل سیستم
فایل سیستم ext3 بر روی گرههای xio بدون شک بر عملکرد کلی سیستم تأثیرگذار میباشد. با این وجود، آزمایشی که در شکل 3 تشریح شده است معرف این نکته است که چنین فایل سیستمی قابلیت پشتیبانی از نرخ انتقال نزدیک به نرخ های انتقال داده خام این دیسک به هنگامیکه سیستم FAStT600 بایپاس میشود را خواهد داشت. از اینرو فایل سیستم ext3 را نمیتوان به عنوان عامل اصلی تأثیرگذار بر روی عملکرد سیستم بشمار آورد.
2-4. پهنای باند باس
باسهای داخلی پردازندههای xio بگونهای طراحی شدهاند که میتوانند از پردازنده های 4/2 گیگاهرتز پنتوم 4 پشتیبانی نموده و دارای پهنای باند مرتبه GB s–1 میباشند. چنین موردی تا زمانی که I/O مد نظر میباشد را نمیتوان عامل بوجود آورن تنگنا برای سیستم بشمار آورد.
3-4. لینک های کانال فیبری
دو لینک کانال فیبری بین کنترلرهای FAStT600 و هر یک از پردازندههای xio وجود دارند. هریک از این لینک ها دارای یک پهنای 212.5 MB s-1 میباشند که به صورت ترکیبی پهنای باند 425 MB s-1 برای پردازنده xio را بوجود میآورند. این امر به میزان قابل توجهی بیشتر از حداکثر نرخ های دادهای میباشد که ما نسبت به سنجش آنها از/ به دیسکها در طی بایپس نمودن FAStT600 اقدام نموده ایم.
4-4. سوئیچ Cisco
این سوئیچ در حقیقت یک سوئیچ غیر انسدادی میباشد که کاملاً قابلیت پشتیبانی ترافیک 2 GB s–1در هر پورت را دارا میباشد. علاوه بر این، این سوئیچ به صورت آماری جهت اتصال FAStT600 به پردازندههای xio مورد استفاده قرار میگیرد، بنابراین هیچگونه رخدادهای وابسته به روال های تأخیری سوئیچینگ را شاهد نخواهیم بود. بر این اساس چنین سوئیچی قابلیت پشتیبانی ترافیک 425 MB s–1، که به وسیله لینک های کانال فیبری عرضه میشود، را خواهد داشت.
5-4 دیسک: لینک SATA ، مکانیکی و کنترلر
پیک نرخ داده SATAبه میزان 150MB s-1 میباشد (جدول 1). نرخ ثابت داده احتمالاً بسیار کمتر خواهد بود. مشخصههای دیسک مکستور 7Y250M0 در جدول 2 نشان داده شده است که معرف نرخ های انتقال ثابت یا پایدار 37–67 MB s–1 میباشد. آزمایشاتی که بر روی دیسکهایی که به صورت مستقیم متصل شده اند (شکل 3) و موارد دیگر موکد نرخ های انتقال پایدار 34.5–60.5 MB s–1 بوده اند. از آنجائیکه حداقل 36 دیسک به هریک از کنترلرها متصل شده بود، ما به صورت جمعی نرخ حداقل (34.5 × 36 =) 1.242 GB s–1 به کنترلر FAStT600 را فراهم ساختیم. از اینرو، یک دستگاه دیسک (متشکل از لینک SATA، کنترلر دیسک و رسانه مغناطیسی) را نمیتوان به عنوان تنگنا در نظر گرفت.
6-4. کنترلر FAStT600
این دستگاه که دارای برچسب کنترلر FAStT600 میباشد در حقیقت از 2 آداپتور باس میزبان تشکیل شده است که به دو کنترلر RAID متصل گردیدهاند. رفتار داخلی کنترلر RAID ناشناخته میباشد و اینگونه تخمین میزنیم که چنین مواردی ممکن است به عنوان تنگناهای اساسی این سیستم در نظر گرفته شوند.
5- مرحله 3: یکسری از روالهای اندازه گیری
1-5. شش پیکر بندی تجربی
در امتداد با روش تشریح شده در بخش های اولیه این مبحث، نسبت به انجام یک سری از آزمایشات، مشتمل بر 6 مورد، بر روی RAID اقدام نمودیم که از نظر اندازه از دیسک های 1 الی 36 همانگونه که در شکل 5 نشان داده شده است متفاوت بوده اند. جهت راحتی کار، از ایده nC:m(r) برای معرفی یک مجموعه مورد نظر با n کنترولر و m LUN اقدام نمودیم و در این زمینه (r) معرف پیکربندی 5RAID در یک lun میباشد. به طور مثال، پیکربندی 1C:2 × (8 + 1)یک روال نصب کنترلر واحد با 2 (8+1) RAID میباشد. هدف این سری از آزمایشات نشان دادن این نکته میباشد که عملکرد RAID های بزرگتر متوالی به صورت یکنواخت افزایش یافته است و همچنین حداکثر عملکرد 2C:4 × (8 + 1) RAID)) نیز بوسیله RAID های کوچکتر پیش بینی شده است.
2-5 تجربههای مربوط به خواندن
جهت تست عملکرد خواندن، ما در ابتدا با این مانع مواجه شدیم که چگونه میتوانیم انواع مختلف حافظه cache یا حافظه پنهانی را خالی سازیم. برای فایلهای بحد کفایت بزرگ، این مورد در حقیقت یک مشکل حاد بشمار نمیآید چرا که در نهایت میزان کفایت حافظه cache وجود خواهد داشت، اما هدف ما حصول اطمینان كافی از عملکرد فایلهای کوچکتر نیز میباشد. از آنجا که نمیتوانیم سیستم را مجدداً بوت نماییم یا آنکه فایل سیستم ها را مجدداً نصب و برپا كنیم، باید گزینه دیگری را در نظر بگیریم. جهت خالی کردن cache کرنل، در ابتدا اقدام به نوشتن بر روی فایلی نمودیم كه دو برابر اندازه رم ماشین بوده است و سپس آن فایل را از طریق دستور «sync» بر روی دیسک ذخیره و بعدا پاک نمودیم. جهت اطمینان بعدی از آنکه cache کنترلر FAStT600 پاک شده است، از طریق یك فایل مجازی (dummy) اقدام به خواندن نموده که این فایل نیز دو برابر اندازه رم کنترلر بوده است (به میزان یک گیگا بایت). پس از انجام کلیه این مراحل قبل از اعمال آزمایشات، هیچ گونه تأثیرات مبتنی بر رویههای حافظه cache که باعث ایجاد اعوجاج یا تحریف در نتایج شوند را مشاهده نکردیم . جهت انجام عملیات خواندن، یکسری از زنجیره ها را بین یک و تعداد دلخواهی از آنها ایجاد نموده و بر این مبنا سعی شد تا داده ها در حد امکان به صورت یکنواخت در بین زنجیره ها قابل دسترس باشند. هریک از این زنجیره ها قابلیت دسترسی به ناحیه مشخص شده خود در داخل فایل را داشته و پس از انجام عملیات میتوانند از آن خارج شوند. هر بایت فایل هدف تنها برای یک بار مورد دسترسی قرار میگیرد. جزئیات مرتبط با چگونگی تقسیم دادههای فایل بین زنجیرهها در (12) مشخص شده است. ما اندازه فایل را به صورت متغییر تخصیص داده و همچنین اندازه بافر کاربردی در بین تعداد زنجیره ها را جهت یافتن پیک عملکرد مشخص نمودیم.
1-2-5. 1C:1 × (1): یک دیسک واحد
یک دیسک واحد متصل شده به یک FAStT600 نمیتواند یک سیستم RAID را تشكیل دهد. با این وجود، عملکرد اندازهگیری شده (شکل 6) معرف بینش لازم در خصوص اورهدها در کنترلر FAStT600 میباشد. در این حالت، هیچگونه مزیتی در وجود حالت چند زنجیرهای، همانند مواردی که از این حالت جهت خواندن از یک دیسک اقدام میشود و منجر به بروز رقابت میگردد، متصور نخواهد بود. اندازه بافر دارای تأثیر اندکی میباشد. نرخ داده مشخص شده به میزان قابل توجهی با توجه به اندازه فایل افزایش خواهد یافت و حداکثر تحصیل شده به میزان 43 MB s–1 خواهد بود که بیشتر از نرخ داده خوانده شده مستقیم حداقل 34.5 MB s–1 (از خواندن تراک داخلی) که در شکل 3 گزارش شده است، میباشد. دلیل این امر نیز بدین علت است که یک دیسک 66 گیگا بایتی در حدود 25% یک دیسک واحد را تشکیل داده و از اینرو نمیتواند محدود به تراک های داخلی (نرخ داده اندک) باشد.
2-2-5. 1C:1 × (4 + 1) : دیسک 5 تایی RAID5
در این آزمایش (شکل 7)، یک RAID5 متشکل از 5 دیسک مشخص شده است (4 دیسک داده و یک دیسک توازن). در اینجا یک تأثیر مثبت کوچک در زمینه افزایش اندازه بافر وجود دارد و یک مورد کاهش در عملکرد با توجه به افزایش چند زنجیرهای بچشم میخورد. حالت آخری از احتمال بیشتری برخوردار میباشد چرا که چنین سیستمینمیتواند از درخواستهای چندگانه پشتیبانی به عمل آورد. میزان نرخ حداکثر خواندن داده ها در حدود 85 MB s–1 میباشد. این میزان در حقیقت نصف مقدار تئوریکی [(4 + 1) × 34.5] = 172.5 MB s–1 (بر مبنای تراک داخلی، نرخ خواندن مستقیم) میباشد.
3-2-5. نواحی داده و FAStT600
ما بر روی یک RAID 4+1 ما تستی را جهت تعیین این موضوع که آیا زمانهای خواندن برای فایل هایی که قبلاً در یک فایل سیستم خالی در برابر فایل هایی که بعداً ساخته شده اند تفاوت خواهند داشت یا خیر انجام دادیم. بر روی یک دیسک واحد متصل شده به صورت مستقیم به یک pc یا کامپیوتر شخصی یک تنوع آشکار همانگونه که در شکل 3 دیده میشود وجود دارد. فایلهای اولیه براساس انتظار در نزدیک ترکهای خارجی وجود آمده اند که خود موجب عمل خواندن سریعتر در مقایسه با فایلهای بعدی که در قسمت حلقههای داخلی تولید میشوند خواهد شد. ما 16 فایل را بوجود آوردیم که پارتیشن مجازی4+1 RAID5 را به میزان 1 ترابایت تحت پوشش قرار دادهاند. هر یک از فایل ها با ظرفیت 5/54 گیگابایت در نظر گرفته شده و 16 فایل به صورت جمعی میزان 884 گیگا بایت از 928 گیگا بایت کل فضای موجود را اشغال نموده اند (یعنی 95%). با چنین استفاده بالایی، تأثیرات نواحی خوانده شده در صورت وجود کاملاً آشکار خواهند بود. با این وجود، زمانهای دسترسی خواندن برای کلیه 16 فایل به صورت ثابتی، در جدول 3، ذکر گردیدهاند. تصور میشود که سختافزار کنترلر RAID FAStT600 هیچگونه فرضیهای، در خصوص ناحیهای که بر روی آن بلوک خاصی قرار میگیرد، را در نظر ندارد. از اینرو، حداکثر نرخ خواندن FAStT600 نباید بیش از نرخ حداقلی باشد که در خصوص بلوک ها بر روی ترک های داخلی دیسک ها بکار گرفته شده اند، البته با مضربی از تعداد دیسک های مدنظر. در حقیقت، این نرخ برای یک RAID5 4+1 در حدود (86/5 =) 17.2 MB s–1 خواهد بود، که تقریباً نصف نرخ “خام” تراک داخلی از شکل 3 میباشد. سیاست هایی که جهت تخصیص بلوک ها در سیستمهای RAID مشخص میگردند بر روی سرعت داده ها به صورت موثر تأثیر گذار خواهند بود.
4-2-5. 1C:1 × (8 + 1) : یک دیسک RAID5 9 تایی
دستگاه RAID5 که در این آزمایش مورد ارزیابی قرار میگیرد دارای 9 دیسک میباشد (8 دیسک داده و 1 دیسک توازن) و همچنین این موارد به طور دقیق منطبق با یک چهارم از یک مورد چهارتایی کامل LUNها میباشند که در مخزن داده های FAStT600 بعنوان OSC مورد استفاده قرار گرفته اند. پیك یا حداكثر نرخ های خواندن حاصل شده به میزان 80 MB s–1 برای فایل های 64 گیگا بایتی میباشد (شکل 8) در اینجا تأثیر بسیار اندک اندازه بافر دیده میشود و از اینرو تنها اندازه بافر 4 مگا بایت را نشان دادهایم و در طرح های جاری آن را بکار میبریم. در اینجا نیز هیچگونه مزیتی در زمینه مقوله چند زنجیره ای دیده نمیشود.
5-2-5. 1C:2 × (8 + 1): یک کنترلر و 18 دیسک
این پیکربندی دارای دو RAID5 (1+8) میباشد که به یک کنترلر متصل شده است (شکل 8). عملکرد این سیستم به میزان قابل توجهی بهتر از عملکرد یک سیستم واحد (8+1) RAID5 میباشد. بعلاوه، افزایش اندکی در عملکرد دیده میشود که همزمان با افزایش سیستم زنجیرهای است که معرف این موضوع است که حالت چند زنجیره ای دارای تأثیر قابل توجهی در مشغول نمودن این دیسک ها دارد. البته یک ناهنجاری در سیستم تایمینگ چنین مقولهای دیده میشود: نرخ های داده برای فایل های 64 گیگا بایتی (که در کنار ستاره در شکل 9 نشان داده شده اند) در حدود نصف موارد فایل های 32 گیگا بایتی میباشند.
6-2-5. 2C:2 × (8 + 1): 2 کنترلر و 18 دیسک
این پیکربندی (شکل 10) دارای یک محدوده مشخص از موارد ارتقا یافته است، اما این محدوده، در عین حال، در مقایسه با پیکربندی کنترلر- واحد از ارتقای زیادی برخوردار نمیباشد. هیچ گونه حالت بی قاعدگی از نوع بحث شده قبلی در اینجا دیده نمیشود، اما نرخهای داده برای اندازههای فایل بزرگ (64-8 گیگا بایت) به صورت کاملاً کلاسترشدهای میباشند که معرف آن است که چنین سیستمیحالت اشباع خود را آغاز نموده است. (در شکل 10، طرح های مرتبط با 16 و 32 گیگا بایتی در بین طرح های 8 و 64 گیگابایتی قرار میگیرند اما به منظور اجتناب از بکار بردن تصاویر بیشتر از آنها اجتناب شده است.) برای اندازه های فایل بزرگ، زمانی که تعداد زنجیره های از 2 به 4 افزایش مییابد، میتوان ارتقای قابل توجهی را در عملکرد مشاهده نمود.
7-2-5. 2C:4 × (8 + 1): نوع كامل RAID5 36 دیسکی
شکل 11 معرف عملکرد خواندن پایدار دستگاه (1+8) RAID5 چهار طرفه کامل میباشد. این نکته آشکار است که برای هریک از فایل های بزرگ (64-2 گیگا بایت ) حداکثر نرخ داده حاصل شده در محدوده 250–280 MB s–1 میباشد.
3-5. آنالیز نتایج خواندن
نرخ های پیک خواندن که در بخش های قبلی حاصل شده اند تا اندازهای ناامیدکننده میباشند، با این وجود، لازم است تا آزمایشاتی را در زمینه دستگاههای RAID دارای اندازه متفاوت از نقطه نظر پیوند با یکدیگر انجام داد. جهت پاسخ دادن به این سوال ما نرخ های خواندن به دست آمده از فایل های 64 گیگا بایت را با استفاده از 4 زنجیره و اندازه بافر 64 مگا بایتی برای هریک از این آزمایش به کار گرفتیم. شکل 13 نشان دهنده سطح بدست آمده میباشد نقاط این سطح مترادف با نقاطی است که از هر یک از این 6 آزمایش بدست آمده است (چهار زنجیره، اندازه بافر 4 گیگا بایت، اندازه فایل 4 گیگا بایت). سطح شکل 13 نشان دهنده پیشرفت منطقی در سرعت داده ها میباشد، آن هم به هنگامی که منابع سیستمیافزایش یافته و خود در نتیجه شکل قابل پذیرشی را فراهم آورده و هیچ گونه قطعی ناگهانی را بروز نخواهد داد. ما نقاط متمایز مترادف با پیکربندی های کنترلر تکی یا دوتایی را مشخص نمودیم. حالت انشعاب بوجود آمده در سطح بواسطه چنین تفاوتی میباشد.
4-5 آزمایشات نوشتاری
جهت تست عملکرد نوشتن، ما یکسری از آزمایشات بزرگ را در محیط ایزوله انجام دادهایم، که هریک از آنها داده های مجازی را به یک فایل جدید واحد از یک زنجیره واحد نوشتهاند و علاوه بر این اندازه فایل و اندازه بافر کاربردی نیز به منظور یافتن پیک عملکرد متفاوت در نظر گرفته شده است. دلایل متعددی باعث این انتخاب شده است تا از یک زنجیره واحد جهت نوشتن در فایل های جدید استفاده شود (بر خلاف استفاده از یک سری از زنجیرهای متغیر جهت بازنویسی بخش هایی از فایل های موجود). برای یک مورد، ما مشخص نمودیم که عملکرد، برای یک حالت نصب چهار سویه 1+8، به میزان ناکافی بوده است آن هم به هنگامی که دو یا سه زنجیره، در مقایسه با استفاده از تنها یک زنجیره واحد، جهت بازنویسی بر روی بخش های موجود یک فایل مورد استفاده قرار گرفته اند. در وهله بعدی، به هنگامیکه توجه خود را بر روی مورد یک زنجیرهای متمرکز نمودیم دریافتیم که به هنگامیکه فایل های جدیدی را میسازیم، در برابر بازنویسی فایل های قدیمی، عملکرد بهتر میگردد. برای مشاهده بحث های بیشتر در خصوص آن که چرا تنها زنجیره واحد را میتوان جهت بوجود آوردن فایل های جدید مورد استفاده قرار داد به (12) رجوع شود.
5-5. تست خواندن موازی به 16 روش
ما این تست را جهت ارزیابی پهنای باند انباشته حاصل شده بوسیله سیستم به هنگامیکه کلیه 16 پردازنده xio فعال بوده و هر به فایل سیستم خود دسترسی داشتند، انجام دادیم. این امر موکد سوئیچ کانال فیبری تا حداكثر ممکن آن میباشد. در این تست از 4 زنجیره برای هر ماشین استفاده نموده و با استفاده از هم آوایی هر 16 تست خواندن را انجام دادیم. نتایج حاصل شده در شکل 15 نشان داده شدند و معرف این نکته میباشند که سرعت داده انباشته به میزان حداکثر 4262 MB s-1 میباشد که مترادف با سرعت میانگین هر ماشین 266 MB s-1 است، آماری که کاملاً نزدیک به حداکثر میزان اندازه گیری شده بوسیله ما یعنی 280 MB s-1 میباشد. آمار 4.3 GB s-1 نیز به عنوان معیاری مدنظر میباشد تحت عنوان یک نقطه ارجاع برای کلیه کاربردهایی که برای این سیستم توسعه یافته اند محسوب میشود.
6- نتیجه گیری
در این مبحث یک روش سیستماتیک برای ارزیابی تجربی عملکردهای سیستم ذخیرهسازی انبوه (MSS) ارائه شده است. این روش به منظور برآورد عملکرد نرخ های داده خواندنی و نوشتاری پایدار برای مخزن ذخیره سازی FAStT600 در OSC مورد استفاده قرار گرفت. ما نشان دادیم که سرعت های خواندن و نوشتن پایدار حداکثر، برای این سیستم بترتیب 280 MB s-1 و 120 MB s-1 (برحسب گره ذخیره) میباشند. با این وجود، آمارهای نوشتاری کاملاً کمتر از فاکتورهای تئوریکی 9/8 برای نرخ خواندن میباشند. کنترلر FAStT600 به نظر تنگنا مربوطه در سیستم OSC میباشد.
توصیههای ما برای توسعه دهندگان برنامه های کاربردی جهت مخزن ذخیره FAStT600 OSC به شرح ذیل اعلام میگردد. (با وجود آنکه این رهنمودها برای یك MSS خاص میباشند، آنها احتمالاً مترادف با سیستم های دیگر خواهند بود).
-
زنجیره های چندگانه را باید برای خواندن مورد استفاده قرار داد. توسعه دهندگان میبایست 4 الی 8 زنجیره را تجربه نمایند تا آنکه شماره ای که بهترین نتایج را حاصل میسازد را مشخص کنند. از آنجائیکه که xio به صورت موثر یک ماشین 4 پردازندهای میباشد، به طور معمول جهت مشغول نگه داشتن کامل این ماشین به بیش از چهار زنجیره نیاز خواهیم داشت.
-
زنجیره های چندگانه ممکن است به هنگامی که بخش هایی از یک فایل موجود بزرگ را آپدیت میکنیم مفید باشند. با این وجود، به هنگامیکه یک فایل بزرگ را بوجود میآوریم، هیچ گونه گزینه ای مدنظر نخواهد بود، به غیر از استفاده از یک زنجیره واحد با یک عملکرد پایین.
-
نتایج خواندن در زمینه خواندن پایدار فایل های بسیار بزرگ (16 الی 64 گیگابایت) كاربرد دارد. برای فایل های کوچکتر، نرخ های پایدار خواندن احتمالاً کمتر خواهند بود. برای فایل های بسیار کوچک، این نرخ ها دوباره افزایش خواهند یافت چرا که تأثیرات کشینگ در بخش های مختلف سیستم وجود دارد.