4/1
(High Availability) یا HA ، وقتی میگویم یک شبکه، یا یک سرویس دارای افزونگی یا همان HA است، این بدین معنی است که سرویس یا برنامهای ما میتواند بدون وقفه و به شکلی مداوم و مطلوب برای یک دورهی زمانی معین کار کند. زیرساختی که HA دارد به شکلی پیکربندی شده است که عملکردی با کیفیت داشته باشد و بتواند از پس بارها و خرابیهای داخلی مختلف با حداقل میزان از کارافتادگی بر آید.
(High Availability) یا HA ، وقتی میگویم یک شبکه، یا یک سرویس دارای افزونگی یا همان HA است، این بدین معنی است که سرویس یا برنامهای ما میتواند بدون وقفه و به شکلی مداوم و مطلوب برای یک دورهی زمانی معین کار کند. زیرساختی که HA دارد به شکلی پیکربندی شده است که عملکردی با کیفیت داشته باشد و بتواند از پس بارها و خرابیهای داخلی مختلف با حداقل میزان از کارافتادگی بر آید.
کلاستر ها در HA، گروهی از سرورها هستند که به عنوان سیستم متحد و تکی با هم کار میکنند. این کلاسترها با عنوان دستههای غلبه بر خرابی (Failover Clusters) نیز شناخته میشوند و از یک فضای ذخیره استفاده میکنند اما از شبکههای متفاوت بهره میبرند. همچنین آنها هدف مشترکی دارند و آن این است که میتوانند بارهای کاری سیستم اصلی که پشتیبانی میکنند را تحمل کنند.
اگر سروری در یک کلاستر از کار بیافتد، سرور یا گرهی دیگری میتواند فوراً جای آن را بگیرد تا از عملکرد مداوم سرویس یا برنامهای که توسط کلاستر پشتیبانی میشود، مطمئن شد. استفاده از کلاستر ها در HA تضمین میکند که هیچ نقطهی خرابی برای سرویس های حیاتی شبکه وجود ندارد و میزان از کارافتادگی را کاهش میدهد یا حتی به طور کامل از بین میبرد.
کلاستر ها در HA به طور مرتب تست میشوند تا مطمئن شد که گرههای داخل یک کلاستر همیشه آماده هستند. عموما مدیران IT از برنامهای متن-باز (open-source) برای نظارت بر سلامت کلاستر استفاده میکنند. برنامه بستههای داده را به هر ماشین و به صورت دستهای ارسال میکند تا تأیید کند که هر ماشین به شکل مد نظر کار میکند.
برای مثال یکی از سرویس های محبوب سرویس شبکه تلفنی می باشد، این سرویس از طریق سرورهای CUCM و UCCX به کاربران خود سرویس ارائه میدهد، فرض کنیم در یکی از ماشین های CUCM به دلیل خرابی از مدار خارج شود، درصورتیکه ما از یک سرور به صورت منحصر بفرد استفاده کرده باشیم به این ترتیب در زمان خرابی تمام سرویس ما قطع ها شد اما اگر در زمان طراحی و پیاده سازی سرویس رو به صورت یک کلاستر پیاده سازی کرده باشیم، در یک کلاستر ما چندین نود یا گره یکسان داریم که یک سرویس را ارائه میدهند و در این مثال هم در صورت خرابی یکی از نود ها بار ترافیکی این سرور به یکی دیگر از نودهای کلاستر منتقل میشود.
خیلی از سرویس ها محبوب سیسکو امکان پیاده سازی به صورت کلاستر رو دارا می باشند، اگر تمایل داشته باشید میتونید مقاله های “معرفی پلتفرم Cisco Stealthwatch” و “بررسی سیسکو Cisco Identity Service Engine | ISE” رو مطالعه کنید.
از نرمافزارهای HA برای مدیریت کلاستر ها استفاده میشود. در یک شبکه که دارای خصوصیت HA میباشد، لایههای مختلفی وجود دارد (لایهی فیزیکی، دیتا لینک، نتورک، transport، session، presentation، و application) که هر کدام از این لایه ها برای رسیدن به بالاترین سطح افزونیگی نیازهای نرمافزاری خود را دارد.
به عنوان مثال، در لایهی application، نرمافزارهای مدیریت باز load-balancing software، برای پخش و متعادلسازی میزان بار کاری و ترافیک شبکه میان سرورها استفاده میشود، نرمافزارهایی حیاتی برای داشتن برنامهای با HA به شمار میآیند.
برای مثال بهتر میتوانیم به وب فایروال ها اشاره کنیم، در نگاه اول انتظار داریم وب فایروال یک تنها سرویس های امنیتی را پوشش دهد، اما یکی از امکاناتی که یک وب فایروال به مدیر شبکه میدهد، تقسیم بار ترافیک بیرونی برروی چند سرور می باشد، بدین ترتیب وب فایروال ما به عنوان مقصد به کاربران شبکه معرفی شده و درخواست به سمت ان سرازیر میشود، سپس وب فایروال درخواست ها بین نودهای داخلی کلاستر تقسیم میکند.
نرمافزارهای HA معمولاً امکاناتی نظیر متعادلسازی و پخش بار، automatic application failover، real-time file replication، و failback خودکار automatic failback capabilities دارند.
سیستمها و سرویسهای IT با HA به شکلی طراحی شدهاند که بتوانند 99.99 درصد زمان در دسترس باشند، هم در قطعیهای برنامهریزی شده و هم در قطعیهای برنامهریزی نشده. در این موارد که با عنوان (Five Nines Reliability) شناخته شده است، سیستم تقریباً همیشه فعال است.
برای مثال سرویس وب گوگل را در نظربگیریم، در اینجا از لایه ی اپلیکیشن که سرویس را ارائه میدهد می بایست دارای افزونگی باشد، تا اخرین لایه که لایه فیزیکی می باشد، برای مثال حتی برق یک سرور در دیتاسنتر می بایست دارای افزونگی باشد، به ترتیبی که درصورت خرابی یکی از پاورهای سرور، سرور ما دچار قطعی نگردد.
اگر زیرساختی حیاتی که توسط معماری با HA پشتیبانی میشود، از کار بیافتد، سیستم پشتیانی جای آن را میگیرد. که به کاربران و application اجازه میدهد که بدون وقفه کار خود را انجام دهند و به دادههایی که قبل از وقوع خرابی در دسترس بودند، دسترسی داشته باشند.
بازیابی بحران یا Disaster Recovery به سیاستها، ابزار، و فرآیندهایی اشاره میکند که سازمانهای IT باید از آنها برای بازیابی اجزاء و سیستمهای حیاتی IT در زمان وقوع بحران، استفاده کنند. به عنوان مثال، نابودی یک مرکز داده به دلیل حادثهای طبیعی (مانند زلزله) نوعی بحران IT به حساب میآید.
میتوان HA را روشی برای مدیریت حوادث کوچک در اجزای زیرساخت IT به شمار آورد. اما بازیابی بحران یا Disaster recovery فرآیندی برای مقابله با حوادث بزرگی است که میتوانند تمام زیرساخت IT را به طور کامل از کار بیاندازند.
افزونگی یا همان HA و بازیابی بحران یا Disaster recovery هر دو برای حفظ دوام کسب و کار ضروری هستند. تابآوری خطا (Fault Tolerance) یکی دیگر از موارد مهم است که در ادامهی متن به آن پرداخته میشود. برنامهریزی برای داشتن HA شامل شناسایی سیستمها و سرویسهای IT که برای تضمین دوام کسب و کار نیاز هستند، میشود.
یک زیرساخت HA از افزونگی سختافزاری، نرمافزاری، و دادهای پشتیبانی میکند. افزونگی یعنی اجزای IT که در دستههای دسترسی بالا هستند (مانند سرورها و دیتاسنترها) میتوانند وظایف یکسانی را انجام دهند.
افزوندگی برای تابآوری خطا الزامی است. تابآوری خطا مکمل HA و بازیابی بحران IT است و در ادامه به آن پرداخته میشود.
تکثیر داده برای رسیدن به HA الزامی است. داده باید تکثیر شود و با نود های داخل یک کلاستر به اشتراک گذاشته شود. گرهها باید با یکدیگر ارتباط برقرار کنند و اطلاعات یکسانی را به اشتراک بگذارند تا هر وقت سرور یا دستگاه شبکه از کار افتاد، هر کدام از آنها بتوانند جای آن را بگیرد و به شکلی بهینه به ارائه سرویس ادامه دهد.
همچنین تکثیر داده میتواند تضمین کند که در صورت از کار افتادگی یک مرکز داده، کسب و کار دوام و HA خود را حفظ میکند.
مقابله با خرابی زمانی رخ میدهد که فرآیندی که باید توسط جزء از کار افتاده انجام میشد توسط جزئی در دستهی HA پشتیبان انجام میشود. یکی از بهترین راهکار در HA و بازیابی بحران این است که سیستم مقابله با خرابی را در جایی خارج از مکان فعلی نگه داشت.
در صورتی که به سیستمهای اصلی بیش از حد فشار بیاید یا از کار بیافتند، مدیران IT که بر سلامت سیستمهای اصلی و حیاتی نظارت میکنند میتوانند به سرعت ترافیک را به سیستم مقابله با خرابی انتقال دهند.
همانطور که قبلاً به آن اشاره شد، HA و بازیابی بحران هر دو برای دوام کسب و کار مهم هستند. آنها با یکدیگر به سازمانها کمک میکنند که سطح بالایی از تابآوری خطا داشته باشد. تابآوری خطا یعنی توانایی یک سیستم برای ادامه به کار خود زمانی که چندین جزء سختافزاری یا نرمافزاری از کار میافتد.
هدف از تابآوری خطا نداشتن از کار افتادگی است در حالی که هدف از HA داشتن حداقل از کار افتادگی است. سیستم HA که برای عملکرد 99.999درصد (یا پنج نهتایی) طراحی شده است در سال حدود 5.26 دقیقه از کار افتادگی خواهد داشت.
بر خلاف HA در تابآوری خطا، داشتن عملکردی با کیفیت در اولویت نیست. هدف از تابآوری خطا در زیرساخت IT جلوگیری از از کار افتادگی برنامههای حیاتی است.
تابآوری خطا رویکر پرهزینهتری نسبت به HAاست چرا که در آن از تمام سیستمهای سختافزاری و نرمافزاری و منابع تغذیه پشتیبانگیری میشود. سیستمهای HA نیازی به تکثیر اجزا فیزیکی ندارند.
HA و تابآوری خطا مکمل یکدیگر هستند و به سیستمهای IT در بازیابی بحران کمک میکنند. بیشتر استراتژیهای حفظ دوام در کسب و کار شامل هر سه مورد HA، تابآوری خطا، و بازیابی بحران میشوند. این استراتژیها به سازمانها کمک میکنند که عملیات حیاتی خود را هنگام خرابیهای کوچک و بزرگ IT حفظ کنند و به پشتیبانی از کاربران خود ادامه دهند.
نظرات کاربران: