آپتایم سرور چیست. طبق گزارش اخیر ITIC، هزینه یک دقیقه خاموشی هر سرور از ۱۶۷۰ دلار برای هر سرور میباشد. این گزارش تاکید میکند که حتی یک کسبوکار کوچک که هزینه خرابی را حدود ۱۰۰۰۰ دلار در ساعت تخمین میزند، برای یک سرور هزینه قطعی ۱۶۷ دلار در دقیقه را دریافت میکند.امروزه، بیش از هر زمان دیگری، آپتایم سرور برای هر کسب و کاری برای عملکرد روان بسیار مهم است. بیایید نگاهی بیندازیم به اینکه آپتایم سرور چیست و چرا برای سازمان های دیجیتال بسیار مهم است و در ادامه با با ۹ راه حل برای بررسی آن آشنا خواهیم شد.
Uptime چیست؟
Uptime به زمانی اشاره دارد که یک سیستم بدون خاموش شدن یا راه اندازی مجدد اجرا میشود. در صورت داشتن یا خرید سرور زمان کار سرور کل مدت زمانی است که یک سرور به طور کامل کار میکند و در حال اجرا است. آپتایم معیاری است که برای نشان دادن عملکرد یک سرور مجازی یا اختصاصی استفاده میشود. پس از سرور مجازی، خرید هاست، زمان کار سرور توسط ابزارهای نظارت سرور مانیتور و اندازه گیری میشود.
نظارت بر آپتایم سرور با eG Enterprise
عوامل eG Enterprise در سرورها زمان کارکرد سرور را ردیابی میکنند. در فواصل منظم از پیش تعیین شده، زمان کار سرور اختصاصی یا مجازی در فاصله اندازه گیری ثبت میشود. برای مثال، شکل سمت راست بالا نشان میدهد که eG Enterprise چه نتیجه ای را گزارش میکند. هر 5 دقیقه چک میکند. اگر سرور در ۵ دقیقه راهاندازی مجدد شده باشد، گزارش eG Enterprise این را نشان میدهد و اگر این کار را انجام داده باشد، زمان اتمام آن از ۵ دقیقه را نیز گزارش میکند. زمان کلی سرور نیز گزارش شده است. جهت اطلاع از این که سرور چیست اینجا کلیک نمایید.
چرا Uptime فقط برای سرورها اعمال نمیشود؟
Uptime همچنین برای ردیابی دستگاه های شبکه مهم است. زمان کارکرد هر دستگاه را فراهم میکند. eG Enterprise همانند سرورها، نیز برای هر دستگاه شبکه ای که نظارت میکند، زمان آپدیت را گزارش میدهد.
Uptime نیز برای برنامهها قابل استفاده است. به عنوان مثال، ممکن است یک سرور بالا باشد اما یک برنامه جاوا که روی آن اجرا میشود ممکن است خراب باشد. در جایی که برنامهها از سایتها و خدمات تجارت الکترونیک پشتیبانی میکنند، این زمان بهروزرسانی برنامه و سرویس است که در دسترس بودن کسبوکار کلیدی را نشان میدهد نه زمان بهروزرسانی زیرساخت اصلی. همچنین eG Enterprise زمان اجرای برنامهها را ردیابی میکند.
به روز بودن پلتفرم های مجازی، مانند سرورهای VMware ESXi یا Citrix Hypervisor یک معیار حیاتی برای ردیابی است. اگر سرور VMware ESX به طور ناخواسته راهاندازی مجدد شود، تمام ماشینهای مجازی در حال اجرا بر روی آن به همراه کاربران و برنامههایی که آن ماشینهای مجازی پشتیبانی میکنند تحت تاثیر قرار خواهند گرفت.
چرا مانیتورینگ Uptime مهم است؟
Uptime مهم است زیرا به این معنی است که هاست اعم از هاست جوملا ، هاست اختصاصی، هاست cpanel یا هاست اشتراکی، هاست ویندوز یا هاست دایرکت ادمین (جهت اطلاع از این که کنترل پنل دایرکت ادمین چیست این جا کلیک نمایید.)، هاست پلسک و یا هاست وردپرس در دسترس است. جهت اطلاع از این که cpanel چیست اینجا کلیک نمایید.
اگر سایت شما در دسترس نیست، بدیهی است که این امر بر تجارت شما تأثیر منفی میگذارد. چرا که مشتریان شما نمیتوانند وب سایت شما را ببینند، بنابراین ممکن است کسب و کار خود را از دست بدهید. شما نمیتوانید ایمیل ارسال یا دریافت کنید. همچنین ممکن است گوگل نیز این قطعی را ببیند تشخیص دهد وب سایت شما غیرقابل اعتماد است و این بر رتبه سئو شما ونیز خدمات سئو سایت تأثیر منفی میگذارد. جهت اطلاع از این که هاست چیست اینجا کلیک نمایید.
تفاوت بین آپتایم سرور و Availability چیست؟
Uptime و در دسترس بودن اغلب به جای یکدیگر مورد استفاده قرار میگیرند، اما آنها یکسان نیستند. Uptime مقدار زمانی است که یک سرور به درستی کار میکند و بر حسب سال، ماه، روز، ساعت، دقیقه و ثانیه بیان میشود. با این حال، در دسترس بودن درصد زمانی است، در یک بازه زمانی خاص، که در طی آن میتوان از یک سرور برای هدف مورد نظر خود استفاده کرد.
از نظر ریاضی، Availability% = Uptime/Total time (Total time = Uptime + Downtime).
درصد Availability بودن سرور خوب چیست؟
هنگامیکه بخش فناوری اطلاعات یک شرکت یا ارائهدهنده خدمات مدیریت شده (MSP) خدمات فناوری اطلاعات را برای کسبوکار یا مشتریان خود ارائه میکند، اغلب متعهد میشود آنچه را که به عنوان توافقنامه سطح خدمات (SLA) شناخته میشود، رعایت کند. SLA آنچه را که کاربران نهایی باید از نظر چیزهایی مانند در دسترس بودن سیستم و سایر جزئیات ارائه خدمات انتظار داشته باشند، تعریف میکند. یک SLA برای یک ارائه دهنده خدمات مهم است که فرآیندهای داخلی خود را با تنظیم استانداردهای عملکردی واضح و قابل اندازه گیری هدایت کند.
یک SLA در دسترس بودن سرور، حداکثر زمان خاموشی را که یک سرور میتواند طی یک دوره زمانی معین، مثلاً یک سال، متحمل شود، مشخص میکند. در حالی که دستیابی به 100٪ در دسترس بودن ممکن نیست، هدف چهار یا پنج نه ( یعنی 99.99٪ یا 99.999٪) در دسترس بودن سرور میتواند یک هدف معقول باشد.
سرور با قابلیت دسترسی بالا چیست؟
هنگامیکه یک سرور قادر است برای درصد بسیار بالایی در دسترس و کارا باقی بماند، به آن سرور با قابلیت دسترسی بالا میگویند. این نوع سرور معمولاً برای برنامه های کاربردی حیاتی در یک سازمان استفاده میشود.
سروری با 99.999 درصد در دسترس بودن، که به معنای تقریباً 5 دقیقه از کار افتادن در سال است، به عنوان یک سرور با در دسترس بودن بالا در نظر گرفته میشود. گزارش ITIC 2020 که قبلاً ذکر شد، میگوید: «… 87 درصد از پاسخدهندگان، 99.99 درصد – که برابر با 52.56 دقیقه برنامهریزینشده برای هر سرور/در سال از کار افتادن است – حداقل سطح قابل قبول در دسترس بودن برای سرورها و برنامههای کاربردی حیاتی است.»
تعمیر و نگهداری سرور چیست؟
تعمیر و نگهداری سرور فرآیند به روز نگه داشتن سرور و در حال اجرا در اوج عملکرد است. سرورها ستون فقرات زیرساخت فناوری اطلاعات در هر شرکتی هستند که فرآیندهای حیاتی به آن بستگی دارد. نگهداری سرور تضمین میکند که همه سرورها در سطح بهینه خود کار میکنند و خطرات امنیتی ندارند. چند کار معمول تعمیر و نگهداری سرور باید به صورت دوره ای انجام شود:
- سیستم عامل (OS) را به روز نگه دارید
- استفاده از دیسک را بررسی کنید و زیر 90 درصد ظرفیت دیسک بمانید
- بررسی استفاده از سرور (به عنوان مثال، CPU، RAM و استفاده از شبکه)
- گزارشها را برای خطاهای سخت افزاری بررسی کنید
- بررسی کنید که نسخه های پشتیبان به درستی کار میکنند
- بررسی تنظیمات ssl در صورت خرید ssl
نظارت بر آپتایم سرور
همانطور که گفته شد Uptime به زمانی اطلاق میشود که سیستم شما برای استفاده طبق برنامه در دسترس است و زمان از کار افتادن زمانی است که سیستم شما متوقف شده، خاموش میشود، یا در غیر این صورت طبق برنامه کار نمیکند. آپ تایم سرور درصد زمانی در دسترس بودن سرور را اندازه گیری میکند. Uptime سطوح بالای عملکرد سرور را تضمین نمیکند، اما گزارش قطع سرور میتواند به مدیران کمک کند تا متوجه شوند مشکل وجود دارد و نیاز به توجه دارد.
از آنجایی که سرورها زیرساخت IT حیاتی هستند، منطقی است که تا حد امکان نزدیک به 100٪ آپتایم ایجاد کنیم. آپتایم 99.999% استاندارد دسترسی بالا در بسیاری از صنایع است. نظارت بر زمان کار سرور فرآیند اندازهگیری عملکرد و در دسترس بودن سرورهای شما است تا نشان دهد آیا زمان کار با استاندارد توافقنامه سطح سرویس (SLA) شما برای دسترسی بالا مطابقت دارد، خواه 99.999٪ باشد یا کمتر. در برخی موارد، گزارشهای آپتایم سرور برای یک کسبوکار برای اثبات انطباق با SLAهای تعیینشدهاش حیاتی هستند.
با چه ابزارهایی آپتایم سرور را بررسی کنیم؟
ویندوز
۱.Task Manager
با استفاده از Task Manager میتوان زمان کارکرد دستگاه ویندوز را بررسی کرد:
روی نوار وظیفه ویندوز کلیک راست کرده و Task Manager را انتخاب کنید
پس از باز شدن Task Manager، روی تب Performance کلیک کنید. در برگه Performance، برچسب Uptime را خواهید یافت.
۲.Systeminfo Command
شما میتوانید آخرین زمان راهاندازی دستگاههای ویندوز را از خط فرمان با تایپ کردن زیر مشاهده کنید:
> systeminfo
۳.Net Stats Command
از طریق خط فرمان خود، همچنین میتوانید آمار اولیه سیستم را با دستور Net Stats مشاهده کنید. Net Stats لیستی از آمار عملیات سرور را از زمان شروع آخرین راهاندازی شما نمایش میدهد.
۴.Windows Management Instrumentation (WMI)
WMI بر روی تمام سیستم عامل های مدرن مایکروسافت (ویندوز 2000، ویندوز XP، ویندوز 2003، ویندوز ویستا و ویندوز 20081) نصب شده است و نحوه فعال کردن WMI تنها یک یا دو دقیقه از وقت شما را میگیرد.
۵. Uptime.exe
جهت این کار پس از دانلود ابزار، uptime.exe را در %WinDir%\System32 از حالت فشرده خارج کنید. سپس یک خط فرمان باز کنید و به سادگی uptime را تایپ کنید.
۶. FreeDOS
اگر FreeDOS را امتحان کرده باشید، ممکن است متوجه تفاوت آن با خط فرمان شده باشید. دستورات DOS با نحوه استفاده شما از خط فرمان لینوکس کمی متفاوت است، بنابراین حرکت در خط فرمان مستلزم یادگیری چند دستور جدید است.
Linux
۷. uptime
برای سرورهای لینوکس، با باز کردن پنجره ترمینال و سپس تایپ کردن دستور uptime میتوان زمان کار را از راه دور بررسی کرد. جهت اطلاع از این که لینوکس چیست اینجا کلیک نمایید.
۸. proc/uptime
دستور زیر نشان میدهد که سیستم از آخرین راه اندازی مجدد چه مدت روشن بوده است:
$ cat /proc/uptime
350735.47 234388.90
عدد اول تعداد کل ثانیه هایی است که سیستم بالا رفته است. عدد دوم این است که چقدر از آن زمان را که دستگاه در حالت بیکار سپری کرده است، بر حسب ثانیه است. در سیستم های چند هسته ای (و برخی از نسخه های لینوکس) عدد دوم مجموع زمان بیکاری انباشته شده توسط هر CPU است.
BSD
۹. uptime
سیستم عامل های مبتنی بر BSD مانند FreeBSD، Mac OS X و SySVr4 دارای فرمان uptime هستند
$ uptime
3:01AM up 69 days, 7:53, 0 users, load averages: 0.08, 0.07, 0.05
۱۰. Using sysctl
همچنین روشی برای استفاده از sysctl برای فراخوانی آخرین زمان بوت شدن سیستم وجود دارد:
$ sysctl kern.boottime
kern.boottime: { sec = 1271934886, usec = 667779 } Thu Apr 22 12:14:46 2010
۱۱. OpenVMS
در سیستمهای OpenVMS، دستور show system را میتوان در خط فرمان DCL برای به دست آوردن زمان کارکرد سیستم استفاده کرد. خط اول صفحه نمایش به دست آمده شامل زمان کارکرد سیستم است که به صورت روز و به دنبال آن ساعت: دقیقه: ثانیه نمایش داده میشود. در مثال زیر، دستور واجد شرایط /noprocess نمایش خطوط جزئیات اطلاعات هر فرآیند را متوقف میکند.
$ show system/noprocess
OpenVMS V7.3-2 on node JACK 29-JAN-2008 16:32:04.67 Uptime 894 22:28:52
ابزارهای مانیتورینگ سرور
ابزارهای مانیتورینگ سرور با ردیابی میزان مصرف CPU، مصرف حافظه، استفاده از دیسک و موارد دیگر، عملکرد سیستم را کنترل میکنند. این ابزارها تیمهای فناوری اطلاعات را قادر میسازند تا مسائل مربوط به عملکرد را نظارت و شناسایی کنند و تعمیر و نگهداری معمولی را برای بهینهسازی زمان کارکرد سرور انجام دهند.
Kaseya VSA، یک راه حل مانیتورینگ و مدیریت سرور و نقطه پایانی، تمام جنبه های دستگاه های متصل به شبکه از جمله سرورها، رایانه های رومیزی، لپ تاپ ها، هایپروایزرها، روترها، سوئیچ ها، فایروالها و موارد دیگر را نظارت میکند.
قابلیتهای مدیریت سرور Kaseya VSA به متخصصان فناوری اطلاعات این امکان را میدهد تا به طور فعال تمام سرورها – از جمله سرورهای فیزیکی و مجازی – را برای مشاهده اطلاعات بلادرنگ به منظور حفظ در دسترس بودن سرور و حفظ عملکرد روان، نظارت کنند.
ویژگیهای OpManager: یک ابزار یکپارچه نظارت بر آپتایم سرور
ابزار نظارت بر آپتایم سرور در OpManager میتواند به شما کمک کند تا سلامت تمام سرورهای شبکه خود را به طور فعال نظارت کنید. OpManager که یک مانیتور آپتایم سرور لینوکس و ویندوز است، دائماً با سرورها با استفاده از پروتکل های مختلف مانند WMI و SNMP ارتباط برقرار میکند تا به طور فعال اطلاعاتی در مورد سلامت و در دسترس بودن سرور به دست آورد. همچنین دارای یک مکانیسم واکنشی برای رفع خطاهای سرور در صورت وقوع و زمانی است که رخ میدهند. ویژگی گزارش به شما کمک میکند تا نحوه عملکرد سرورهای خود و ماهیت خطاها را درک کنید.
زمان آپتایم چگونه محاسبه میشود؟
Uptime بر اساس تعداد ساعاتی که سیستم (سرور) در یک بازه زمانی مشخص در دسترس است محاسبه میشود و به صورت درصد بیان میشود.
بیایید به یک مثال نگاه کنیم. ما میدانیم که 365 روز در سال وجود دارد، بنابراین از نظر ساعت در مجموع 365 x 24 = 8760 ساعت وجود دارد.
بنابراین اگر در سال 4 ساعت از کار افتادگی وجود داشته باشد، به این معنی است که 8756 ساعت کار (یعنی 8760 ساعت منهای 4 ساعت توقف) وجود دارد. بنابراین محاسبه به این صورت خواهد بود:
(8756 / 8760) *100 = 99.95٪
بنابراین در این مورد زمان آپ تایم 99.95٪ است
مرکز داده آپتایم
مرکز داده یا دیتاسنتر یک سرمایه گذاری چند میلیون پوندی با هدف اطمینان از زمان بالا و در دسترس بودن دادهها است. این امر با استفاده از سیستمهای متعدد به دست میآید تا اطمینان حاصل شود که یک شکست منجر به خرابی نمیشود زیرا سیستمهای پشتیبان در محل وجود دارند.
مرکز داده پشتیبان های الکتریکی را از طریق سیستم های خراب و ژنراتورهای آماده به کار با قراردادهایی برای سوخت اضافی در صورت بروز هر گونه مشکل عمده پوشش میدهند. همچنین مرکز داده دارای نقاط ورودی جداگانه برای منابع اصلی برق است تا در صورت قطع برق در یک منبع، سرویس آنها قطع نشود.
همچنین Uptime به سطوح بالایی از اتصال داده نیاز دارد. چندین تامین کننده داده وجود دارد که در نقاط فیزیکی جداگانه به مرکز داده دسترسی دارند تا احتمال خرابی ناشی از مشکلات اتصال داده را از بین ببرند.
کلام آخر
مثال واقعی توصیف شده در این وبلاگ سناریویی را برجسته میکند که در آن نظارت بر زمان به شناسایی و رفع راه اندازی مجدد غیرعمدی سیستمها کمک میکند. تیمهای فناوری اطلاعات باید پیش از تماس و شکایت کاربران، مسائل مربوط به عملکرد را به طور فعال شناسایی کنند، مهم است که آنها زمان آپدیت را برای هر سرور، برنامه یا دستگاهی که مسئولیت آن را بر عهده دارند نظارت کنند. با ردیابی زمان، تیمهای فناوری اطلاعات میتوانند متوجه شوند که سیستمها به طور ناخواسته از کار میافتند، یا حتی اگر برخی از سیستمها آنطور که باید به عنوان بخشی از راهاندازی مجدد تعمیر و نگهداری برنامهریزیشده دورهای از کار نمیافتند.
در صورت نیاز به هرگونه مشاوره و راهنمایی در این زمینه میتوانی با کارشناسان محرب وب رمز تماس حاص نمایید.
[faq]
سوالات متداول
منبع : eginnovations.com kaseya.com quora.com dnsstuff.com en.wikipedia.org manageengine.com pickaweb.co.uk