بالا رفتن مصرف CPU سرور؛ دلایل واقعی + روش‌های کاهش مصرف

8 آذر 1404

فهرست محتوا

1 مقدمه:
2 نشانه‌هایی که نشان می‌دهد CPU سرور در حال رسیدن به 100% است
3
4 چرا CPU سرور به 100% می‌رسد؟
5 از کجا بفهمیم مشکل دقیقاً چیست؟
6 ابزارهای سریع برای مانیتورینگ
7 لاگ‌ها از چه چیزهایی پرده برمی‌دارند؟
8 روش‌های عملی برای کاهش مصرف CPU
9 جمع‌بندی

مقدمه:

بالا رفتن مصرف CPU سرور یکی از رایج‌ترین مشکلات در سرورهای VPS و VDS است؛ مشکلی که اگر به‌موقع شناسایی نشود، می‌تواند کل سیستم را تحت فشار بگذارد. وقتی CPU به سقف مصرف نزدیک می‌شود، اولین نشانه‌ها مانند کند شدن سایت یا اپلیکیشن، ارورهای 500 و 503، تأخیر در پاسخ‌گویی سرور و حتی قطع شدن سرویس، ظاهر می‌شوند.این وضعیت فقط یک «کندی ساده» نیست؛ می‌تواند ناشی از افزایش ناگهانی ترافیک، خطای نرم‌افزاری، تنظیمات اشتباه، یا حتی فعالیت‌های مخرب باشد. در نتیجه، بی‌توجهی به آن می‌تواند هم عملکرد سرویس را مختل کند و هم ریسک‌های امنیتی جدی ایجاد کند.

در این مقاله دقیقاً بررسی می‌کنیم که چرا CPU سرور ناگهان بالا می‌رود و چطور می‌توان این مشکل را به‌صورت اصولی و عملی برطرف کرد.

نشانه‌هایی که نشان می‌دهد CPU سرور در حال رسیدن به 100% است

وقتی بالا رفتن مصرف CPU سرور شروع می‌شود، معمولاً قبل از این‌که سرور کامل از کار بیفتد، چند علامت واضح به‌چشم می‌آید. شناخت این نشانه‌ها کمک می‌کند مشکل را قبل از ایجاد اختلال جدی پیدا کنید.

۱) کند شدن سایت یا اپلیکیشن

اولین نشانه، افت سرعت است. صفحات دیر لود می‌شوند، عملیات ساده مثل ورود کاربران یا ارسال فرم با تأخیر انجام می‌شود و پاسخ‌دهی کلی سیستم افت می‌کند. این معمولاً زمانی رخ می‌دهد که پردازنده زیر بار سنگین درخواست‌ها قرار گرفته باشد.

۲) دیر پاسخ دادن SSH

اگر هنگام اتصال SSH، ورود شما چند ثانیه طول می‌کشد یا حتی با timeout مواجه می‌شوید، احتمالاً پردازنده درگیر پردازش‌های سنگین است. SSH یکی از سبک‌ترین سرویس‌هاست و وقتی حتی آن کند می‌شود یعنی مصرف CPU سرور به مرز خطر نزدیک شده.

۳) بالا رفتن Load Average

Load average مثل «نوبت صف پردازش» است. اگر عدد آن از مجموع vCPUهای سرور بیشتر شود، یعنی درخواست‌ها در صف مانده‌اند و CPU دیگر توان پردازش سریع ندارد. این یکی از مهم‌ترین نشانه‌هاست که معمولاً قبل از 100% شدن کامل CPU دیده می‌شود.

۴) کند شدن دیتابیس

اگر Queryهای ساده دیر اجرا می‌شوند یا اتصال به MySQL/PostgreSQL با تأخیر همراه است، معناش معمولاً این است که دیتابیس منتظر پردازنده است. زمان‌هایی که بالا رفتن مصرف CPU سرور اتفاق می‌افتد، دیتابیس سریع‌ترین بخشی است که تحت تأثیر قرار می‌گیرد.

۵) Timeout در Nginx یا Apache

وقتی CPU زیر فشار است، وب‌سرور نمی‌تواند درخواست‌ها را به‌موقع پردازش کند. نتیجه معمولاً Timeout یا Errorهای مربوط به کندی Backend است. این یکی از شایع‌ترین نشانه‌ها در سایت‌های پربازدید است.

۶) خطاهای 503 و 504

این ارورها معمولاً زمانی ظاهر می‌شوند که سرور به‌قدری تحت فشار است که دیگر امکان پاسخ‌دهی ندارد.
503 = سرور موقتاً ظرفیت ندارد
504 = Backend پاسخ نداده (معمولاً به‌دلیل CPU full)

چرا CPU سرور به 100% می‌رسد؟

بالا رفتن مصرف CPU سرور همیشه اتفاقی نیست؛ پشت آن تقریباً همیشه یک عامل مشخص وجود دارد. در این بخش مهم‌ترین دلایل را به‌صورت ساده و کاربردی توضیح می‌دهیم.

۱) درخواست‌های زیاد (Traffic Spike یا حملات رباتی)

گاهی اوقات تعداد درخواست‌هایی که به سرور می‌رسد ناگهان چند برابر می‌شود. این افزایش می‌تواند ناشی از رشد طبیعی بازدید یا فعالیت ربات‌ها و حملات لایه 7 باشد.وقتی تعداد زیادی درخواست هم‌زمان پردازش می‌شوند، CPU درگیر مدیریت همین صف درخواست‌ها می‌شود و نتیجه‌اش بالا رفتن مصرف CPU سرور تا 100% است. در این حالت حتی سایت‌هایی با منابع خوب هم ممکن است قفل کنند.

۲) تنظیمات اشتباه وب‌سرور (Nginx یا Apache)

حتی اگر ترافیک عادی باشد، تنظیمات اشتباه وب‌سرور می‌تواند CPU را زیر فشار بگذارد. مثلاً:

تعداد workerهای زیاد
مقدار نادرست MaxRequest
زمان‌های Keep-Alive اشتباه

این تنظیمات باعث می‌شوند درخواست‌ها بیش از حد زمان CPU را درگیر کنند. یعنی بدون نیاز واقعی، پردازنده با کارهای تکراری مصرف می‌شود و مصرف CPU سرور بالا می‌رود.

۳) پردازش‌های سنگین در PHP یا NodeJS

یکی از دلایل رایج بالا رفتن مصرف CPU، پردازش‌های سنگین یا غیربهینه در کد اپلیکیشن است. این موارد معمولاً CPU را سریع پر می‌کنند:

حلقه‌های بی‌پایان (infinite loop)
کدهای کند و سنگین
اسکریپت‌های زمان‌بر
افزونه‌های بد در وردپرس یا Node Packageهای ناکارآمد

وقتی یک پردازش اشتباه نوشته شده باشد، حتی در سرور قدرتمند هم CPU به‌سرعت به سقف نزدیک می‌شود.

۴) دیتابیس کند (MySQL/PostgreSQL)

اگر دیتابیس به‌درستی بهینه نشده باشد، Queryهای زیادی در صف می‌مانند و هرکدام زمان CPU مصرف می‌کنند. دلایل رایج:

کوئری‌های بدون Index
تعداد زیاد Connection
کم بودن Buffer pool
Full Table Scan در دیتابیس‌های بزرگ

این وضعیت باعث می‌شود هر درخواست ساده به دیتابیس، زمان زیادی از CPU بگیرد و مصرف CPU سرور به‌صورت ناگهانی بالا برود.

۵) Background Processهای کنترل‌نشده

گاهی دلیل اصلی بالا رفتن مصرف CPU سرور از جایی می‌آید که کمتر به آن فکر می‌کنیم: پردازش‌های پس‌زمینه. کارهایی مثل Cronjobها، Queue Workerها، اسکریپت‌های Backup یا هر اسکریپت خودکاری که در زمان‌های مشخص اجرا می‌شود.اگر این پردازش‌ها درست زمان‌بندی نشده باشند یا بدون محدودیت منابع اجرا شوند، می‌توانند برای چند دقیقه کاملاً CPU را درگیر کنند. نتیجه این وضعیت معمولاً افزایش‌های ناگهانی و موجی در مصرف CPU است که عملکرد سرور را به‌شدت کند می‌کند.

۶) مشکلات امنیتی (Malware یا Crypto Mining)

یکی از جدی‌ترین دلایل بالا رفتن مصرف CPU سرور، آلودگی به اسکریپت‌های مخرب است. در بسیاری از حملات، هکرها یک اسکریپت Crypto Mining روی سرور اجرا می‌کنند تا از توان پردازنده برای استخراج ارزهایی مثل مونرو استفاده کنند. این اسکریپت‌ها معمولاً به‌محض اجرا، CPU را تا 100% اشغال می‌کنند.

نشانه واضح این اتفاق این است که حتی وقتی ترافیک یا پردازش خاصی ندارید، همچنان مصرف CPU غیرطبیعی و بالاست و هیچ سرویس منطقی چنین مصرفی را توجیه نمی‌کند. در چنین شرایطی، تقریباً همیشه باید احتمال حمله یا نفوذ را جدی بگیرید.

۷) کم بودن منابع نسبت به نیاز واقعی پروژه

گاهی مشکل از حمله، باگ یا تنظیمات اشتباه نیست؛ واقعیت این است که پروژه رشد کرده اما منابع سرور همان منابع اولیه مانده‌اند. وقتی اندازه ترافیک، تعداد کاربران یا حجم پردازش‌ها افزایش پیدا می‌کند، سروری که برای مرحله قبلی مناسب بوده دیگر پاسخ‌گو نیست.

برای مثال، سایتی با حدود ۲۰۰ هزار بازدید ماهانه که همچنان روی VPS با 2 vCPU میزبانی می‌شود، به‌احتمال زیاد مرتباً با بالا رفتن مصرف CPU سرور مواجه می‌شود. در چنین شرایطی، پردازنده زیر بار طبیعی کاربرها هم به سقف می‌رسد و رسیدن CPU به 100% کاملاً طبیعی است.

از کجا بفهمیم مشکل دقیقاً چیست؟

وقتی با بالا رفتن مصرف CPU سرور روبه‌رو می‌شویم، اولین قدم این است که ریشه مشکل را پیدا کنیم. این مرحله بدون ابزارهای مانیتورینگ و تحلیل لاگ‌ها ممکن نیست. در ادامه، مهم‌ترین ابزارهایی که برای تشخیص سریع وضعیت CPU استفاده می‌شوند را به‌صورت کامل توضیح می‌دهیم.

مستندات Ubuntu درباره CPU Usage

ابزارهای سریع برای مانیتورینگ

۱) تصویر لحظه‌ای از وضعیت پردازش‌ها

ابزار top یکی از پایه‌ای‌ترین و در عین حال مؤثرترین روش‌ها برای بررسی لحظه‌ای مصرف CPU است.با اجرای آن، لیستی از پردازش‌ها نمایش داده می‌شود که شامل درصد مصرف CPU، مصرف حافظه، وضعیت پردازش و Load Average است.اگر پردازشی به‌طور غیرطبیعی CPU را مصرف کند، top بلافاصله آن را نشان می‌دهد.این ابزار برای تشخیص سریع «پروسه مقصر» ضروری است.

۲) نسخه خواناتر و پیشرفته‌تر top

htop همان top است اما با رابطی گرافیکی‌تر و قابل خواندن‌تر.
در htop می‌توانید:

پردازش‌ها را جابه‌جا کنید
آن‌ها را بر اساس مصرف CPU مرتب کنید
به‌صورت رنگی وضعیت منابع را ببینید

این ابزار برای زمانی مناسب است که بخواهید دقیق‌تر و سریع‌تر تشخیص دهید چرا مصرف CPU سرور بالا رفته است.

۳) سریع‌ترین راه برای پیدا کردن پردازش سنگین

گاهی لازم نیست مانیتورینگ کامل انجام دهید؛ فقط می‌خواهید بدانید «همین الآن کدام پردازش بیشترین CPU را می‌خورد؟».
دستور زیر دقیق‌ترین پاسخ را می‌دهد:

ps aux --sort=-%cpu

خروجی این دستور پردازش‌ها را از بیشترین مصرف CPU به کمترین مرتب می‌کند.این ابزار زمانی بسیار مفید است که CPU ناگهان به 100% رسیده و می‌خواهید در همان لحظه مقصر را پیدا کنید.

۴) تشخیص درگیری CPU یا I/O

vmstat اطلاعات عمیق‌تری نسبت به top ارائه می‌دهد.این ابزار مشخص می‌کند آیا پردازنده واقعاً زیر فشار است یا مشکل از جای دیگری مثل I/O یا صف‌های دیسک می‌آید.
گاهی مصرف CPU بالا نیست اما سیستم کند است؛ vmstat دقیقاً نشان می‌دهد مشکل در کدام بخش میباشد.

۵)بررسی ارتباط مصرف CPU با دیسک

اگر احساس می‌کنید کندی دیتابیس یا عملیات دیسک با CPU مرتبط است، iostat بهترین ابزار است.این ابزار نشان می‌دهد آیا عملیات Read/Write روی دیسک به حدی زیاد شده که اجرای پردازش‌ها را کند کرده باشد.در بسیاری از موارد، فشار روی I/O به‌صورت غیرمستقیم منجر به بالا رفتن مصرف CPU سرور می‌شود.

۶) بررسی تاریخچه مصرف CPU

اگر مشکل شما دائمی نیست و در ساعت‌های خاصی رخ می‌دهد، sar با نمایش تاریخچه مصرف CPU بهترین انتخاب است.
این ابزار نشان می‌دهد:

چه ساعتی مصرف CPU افزایش یافته
روند مصرف در روزهای گذشته چطور بوده
آیا مصرف CPU موجی است یا دائمی

در تشخیص مشکلاتی مثل حملات زمان‌دار یا Cronjobهای سنگین بسیار کاربردی است.

۷) مانیتورینگ کامل و عمیق سیستم

atop فقط CPU را نشان نمی‌دهد؛ بلکه یک نمای کلی از مصرف RAM، دیسک، شبکه و پردازش‌ها ارائه می‌دهد.برتری آن این است که اگر مصرف CPU بالا باشد اما علت آن جای دیگری باشد، atop این ارتباط را واضح نشان می‌دهد.برای تحلیل مشکلات پیچیده، این ابزار دقیق‌ترین گزینه است.

۸)ردگیری خطاها و مشکلات سیستمی

journalctl لاگ‌های سیستم را نمایش می‌دهد و به‌خصوص در محیط‌های مبتنی بر systemd اهمیت بالایی دارد.
این ابزار نشان می‌دهد:

کدام سرویس‌ها خطا داده‌اند
آیا Crash یا Restart غیرمنتظره رخ داده
چه اتفاقاتی درست قبل از افزایش مصرف CPU ثبت شده

اگر مصرف CPU به‌صورت ناگهانی بالا رفته باشد، journalctl اغلب سرنخ دقیقی ارائه می‌دهد.

لاگ‌ها از چه چیزهایی پرده برمی‌دارند؟

وقتی می‌خواهیم دلیل بالا رفتن مصرف CPU سرور را پیدا کنیم، لاگ‌ها معمولاً بیشتر از هر ابزار دیگری حقیقت را نشان می‌دهند. پردازش‌ها ممکن است در لحظه عوض شوند، اما ردپا در لاگ باقی می‌ماند و دقیقاً مشخص می‌کند چه چیزی چه زمانی اتفاق افتاده. چهار لاگ مهم معمولاً بیشترین کمک را به ما می‌کنند.

۱) slow log دیتابیس؛ جایی که کندی‌های واقعی مشخص می‌شوند

اگر همراه با افزایش CPU، سرعت دیتابیس هم پایین آمده باشد، slow log اولین جایی است که باید به آن سر زد. این لاگ دقیقاً نشان می‌دهد کدام Query بیش از حد زمان پردازش گرفته، آیا اجرای آن بدون Index بوده یا این‌که دیتابیس مجبور شده چندین هزار رکورد را جست‌وجوی کامل کند. هر Query سنگینی که در slow log دیده می‌شود، می‌تواند علت مستقیم بالا رفتن مصرف CPU سرور باشد؛ چون دیتابیس برای اجرای آن Query مجبور است زمان بیشتری از پردازنده بگیرد. در بسیاری از مواردی که MySQL یا PostgreSQL عملکرد خوبی ندارد، تحلیل slow log دقیق‌ترین نقطه شروع برای پیدا کردن مشکل است.

۲) error log وب‌سرور؛ نشانه‌های واضح فشار یا خطای پردازشی

در سرورهای Nginx و Apache، error log تقریباً همیشه یکی از ارزشمندترین منابع برای تشخیص ریشه مشکل است. وقتی پردازنده تحت فشار باشد یا سرویس‌های پشت وب‌سرور به‌موقع پاسخ ندهند، پیام‌هایی مثل timeout، خطاهای PHP-FPM یا هشدارهای مربوط به overload در این فایل دیده می‌شود. همین پیام‌ها به‌طور مستقیم نشان می‌دهند چرا مصرف CPU سرور بالا رفته و اینکه کدام سرویس دقیقاً در لحظه مشکل داشته. اگر پردازنده به خاطر تعداد زیاد پردازش‌های PHP یا درخواست‌های هم‌زمان نابود شده باشد، معمولاً اولین علامت در همین error log دیده می‌شود.

۳) access log؛ سریع‌ترین راه برای تشخیص ترافیک غیرعادی و حملات

اگر افزایش CPU ناشی از ترافیک سنگین، ربات‌ها یا حملات لایه 7 باشد، access log دقیق‌ترین و شفاف‌ترین منبع برای تشخیص ماجراست. در این لاگ می‌توان الگوهایی مثل افزایش ناگهانی تعداد درخواست‌ها در یک دقیقه، ارسال درخواست‌های تکراری از یک IP، یا دسترسی به مسیرهای بی‌معنا توسط ربات‌ها و اسکنرها را دید. این نشانه‌ها معمولاً فقط یک معنا دارند: یک موج ترافیک غیرعادی یا حمله در جریان است که می‌تواند مستقیماً باعث بالا رفتن مصرف CPU سرور شود.
گاهاً تنها با یک نگاه به access log می‌توان فهمید که مشکل از کد یا دیتابیس نیست، بلکه از ترافیک غیرمنتظره است.

۴) لاگ‌های فایروال؛ خط اول دفاع در تشخیص حملات

اگر مصرف CPU دقیقاً در لحظاتی افزایش یافته که ارتباطات مشکوک یا تلاش‌های ورود غیرمجاز ثبت شده‌اند، logهای فایروال بهترین مکان برای بررسی‌اند. این لاگ‌ها معمولاً رفتارهایی مثل حملات brute-force، تلاش برای اسکن پورت‌ها یا درخواست‌های غیرعادی شبکه را ثبت می‌کنند. در صورتی که این رفتارها هم‌زمان با افزایش مصرف CPU دیده شود، احتمال حمله بسیار بالاست. فایروال معمولاً اولین جایی است که هشدار می‌دهد یک رفتار غیرعادی در شبکه جریان دارد؛ رفتاری که می‌تواند مستقیماً باعث بالا رفتن مصرف CPU سرور شود.

روش‌های عملی برای کاهش مصرف CPU

بعد از اینکه دلایل بالا رفتن مصرف CPU سرور را پیدا کردیم، نوبت به مهم‌ترین بخش می‌رسد: اینکه چطور مصرف CPU را به‌طور واقعی و پایدار کاهش دهیم. بسیاری از مشکلات CPU با چند تغییر ساده و اصولی حل می‌شوند، بدون اینکه نیاز باشد سرور را ارتقا دهیم یا منابع بیشتری اضافه کنیم. در این بخش، مجموعه‌ای از روش‌های عملی و قابل‌اجرا را بررسی می‌کنیم؛ روش‌هایی که مستقیماً روی عملکرد سرور تأثیر می‌گذارند و باعث می‌شوند CPU از حالت اشباع خارج شود و سیستم دوباره به شکل پایدار کار کند.

۱) فعال کردن Cache در سطح اپلیکیشن و سرور

یکی از مؤثرترین روش‌ها برای کنترل بالا رفتن مصرف CPU سرور، استفاده درست از Cache است. بخش زیادی از فشار روی CPU به این دلیل وارد می‌شود که سرور مجبور است هر درخواست را از صفر پردازش کند؛ یعنی هر بار Query اجرا کند، PHP یا NodeJS را درگیر کند و تمام منطق برنامه را دوباره طی کند. Cache این چرخه را می‌شکند.

در سطح اپلیکیشن، استفاده از Redis یا Memcached باعث می‌شود نتایج پردازش‌های تکراری ذخیره شوند و به‌جای اجرای دوباره، مستقیماً از حافظه تحویل داده شوند. این کار فشار زیادی از روی دیتابیس برداشته و مصرف CPU را به‌طور محسوس کاهش می‌دهد.در اجرای PHP هم فعال کردن OpCache اهمیت زیادی دارد؛ چون به جای این‌که فایل‌های PHP هر بار کامپایل شوند، نسخهٔ کامپایل‌شده در حافظه نگه داشته می‌شود. همین کار ساده می‌تواند زمان پردازش و مصرف CPU را چند برابر بهبود دهد.

در لایه‌ی سرور نیز فعال کردن Nginx Cache یا FastCGI Cache یکی از مؤثرترین راه‌ها برای کاهش بار است. با این کار، پاسخ بسیاری از صفحات پربازدید بدون نیاز به اجرای PHP یا دسترسی به دیتابیس ارائه می‌شود. نتیجه‌اش این است که پردازنده فقط برای درخواست‌های واقعاً جدید درگیر می‌شود.

در بسیاری از سرورها مشاهده می‌شود که بدون استفاده از Cache، CPU مدام به سقف مصرف نزدیک می‌شود؛ اما با راه‌اندازی این سه نوع Cache، فشار روی پردازنده تا حد زیادی کنترل شده و مشکل بالا رفتن مصرف CPU سرور عملاً برطرف می‌شود. این روش هم ساده است، هم ارزان، و از نظر تأثیرگذاری جزو اولین اقداماتی است که باید انجام شود.

۲) محدود کردن ربات‌ها و حملات (Rate-Limit / Bot Protection)

یکی از رایج‌ترین دلایل بالا رفتن مصرف CPU سرور، درخواست‌های زیاد و بی‌هدف از طرف ربات‌ها، اسکنرها یا حملات لایه 7 است. این نوع درخواست‌ها معمولاً محتوا یا بخش‌های حساس سایت را بارها و بارها هدف قرار می‌دهند و حتی اگر ترافیک واقعی نداشته باشید، CPU را به‌شدت درگیر می‌کنند. نکته مهم این است که بیشتر این درخواست‌ها واقعی نیستند و قرار هم نیست پاسخی برای کاربر انسانی بدهند؛ در نتیجه محدود کردن آن‌ها یکی از مؤثرترین راه‌های کاهش مصرف CPU است.

با فعال‌سازی Rate-Limit روی Nginx یا فایروال، می‌توان تعداد درخواست‌هایی که از یک IP در یک بازه زمانی مشخص ارسال می‌شود را کنترل کرد. وقتی یک ربات در چند ثانیه ده‌ها یا صدها درخواست ارسال می‌کند، Rate-Limit بلافاصله آن را متوقف می‌کند و اجازه نمی‌دهد این بار سنگین روی پردازنده تحمیل شود. این روش در سایت‌هایی که فرم‌ها، API یا مسیرهای پرترافیک دارند، تاثیر بسیار قابل توجهی دارد.

در کنار Rate-Limit، استفاده از Bot Protection اهمیت زیادی دارد. این ابزارها می‌توانند رفتار ربات‌ها را تشخیص دهند و پیش از آن‌که درخواست وارد پردازش اصلی سرور شود، آن را مسدود کنند. به‌خصوص در حملات لایه 7 که هدف، ایجاد فشار روی CPU و اشباع آن است، وجود یک لایه تشخیص ربات باعث می‌شود حجم زیادی از درخواست‌های تقلبی هرگز به اپلیکیشن یا وب‌سرور نرسند.

ترکیب این دو روش یکی از سریع‌ترین و قطعی‌ترین روش‌ها برای جلوگیری از اشباع CPU است. در بسیاری از سرورها تنها با فعال‌سازی همین دو روش، مشکل بالا رفتن مصرف CPU سرور به‌طور کامل کنترل شده و مصرف CPU به حالت طبیعی برمی‌گردد.

۳) بهینه‌سازی وب‌سرور (Nginx / Apache Tuning)

بخش قابل‌توجهی از فشار روی پردازنده در سایت‌ها و اپلیکیشن‌های تحت وب، مستقیماً از نحوه پیکربندی وب‌سرور می‌آید. اگر تنظیمات Nginx یا Apache درست انجام نشده باشد، حتی یک ترافیک معمولی هم می‌تواند CPU را تا مرز اشباع ببرد و عملاً باعث بالا رفتن مصرف CPU سرور شود. این مسئله نه به ضعف سخت‌افزار مربوط است و نه لزوماً به کد برنامه؛ بلکه نتیجه تنظیماتی است که باعث می‌شوند هر درخواست بیش از حد لازم منابع مصرف کند.

در Apache، مهم‌ترین چالش مربوط به مدل پردازشی آن است. اگر تعداد Workerها و MaxRequestها بیش از توان واقعی سرور تنظیم شوند، هر Request یکی از پردازش‌ها را درگیر می‌کند و مصرف CPU سریعاً بالا می‌رود. به‌خصوص در سایت‌های PHP، اگر KeepAlive بیش از حد فعال باشد، پردازش‌ها مدت طولانی‌تری زنده می‌مانند و پاسخ‌دهی سایر درخواست‌ها کند می‌شود. فقط چند پارامتر اشتباه کافی است تا پردازنده برای مدت زیادی درگیر یک صف طولانی از کانکشن‌ها شود.

در Nginx وضعیت کمی بهتر است، اما همچنان تنظیمات اشتباه می‌تواند CPU را زیر بار ببرد. برای مثال، اگر تعداد worker_processes بیش از تعداد هسته‌های CPU باشد، یا worker_connections خیلی بالا تنظیم شود، Nginx تلاش می‌کند درخواست‌های بیشتری را مدیریت کند در حالی که منابع واقعی سرور اجازه نمی‌دهد. از طرف دیگر، اگر Bufferها کوچک باشند یا Gzip اشتباه فعال شده باشد، پردازنده ناچار می‌شود تعداد زیادی عملیات فشرده‌سازی و پردازش اضافه انجام دهد.

۴) بهینه‌سازی دیتابیس

در بسیاری از سرورها، ریشه اصلی بالا رفتن مصرف CPU سرور نه وب‌سرور است و نه اپلیکیشن؛ بلکه دیتابیس است. دیتابیس اگر درست بهینه نشود، هر Query ساده می‌تواند زمان زیادی از پردازنده بگیرد و همین مسئله به‌مرور CPU را اشباع کند. مشکل از آن‌جایی آغاز می‌شود که دیتابیس مجبور است حجم زیادی از داده‌ها را بدون Index جست‌وجو کند یا تعداد بالایی Connection هم‌زمان را مدیریت کند. نتیجه این وضعیت، کند شدن کل سیستم و مصرف غیرطبیعی CPU است.

یکی از مهم‌ترین اقدام‌ها در بهینه‌سازی دیتابیس، بررسی Queryهای سنگین است؛ Queryهایی که بیش از حد طول می‌کشند و پردازنده را مدت طولانی درگیر می‌کنند. فعال‌سازی slow log یا ابزارهای مشابه به‌سرعت مشخص می‌کند کدام Query بیشترین فشار را ایجاد کرده و آیا نیاز به اصلاح ساختار جدول یا ایجاد Index دارد یا نه. بسیاری از اوقات، فقط با اضافه کردن یک Index ساده مصرف CPU چندین برابر کمتر می‌شود.

در کنار Queryها، تنظیمات داخلی دیتابیس هم اهمیت دارد. در MySQL، پارامترهایی مثل buffer pool در InnoDB، تعداد connectionها یا سایز cacheها نقش مستقیم در مصرف CPU دارند. اگر buffer pool کوچک باشد، دیتابیس مجبور است به‌جای حافظه، دائماً از دیسک استفاده کند؛ و این یعنی CPU باید زمان بیشتری صرف مدیریت I/O کند. همین اتفاق در PostgreSQL با shared_buffers، work_mem و maintenance_work_mem دیده می‌شود. هر کدام از این پارامترها اگر با حجم واقعی داده و ترافیک هماهنگ نباشند، CPU دائماً تحت فشار قرار می‌گیرد.

۵) افزایش منابع سرور و رشد پروژه

گاهی همه‌چیز درست تنظیم شده، وب‌سرور و دیتابیس بهینه‌اند، ترافیک هم طبیعی است؛ اما باز هم بالا رفتن مصرف CPU سرور ادامه دارد. در این حالت معمولاً مشکل از جای دیگری می‌آید: پروژه رشد کرده اما منابع سرور همان منابع قبلی مانده‌اند. این سناریو در سایت‌ها و اپلیکیشن‌هایی که طی چند ماه رشد ناگهانی تجربه می‌کنند بسیار شایع است.

سروری که در ابتدا با ۱ یا ۲ هسته CPU برای یک سایت یا اپلیکیشن کوچک کافی بوده، بعد از افزایش کاربران، بزرگ‌تر شدن دیتابیس، افزایش تعداد درخواست‌ها یا راه‌اندازی ماژول‌های جدید، دیگر نمی‌تواند همان حجم پردازش قبلی را مدیریت کند. هر بخش از پروژه به شکل طبیعی CPU بیشتری نیاز دارد. اگر سخت‌افزار رشد پروژه را همراهی نکند، مصرف CPU کم‌کم به نقطهٔ اشباع می‌رسد.

نشانه اصلی این وضعیت این است که حتی بعد از بهینه‌سازی‌های لازم، CPU باز هم در ساعات اوج مصرف بالا می‌رود. یا تعداد کاربرهای آنلاین به یک حد خاص که می‌رسد، سرور بلافاصله کند می‌شود. این یعنی محدودیت پردازشی در سطح سخت‌افزار وجود دارد. در چنین حالتی ارتقای سرور؛ مثلاً افزایش تعداد vCPU، افزایش RAM، یا مهاجرت از VPS به VDS،راه‌حل منطقی و پایدار است.

نکته مهم این است که افزایش منابع زمانی مؤثر است که قبلاً مشکلات نرم‌افزاری و تنظیمات اشتباه را برطرف کرده باشید. ارتقای ناگهانی بدون تحلیل، فقط باعث می‌شود مشکل برای مدتی پنهان بماند؛ اما اگر دلیل اصلی، رشد واقعی پروژه باشد، اضافه کردن CPU کاملاً ضروری است و هسته‌های بیشتر باعث می‌شود پردازنده از حالت اشباع خارج شود، سرعت پردازش بالا برود و تجربه کاربری به‌طور محسوسی بهتر شود.

۶) استفاده از سرور مدیریت‌شده (VDS / Managed Service)

در بسیاری از موارد، مشکل اصلی بالا رفتن مصرف CPU سرور مربوط به نبود مدیریت صحیح زیرساخت است. سرورها در طول زمان به نگه‌داری مستمر، مانیتورینگ دائمی و بهینه‌سازی دوره‌ای نیاز دارند؛ اما بسیاری از کسب‌وکارها تیم فنی تخصصی ندارند یا فرصت نمی‌کنند به‌صورت منظم پیکربندی سرور، امنیت، دیتابیس و اپلیکیشن را بررسی کنند. نتیجه این می‌شود که تنظیمات اشتباه، پردازش‌های رهاشده، حملات امنیتی یا مشکلات پرفورمنس آرام‌آرام CPU را به سمت اشباع می‌برند، بدون اینکه کسی متوجه شود.

اینجاست که سرورهای مدیریت‌شده یا VDSهای Managed وارد بازی می‌شوند. در این نوع سرویس‌ها، یک تیم متخصص وظیفه دارد تمام امور زیرساختی را به‌جای شما انجام دهد: از بهینه‌سازی وب‌سرور و دیتابیس گرفته تا مانیتورینگ ۲۴ ساعته، اعمال پچ‌های امنیتی، مدیریت پردازش‌ها، کنترل حملات و بررسی خودکار مصرف منابع. این یعنی مشکلات قبل از آن‌که به مرحله بحرانی برسند شناسایی و رفع می‌شوند.

مزیت بزرگ سرویس مدیریت‌شده این است که بار فنی از دوش تیم شما برداشته می‌شود. به‌جای اینکه ساعت‌ها درگیر پیدا کردن علت مصرف بالای CPU شوید، تمام این مراحل به‌صورت خودکار و تخصصی انجام می‌شود. بسیاری از کسب‌وکارها بعد از مهاجرت به VDS مدیریت‌شده تجربه کرده‌اند که بدون تغییر جدی در کد یا افزایش منابع، مصرف CPU تا حد زیادی پایدارتر شده و مشکلات لود، کندی و خطاهای 503 یا 504 از بین رفته است.

در نهایت، استفاده از یک سرور مدیریت‌شده برای کسب‌وکارهایی که رشد کرده‌اند یا زیر بار ترافیک بالاتر رفته‌اند، یک انتخاب منطقی است. وقتی زیرساخت به‌طور تخصصی مدیریت شود، CPU کمتر به مرز اشباع می‌رسد، امنیت افزایش می‌یابد و سرویس با اطمینان بیشتری در دسترس می‌ماند. اگر بالا رفتن مصرف CPU سرور به یک مشکل تکراری تبدیل شده، استفاده از VDS یا Managed Service یکی از مطمئن‌ترین راه‌حل‌ها برای بازگرداندن ثبات به سرور است.

جمع‌بندی

بالا رفتن مصرف CPU سرور معمولاً یک اتفاق لحظه‌ای و بی‌دلیل نیست؛ پشت آن همیشه یک عامل مشخص وجود دارد. از ترافیک غیرمنتظره و ربات‌ها گرفته تا Queryهای سنگین دیتابیس، پردازش‌های پس‌زمینه، تنظیمات اشتباه یا حتی رشد طبیعی پروژه همه می‌توانند پردازنده را به‌طور کامل درگیر کنند و روی عملکرد کل سرویس تأثیر بگذارند.

آنچه مهم است، این است که مشکل را ریشه‌ای ببینیم. با چند ابزار ساده می‌توان فهمید CPU دقیقاً درگیر چه چیزی شده؛ و با اقداماتی مانند فعال‌سازی Cache، اعمال Rate-Limit، بهینه‌سازی وب‌سرور و دیتابیس یا مدیریت درست پردازش‌ها، مصرف CPU به شکل قابل‌توجهی کاهش پیدا می‌کند. در بسیاری از موارد، همین اصلاحات نرم‌افزاری کافی است و نیازی به ارتقای فوری سرور نیست.

اما وقتی همه‌چیز درست تنظیم شده و مشکل همچنان پابرجاست، معمولاً نشانه رشد پروژه و نیاز واقعی به منابع بیشتر است. در چنین شرایطی، ارتقای CPU یا استفاده از یک سرویس مدیریت‌شده می‌تواند پایداری و سرعت سرور را به‌طور کامل برگرداند.

در نهایت، کنترل بالا رفتن مصرف CPU سرور فقط یک اقدام فنی نیست؛ بخشی از مدیریت سلامت زیرساخت است. اگر این موضوع جدی گرفته شود و مانیتورینگ و بهینه‌سازی به‌صورت مداوم انجام شود، سرور پایدارتر می‌ماند، عملکرد بهتر می‌شود و تجربه کاربران هم به‌مراتب ارتقا پیدا می‌کند.

اشتراک گذاری