عدم دریافت دیتا در بعضی آیتم های زبیکس


#1

سلام
من چند تا مشکل روی سرور زبیکس دارم . اول اینکه به عنوان مثال روی مپ من یک تریگر فعال شده که مثلا Used MEmory من تا 80 درصد بالا رفته و وضعیت MAP به هشدار تغییر کرده بعد از رفع مشکل باید رنگ MAP من مجددا طبیعی میشد ولی نشده . با بررسی lastdata دیدم که آخرین رکورد دریافتی همون 86 درصد مقدار Used Memory بوده که نشون میده نمیتونه دیتای دیتابیس رو آپدیت کنه یا شاید نیمیتونه مقدار جدید بفرسته . این مشکل تا زمانی که سرور رو ریبوت کنم ادامه داره با ریبوت کردن سرور مشکل حل میشه حتی با ریست کردن سرویس Zabbix Agent بازم مشکل برقراره.
مشکل دوم اینکه روی یک سرور من یک سری Userparameter جدید برای مانیتور کردن پارامتر های سرور اضافه میکنم. با ریست کردن سرویس زبیکس Agent باید پارامتر های جدید اضافه بشه و بتونم آنها رو مانیتور کنم . اما بعضی مواقع این اتفال نمی افته و سرور من نمیتونه دیتای جدید و حتی دیتای قدیمی اون سرور رو بگیره و Agent بطور کامل ارتباطش با سرور قطع میشه ( Telnet به پورت 10050 انجام میشه یعنی پورت فعاله اما دیتا نمیفرسته ) و با ریست کردن Agent هم مشکل حل نمیشه تا زمانی که سرور رو به طور کامل ریبوت کنم .
این مورد رو من 5 سرور مشابه دارم که برای دوتا بدون مشکل userparameter کار میکنه ولی برای سه تای بعدی حتما باید سرور رو ریبوت کنم .

در نهایت اینکه بعضی وقتا ارتباط زبیکس Agent با سرور زبیکس برقرار نمیشه و تا ریست شدن کامل سرور این مشکل ادامه داره .
راهکاری برای رفع این مشکل هست ؟ چون بعضی سرورها عملیاتی هستن و واقعا ریست کردن اونها غیر ممکنه

ضمن اینکه به نظر من این مشکل مربوط به Cache شدن ارتباط هست که نمیتونه ارتباط جدید بین نرم افزار تا سرور برقرار بشه
ممنون میشوم راهنمایی کنید


#2

مهندس جان در صورتی که مشکل در لینک ارتباطی بین سرور زبیکس با سرورهای مانیتور شده ندارید و شبکه با کیفیت داره کار می کنه باید بگم که گاهی اوقات هست که Userparameter یی که می نویسید بار زیادی رو روی سرور ایجاد می کنه ( البته من نمی دونم که UserParameter شما چه کار می کنه) این باعث می شه که عملا سرور نیاز به ریست شدن پیدا کنه.

نکته مهم این جاست که در زمان ریست کردن Agent گاهی اوقات این اتفاق به صورت کامل انجام نمی شه یعنی اینکه Agent با یک error مواجه شده که باعث می شه فرآیند Restart شده اون کامل صورت نگیره و در نتیجه شما هیچ گونه تغییری در رفتار اون رو احساس نمی کنید. اگر این اتفاق افتاد باید یک بار تمام Process های Agent رو Stop کنید و مجددا Start کنید.

مورد بعدی اینه که ممکنه این مشکل در اثر کم بودن تعداد Process های Poller باشه که این از طریق گراف های زبیکس قابل بررسی هستش. اگر این طوره شما باید در تنظیمات زبیکس تعداد این Process ها رو افزایش بدید.