Дек. 172008
 

Че и в 10.2.0.5. Настъпихме го наскоро. За какво става дума:

Преди 2 седмици, след дълга подготовка (разбирай: помотване), решихме да си пачнем Grid Control-а до 10.2.0.4 (последния наличен към момента). Речено-сторено. Съборихме го и за няма и ден го ъпгрейднахме целия. И така и така сме почнали със зловещите дела, хрумна ми да пачнем и агентите. Това го правим в пълен разрез с правилото „щом работи – не го пипай“. Ама нали си нямаме много работа…

Като се сетих за „щом работи – не го пипай“, да кажа – вярно е. За пореден път се уверих. За начало пачнахме един от по-небрежните сървъри, който не е много натоварен. Пача си мина като по дебелите книги, всичко изглеждаше добре. Обаче няма и половин час след това Станко забеляза, че процесорът е ударил платото на 100%. А то това сървърче, горкото, няма много вътък – 2 GB памет и само един процесор.

Зоркото наблюдение и ровене из логове и performance статистики показа, че един процес с коварното име PERL.EXE се събужда на всеки 15 минути и почва да яде 100% CPU. И така за около 13 минути 🙂

Не стига това, ами постепенно се назобва и с около 1.1 GB памет, т.е. системата започва да swap-ва брутално и да се бави още повече. С ProcessExplorer успяхме да установим, че тоя perl в момента изпълнява скрипта PARSE-LOG1.PL. Пуснах един service request към Oracle и от там ме успокоиха, че съм настъпил бъг 7427555. Освен това „This bug is closed as duplicate of Bug 6691174 which is inernal bug can not view through metalink“. Решение се очаква в пачсет 10.2.0.6 (шест! скоро се очаква да излезе 10.2.0.5!). Оправия, в момента, няма: „Even if we log a backport request for 10.2.0.4 GC, They will not issue any patch because still the DEV team is working on that.“

Все пак има начин да се избегне ефекта, макар и временно. Трябва да се махнат всички „по-големички“ log и trace файлове от всички наблюдавани orace_homes (включитено и home-а на агента, аз там имах най-големите тлъстотии). След като отрязах всичко по-голямо от няколко мегабайта, нещата потръгнаха. Сега скрипта си минава за секунди. Естествено, логовете постоянно растат и ще им трябва периодично подкастряне…

(Това временно решение ми напомня за една мъдра мисъл относно Windows: „Преинсталирането на Windwos е като размразяването на хладилника. Помага, ама за малко“)

Досещате се, че ще си стоя на 10.2.0.3 агенти навсякъде поне до излизането на 10.2.0.6. На злощастния сървър му предстои изтриване на агента и инсталиране на стария.

 Posted by at 16:02

Sorry, the comment form is closed at this time.