Въпрос на процедура – част 2

 Consultant  Коментарите са изключени за Въпрос на процедура – част 2
Ное. 262007
 

Вторият интересен случай, за който научих миналата седмица, е описан много подробно в Computerworld. Случва се на 31 Август, в U.S. Department of Veterans Affairs. Това е огромна организация с огромна IT инфраструктура. IT инфраструктурата се управлява от VA Office of Information & Technology (OI&T). В OI&T тече едно голямо преструктуриране, започнало октомври 2005 и с идея за завърши в рамките на 3 години (до октомври 2008). Много неща се променят драстично – целият модел на работа, системите и т.н.

Една от промените е централизирането на IT отделите. До преди всеки от около 150 медицински центъра си е имал собствен IT отдел, който е вземал решения за всичко – имат си бюджет, имат си визия за развитие и си действат. Естествено, това нещо е кошмарно за управление и консолидация на данните на по-горно ниво, стандартизация на процедурите и т.н. Идеята е всички IT мощности да се преместят в 4 центъра, 2 в източната и 2 на западната част на щатите. Западните са съответно в Сакраметно и Денвър.

На 31 Август в центъра в Сакраменто има консултанти от HP, които правят диагностика Alpha сървъра им. По същото време, потребители от медицинските центрове в Северна Калифорния започват работа и откриват, че не могат да влязат в системите с данни за пациентите: Veterans Health Information Systems and Technology Architecture (Vista) и Computerized Patient Record System (CPRS). Всички в IT центъра започват да диагностицират какъв е проблема. Няма видима причина за липсата на достъп до приложението – всичко си работи.

Засегнатите медицински заведения задействат процедурата за работа при отпадане на центъра. Процедурата има 3 нива
– първо ниво: Failover към центъра в Денвър
– второ ниво: достъп до readonly копие на данните, което е налично във всяко медицинско заведение
– трето ниво: данните за пациентите за следващите 2 дни са налични на локалните дискове.

Логично е да се действа по плана на първо ниво. Но не става така. Проблема е, че между двата центъра има синхронна репликация. Ако единия център отпадне пореди липса на свързаност, или се сринат сървъри, или нещо друго – работата минава на другия. Но в настоящия случай няма видим проблем. Специалистите се опасяват, че докато не знаят причината за проблема, не бива да минават към втория център. Ако проблема е софтуерен, може да се повреди и Денвър, който в този момент си работи. За това решават засегнатите медицински заведения да минат направо на второ ниво, докато открият какво става в Сакраменто.

Така и правят, в 16 от 17-те засегнати сгради. В 17-тата, обаче, локалното read-only копие е изключено по-рано през седмицата за рутинна поддръжка. Там трябва да преминат на трето ниво – четене на данни от локалните дискове.

Настава голяма суматоха – няма възможнсот да се видят данните от изследвания, направени предния ден; не могат да се назначават нови изследвания; кардиолозите не могат да четат ЕКГ, понеже те излизат online. Всички започват да пишат на хартия, да се обменят данни написани на карирани листи и т.н.

Постепенно в Сакраметно откриват какъв е проблема: един екип поискал от друг екип да направят промяна в един мрежов порт; вторият екип го е направил, и понеже е нещо толкова минимално, не са го записали в changelog-а. От там последват всички беди. Хората, заети с борбата със ситуацията, нямат информация за промяната. И за това трябва да прегледат цялото приложение, на всички нива, за да видят какво става. На практика това им отнема почти целия ден (мога дамо да се досещам каква лудница е станала, със стотици хора, които нагнетяват обстановката).

При наличие за информация в changelog-а, всичко би било много лесно: виждаш кога системата отказва, поглеждаш какво е правено тогава и го връщаш. Всичко е въпрос на процедура.

След като са открили проблема, специалистите в Сакраметно изключили всички системи с Vista и започнали да ги включват една по една. Всичко минало гладко. Но всички данни, написани на хартия, трябвало да се вкарат в системата. Работниците в лабораториите и аптеките въвеждали до късо през нощта в петък; администраторите въвеждали данни за пациентите, минали през съответните заведения в продължение на 2 седмици; допълването на всички данни ще отнеме месеци.

Изводите са като при другия случай, за който писах. Ще добавя само един: може да имаш най-перфектния софтуер, най-добрия хардуер, но ако нямаш най-добрата организация, с процедури които са разписани и наистина се следват, рано или късно ще изгърмиш.

 Posted by at 11:59
Ное. 232007
 

Тази седмица станаха известни 2 случая, които могат да бъдат показателни за много организации (и техните консултанти)

Първата история се е случила във Великобритания миналия месец. National Audit Office (NAO) изпраща на HM Revenue & Customs (HMRC) искане за данни от БД за детски помощи. Убеден съм, че HMRC имат много добре измислена security процедура – сървърите им са защитени, приложенията са обмислени, паролите са дебели, вероятно използват и PKI. Но някой (както казват: „Junior official from HMRC“) съвсем съвестно записва исканите данни на 2 CD-та и ги изпраща до NAO чрез TNT. Звучи доста рутинно, дори не е записал и информацията за пратката никъде (малка процедурна грешчица…)

Тези CD-та, обаче, никога не пристигат. 6 дни по-късно HMRC отново записват данните и ги изпращат на NAO. Този път данните пристигат. Но къде са първите 2 CD-та? Те съдържат данните за 25 милиона британци. Имена, дата на раждане, банкови сметки, номер на осигуровка… Някой се сеща 9 дни по-късно и повдига въпроса на по-високо ниво. Въпроса се ескалира до правителството, изпращат полицията да търси данните, примиера трябва да дава обяснения; стига се до оставка на директора на HRMC, Paul Gray. (timeline). Има една хубава българска пословица: „след дъжд – качулка“. Дисковете така и не са намерени.

Убеден съм, че HRMC има много нива на защита на информацията. Процедури, правила, и т.н. Но тук има няколко издънки:

– Как така NAO ще искат такива данни от HRMC?

– Какви са били инструкциите към споменатия „junior official from HMRC“? Вероятно „от теб се иска пълно съдействие към одиторите“

– Защо „junior official from HMRC“ има достъп до всичките данни и права да ги извлече и запише на CD? Той така може да си ги вземе и да поработи вкъщи…

– Защо толкова чувствителни данни се изпращат с куриер (вярно, защитени с парола)

– Как така TNT губи пратки?

Всъщност, няма много смисъл от въпроси. Каквото станало-станало. Лошо, хубаво, тъжно, весело… минало. Важни са изводите:

– Няма перфектна процедура. Просто няма. Няма пълна защита.
->Следвствие: Работи с цел да подобряваш ежедневно. Няма „Готово, направих го перфектно“

-Всеки греши. Колкото си по-“голям“, толкова по-големи грешки правиш.
->Следствие 1: Ако си сгрешил, няма какво да се вайкаш. Признай си и действай до колкото може за да оправиш бакиите.
->Следствие 2: Ако друг е сгрешил, не му натяквай „Колко си глупав, как можа да сгрешиш“. Помогни му да се поправи. Другия път може да сгрешиш ти

Генерален извод: Такъв е светът в който живеем – несигурен, не-перфектен. Колкото по-бързо се примириш и започнеш да подобряваш бъдещето, вместо да се вайкаш за миналото – толкова по-добре. Не казвам да не се учиш от грешките си – напротив. Но вземай само полезното и продължавай напред.

Вторият случай, който ме развълнува тази седмица, ще обсъдя малко по-късно. И без това настоящият пост стана неприлично дълъг

 Posted by at 12:38

Helloween / Gamma Ray в София

 Общи  Коментарите са изключени за Helloween / Gamma Ray в София
Ное. 192007
 

Hellish Rock

Снощи ходих на концерта на Helloween и Gamma Ray и… беше невероятно. Евала на момчетата, раздадоха се страхотно. Концерта ми хареса повече и от този на Iron Maiden, и от Blind Guardian, дори от миналогодишният концерт на Helloween! Просто не се сещам как да изразя удоволствието си от това преживяване.

И много критики за огранизаторите. Влизането беше супер затруднено. Аз бях пред залата към 18:30 и не пускаха. В 19 пак отидох, вече имаше голяма тълпа. Започнаха да пускат към 19:15, бааавнооооо…. Голяма блъсканица беше. Имаше отворени само 4 врати, за около 4-5 хиляди души, които трябваше да влязат за 40 минути. Абсурд. Аз успях да вляза за час, и отвън имаше още много…

Вътре нямаше подгряваща група на живо, пускаха класически метъл. Което не е толкова лошо. Само дето достa нескопосано прекъснаха White Snake на средата на песента, за да настанят Gamma Ray. Толкова ли не можеха да се синхронизират…

Gamma Ray започнаха към 20:45. Не съм им голям фен, въпреки че те са си направо Helloween. Но все пак се изкефих. Не можех да припявам, защото не знам текстовете, но си подскачах. А и Kai Hansen доста добре си играеше с публиката. Не мога да кажа „добре подгряха“, защото те не са просто някаква подгряваща група – това са си Gamma Ray.

Приключиха към 21:45. Последва около 40 минути (защо чак толкова?) „антракт“, докато закачат техниката на Helloween. Което е странно, защото тяхната техника беше на втора сцена. В почивката се видя и още една, може би очаквана издънка в организацията – само 2 тоалетни, които нямат шанс да поемат всичката изпита бира. И станаха едни големи опашки… Сещам се за Iron Maiden, където имаше поне 30 такива заведения.

Но дойде и момента, който чаках месеци. Залата отново притъмня, чу се въведението от „Gambling wit the Devil“ и… Helloween, великите Helloween се развилняха! Започнаха с Helloween – култово парче. Последваха нови и нов забивки, просто страхотно. Не ми остана нито глас, нито врат…

Е, имаше и няколко издънки, които бих записал отново на сметката на организаторите. В края на „The King for a 1000 Years“ озвучението просто спря. Добре че остана осветление. Пичовете от групата се справиха съвсем професионално – даже Sascha Gerstner започна да забавлява публиката с някаква весела пантомима, докат разни хора се лутата по сцената да оправят звука. Оправиха го някак, започнаха „We Burn“, не минаха и 2 минути звука пак изчезна. Добре че това беше последното спиране. Бях започнал да се притеснявам, че ще се провали цялата веселба. За щастие, нямаше повече такива простотии.

Специална похвала Daniel Löble – барабаниста на Helloween. По средата на сета им, докато колегите му си почиваха зад сцената, той забавлява публиката поне 10 минути със страхотни изпълнения. На барабаните! Страшен е.

Концерта приключи към 1 часа през нощта, след 2 биса. За последната песен на сцената излязоха и Gama Ray и изведнъж се оказа, че има 6 китари и два вокала (Kai Hansen не пуска китарата). Дълго ще си спомням с удоволствие преживяното

 Posted by at 19:41
Ное. 162007
 

Най-после и аз се престраших да си upgrade-на blog-а. Скока е голям – от WordPress 1.5.1.3 на WordPress 2.3.1.

Учуден съм колко лесна е процедурата. Първо си бекъпнах всичко според инструкциите за Backup; спрях плъгина против спам (аз друг плъгин не използвам); после копирах внимателно новите файлове според инструкциите за Upgrade и пуснах /wp-admin/upgrade.php.

Е, не мина без абсолютно никакви проблеми. Повяиха се разни надписи преди всеки пост:

Warning: array_key_exists(): The first argument should be either a string or an integer in /www/yavor.org/blog/root/wp-includes/category-template.php on line 176

Това, обаче, е мотика, настъпвана и преди (от други). Според съветите на знаещите, отворих си index.php на темата (MistyLook 2.3) и промених ред 15 от

< ?php if (in_category($AsideId) && !is_single() ) : ?>

на

< ?php if ( $AsideID != '' && in_category($AsideId) && !is_single() ) : ?>

Толкова! Сега предстои да разбера и каква ми е далаверата ит новия WordPress (т.е. да се науча да го използвам)

p.s. Така и така съм почнал, сложих си и новата версия на темата, MistyLook 3.5.

 Posted by at 15:28

Oracle VM – подробности

 Consultant, Общи  Коментарите са изключени за Oracle VM – подробности
Ное. 162007
 

Излязоха малко подробности около Oracle VM. Оказва се, че за база са взели Xen, закачили са го върху своя Linux (който е копие на RHEL) и са направили цялата работа ужасно оптимизирана. Постигнали са това с промяна на подхода като цяло – няма Linux, идващ с една торба софтуери и Xen между другото. Не. Има едно ядро (2.6.18) и върху него е виртуализацията. Нищо друго.

Лиценза е „Fedora style“, което е хубаво; ако искаш – ползваш, оправяш се сам, никой няма да те гони. Плащаш само ако ти трябва съпорт.

Като цяло идеята е да конкурират директо набиращият все повече сила VMWare ESX Server (нещо, което ползваме и при нас). Изобщо не се занимават с безплатния VMWare Server или VMWare Workstation. Microsoft VirtualPC също не им пречи – просто това не са системи, върху които някой пуска сървъри в production. Целта е да се прилапа точно обособения от ESX пазар, който преди ESX дори не съществуваше.

Поддържаните сториджи (един много важен въпрос в този тип виртуализация) са „anything supported on RHEL5“.

Явно много са бързали, защото има недовършени неща. Плана е цялата инфраструктура да се управлява от OEM Grid Control, но това ще се случи през 2008. За свега има standalone конзола за управление върху management сървъра. Работи се интензивно и по поддръжката на RAC върху Oracle VM (само не мен ли тези две технологии ми се струват противоречиви?). Поддръжката за Windows, изглежда, не е приоритет; за сега работи бавно и направо си казват „If you have a Windows system you are currently better running on ESX until we have the drivers to make Windows run faster“.

Аз лично съм много заинтересуван от тази посока на развитие. Представете си – инсталирам си на една виртуална машина нещо (примерно Linux + Oracle + AppServer + …), конфигурирам го, настройвам му всичко, пачвам, записвам на DVD и… когато ми потрябва, за тест, за production, при нас, при клиент, където и да е, просто го стоварвам от DVD-то и то тръгва. В Production! До сега този подход се използва (все повече и повече) за тестови и демо постановки. А сега ще имаме HAL на N-та степен 🙂

 Posted by at 12:16
Ное. 152007
 

Днес научих за нова бомба на пазара, пусната от Oracle – Oracle VM. Това е софтуер за виртуализация на хардуера, който се инсталира върху „голо желязо“. Интересното е, че не мога да намеря от къде са го купили. Според рекламите му описания, този продукт е „three times more efficient than the other, leading server virtualization product“. Това веднага показва, че това не е копие на някой друг „leading server virtualization product“, т.е. не е VMWare или Xine. Нещо повече, Oracle VM се опитва да открадне дял от пазара на най-добрия продукт на VMWare, с който до сега бяха „приятели“ (имат споразумение за взаимна поддръжка) – VMWare ESX Server, който също се слага направо върху хардуер, но струва доста. Oracle VM се разпространява безплатно, а поддръжката му струва от $499 на година за сървър с до 2 процесорни сокета, до $2997 за 3 години за машина с неограничен брой процесори.

Продуктите, които се съпортват под Oracle VM са доста:

Oracle Database 10g Release 2 and Oracle Database 11g Release 1
Oracle Application Server 10gR2 and 10gR3
Oracle Enterprise Manager 10.2.0.4
Oracle Berkeley DB 4.6
Oracle TimesTen 7.0.3.1
Oracle E-Business Suite 11.5.10 and 12
Oracle PeopleSoft Enterprise 8.4.x and 9.0
PeopleTools 8.49.07 and above
Oracle Siebel CRM 8.0
Oracle Hyperion 9.3.1

Дори има план да се поддържа Oracle RAC, някъде през 2008 (календарна) година. През 2008 се очаква и управлението да се поеме от Oracle Enterprise Manager – за сега е от отделен web сървис.

От хардуерна гледна точка „партньори“ на продукта са AMD, Dell, Emulex, HP, Intel, Liquid Computing, NetApp, Pillar Data Systems и Qlogic, като се очаква да стават повече. По принцип операционните системи, които могат да се търкулнат върху Oracle VM (guest operating systems) са следните:

Oracle Enterprise Linux 4 and 5;
RHEL3, RHEL4 and RHEL5;
Windows 2003, Windows Server 2003 and Windows XP are supported on HV capable hardware.

Има обаче една уговорка:

Currently, Microsoft Windows runs significantly slower on Oracle VM than it does on native hardware. However, Oracle is developing paravirtualized Windows drivers that will substantially improve the performance of Windows on Oracle VM.

С други думи, за сега става само за инсталиране на Linux (или за тестове).

 Posted by at 14:46
Ное. 152007
 

Вражалец
Вчера ходихме в „Сълза и смях“ да гледаме „Вражалец“. Както очаквах, в продължение на 2 часа се счупих от смях. Пиесата е силно адаптирана към съвремието. И макар да е малко тъжна като идея (един чешит прекарва цяло село да му дадат спестяванията си и духва с тях), всичко е поднесено с толкова хумор, че залата не спира да се превива. Всички актьори (Димитър Рачков, Любо Нейков, Асен Блатечки, Светлана Бонин, Деси Бакърджиева) са страхотни.

Какво да спомена? Най-добре изиграната роля според мен е на Цвета, касиерката на кметството. Просто наистина виждам една бюрократична кокошка, която кудкудяка заедно със секретарката на кмета Босилка. Похотливия поп Стайко, който минава с мотопед през сцената и винаги катастрофира зад декора (кмета: „Ей, не се научи да паркира тоя…“), с фалшиви богоугодни думи, селски тарикатлък и умерена алчност. Невероятните изпълнения на Ракчов в ролата на кмета, тарикат над тарикатите, който като чуе за пари забравя ума и дума. Само Манчо не ме грабна с играта си (Асен Блатечки) – но той е отрицателния герой и не съм навит да му симпатизирам.

А на края, когато ставя ясно, че Мачо е духнал с парите на цялото село, пиесата свършва и започват бурни аплодисменти, Рачков укротява залата с един жест и казва на смълчаните в очакване на поредния лаф зрители: „Знаете ли на кого се смеете? На себе си.“

Дааа… наистина е така. Тъжно е, но се смеем.

 Posted by at 11:08
Ное. 132007
 

В събота се възползвах от услугите на банкомат на ОББ. Получих малко интересна бележка за транзакцията:

bankomat

Проблема очевидно не е в кирилицата. Обаче надписите си остават трудни за четене… 🙂

 Posted by at 12:10
Ное. 052007
 

Тази сутрин открих интересна страничка в родния интернет. Адреса е oracle.start.bg. Там има невероятна мешавица от неща, които могат да бъдат свързани с думичката „оракул“, подредени в разни категории: хороскопи, гадания, ритуали, номерология (не се ли пише нумерология?), астрология, съновник и… oracle database. Забавното е, че в секцията Oracle Database има и два-три линка към мои писания, за които аз научих просто случайно: „Статии и съвети за инсталации под Oracle“, „Инсталация на Oracle 10g под Linux x86“, „Полезни връзки за Oracle“.

Стана ми приятно, усетих някакъв гъдел. От друга страна, малко е кофти начина, по който научавам. Не знам имам ли право да се сърдя – в крайна сметка, няма нищо против да споделям информацията, която пиша и поствам публично. Нали за това си направих и сайт, и блог – за да мога да споделям знание. Само че ми се иска да имах някакъв хабер за страничката…

 Posted by at 10:15

Alter tablespace begin backup

 Общи  Коментарите са изключени за Alter tablespace begin backup
Ное. 022007
 

В oracle 11g се появяват много нови и невероятни възможности. Направо немислими. Както казва Пламен Зюмбюлев, „Това да пачваш binary-тата докато работят е невероятна глезотия“.

Но аз се наслушах за 11g в последните 7 дни. Сега ще говоря за Oracle 6. И в Оracle 6 се появяват много нови и немислими неща, с които днес сме свикнали. Има възможност да се прави бекъп на БД докато тя работи. Нещо, което тогава е изглеждало немислимо. А днес е немислимо обратното…

И като се замислиш… ама те потребителите РАБОТЯТ! Как може да направиш копие на БД, докато всички пишат и нищо не усещат?

По това време не е имало RMAN. Той се появява в Oracle 7. По време на шестицата са се появили alter tablespace ... begin backup и
alter tablespace ... end backup. Пускаш първото, копираш файловете с каквото искаш OS utility и после пускаш второто.

И до днес се чудех как всъщност става трика. Това, че header-а на data файловете се „замразява“ е ясно, то е описано. Това е защото външното utility, с което копираш, няма идея какво копира и може да прочете header-а последен, примерно. Но как става номера със самите блокове? В документацията не е описано, нито в курсовете казва някой. Ето какво е казано в новата документация (11g):

When updates are made to files in backup mode, additional redo data is logged. This additional data is needed to repair fractured blocks that might be backed up by the operating system utility.

Същото пише и във всички други източници. Това обяснява, че се генерира повече redo, за да се оправи системата с т.нар. fractured blocks. Ама как?

Всъщност, нека дефинирам проблема с fractured blocks. Всичко в Oracle е нацепено на блокчета. Обикновено всичките са еднакви по размер – примерно, 8 КВ. Проблема е, че когато това „външно“ за БД utility (примерно cp, или dd, или Windows Explorer…) чете файла с данни, за да го копира, то не се съобразява с това. И прави заявки за четене по колкото у е удобно – примерно по 100 КВ. Така може да се случи един блок да бъде прочетен на 2 части, с 2 IO операции. Обаче между двете операции може DBWR да се намеси и да промени блока. И понеже не може да се „замразят“ хедърите на всички блокчета (защото потребителите няма да могат да работят), се получават предпоставки блока да е съвсем омешан.

Та, какво прави alter tablespace ... begin backup за да спаси това? Ми, всъщност, елементарно е. Просто поставя tablespace в backup режим и от там нататък първия, който промени даден блок, не записва в redo само промяната си, а целия блок, както е бил в началото. Така за всеки блок имаме началното му състояние и всички последващи промени.

Елементарно, нали? Само трябва да се сетиш… 🙂

Сега, много години по-късно, този механизъм още работи. Вече има rman, който сам се грижи за четенето. Той си знае как е устроена всякак БД и чете блоковете на една IO операция. Така няма нужда от тези хватки за допълнително redo. Но все още разполагаме и с alter tablespace ... begin backup. Въпрос на избор.

 Posted by at 20:48