SCADA Teljesítményösszeomlás Műszakváltáskor: A GE HMI és a Honeywell Experion Egyidejű Terheléscsúcsának Diagnosztizálása

A tünet: A SCADA csak műszakváltáskor fagy le
Az üzemeltetők arról számolnak be, hogy a SCADA rendszer nem reagál műszakváltáskor. A grafikus oldalak lassan töltődnek be. A riasztások visszaigazolása 5–10 másodpercet vesz igénybe. A címkék értékei pillanatra megfagynak a trendkijelzőkön. A PLC továbbra is normálisan működik. A mezőműszerek helyes értékeket mutatnak. A lefagyás 15–20 perc után magától megszűnik.
Ez a minta szerveroldali terheléscsúcsra utal, nem pedig mezőkommunikációs problémára. A GE HMI Proficy iFIX és a Honeywell Experion PKS rendszerek is tapasztalják ezt a problémát, amikor több esemény ütközik a műszakhatárnál. Az egyes események megértése segít elkülöníteni a domináns okot.
Ok 1: Egyidejű munkaállomás újraindítás és címke újra-feliratkozás
Műszakváltáskor a távozó kezelő bezárja a SCADA alkalmazást. Az érkező kezelő frissen indítja el. A GE HMI Proficy iFIX esetén minden munkaállomás újraindítás teljes címkefeliratkozás letöltést indít a SCADA szerverről. Ha 8 munkaállomás indul újra 2 percen belül, a szerver 8 egyidejű feliratkozási kérelmet dolgoz fel.
Minden feliratkozás adatbázis-lekérdezést, címke-keresést és valós idejű adatirányítás beállítást foglal magában. A GE Proficy Cim-Manager szolgáltatás kezeli ezeket a kéréseket. Nagy terhelés alatt a várakozási sor mélysége meghaladja a pufferhatárt. Az új feliratkozási kérelmek a sorban várakoznak. A késés a kliens oldalon lassú grafikus betöltésként jelentkezik.
Megoldás: Állítsa be a munkaállomásokat, hogy alkalmazás folytatást használjanak teljes újraindítás helyett. A Proficy iFIX-ben állítsa be az Auto-Resume opciót az iFIX munkaterület tulajdonságainál. Ez újrahasznosítja a meglévő címkefeliratkozásokat a teljes újraépítés helyett. Az indítási idő 45 másodpercről 10 másodperc alá csökken.
Ok 2: Riasztás visszaigazolási roham és adatbázis írási vihar
Műszakváltáskor a távozó kezelő visszaigazolja az összegyűlt riasztásokat. Egy tipikus műszak 200–400 riasztási eseményt generál. Ha 80% marad visszaigazolás nélkül, az érkező kezelő egyben erősíti meg őket. Minden visszaigazolás adatbázis tranzakciót hoz létre, amely rögzíti a kezelő nevét, időbélyegét, riasztás azonosítóját és megjegyzést.
A Honeywell Experion PKS-ben a riasztási események az Alarm Database-be (ADB) íródnak. Minden írás indexfrissítést igényel. Rohamszerű terhelés alatt az indexfrissítési sor gyorsabban nő, mint ahogy a lemez I/O képes feldolgozni. Az Experion Alarm Server válasza késleltetett lesz. A riasztás felugró ablakok 3–5 másodperces késéssel jelennek meg. Honeywell vezérlőmodul kártyáink és C300 rendszerkomponenseink úgy vannak tervezve, hogy stabilitást biztosítsanak ezek alatt a terhelési körülmények között.
A GE Proficy iFIX-ben a riasztás visszaigazolások a történeti adatbázisba íródnak a SCU (System Configuration Utility) segítségével. Ha a történeti adatbázis ugyanazon a szerveren van, a lemez I/O versengés súlyosbodik. A Proficy Process Historian adatvesztést szenvedhet ebben az időablakban.
Megoldás: Engedélyezze az alacsony prioritású riasztások polcra helyezését a műszak vége előtt. Az Experion PKS-ben állítsa be a riasztás polcra helyezési funkciót az Alarm Configuration fülön. Tegye polcra az el nem ismert alacsony prioritású riasztások akár 50%-át. Ez csökkenti a visszaigazolási rohamot a nem kritikus események kizárásával.
Ok 3: Automatikus műszakjelentés generálás és lekérdezési túlterhelés
A GE és a Honeywell SCADA platformok is támogatják az automatikus jelentéskészítést ütemezett időpontokban. Gyakori műszakjelentések a termelési összesítők, leállási összefoglalók, riasztás statisztikák és energiafogyasztás. Ezek a jelentések több ezer adatpontot kérdeznek le a történeti adatbázisból.
Ha a jelentéskészítő motor a SCADA szerveren fut, CPU és lemez erőforrásokért verseng a valós idejű műveletekkel. Egy tipikus műszakjelentés lekérdezés a GE Proficy Process Historian-ben 8–12 másodpercig tart. Ez alatt az idő alatt a SCADA szerver csökkentett kapacitással dolgozik a címke frissítések és riasztás feldolgozás terén.
A Honeywell Experion PKS-ben a Reports Workstation készíti a jelentéseket az Experion Reports Server-en keresztül. Ha a Reports Workstation ugyanazon a szerveren van, mint az Experion Application Server, a lekérdezési terhelés rontja a valós idejű teljesítményt. A Server Health Monitor CPU használat 85–95%-os csúcsot mutat a jelentéskészítés alatt.
Megoldás: Ütemezze a műszakjelentéseket 10 perccel a műszakváltás utánra, ne pontosan a váltás időpontjára. Ez szétválasztja a jelentés lekérdezést a riasztás visszaigazolási rohamtól. Ellenőrizze az ütemezést az Experion Report Designer-ben vagy a Proficy Process Historian jelentésütemezőjében.
Lépésről lépésre diagnosztikai eljárás
A lefagyás bekövetkeztekor azonnal gyűjtsön diagnosztikai adatokat. Ne várjon a következő műszakig.
- 1. lépés: Nyissa meg a Windows Feladatkezelőt a SCADA szerveren. Jegyezze fel a CPU használatot, memóriahasználatot és a lemez várakozási sor hosszát. Azonosítsa, hogy a szűk keresztmetszet CPU, RAM vagy lemez I/O.
- 2. lépés: Ellenőrizze a Windows Eseménynézőt adatbázis írási hibák vagy szolgáltatás időtúllépések miatt. Keressen 833-as eseményazonosítót (adatbázis késleltetés túllépve) az Experion naplókban vagy 4096-os eseményazonosítót a Proficy iFIX naplókban.
- 3. lépés: Tekintse át a SCADA címke feliratkozások számát. Experion PKS-ben használja a Station Manager-t az aktív feliratkozási statisztikák megjelenítéséhez. GE Proficy iFIX-ben a System Diagnostics képernyőn ellenőrizze a Cim-Manager sor mélységét.
- 4. lépés: Vizsgálja meg a riasztásnaplót a roham mintázatért. Számolja meg a riasztás visszaigazolások számát egy 5 perces ablakban a műszakváltás körül. Ha az érték meghaladja az 50-et percenként, az adatbázis írási vihar a domináns ok.
- 5. lépés: Ellenőrizze a jelentéskészítés ütemezését. Keressen jelentéseket, amelyek műszakváltáskor indulnak. Tolja el az indítási időt 10–15 perccel a fedés csökkentése érdekében.
Következtetés és javaslatok
A SCADA teljesítmény összeomlása műszakváltáskor három egyidejű eseményből ered. Először, a munkaállomások újraindulnak és egyszerre iratkoznak fel az összes címkére. Másodszor, a kezelők csoportosan visszaigazolják az összegyűlt riasztásokat, ami adatbázis írási vihart generál. Harmadszor, az automatikus műszakjelentések a történeti adatbázist kérdezik le csúcsidőben.
A GE HMI Proficy iFIX-ben engedélyezze az Auto-Resume-t a teljes feliratkozás újraépítés elkerülésére. A Honeywell Experion PKS-ben engedélyezze a riasztás polcra helyezést és ütemezze át a jelentéseket 10 perccel a műszakváltás utánra. Mindkét platform profitál a történeti adatbázis dedikált szerverre helyezéséből. Ez elkülöníti a valós idejű címke feldolgozást a jelentés lekérdezési terhelésektől. Megbízható Honeywell I/O modulok biztosítják a mezőadatok integritását még szerveroldali terheléscsúcsok idején is.
Dokumentálja a diagnosztikai eredményeket a gyár CMMS rendszerében. Készítsen műszakváltási teljesítmény eljárást, amely a három terhelési eseményt 30 perces időablakra osztja szét. Figyelje az eredményeket két héten át. Ha a CPU használat továbbra is meghaladja a 80%-ot műszakváltáskor, fontolja meg a SCADA szerver frissítését vagy egy második szerver hozzáadását a terheléselosztáshoz.
