SCADA-Leistungsabfall beim Schichtwechsel: Diagnose des gleichzeitigen Lastanstiegs bei GE HMI und Honeywell Experion

Das Symptom: SCADA friert nur während der Schichtübergabe ein
Bediener berichten, dass das SCADA-System während des Schichtwechsels nicht mehr reagiert. Grafikseiten laden langsam. Alarmbestätigungen dauern 5–10 Sekunden. Tag-Werte frieren kurzzeitig auf Trendanzeigen ein. Die SPS läuft normal weiter. Feldgeräte zeigen korrekte Werte an. Das Einfrieren löst sich nach 15–20 Minuten von selbst auf.
Dieses Muster deutet auf eine serverseitige Lastspitze hin, nicht auf ein Kommunikationsproblem im Feld. Das GE HMI Proficy iFIX-System und Honeywell Experion PKS erleben dieses Problem, wenn mehrere Ereignisse am Schichtübergang zusammenfallen. Das Verständnis jedes Ereignisses hilft, die Hauptursache zu isolieren.
Ursache 1: Gleichzeitiger Neustart der Arbeitsstation und erneute Tag-Abonnements
Beim Schichtwechsel schließt der abgehende Bediener die SCADA-Anwendung. Der kommende Bediener startet sie neu. Bei GE HMI Proficy iFIX löst jeder Neustart einer Arbeitsstation einen vollständigen Tag-Abonnement-Download vom SCADA-Server aus. Wenn 8 Arbeitsstationen innerhalb von 2 Minuten neu starten, verarbeitet der Server 8 gleichzeitige Abonnementanfragen.
Jedes Abonnement umfasst Datenbankabfrage, Tag-Suche und Einrichtung der Echtzeit-Datenweiterleitung. Der GE Proficy Cim-Manager-Dienst bearbeitet diese Anfragen. Unter hoher Last überschreitet die Warteschlangentiefe das Pufferlimit. Neue Abonnementanfragen warten in der Warteschlange. Die Verzögerung zeigt sich als langsames Laden der Grafiken auf der Client-Seite.
Abhilfe: Konfigurieren Sie die Arbeitsstationen so, dass sie die Anwendung fortsetzen, anstatt vollständig neu zu starten. In Proficy iFIX aktivieren Sie die Auto-Resume-Option in den iFIX-Arbeitsbereichseigenschaften. Dadurch werden bestehende Tag-Abonnements wiederverwendet, anstatt sie neu aufzubauen. Die Startzeit sinkt von 45 Sekunden auf unter 10 Sekunden.
Ursache 2: Alarmbestätigungs-Burst und Datenbank-Schreibsturm
Während der Übergabe bestätigt der abgehende Bediener angesammelte Alarme. Eine typische Schicht erzeugt 200–400 Alarmereignisse. Wenn 80 % davon unbestätigt bleiben, bestätigt der kommende Bediener sie in einem Batch. Jede Bestätigung erzeugt eine Datenbanktransaktion, die Bedienernamen, Zeitstempel, Alarm-ID und Kommentar aufzeichnet.
Im Honeywell Experion PKS werden Alarmereignisse in die Alarmdatenbank (ADB) geschrieben. Jeder Schreibvorgang erfordert ein Index-Update. Unter Burst-Last wächst die Index-Update-Warteschlange schneller, als die Festplatten-I/O sie verarbeiten kann. Der Experion Alarm Server reagiert mit erhöhter Latenz. Alarm-Pop-ups erscheinen mit 3–5 Sekunden Verzögerung. Unsere Honeywell Controller-Modulkarten und C300 Systemkomponenten sind darauf ausgelegt, unter diesen Lastbedingungen Stabilität zu gewährleisten.
Bei GE Proficy iFIX schreiben Alarmbestätigungen über das SCU (System Configuration Utility) in die historische Datenbank. Befindet sich der Historian auf demselben Server, verschärft sich die Festplatten-I/O-Konkurrenz. Der Proficy Process Historian kann in diesem Zeitraum Datenverluste erleiden.
Abhilfe: Aktivieren Sie das Alarm-Shelving für Alarme mit niedriger Priorität vor Schichtende. In Experion PKS konfigurieren Sie die Alarm-Shelving-Funktion im Alarm-Konfigurationstab. Legen Sie bis zu 50 % der unbestätigten Alarme mit niedriger Priorität auf „Shelved“. Dies reduziert den Bestätigungs-Burst, indem nicht-kritische Ereignisse eliminiert werden.
Ursache 3: Automatische Schichtberichtserstellung und Abfrageüberlastung
Sowohl GE als auch Honeywell SCADA-Plattformen unterstützen die automatische Berichtserstellung zu geplanten Zeiten. Übliche Schichtberichte umfassen Produktionsmengen, Stillstandszeiten, Alarmstatistiken und Energieverbrauch. Diese Berichte fragen die historische Datenbank für Tausende von Datenpunkten ab.
Wenn die Berichtserstellungs-Engine auf dem SCADA-Server läuft, konkurriert sie um CPU- und Festplattenressourcen mit den Echtzeitprozessen. Eine typische Schichtbericht-Abfrage im GE Proficy Process Historian dauert 8–12 Sekunden. In diesem Zeitraum hat der SCADA-Server eine reduzierte Kapazität für Tag-Updates und Alarmverarbeitung.
Im Honeywell Experion PKS generiert die Reports Workstation Berichte über den Experion Reports Server. Teilt die Reports Workstation denselben Server mit dem Experion Application Server, verschlechtert die Abfragelast die Echtzeit-Performance. Der Server Health Monitor zeigt CPU-Auslastungen von 85–95 % während der Berichtserstellung.
Abhilfe: Planen Sie Schichtberichte so, dass sie 10 Minuten nach Schichtwechsel laufen, nicht genau zur Übergabezeit. Dadurch wird die Berichtabfrage vom Alarmbestätigungs-Burst entkoppelt. Überprüfen Sie den Zeitplan im Experion Report Designer oder im Proficy Process Historian Bericht-Planer.
Schritt-für-Schritt-Diagnoseverfahren
Wenn das Einfrieren auftritt, sammeln Sie sofort Diagnosedaten. Warten Sie nicht bis zur nächsten Schicht.
- Schritt 1: Öffnen Sie den Windows Task-Manager auf dem SCADA-Server. Notieren Sie CPU-Auslastung, Speichernutzung und Festplatten-Warteschlangenlänge. Ermitteln Sie, ob der Engpass CPU, RAM oder Festplatten-I/O ist.
- Schritt 2: Prüfen Sie den Windows Ereignisanzeige auf Datenbank-Schreibfehler oder Dienstzeitüberschreitungen. Suchen Sie nach Ereignis-ID 833 (Datenbanklatenz überschritten) in den Experion-Protokollen oder Ereignis-ID 4096 in Proficy iFIX-Protokollen.
- Schritt 3: Überprüfen Sie die Anzahl der SCADA-Tag-Abonnements. In Experion PKS verwenden Sie den Station Manager, um aktive Abonnementstatistiken anzuzeigen. In GE Proficy iFIX prüfen Sie die Cim-Manager-Warteschlangentiefe im Systemdiagnosebildschirm.
- Schritt 4: Untersuchen Sie das Alarmlog auf das Burst-Muster. Zählen Sie die Anzahl der Alarmbestätigungen innerhalb eines 5-Minuten-Fensters um den Schichtwechsel. Überschreitet die Anzahl 50 pro Minute, ist der Datenbank-Schreibsturm die Hauptursache.
- Schritt 5: Prüfen Sie den Zeitplan der Berichtserstellung. Suchen Sie nach Berichten, die zum Schichtwechsel starten. Verschieben Sie die Startzeit um 10–15 Minuten, um Überschneidungen zu reduzieren.
Fazit und Handlungsempfehlung
Der Leistungseinbruch des SCADA-Systems beim Schichtwechsel resultiert aus drei gleichzeitigen Ereignissen. Erstens starten Arbeitsstationen neu und abonnieren alle Tags gleichzeitig neu. Zweitens bestätigen Bediener angesammelte Alarme in Batches, was einen Datenbank-Schreibsturm erzeugt. Drittens fragen automatische Schichtberichte die historische Datenbank zur Spitzenlastzeit ab.
Bei GE HMI Proficy iFIX aktivieren Sie Auto-Resume, um vollständige Abonnement-Neuaufbauten zu vermeiden. Bei Honeywell Experion PKS aktivieren Sie Alarm-Shelving und verschieben Sie Berichte 10 Minuten nach Schichtwechsel. Beide Plattformen profitieren davon, die historische Datenbank auf einen dedizierten Server auszulagern. So werden Echtzeit-Tag-Verarbeitung und Berichtabfragen getrennt. Zuverlässige Honeywell I/O-Module gewährleisten die Integrität der Felddaten auch bei serverseitigen Lastspitzen.
Dokumentieren Sie die Diagnoseergebnisse im CMMS der Anlage. Erstellen Sie eine Schichtwechsel-Leistungsprozedur, die die drei Lastereignisse über ein 30-Minuten-Fenster verteilt. Überwachen Sie die Ergebnisse zwei Wochen lang. Überschreitet die CPU-Auslastung beim Schichtwechsel weiterhin 80 %, ziehen Sie ein Upgrade des SCADA-Servers oder die Hinzunahme eines zweiten Servers zur Lastverteilung in Betracht.
