18 temperatūras raidītāji pārstāj darboties: temperatūras multipleksera bojājuma un rūpnīcas apstāšanās pamatcēloņu analīze

18 Temperature Transmitters Go Offline: Root Cause Analysis of a Temperature Multiplexer Failure and Plant Shutdown

Negadījuma fons: Kad 36 temperatūras tagi rādīja nulli

Temperatūras multipleksera kļūme ir viena no visvairāk traucējošajām kļūmju situācijām procesrūpnīcās. Kad 18 temperatūras raidītāju tagi vienlaikus uz PLC displeja nokrita līdz 0°C, operāciju komanda sākotnēji to uzskatīja par lokālu instrumentācijas kļūmi. Tomēr tā pati kļūmes shēma bija bijusi periodiska divas dienas pirms kļūšanas par pastāvīgu. Šis raksts rekonstruē notikumu, analizē kļūmju ķēdi un identificē korektīvās darbības, kas novērsa nopietnāka drošības incidenta rašanos.

Rūpnīca izmantoja Phoenix Contact temperatūras multipleksera moduļus, lai apkopotu RTD un termopāru signālus no vairākiem lauka instrumentiem pirms datu pārraides uz PLC. Katrs MUX bloks apstrādāja 18 temperatūras tagus. Vadības platforma — Honeywell Safety Manager SC S300 SIL3 drošības kontrolieris — apstrādāja šos ieejas datus procesa uzraudzībai un aizsardzības izslēgšanas loģikai.

Vispirms saprotiet arhitektūru: temperatūras MUX nav vienkārša terminālu bloks. Tas apstrādā analogo signālu, veic konversiju un sazinās ar PLC pa digitālo lauka autobusu. Kļūme jebkurā MUX vietā traucē visus 18 kanālus vienlaikus.

1. fāze: Periodiskas kļūmes signalizē attīstības problēmu

Divas dienas pirms izslēgšanas operatori pamanīja, ka 18 temperatūras tagi periodiski dažas sekundes rāda 0°C, pēc tam atgriežas normālā stāvoklī. Operāciju komanda reģistrēja šos notikumus, bet turpināja normālu darbību, gaidot instrumentācijas komandas izmeklēšanu. Šī kavēšanās bija pirmais kritiskais lēmuma punkts.

Periodiskas kļūmes MUX blokā norāda uz iekšējo aparatūras degradāciju — parasti bojātu barošanas avotu, vaļīgu atpakaļplāksnes savienotāju vai attīstāmu programmaparatūras nestabilitāti. Katrs periodisks notikums ir priekšvēstnesis pilnīgai kļūmei, nevis nekaitīgs traucējums.

Turklāt 18 no tiem pašiem tagu slotiem jau rādīja 0°C sakarā ar atsevišķu iepriekšēju problēmu. Kad 1. zonas MUX pārgāja nepārtrauktā kļūmes režīmā, kopējais nulles rādījumu tagu skaits pieauga līdz 36. Šāds kļūmju apjoms pārslogoja operatora spēju atšķirt patiesus procesa trauksmes signālus no instrumentācijas trokšņa.

2. fāze: Lauka izmeklēšana un sarkanās LED diagnostika

Instrumentācijas inženieris saņēma darba atļauju un devās pie 1. zonas temperatūras MUX. MUX bija ieslēgts, bet sarkanā kļūmes LED bija iedegusies. Barošanas pārstartēšana neatbrīvoja no kļūmes — sarkanā LED atkal iedegās tūlīt pēc restartēšanas. Pastāvīga kļūmes LED, kas saglabājas pēc barošanas pārslēgšanas, norāda uz iekšēju aparatūras bojājumu, nevis komunikācijas laika pārsniegumu.

  • 1. solis: Pārbaudīt DC barošanas spriegumu MUX ieejas termināļos. Zems spriegums izraisa nestabilu darbību un pastāvīgas kļūmes signālus.
  • 2. solis: Pārbaudīt moduļa pieslēgumu. Vibrācijas radīta vaļīguma atpakaļplāksnes savienotājos bieži izraisa periodisku signāla zudumu daudzkanālu moduļos.
  • 3. solis: Nolasīt MUX diagnostikas LED saskaņā ar ražotāja kļūdu kodu tabulu. Phoenix Contact moduļi izmanto LED rakstus, lai kodētu specifiskas kļūdu kategorijas, tostarp barošanas kļūmes un iekšējas procesora kļūdas.
  • 4. solis: Mēģināt programmaparatūras līmeņa atiestatīšanu, izmantojot moduļa aparatūras atiestatīšanas pogu, pirms pasludināt moduli par bojātu.

Šajā gadījumā MUX neizturēja visus četrus pārbaudījumus. Komanda pareizi pasludināja to par bojātu un paņēma iepriekš konfigurētu rezerves vienību no noliktavas.

3. fāze: Kaskāde — 2. zonas MUX kļūme nomaiņas laikā

Kamēr inženieris nomainīja 1. zonas MUX, arī 2. zonas temperatūras MUX nokritās ar visiem 18 tagiem uz 0°C. Inženieris steidzās uz 2. zonu. Visi diagnostikas indikatori 2. zonas MUX izskatījās normāli. Izslēdzot un atkal ieslēdzot vienību, 2. zonas tagi tūlīt atjaunojās.

Šī ir vissvarīgākā novērojuma daļa incidentā. 2. zonas MUX atjaunojās pēc vienkāršas pārstartēšanas, kamēr 1. zona prasīja aparatūras nomaiņu. Abas vienības gandrīz vienlaicīgā kļūme norāda uz kopīgu augšupējā līmeņa cēloni — visdrīzāk kopīgu barošanas avotu vai tīkla notikumu, kas vienlaikus ietekmēja abas vienības.

Tāpēc izmeklēšanai jāizseko kopīgais barošanas avots, kas baro abus MUX skapjus, un jāverificē sprieguma stabilitāte pilnā slodzē. Barošanas avots ar marginālu regulāciju var nodrošināt pietiekamu spriegumu pie vieglas slodzes, bet krist pilnā slodzē, izraisot kļūmes nosacījumus vairākos moduļos vienlaikus.

Honeywell S300 FC-SCNT01 drošības kontroliera modulis apstrādāja visus 36 vienlaicīgos nulles rādījumus kā patiesus zemas temperatūras apstākļus. Tas izraisīja aizsardzības loģiku un uzsāka rūpnīcas izslēgšanas secību. Drošības sistēma darbojās pareizi — tā reaģēja uz saņemtajiem datiem. Kļūme bija instrumentācijas līmenī, nevis drošības sistēmā.

Preventīvie pasākumi un protokolu atjauninājumi

  • 1. solis: Apstrādāt periodiskas MUX kļūmes kā aparatūras degradācijas gadījumus. Plānot nomaiņu nākamajā pieejamajā apkopes logā, nevis pēc pilnīgas kļūmes.
  • 2. solis: Uzturēt iepriekš konfigurētas rezerves MUX vienības katram moduļa tipam servisā. Konfigurācijas laiks ārkārtas situācijā palielina dīkstāves laiku un nepareizas konfigurācijas risku.
  • 3. solis: Pievienot MUX diagnostikas izvades PLC uzraudzības sistēmai. Lielākā daļa mūsdienu Phoenix Contact multiplekseru nodrošina veselības statusa signālu, ko PLC var uzraudzīt un izsaukt trauksmi pirms pilnīgas kļūmes.
  • 4. solis: Veikt barošanas avotu kvalitātes auditu MUX skapjiem reizi gadā. Mērīt spriegumu pilnā slodzē un pārbaudīt viļņošanās līmeni pret ražotāja ieejas specifikāciju.
  • 5. solis: Konfigurēt PLC ieejas validāciju, lai atklātu pēkšņas masveida pārejas uz nulli vienā MUX. Šis modelis norāda uz instrumentācijas kļūmi un jāizsauc cita trauksmes klase nekā patiesām procesa zemas temperatūras trauksmēm, dodot operatoriem skaidru kontekstu pirms rīcības.

Visbeidzot, pēc katras apkopes pārbaudīt rezerves vienību krājumus pret pašreizējo uzstādīto bāzi. Moduļu aparatūras revīzijas var prasīt programmaparatūras atjauninājumus, lai rezerves vienība varētu aizstāt pašreizējās paaudzes uzstādīto vienību bez komunikācijas kļūdām.

Nobeigums un rīcības ieteikumi

Temperatūras multipleksera kļūmes ātri noved pie rūpnīcas izslēgšanas, ja daudzi sensora ieejas koncentrējas uz vienu aparatūras moduli. Šis incidents rāda, ka periodiskas kļūmes ir uzticamas brīdinājuma zīmes par tuvojošos aparatūras bojājumu. Instrumentācijas komandas jāreaģē uz pirmo periodisko notikumu ar aparatūras nomaiņu, nevis turpinātu novērošanu. Iepriekš konfigurētas rezerves vienības, PLC līmeņa MUX veselības uzraudzība un periodiskas barošanas avotu pārbaudes ir trīs efektīvākie preventīvie pasākumi pret šo kļūmes veidu. Pēc jebkuras vienlaicīgas vairāku vienību kļūmes ir būtiski pārskatīt barošanas sadales arhitektūru, ko koplieto vairāki MUX bloki.

Autors: Liu Weicheng ir rūpnieciskās automatizācijas inženieris ar vairāk nekā 10 gadu pieredzi PLC, DCS un vadības sistēmās.

Parādīt visu
Emuāra ziņas
Parādīt visu
Batch Sequence Control Using DCS Sequential Function Charts: Emerson DeltaV SFC Configuration and Woodward EasyGen 3200 Synchronization Interlock

Partiju secības vadība, izmantojot DCS secīgo funkciju diagrammas: Emerson DeltaV SFC konfigurācija un Woodward EasyGen 3200 sinhronizācijas bloķēšana

Partiju procesa vadība, izmantojot formālas IEC 61131-3 secīgās funkciju shēmas (SFC) struktūras Emerson DeltaV sistēmā, novērš stāvokļu mašīnu iestrēgšanu un vienkāršo ISA-88 audita atbilstību. Šis ceļvedis aptver DeltaV fāzes loģikas SFC projektēšanas principus, Woodward EasyGen 3200 Modbus TCP reģistru kartēšanu ģeneratora sinhronizācijas bloķēšanai, turēšanas un pārtraukšanas ceļu izstrādi, kā arī četru visbiežāk sastopamo SFC partiju kļūdu modeļu diagnostiku.
Foundation Fieldbus H1: Segment Design and Commissioning

Foundation Fieldbus H1: segmenta izstrāde un nodošana ekspluatācijā

Foundation Fieldbus H1 veic vadības funkciju blokus lauka ierīcēs, nodrošinot vadību pat tad, ja pārraide ar centrālo sistēmu pārtrūkst — tas ir būtisks ieguvums SIL-2 un SIL-3 cilpām. Šis ceļvedis aptver FF H1 jaudas budžeta aprēķinu, sprieguma krituma analīzi, mīkstas palaišanas strāvas aizsardzību, piecu soļu nodošanas ekspluatācijā procedūru, funkciju bloku plānošanu un sistemātisku kļūdu diagnostiku segmenta bojājumu, periodisku ierīču izslēgšanos un terminācijas pretestības kļūdu gadījumos.
PROFINET IO Communication Fault Diagnosis: ABB AC500 CM575-PNIO and Phoenix Contact AXL F DI16 Field Troubleshooting

PROFINET IO komunikācijas kļūdu diagnostika: ABB AC500 CM575-PNIO un Phoenix Contact AXL F DI16 lauka problēmu novēršana

PROFINET IO komunikācijas kļūmes starp ABB AC500 CM575-PNIO un Phoenix Contact Axioline F izkliedētās I/O sistēmas ir biežs neplānotu dīkstāves iemesls. Šis ceļvedis aptver fiziskā slāņa kabeļu pārbaudes, GSDML versijas pārbaudi, ierīces nosaukuma konfliktu risināšanu, AR uzraudzības pielāgošanu un sešu soļu kļūdu izolācijas procedūru, izmantojot DIAG_STATUS reģistra bitu kartēšanu un kanālu diagnostikas trauksmes.