۱۸ فرستنده دما آفلاین شدند: تحلیل علت اصلی خرابی مولتیپلکسر دما و توقف کارخانه

زمینه حادثه: وقتی ۳۶ برچسب دما صفر را نشان دادند
خرابی مبدل دما یکی از سناریوهای خطای بسیار مخرب در کارخانههای فرآیندی است. زمانی که ۱۸ برچسب فرستنده دما به طور همزمان روی نمایشگر PLC به ۰ درجه سانتیگراد افت کردند، تیم عملیات ابتدا آن را به عنوان یک خطای محلی در ابزار دقیق تلقی کرد. با این حال، همین الگوی خرابی به صورت متناوب به مدت دو روز قبل از دائمی شدن رخ داده بود. این مقاله رویداد را بازسازی میکند، زنجیره خرابی را تحلیل میکند و اقدامات اصلاحی که از وقوع حادثه ایمنی جدیتر جلوگیری کردند را شناسایی میکند.
کارخانه از ماژولهای مبدل دمای Phoenix Contact برای تجمیع سیگنالهای RTD و ترموکوپل از چندین ابزار میدانی قبل از ارسال دادهها به PLC استفاده میکرد. هر واحد MUX مسئول ۱۸ برچسب دما بود. پلتفرم کنترل — یک Honeywell Safety Manager SC S300 SIL3 Safety Controller — این ورودیها را برای نظارت فرآیند و منطق خاموشی حفاظتی پردازش میکرد.
ابتدا معماری را درک کنید: مبدل دما یک ترمینال ساده نیست. این دستگاه سیگنالهای آنالوگ را شرایطی میکند، تبدیل انجام میدهد و از طریق یک فیلدباس دیجیتال با PLC ارتباط برقرار میکند. خطا در هر نقطه از MUX باعث اختلال همزمان در هر ۱۸ کانال میشود.
فاز ۱: خطاهای متناوب نشانه مشکل در حال توسعه
دو روز قبل از خاموشی، اپراتورها متوجه شدند که ۱۸ برچسب دما به طور متناوب برای چند ثانیه ۰ درجه سانتیگراد را نشان میدهند و سپس به حالت عادی بازمیگردند. تیم عملیات این رویدادها را ثبت کرد اما در حالی که منتظر بررسی تیم ابزار دقیق بود، عملیات عادی را ادامه داد. این تأخیر اولین نقطه تصمیمگیری بحرانی بود.
خطاهای متناوب در واحد MUX نشاندهنده تخریب داخلی سختافزار است — معمولاً منبع تغذیه در حال خرابی، اتصال شل در بکپلین یا ناپایداری در حال توسعه در نرمافزار داخلی. هر رویداد متناوب پیشدرآمد خرابی کامل است، نه یک اشکال بیضرر.
علاوه بر این، ۱۸ اسلات همان برچسبها به دلیل یک مشکل جداگانه قبلی نیز در حال حاضر ۰ درجه سانتیگراد را نشان میدادند. وقتی MUX منطقه ۱ وارد حالت خطای مداوم شد، تعداد کل برچسبهای صفرخوان به ۳۶ رسید. این حجم از خوانشهای خراب توانایی اپراتور را برای تشخیص هشدارهای واقعی فرآیند از نویز ابزار دقیق تحت تأثیر قرار داد.
فاز ۲: بررسی میدانی و تشخیص LED قرمز
مهندس ابزار دقیق مجوز کار گرفت و به MUX دمای منطقه ۱ رفت. MUX روشن بود اما LED خطای قرمز روشن بود. راهاندازی مجدد برق خطا را پاک نکرد — LED قرمز بلافاصله پس از راهاندازی مجدد بازگشت. روشن ماندن LED خطا پس از قطع و وصل برق نشاندهنده خرابی سختافزاری داخلی است نه تایماوت ارتباطی.
- گام ۱: ولتاژ منبع تغذیه DC را در ترمینالهای ورودی MUX بررسی کنید. ولتاژ پایین باعث عملکرد ناپایدار و پرچمهای خطای مداوم میشود.
- گام ۲: جایگیری ماژول را بررسی کنید. شل شدن اتصالهای بکپلین ناشی از لرزش یکی از دلایل متداول از دست رفتن سیگنال متناوب در ماژولهای چندکاناله است.
- گام ۳: LEDهای تشخیصی MUX را با جدول کد خطای سازنده مقایسه کنید. ماژولهای Phoenix Contact از الگوهای LED برای رمزگذاری دستههای خاص خطا از جمله خرابی برق و خطاهای پردازنده داخلی استفاده میکنند.
- گام ۴: قبل از اعلام خرابی ماژول، تلاش کنید با دکمه ریست سختافزاری ماژول، ریست نرمافزاری انجام دهید.
در این مورد، MUX در هر چهار مرحله شکست خورد. تیم به درستی آن را خراب اعلام کرد و یک واحد یدکی پیشپیکربندی شده از انبار برداشت.
فاز ۳: اثر زنجیرهای — خرابی MUX منطقه ۲ هنگام تعویض
در حالی که مهندس در حال تعویض MUX منطقه ۱ بود، MUX دمای منطقه ۲ نیز همه ۱۸ برچسب خود را به ۰ درجه سانتیگراد کاهش داد. مهندس به سرعت به منطقه ۲ رفت. همه نشانگرهای تشخیصی MUX منطقه ۲ طبیعی به نظر میرسیدند. خاموش و روشن کردن واحد باعث بازیابی فوری برچسبهای منطقه ۲ شد.
این مهمترین مشاهده در حادثه است. MUX منطقه ۲ پس از یک راهاندازی مجدد ساده خود را بازیابی کرد در حالی که منطقه ۱ نیاز به تعویض سختافزار داشت. خرابی تقریباً همزمان هر دو واحد نشاندهنده یک علت مشترک بالادستی است — احتمالاً منبع تغذیه مشترک یا رویداد شبکهای که هر دو واحد را همزمان تحت فشار قرار داده است.
بنابراین، بررسی باید منبع تغذیه مشترک هر دو کابینت MUX را پیگیری کند و پایداری ولتاژ را تحت بار کامل تأیید کند. منبع تغذیه با تنظیم ضعیف ممکن است در بار سبک ولتاژ کافی ارائه دهد اما در بار کامل افت کند و شرایط خطا را در چندین ماژول همزمان ایجاد کند.
ماژول کنترل ایمنی Honeywell S300 FC-SCNT01 همه ۳۶ خوانش صفر همزمان را به عنوان شرایط دمای پایین واقعی پردازش کرد. این منطق حفاظتی را فعال کرد و توالی خاموشی کارخانه را آغاز نمود. سیستم ایمنی به درستی عمل کرد — به دادههای دریافتی پاسخ داد. خطا در لایه ابزار دقیق بود، نه سیستم ایمنی.
اقدامات پیشگیرانه و بهروزرسانی پروتکلها
- گام ۱: خطاهای متناوب MUX را به عنوان نشانه تخریب سختافزار در نظر بگیرید. تعویض را در اولین فرصت تعمیر و نگهداری برنامهریزی کنید، نه پس از وقوع خرابی کامل.
- گام ۲: واحدهای یدکی پیشپیکربندی شده برای هر نوع ماژول در سرویس نگه دارید. زمان پیکربندی در شرایط اضطراری باعث افزایش زمان توقف و خطر خطاهای پیکربندی میشود.
- گام ۳: خروجیهای تشخیصی MUX را به سیستم نظارت PLC اضافه کنید. اکثر مبدلهای مدرن Phoenix Contact سیگنال وضعیت سلامت ارائه میدهند که PLC میتواند آن را مانیتور و قبل از خرابی کامل هشدار دهد.
- گام ۴: کیفیت منبع تغذیه کابینتهای MUX را سالانه بررسی کنید. ولتاژ را تحت بار کامل اندازهگیری و سطح ریپل را با مشخصات ورودی سازنده مقایسه کنید.
- گام ۵: اعتبارسنجی ورودی PLC را طوری تنظیم کنید که انتقال ناگهانی و گسترده به صفر در یک MUX را تشخیص دهد. این الگو نشاندهنده خرابی ابزار دقیق است و باید هشدار متفاوتی نسبت به هشدارهای واقعی دمای پایین فرآیند ایجاد کند تا اپراتورها قبل از اقدام، زمینه واضحی داشته باشند.
در نهایت، پس از هر دوره تعمیر و نگهداری، موجودی واحدهای یدکی را با پایگاه نصب شده فعلی تطبیق دهید. بازنگریهای سختافزاری ماژول ممکن است نیاز به بهروزرسانی نرمافزار داشته باشند تا واحد یدکی بتواند بدون ایجاد خطاهای ارتباطی جایگزین واحد نصب شده نسل فعلی شود.
نتیجهگیری و توصیههای عملی
خرابی مبدلهای دما به سرعت به خاموشی کارخانه منجر میشود وقتی ورودیهای چندین حسگر روی ماژولهای سختافزاری واحد متمرکز شوند. این حادثه نشان میدهد که خطاهای متناوب هشدارهای قابل اعتمادی از خرابی قریبالوقوع سختافزار هستند. تیمهای ابزار دقیق باید به اولین رویداد متناوب با تعویض سختافزار پاسخ دهند، نه ادامه مشاهده. واحدهای یدکی پیشپیکربندی شده، نظارت سلامت MUX در سطح PLC و بررسیهای دورهای منبع تغذیه سه اقدام پیشگیرانه مؤثر در برابر این نوع خرابی هستند. بازبینی معماری توزیع برق مشترک بین چندین واحد MUX پس از هر رویداد خطای همزمان چند واحد ضروری است.
نویسنده: لیو ویچنگ، مهندس اتوماسیون صنعتی با بیش از ۱۰ سال تجربه در PLC، DCS و سیستمهای کنترل.
