Kesinti, sahada tek bir rölenin susması kadar sıradan başlayabilir. Sonra alarm yağar, veri akışı durur, karar alma gecikir. Enerji, su, atıksu, petrol ve gaz, ulaşım gibi sektörlerde bu gecikme, gerçek dünyada maliyete dönüşür. İşte tam burada yedeklilik devreye girer. Çift SCADA sunucusu, çift RTU ve çift SIM kullanan bir mimari, hot standby, failover ve yüksek erişilebilirlik ile veriyi ve kontrolü ayakta tutar. Amaç net, operasyon dursun istemeyiz, veri kaybı yaşanmasın ve felaket kurtarma planı her zaman hazır olsun.
Bu yazıda, bu mimarinin temel yapı taşlarını ve pratik uygulama noktalarını sade ve odaklı şekilde ele alıyoruz. Sahadan merkeze, donanımdan bağlantıya kadar, yüksek erişilebilirlik kültürünü kurmanın yolunu anlatıyoruz.
Yüksek erişilebilirlik neden kritik? Riskler, maliyet ve hedefler
SCADA ortamında duruş yalnızca ekranın kararması değildir. Pompa durabilir, vana yanlış konumda kalabilir, alarmlar gecikebilir. Bu da üretim kaybı, çevreye deşarj riski, güvenlik açıkları ve regülasyon ihlalleri anlamına gelir. Su dağıtımında basınç kaybı, trafo merkezinde kontrolsüz açma kapama, boru hattında geç fark edilen sızıntı gibi senaryolar kısa sürede büyür.
Uptime yüzdesi, iş etkisini basitçe gösterir. 99,95 ile 99,999 arasındaki fark, yıl sonunda günlere değil dakikalara yansır.
| Uptime yüzdesi | Yıllık tahmini kesinti |
| 99,95 | Yaklaşık 4 saat 22 dakika |
| 99,99 | Yaklaşık 52 dakika |
| 99,999 | Yaklaşık 5 dakika |
RTO, sistemin kabul edilebilir maksimum toparlanma süresidir. RPO, kabul edilebilir maksimum veri kaybı aralığıdır. SCADA özelinde RTO dakikalarla, RPO ise saniyelerle ifade edilmelidir. Çünkü alarm ve olay verilerinin zaman damgalı olması ve geri gönderim sırasında tutarlı kalması gerekir. Güvenlik de ayrı bir başlık, özellikle kritik altyapılarda yanlış veri, yanlış komut kadar tehlikelidir. Çevresel ve uyumluluk riskleri, raporlanabilir veri ve arşiv sürekliliği ile kontrol altına alınır.
Bu nedenle hedefler net olmalı: yüksek erişilebilirlik, güvenilir failover, tutarlı veri, hızlı felaket kurtarma. Yedeklilik bir seçenek değil, sürdürülebilir operasyonun temeli.
Çift SCADA sunucusu: hot standby ve hızlı failover tasarımı
İki SCADA sunucusunu düşünün, biri aktif, diğeri hot standby. Aktif sunucu çalışır, tüm oturumları taşır, alarmları üretir. Standby sunucu aynı veritabanını, alarm durumunu ve kullanıcı oturumlarını senkron tutar. Aktif sunucu düşerse, failover otomatik ve hızlı gerçekleşir. Hedef, operatörün durumu fark etmeden işine devam etmesidir.
Bu tasarımın kritik bileşenleri:
- Heartbeat: Sunucular birbirini düzenli aralıklarla yoklar. Paket kaybı, gecikme ve eşik değerler iyi ayarlanır.
- Quorum: Çoklu düğümde karar, çoğunlukla alınır. Tek taraflı kararları önler.
- Split-brain önleme: Ağ bölünmesinde iki aktif sunucu olmasını engeller. Tanık düğüm veya tie-breaker kullanılır.
- Veritabanı replikasyonu: Senkron veya yarı senkron replikasyon ile veri güncel kalır. RPO hedefi burada belirleyicidir.
- Oturum ve alarm senkronu: Operatör ekranları, alarm akışı, acknowledgment bilgileri uyumlu kalmalıdır.
Test ve bakım sırasında riskleri azaltmak için:
- Planlı failover tatbikatları yapın, gözlemi otomatik raporla birleştirin.
- Yazılım güncellemelerini kademeli uygulayın, önce standby, sonra aktif.
- Yedekleme ve geri yükleme senaryolarını düzenli çalıştırın.
Güvenlik tarafında rol tabanlı erişim, çok faktörlü kimlik doğrulama ve ağ segmentasyonu temel ihtiyaçtır. Lisans yönetiminde çift düğüm için HA lisans modeli ve aktivasyon kuralları önceden netleştirilmelidir.
SCADA ve RTU kavramlarını hızlı hatırlamak için, şu rehber faydalı bir özet sunar: RTU nedir ve nasıl çalışır SCADA ile.
Çift RTU ile saha güvenliği: güvenilir IO ve kontrol
Saha kontrolünün kalbi RTU cihazlarıdır. Yedekli RTU mimarisinde iki cihaz aynı IO’yu paylaşabilir. Biri aktif kontrolü yürütür, diğeri izler ve senkron kalır. Aktif cihaz arıza verirse, kontrol kesilmeden ikinci cihaz devreye geçer.
Nasıl işler?
- IO paylaşımı, aktif-pasif veya aktif-aktif olabilir. Çoğu SCADA ortamında aktif-pasif tercih edilir.
- Devreye alma sırasında birincil RTU lider seçilir. İkinci RTU pasif modda senkronudur.
- Arıza, watchdog sinyali, haberleşme kopması veya besleme düşümü ile tespit edilir.
- Zaman senkronu, NTP veya GPS ile sabitlenir. Olay ve trend verileri doğru zaman damgası ile tutulur.
Protokol desteği önemlidir. IEC 60870-5-104, DNP3, Modbus TCP, MQTT gibi protokoller hem merkez bağlantısı hem istasyonlar arası iletişim için seçilir. Çevresel dayanım, sıcaklık, EMC ve titreşim şartlarına uygun sınıfta cihazlar tercih edilmelidir.
Enerji yedekliliği ve saha kablolaması için iyi uygulamalar:
- Çift besleme hattı ve harici UPS kullanın.
- IO kablolarında ayrıştırma yapın, giriş ve çıkış gruplarını ayrı kanallara alın.
- Hat sonu terminasyon ve ekranlama kurallarına uyun.
- Watchdog röleleri ile güvenli duruş senaryosu tanımlayın.
Yedekliliği destekleyen RTU örneklerini incelemek isteyenler için, iki farklı ürün ailesi iyi bir referans sunar: DM100 RTU yedekli SCADA çözümü ve DM500 yedekli CPU modüllü RTU. Detaylı programlama ve protokol blokları için şu doküman pratik bir kaynak sağlar: Mikrodev DCS programlama kılavuzu.
Çift SIM ve çoklu bağlantı: kesintisiz veri iletişimi
Hücresel altyapıya bağlı sahalarda çift SIM büyük fark yaratır. İki operatör, tek hedef, bağlantı kopmadan devam. Temel mantık, birincil hat sağlıklı olduğu sürece onu kullanmak, tespit edilen sorunda otomatik olarak ikincile geçmektir.
Pratik ayarlar:
- Geçiş kuralları: Sinyal seviyesi, paket kaybı, RTT eşiği ve ardışık hata sayısı ile tetikleyin.
- Veri kotası: Aylık sınırı izleyin, ikame hattı devreye alma kuralı tanımlayın.
- Sağlık kontrolü: Keepalive ve periyodik ping ile gerçek uç noktaya test yapın.
Alternatif yol seçenekleri:
- Ethernet veya fiber, sahada mümkünde birincil yol olarak kullanılabilir.
- Endüstriyel radyo linkleri, kısa mesafede düşük gecikmeli yedek bağlantı sağlar.
- MPLS veya SD-WAN çözümleri, merkezi politikalar ile akıllı yönlendirme sunar.
Güvenlik başlıkları:
- Özel APN, hücresel ağda izolasyon sağlar.
- VPN tüneli, şifreleme ve kimlik doğrulama ile veriyi korur.
- Sertifika yönetimi ve cihaz kimliği, sahte erişimi engeller.
Hot standby ve failover kavramları yalnız sunucuya ait değildir, ağ katmanında da uygulanır.
Felaket kurtarma planı ve sürekli iyileştirme
Felaket kurtarma, tek bir belge değil, yaşayan bir süreçtir. Ama basit adımlarla yönetilebilir.
- Hedefleri belirleyin: RTO ve RPO değerlerini iş etkisine göre tanımlayın. Kritik alarmlar için RPO saniye, raporlama için dakika kabul edilebilir.
- Yedekleme stratejisi: Tam, artımlı ve sürekli yedek kombinasyonu kullanın. Yedekleri çevrim dışı ve coğrafi olarak ayrık tutun.
- İkincil merkeze geçiş: Runbook içinde adım adım yazın. DNS, bağlantı tünelleri, SCADA lisans taşınması, operatör erişimi ve geri dönüş planını dahil edin.
- Tatbikat: Planlı tatbikatları, sürpriz testler ile destekleyin. Sonuçları ölçün, RTO ve RPO sapmalarını kayıt altına alın.
- Gözlemleme ve kök neden analizi: Olay sonrası kalıcı düzeltici aksiyon üretin. Konfigürasyon yönetimi ve versiyonlama ile hataları tekrarlamayın.
- Dokümantasyon ve eğitim: Operatör, bakım ve ağ ekipleri için kısa, görsel ve rol bazlı yönergeler hazırlayın. Personel değiştiğinde bilgi kaybı yaşamayın.
- Değişiklik yönetimi: Her yama, cihaz değişimi veya mimari güncelleme, etki analizi ile geçsin. Onay ve rollback planı zorunlu olsun.
Bu döngü, yedeklilik kültürünü güçlendirir. Yüksek erişilebilirlik, yalnız ekipmanla değil, süreçle sürdürülebilir.
Sonuç
Çift SCADA sunucusu, çift RTU ve çift SIM birlikte kullanıldığında, sahadan merkeze kadar kontrolü ve veriyi ayakta tutan bir omurga kurulur. Hot standby, failover, yüksek erişilebilirlik ve felaket kurtarma disiplinleri tek çatı altında düşünülmelidir. Şimdi harekete geçin, hedeflerinizi netleştirin, riskleri sıralayın, küçük bir pilot ile test edin, sonra kademeli olarak genişletin. Sorunsuz değil, kontrollü ve ölçülebilir bir yolculuk planlayın. Paylaşmak istediğiniz bir senaryo varsa yorum olarak bırakın, birlikte netleştirelim.











