🔹 1) เฝ้าระวังระบบเครือข่ายและระบบสารสนเทศ (Monitoring)
ตรวจสอบสถานะการทำงานของระบบเครือข่าย (Network) และระบบเซิร์ฟเวอร์ (System) ตามรอบเวลาที่กำหนด
เฝ้าดูอุปกรณ์เครือข่าย เช่น Router, Switch, Firewall, CCTV , IPC และ อื่น ๆ
ตรวจสอบระบบ Server, VM, Cloud, Storage และบริการต่าง ๆ (Application, Database, Service)
🔹 2) ตรวจจับและแจ้งเตือนความผิดปกติ (Incident Detection)
ตรวจพบความผิดปกติ เช่น Network Down, Packet Loss, High Latency, CPU/RAM สูงผิดปกติ
ตรวจสอบ Alarm / Alert จากระบบ Monitoring Tools (เช่น Zabbix, PRTG, Nagios, SolarWinds)
วิเคราะห์เหตุการณ์เบื้องต้น และแจ้งเตือนทีมที่เกี่ยวข้องตามขั้นตอน (Escalation)
🔹 3) แก้ไขปัญหาเบื้องต้น (First-Level Support)
ดำเนินการแก้ไขปัญหาเบื้องต้นตาม SOP ที่กำหนด
Restart Service / Interface / Server ตามสิทธิ์ที่ได้รับ
ประสานงานกับ Network Engineer / System Engineer เมื่อพบปัญหาระดับสูง
🔹 4) บันทึกและจัดทำรายงาน (Logging & Reporting)
บันทึก Incident, Alarm, Downtime และการแก้ไขในระบบ Ticket / Log
จัดทำรายงานสถานะระบบประจำวัน / สัปดาห์ / เดือน
สรุปเหตุการณ์สำคัญ (Major Incident Report) เพื่อใช้วิเคราะห์และปรับปรุงระบบ
🔹 5) ดูแลระบบ Monitoring Tools
ตรวจสอบและดูแลระบบ Monitoring ให้ทำงานได้อย่างถูกต้อง
ตั้งค่า Threshold, Alert Policy และ Notification
ตรวจสอบความถูกต้องของข้อมูลและ Dashboard แสดงผล
🔹 6) ประสานงานภายในและภายนอก
ประสานงานกับทีม IT ภายในองค์กร
ติดต่อ Vendor / ISP / Data Center เมื่อเกิดเหตุขัดข้อง
ติดตามสถานะงานจนระบบกลับสู่สภาวะปกติ (Service Restoration)
🔹 7) ปฏิบัติตามนโยบายความปลอดภัย (Security & Compliance)
เฝ้าระวังเหตุการณ์ที่เกี่ยวข้องกับความปลอดภัยระบบ
ตรวจสอบ Log การเข้าใช้งานที่ผิดปกติ
ปฏิบัติตามนโยบาย IT Security, SLA และ Compliance ขององค์กร
🔹 8) งานอื่น ๆ ที่ได้รับมอบหมาย
สนับสนุนงานด้าน IT Operation
ปรับปรุงขั้นตอนการเฝ้าระวังและการตอบสนองเหตุการณ์