Kính gửi Quý Thầy, Cô,
Phòng thí nghiệm An toàn thông tin (PTN ATTT) kính mời quý Thầy Cô tham dự Buổi báo cáo học thuật An toàn thông tin - Lần 03 năm 2024 với nội dung cụ thể như sau:
- Nội dung báo cáo: "A FEDERATED INCREMENTAL LEARNING APPROACH FOR INTRUSION DETECTION SYSTEM"
- Báo cáo viên: CN. Nguyễn Hữu Quyền (Nghiên cứu viên PTN ATTT).
- Thời gian: 09h00 ngày thứ Ba, ngày 11/06/2024.
- Địa điểm: Phòng E8.3, Trường ĐH CNTT.
Hoạt động này nằm trong kế hoạch triển khai "Chuỗi báo cáo học thuật các chủ đề liên quan đến an toàn, bảo mật thông tin" do Phòng thí nghiệm An toàn thông tin (PTN ATTT - InSecLab) tổ chức năm 2024.
Kính mời quý Thầy Cô quan tâm chủ đề trên cùng tham dự và trao đổi với nhóm nghiên cứu.
Trân trọng.
TÓM TẮT:
Học cộng tác (Federated Learning - FL) đã thu hút được sự chú ý của các nhà nghiên cứu thông qua việc huấn luyện các mô hình học máy (Machine Learning - ML) với bộ dữ liệu phi tập trung. Đặc biệt, trong ngữ cảnh an toàn thông tin của các mạng thiết bị IoTs, các hệ thống phát hiện xâm nhập mạng phi tập trung (Federated Intrusion Detection System - FedIDS) được quan tâm và phát triển nhằm bảo vệ quyền riêng tư của dữ liệu cho các bên tham gia. Tuy nhiên, hầu hết các hệ thống hiện có chưa đạt được hiệu quả cao khi áp dụng vào thực tế. Cụ thể, các FedIDS phải huấn luyện tiệm tiến (Incremental Learning) liên tục để có thể phát hiện được các lớp (classes) tấn công mới (zero-day). Nhưng các bên cộng tác thường không đủ khả năng lưu trữ được lớp dữ liệu mới lẫn lớp dữ liệu cũ, dẫn tới việc tái huấn luyện mô hình nhưng lại lãng quên kiến thức cũ (Catatrophic forgetting - CF). Hơn nữa, các bên cộng tác mới tham gia vào quy trình huấn luyện cộng tác mà chứa các lớp dữ liệu mới chưa từng thấy hay các bên huấn luyện với dữ liệu mất cân bằng (NonIID) sẽ làm trầm trọng thêm tình trạng CF của mô hình toàn cục. Để giải quyết những thách thức, chúng tôi đề xuất một hệ thống phát hiện xâm nhập mạng phi tập trung hỗ trợ học tiệm tiến (FIIDS) để giảm sự ảnh hưởng của CF lên hiệu suất hệ thống. Đặc biệt, để giải quyết tình trạng quên cục bộ do mất cân bằng lớp tại các bên, chúng tôi áp dụng phương pháp Elastic Weight Consolidation (EWC) vào trong huấn luyện mô hình cục bộ giúp chắt lọc quan hệ ngữ nghĩa giữa lớp và giá trị mất mát để cân bằng sự lãng quên của các lớp dữ liệu cũ với các lớp dữ liệu mới. Hệ thống FIIDS được chúng tôi thực nghiệm và so sánh với các hệ thống mới hiện có. Các thực nghiệm dựa trên ba bộ dữ liệu Kitsune là bộ dữ liệu mới nhất và mạng tin cậy.
ABSTRACT:
Federated Learning (FL) has garnered significant interest from researchers due to its ability to train Machine Learning models using decentralized datasets. This approach is particularly relevant in IoT device networks, where decentralized network intrusion detection systems (Federated Intrusion Detection Systems - FedIDS) are being developed to protect data privacy for participants. However, many current systems have not demonstrated high efficiency in practical applications. Specifically, FedIDS must be able to incrementally train to detect new attack classes (zero-day attacks). Unfortunately, most participants lack the capacity to store both new and old data, resulting in the need to retrain the model and subsequently forget previous knowledge (a problem known as Catastrophic Forgetting - CF). Additionally, new participants joining the collaborative training process with new, unseen classes or imbalanced training datasets (NonIID) exacerbate the CF issue in the global model. To address these challenges, we propose a federated incremental learning approach for intrusion detection systems (FIIDS) aimed at reducing the impact of CF on system performance. Specifically, to mitigate local forgetting due to class imbalance among participants, we utilize the Elastic Weight Consolidation (EWC) method to train local models. This approach helps distill the semantic relationship between classes and adjusts the loss value to balance the retention of old classes with the learning of new ones. We also evaluated and compared FIIDS with other recent FedIDS approaches. Our experiments, conducted using the Kitsune datasets, which are the latest and most reliable network datasets, demonstrate the efficacy of our proposed approach.