The UIT Information Security Laboratory

Trong thời đại ngày nay, vấn đề an ninh bảo mật luôn tạo nhiều tiếng vang trong thế giới công nghệ. với lý do chính đáng, các câu hỏi và mối quan tâm xoay quanh quyền riêng tư và sự an toàn của thông tin cá nhân của người dùng luôn được đưa ra hết lần này đến lần khác. Người dùng thường xuyên cập nhật thông tin cá nhân, vị trí của họ và hơn thế nữa từ điện thoại của mình hàng ngày. Những thông tin này cũng có thể bao gồm các báo cáo và giao dịch ngân hàng. Vậy nó được lưu trữ ở đâu? Tất nhiên, sẽ có câu trả lời là dữ liệu được lưu giữ trên các đám mây trong mạng máy tính an toàn! Nếu không có các biện pháp bảo mật thích hợp ngay tại chỗ, bất kỳ ai từ bất kỳ nơi nào trên thế giới cũng có thể truy cập thông tin này.

***Hình 1 - Hệ thống IDS đóng vai trò phòng thủ trước tấn công mạng của hệ thống***

Hệ thống phát hiện xâm nhập (IDS) là tuyến phòng thủ đầu tiên cho bất kỳ hệ thống hoặc mạng nào. Nó làm nhiệm vụ như chính tên của mình: đảm nhận vai trò là một hệ thống phát hiện bất kỳ loại xâm nhập vào hệ thống. IDS có thể dựa trên các quy tắc, trong đó lưu lượng (traffic) thuộc bất kỳ loại kết nối nào phải được kiểm tra bằng một bộ quy tắc để cấp phép vượt qua; hoặc được tạo bằng thuật toán học máy, trong đó các thuật toán tự động tạo quy tắc mới dựa trên loại lưu lượng mạng mà nó thấy. Các hệ thống này phát hiện và phân loại lưu lượng mạng hoặc là bình thường (normal) hoặc độc hại (malicious). Nó chính là những người gác cổng vốn có của hệ thống / mạng. Ngày nay, nhiều hệ thống IDS như vậy đang dần được xây dựng dựa trên trí tuệ nhân tạo (AI) do triển vọng, tốc độ của những tiến bộ mới trong công nghệ mang lại. Các hệ thống IDS phải theo kịp sự phát triển của công nghệ đi đôi với sự tinh vi trong các hành vi của các cuộc tấn công. Hiện tại, chúng ta đã bước vào một thời điểm rất khó để viết thủ công các quy tắc nhận diện các xâm nhập hay cuộc tấn công để bảo vệ các máy trong hệ thống. Thay vào đó, một ý tưởng mới được sử dụng là hãy để máy tính tự xử lý dữ liệu lưu lượng mạng theo dõi, thu thập được, sau đó tự sinh ra các quy tắc để nhận diện tấn công. Tuy nhiên, thật không may là có một lỗ hổng mới nảy sinh trong các hệ thống dựa trên AI này: chúng dễ dàng bị tổn thương trước các cuộc tấn công đối kháng (adversarial attack).

**Hình 2 - Tấn công đối kháng: Dùng AI đối nghịch để chống lại các hệ thống dựa trên AI**

Vậy một cuộc tấn công đối kháng là gì? Để đơn giản, đầu tiên, điều quan trọng là phải xác định một đối tượng như thế nào thì được xem là một kẻ thù. Một kẻ thù được định nghĩa là một đối thủ trong một cuộc chơi, xung đột hoặc tranh chấp. Vì vậy, một cuộc tấn công đối kháng là một cuộc tấn công chống lại phe đối lập hoặc nhân vật đối lập. Trong trường hợp này, một cuộc tấn công đối kháng sẽ là một cuộc tấn công chống lại IDS (dựa trên hệ thống AI). Các cuộc tấn công đối kháng được tạo ra bởi trí tuệ nhân tạo đối nghịch (adversarial AI). Hệ thống trí tuệ nhân tạo đối nghịch này là một hệ thống máy học đóng vai trò là đối thủ tự nhiên của AI, và nó thách thức AI sử dụng AI. Hiện tại, IDS dựa trên AI có thể rất hữu dụng trong việc phân loại lưu lượng độc hại và lưu lượng bình thường nhưng nó cũng đang phải đấu tranh để phân loại lưu lượng độc hại được ngụy trang thành lưu lượng bình thường do chính các AI đối nghịch tạo nên.

Hình 3 - Các hệ thống AI đối nghịch có thể gây rắc rối cho nhiều hệ thống dựa trên AI: xe hơi tự lái, chẩn đoán và theo dõi sức khỏe - dịch vụ y tế, quân sự, an ninh mạng.

Có bốn trường hợp khi lưu lượng truy cập cố gắng đi qua IDS. Hai trường hợp đầu tiên là lưu lượng truy cập bình thường đi qua và lưu lượng độc hại bị từ chối. Nhưng bên cạnh đó, sẽ có hai trường hợp lưu lượng có thể bị phân loại sai. Dương tính giả (false positive) là khi lưu lượng bình thường bị coi là độc hại và bị từ chối trước khi vào hệ thống; trong khi đó, âm tính giả (false negative) là khi lưu lượng độc hại được coi là bình thường và được phép vào hệ thống. Cần phải chú ý thêm rằng trong trường hợp này , dương tính (positive) là một thuật ngữ để chỉ lưu lượng nào đó được coi là độc hại, ngược lại, âm tính (negative) để chỉ ra rằng lưu lượng mạng được coi là bình thường. AI đối nghịch tập trung vào hai trường hợp cuối cùng này; bằng cách đánh lừa hệ thống, hệ thống AI đối nghịch có thể chọn ra lưu lượng truy cập nào có thể sử dụng để xâm nhập và biết được rằng lưu lượng nào có thể bị từ chối truy cập khi đi qua IDS.

IDS và hệ thống AI đối nghịch là hai người chơi chính trong cuộc chiến cân não để vượt qua người kia. Tiềm năng cho cả hai hệ thống này về cơ bản là vô hạn và đang được chú ý và bắt đầu nghiên cứu. Trong tương lai gần, các hệ thống AI đối nghịch sẽ ảnh hưởng đến sự phát triển của không chỉ IDS mà cả AI nói chung.

Tham khảo: Gerry Saporito

Sự tranh đấu của các hệ thống phát hiện xâm nhập (IDS) hiện nay