Một tin tặc được cho là đã đánh cắp một lượng lớn dữ liệu nhạy cảm, bao gồm các tài liệu quốc phòng tuyệt mật và sơ đồ tên lửa, từ một siêu máy tính nhà nước của Trung Quốc, trong vụ việc có thể là một trong những vụ rò rỉ dữ liệu lớn nhất từng được ghi nhận tại nước này.
Các nhân viên làm việc tại Trung tâm Siêu máy tính Quốc gia ở Tế Nam, Trung Quốc, ngày 17/10/2018. Ảnh: EPA-EFE
Theo CNN, bộ dữ liệu này chứa hơn 10 petabyte thông tin nhạy cảm, được các chuyên gia cho rằng đã bị đánh cắp từ Trung tâm Siêu máy tính Quốc gia (NSCC) tại Thiên Tân. NSCC là cơ sở cung cấp hạ tầng tính toán cho hơn 6.000 khách hàng trên khắp Trung Quốc, bao gồm các cơ quan khoa học và quốc phòng tiên tiến.
Để hình dung quy mô, một petabyte tương đương 1.000 terabyte, trong khi một máy tính xách tay cấu hình cao thông thường chỉ có dung lượng khoảng một terabyte.
Sau khi tiếp cận đối tượng và xem xét các mẫu dữ liệu bị đăng tải trực tuyến, các chuyên gia an ninh mạng nhận định đối tượng này dường như đã xâm nhập vào hệ thống một cách tương đối dễ dàng, đồng thời có thể lấy đi lượng lớn dữ liệu trong nhiều tháng mà không bị phát hiện.
Một tài khoản tự xưng là FlamingChina đã đăng tải mẫu dữ liệu bị cáo buộc trên một kênh Telegram ẩn danh vào ngày 6/2, tuyên bố rằng bộ dữ liệu chứa “các nghiên cứu thuộc nhiều lĩnh vực như kỹ thuật hàng không vũ trụ, nghiên cứu quân sự, tin sinh học, mô phỏng phản ứng tổng hợp và nhiều lĩnh vực khác”. Tài khoản này cũng cho rằng thông tin có liên quan đến các “tổ chức hàng đầu”, bao gồm Tập đoàn Công nghiệp Hàng không Trung Quốc, Tập đoàn Máy bay Thương mại Trung Quốc và Đại học Công nghệ Quốc phòng.
CNN cho biết đã liên hệ với Bộ Khoa học và Công nghệ Trung Quốc cũng như Cục Quản lý Không gian mạng Trung Quốc để đề nghị bình luận.
Các chuyên gia an ninh mạng sau khi xem xét dữ liệu cho biết nhóm tin tặc đang chào bán bản xem trước giới hạn của bộ dữ liệu bị rò rỉ với giá vài nghìn USD, trong khi quyền truy cập đầy đủ có thể lên tới hàng trăm nghìn USD. Hình thức thanh toán được yêu cầu bằng tiền điện tử.
Hiện CNN chưa thể xác minh độc lập nguồn gốc của bộ dữ liệu cũng như các tuyên bố của FlamingChina. Tuy nhiên, nhiều chuyên gia nhận định ban đầu rằng vụ rò rỉ có khả năng là có thật.
Dữ liệu mẫu được cho là bao gồm các tài liệu có dấu “bí mật” bằng tiếng Trung, cùng với các tệp kỹ thuật, mô phỏng hoạt hình và hình ảnh dựng của các thiết bị quốc phòng như bom và tên lửa.
Dakota Cary, chuyên gia tư vấn tại công ty an ninh mạng SentinelOne, cho rằng những dữ liệu này phù hợp với những gì có thể được lưu trữ tại một trung tâm siêu máy tính. “Bạn sẽ sử dụng các trung tâm siêu máy tính cho các tác vụ tính toán quy mô lớn. Các mẫu dữ liệu được đưa ra cho thấy phạm vi khách hàng rất rộng của trung tâm này”, ông nhận định.
Theo ông Cary, phần lớn các khách hàng sử dụng dịch vụ tại đây không có nhu cầu hoặc khả năng tự duy trì hạ tầng siêu máy tính riêng.
Trung tâm NSCC Thiên Tân, được khai trương năm 2009, là một trong số các cơ sở siêu máy tính đặt tại các thành phố lớn của Trung Quốc như Quảng Châu, Thâm Quyến và Thành Đô.
Marc Hofer, nhà nghiên cứu an ninh mạng và tác giả blog NetAskari, cho rằng quy mô của bộ dữ liệu khiến nó đặc biệt hấp dẫn đối với các cơ quan tình báo nước ngoài. “Chỉ những tổ chức này mới có đủ năng lực xử lý khối lượng dữ liệu khổng lồ và khai thác thông tin hữu ích từ đó”, ông nhận định.
Theo ông Hofer, sau khi phân tích dữ liệu mẫu, ông đã liên hệ được với một người trên Telegram tự nhận là thủ phạm vụ tấn công. Đối tượng này cho biết đã truy cập vào hệ thống siêu máy tính Thiên Tân thông qua một tên miền VPN bị xâm nhập.
Sau khi xâm nhập, tin tặc được cho là đã triển khai một “botnet” - mạng lưới các chương trình tự động có khả năng xâm nhập sâu hơn vào hệ thống của NSCC, từ đó trích xuất, tải xuống và lưu trữ dữ liệu. Quá trình lấy cắp khoảng 10 petabyte dữ liệu được cho là kéo dài trong khoảng sáu tháng.
Trong khi đó, ông Cary nhận định phương thức này không quá phức tạp về mặt kỹ thuật mà chủ yếu khai thác các lỗ hổng trong kiến trúc hệ thống.
“Có thể hình dung như việc đối tượng có quyền truy cập vào nhiều máy chủ khác nhau và lần lượt trích xuất dữ liệu thông qua các điểm yếu bảo mật, phân tán dữ liệu về nhiều nơi”, ông nói.
Bằng cách phân tán hoạt động này trên nhiều hệ thống, tin tặc đã giảm nguy cơ bị phát hiện. Theo ông Cary, các hệ thống phòng thủ thường khó phát hiện những luồng dữ liệu nhỏ rời khỏi hệ thống hơn so với một lượng lớn dữ liệu được chuyển tới một điểm duy nhất.
Nếu vụ việc được xác nhận, đây có thể là dấu hiệu cho thấy những điểm yếu sâu hơn trong hạ tầng công nghệ của Trung Quốc, trong bối cảnh nước này đang cạnh tranh với Mỹ để dẫn đầu trong các lĩnh vực công nghệ và trí tuệ nhân tạo.
Theo các chuyên gia, an ninh mạng từ lâu đã là một điểm yếu tồn tại ở cả khu vực công và tư nhân tại Trung Quốc.
Năm 2021, một cơ sở dữ liệu trực tuyến lớn được cho là chứa thông tin cá nhân của tới một tỷ công dân Trung Quốc đã bị để lộ công khai trong hơn một năm, trước khi bị phát hiện khi một tài khoản ẩn danh rao bán dữ liệu trên diễn đàn tin tặc vào năm 2022.
“Trung Quốc đã đối mặt với các vấn đề an ninh mạng trong thời gian dài, trên nhiều lĩnh vực và tổ chức”, ông Cary nhận định.
Chính phủ Trung Quốc cũng thừa nhận thách thức này. Trong Sách trắng về An ninh quốc gia năm 2025, Bắc Kinh xác định việc xây dựng “các rào cản an ninh vững chắc cho không gian mạng, dữ liệu và trí tuệ nhân tạo” là một trong những ưu tiên hàng đầu, đồng thời nhấn mạnh việc tăng cường các cơ chế và nền tảng nhằm bảo đảm an toàn, độ tin cậy của hạ tầng thông tin trọng yếu.