Theo Financial Times, công ty trí tuệ nhân tạo Anthropic (Mỹ) ngày 23/2 cáo buộc ba phòng thí nghiệm trí tuệ nhân tạo (AI) Trung Quốc tiến hành các cuộc tấn công “distillation” ở quy mô công nghiệp nhằm vào mô hình của hãng, làm gia tăng lo ngại an ninh quốc gia trong ngành AI Mỹ.
Trang web của Claude hiển thị trên màn hình điện thoại. Ảnh minh họa: Shutterstock
Distillation (tạm dịch là chưng cất) là phương pháp huấn luyện các mô hình nhỏ hơn dựa trên đầu ra của những mô hình lớn và tiên tiến hơn. Cách tiếp cận này cho phép nhà phát triển tiết kiệm chi phí và rút ngắn thời gian xây dựng sản phẩm, song đang trở thành vấn đề nhạy cảm trong bối cảnh cạnh tranh công nghệ Mỹ - Trung leo thang.
Công ty khởi nghiệp có trụ sở tại San Francisco, đơn vị phát triển công cụ lập trình Claude, cho biết họ phát hiện các hành vi chưng cất do DeepSeek, Moonshot và MiniMax thực hiện. Theo Anthropic, hoạt động này nhằm tái tạo hiệu suất của các hệ thống tiên tiến mà không cần đầu tư tương đương về hạ tầng tính toán.
Anthropic cho biết họ đã xác định khoảng 24.000 tài khoản bị cho là gian lận, tạo ra hơn 16 triệu lượt trao đổi với Claude. Công ty cáo buộc các tương tác này được sử dụng để huấn luyện và cải thiện mô hình của các đối thủ Trung Quốc. DeepSeek, Moonshot và MiniMax chưa đưa ra phản hồi ngay lập tức trước các yêu cầu bình luận.
Căng thẳng diễn ra trong bối cảnh Mỹ áp đặt các biện pháp kiểm soát xuất khẩu nghiêm ngặt, hạn chế khả năng tiếp cận của Trung Quốc đối với các dòng chip tiên tiến của Nvidia, bao gồm cả dòng Blackwell. Các hạn chế này buộc nhiều công ty AI Trung Quốc phải tìm chiến lược thay thế, như huấn luyện mô hình ở nước ngoài, sử dụng chip đời cũ hoặc tối ưu hóa kỹ thuật để giảm chi phí.
Anthropic cho rằng các cuộc tấn công chưng cất làm suy yếu mục tiêu của kiểm soát xuất khẩu, vốn nhằm duy trì lợi thế cạnh tranh công nghệ của Mỹ. Theo công ty, những mô hình được xây dựng thông qua chưng cất bất hợp pháp có thể không duy trì đầy đủ các cơ chế an toàn, làm gia tăng rủi ro bị lạm dụng cho phát triển vũ khí sinh học hoặc các hoạt động tấn công mạng.
Trong những tuần gần đây, các công ty AI Trung Quốc, bao gồm Moonshot và MiniMax, đã ra mắt nhiều mô hình mới được cộng đồng phát triển đánh giá cao về hiệu quả, đặc biệt trong xây dựng tác nhân AI và tạo video. DeepSeek từng gây chú ý tại Thung lũng Silicon khi công bố mô hình R1 với chi phí thấp nhưng hiệu suất cao hồi tháng 1/2025. Tuy nhiên, hãng này chưa công bố phiên bản kế nhiệm như dự đoán trước kỳ nghỉ Tết Nguyên đán vừa qua.
Kể từ sau R1, DeepSeek chủ yếu phát hành các bản cập nhật nhỏ thay vì một mô hình chủ lực mới, trong khi các đối thủ nội địa như Alibaba và ByteDance gia tăng hiện diện và thu hút nhà phát triển tìm kiếm giải pháp mã nguồn mở chi phí thấp.
Trước đó, OpenAI cho biết họ phát hiện bằng chứng cho thấy mô hình của mình, nền tảng của ChatGPT, đã bị chưng cất và nghi ngờ có liên quan đến DeepSeek. Đầu tháng này, OpenAI gửi bản ghi nhớ tới Ủy ban Hạ viện Mỹ về Cạnh tranh Chiến lược giữa Mỹ và Trung Quốc, trong đó lập luận rằng các nỗ lực của DeepSeek phản ánh xu hướng tận dụng thành tựu của các phòng thí nghiệm AI hàng đầu của Mỹ.
Các công ty AI Mỹ và một số quan chức trong Chính quyền Tổng thống Trump cảnh báo rằng mô hình chưng cất có thể tạo ra rủi ro thương mại và chiến lược. Tuy nhiên, giới quan sát cho rằng tranh cãi về chưng cất cũng phản ánh cuộc đua ngày càng quyết liệt trong lĩnh vực AI, nơi lợi thế công nghệ gắn chặt với kiểm soát chuỗi cung ứng bán dẫn và chính sách xuất khẩu.