Nghiên cứu mới tiết lộ bí quyết thành công của DeepSeek

Mô hình trí tuệ nhân tạo R1 của công ty khởi nghiệp Trung Quốc DeepSeek, từng gây chấn động thị trường chứng khoán Mỹ khi ra mắt hồi tháng 1, đã được công bố trong một nghiên cứu được bình duyệt đầu tiên, cho thấy cách hãng này phát triển một LLM mạnh mẽ chỉ với chi phí khoảng 300.000 USD.

Chú thích ảnh
Biểu tượng của Deepseek. Ảnh: REUTERS/TTXVN

R1 được thiết kế để vượt trội trong các tác vụ lập luận như toán học và lập trình, trở thành đối thủ chi phí thấp của các công cụ do các tập đoàn công nghệ Mỹ phát triển. Đây là mô hình “open weight” (mở trọng số), có thể tải về miễn phí và hiện là mô hình phổ biến nhất trên nền tảng Hugging Face, với hơn 10,9 triệu lượt tải.

Nghiên cứu trên Nature cập nhật từ bản thảo công bố tháng 1, lần đầu tiết lộ chi phí huấn luyện R1 chỉ là 294.000 USD, bên cạnh khoảng 6 triệu USD để xây dựng mô hình nền. Con số này thấp hơn nhiều so với hàng chục triệu USD mà các đối thủ được cho là đã chi. DeepSeek cho biết R1 được huấn luyện chủ yếu bằng chip Nvidia H800 – loại đã bị Mỹ cấm xuất khẩu sang Trung Quốc từ năm 2023.

Điểm đột phá của R1 là áp dụng phương pháp “học tăng cường thuần túy”, tức cho mô hình thử–sai và tự được thưởng khi đưa ra đáp án đúng, thay vì học từ ví dụ do con người lựa chọn. Mô hình còn tự chấm điểm nỗ lực của mình bằng ước lượng nội bộ, một kỹ thuật gọi là “tối ưu hóa chính sách nhóm tương đối”, giúp tăng hiệu quả.

Theo nhà nghiên cứu Huan Sun (Đại học Bang Ohio), “quá trình bình duyệt nghiêm ngặt giúp xác thực giá trị và độ tin cậy của mô hình. Các hãng khác cũng nên làm điều tương tự”. Lewis Tunstall, kỹ sư học máy tại Hugging Face, nhận định đây là tiền lệ quan trọng bởi minh bạch trong phát triển AI giúp đánh giá rủi ro chính xác hơn.

DeepSeek khẳng định R1 không được huấn luyện bằng dữ liệu từ các mô hình của OpenAI, dù thừa nhận mô hình nền được huấn luyện trên dữ liệu web – vốn có thể bao gồm nội dung do AI tạo ra. Các chuyên gia đánh giá tuy khó xác minh tuyệt đối, nhưng bằng chứng hiện nay cho thấy phương pháp tăng cường thuần túy là đủ để đạt hiệu suất cao.

Trên bảng thử nghiệm ScienceAgentBench, R1 không đứng đầu về độ chính xác nhưng đạt cân bằng tốt giữa hiệu quả và chi phí. Các nhà nghiên cứu hiện tìm cách áp dụng phương pháp của DeepSeek để tăng cường khả năng lập luận cho các LLM hiện có, cũng như mở rộng sang nhiều lĩnh vực ngoài toán và lập trình.

Theo ông Tunstall, R1 đã “khởi động một cuộc cách mạng” trong phát triển trí tuệ nhân tạo.

Thanh Tùng (TTXVN)
Nỗ lực dùng chip nội địa thất bại, DeepSeek lùi ngày ra mắt mô hình AI mới
Nỗ lực dùng chip nội địa thất bại, DeepSeek lùi ngày ra mắt mô hình AI mới

Công ty trí tuệ nhân tạo (AI) DeepSeek của Trung Quốc đã phải trì hoãn việc phát hành mô hình mới sau khi không thể huấn luyện mô hình này bằng chip của Huawei. Sự việc này cho thấy những hạn chế trong nỗ lực của Trung Quốc nhằm thay thế công nghệ của Mỹ.

Chia sẻ:

doanh nghiệp - Sản phẩm - Dịch vụ

Các đơn vị thông tin của TTXVN