Trí tuệ nhân tạo: DeepSeek phát triển mô hình thế hệ AI mới

Ngày 29/9, công ty công nghệ DeepSeek của Trung Quốc công bố mô hình trí tuệ nhân tạo (AI) thử nghiệm mới mang tên DeepSeek-V3.2-Exp, được đánh giá hiệu quả hơn trong huấn luyện và xử lý các chuỗi văn bản dài so với những phiên bản trước.

Chú thích ảnh — Biểu tượng của Deepseek. Ảnh: REUTERS/TTXVN

Theo thông báo trên diễn đàn Hugging Face, DeepSeek xem V3.2-Exp là “bước trung gian hướng tới kiến trúc thế hệ tiếp theo”.Đây được xem là sản phẩm quan trọng nhất của DeepSeek kể từ sau màn ra mắt của các phiên bản V3 và R1 từng gây bất ngờ cho giới công nghệ Mỹ hồi đầu năm.

Mô hình mới tích hợp cơ chế DeepSeek Sparse Attention, giúp cắt giảm chi phí tính toán và cải thiện một số dạng hiệu suất. DeepSeek cũng cho biết đang cắt giảm giá giao diện lập trình mô hình này hơn 50%.

Dù giới phân tích nhận định V3.2-Exp khó tạo ra biến động lớn trên thị trường như các bản phát hành hồi tháng 1, sản phẩm mới vẫn có thể gây sức ép lên các đối thủ trong ngành như Alibaba hay OpenAI, nếu chứng minh được năng lực cao với chi phí huấn luyện thấp hơn đáng kể.

Linh Tô (TTXVN)

Cuộc đua nghìn tỷ USD xây dựng hạ tầng AI toàn cầu

Sự bùng nổ của trí tuệ nhân tạo (AI) đang kéo theo cuộc chạy đua chưa từng có trong việc xây dựng hạ tầng tính toán - yếu tố cốt lõi để vận hành các mô hình AI thế hệ mới.

Chia sẻ:

Từ khóa: