Động thái này được đưa ra dựa trên niềm tin của Amazon rằng đây là con đường tốt hơn để cạnh tranh với Nvidia, công ty dẫn đầu thị trường chip AI toàn cầu.
Kể từ khi tuyên bố tham gia lĩnh vực chip AI vào năm 2018, AWS (Amazon Web Services) – mảng điện toán đám mây của Amazon – đã phát triển chip Inferentia được tùy chỉnh cho mục đích dự đoán, suy luận, sử dụng trong hệ thống bán dẫn AI và chip Trainium dành cho huấn luyện mô hình AI. Hai dòng sản phẩm này được cung cấp cho các công ty AI thông qua dịch vụ điện toán đám mây của Amazon.
Tuy nhiên, Giám đốc bộ phận điện toán của AWS, Rahul Kulkarni, chia sẻ với Nikkei và các phương tiện truyền thông ngày 4/12 rằng “các dòng sản phẩm sẽ được hợp nhất và AWS sẽ tập trung vào chip Trainium để cung cấp hiệu năng cho cả công nghệ suy luận và huấn luyện. Điều này có nghĩa là dòng sản phẩm chip Inferentia sẽ bị ngừng phát triển, nhường tài nguyên cho chip Trainium.
Trainium có dung lượng bộ nhớ lớn hơn và hỗ trợ nhiều định dạng dữ liệu hơn. Loại chip này cũng chứa các cơ chế cho phép tính toán và giao tiếp nhanh chóng hơn khi xử lý lượng lớn dữ liệu đồng thời với nhau bằng nhiều máy chủ. Trong khi đó, Inferentia thực hiện một lượng nhỏ phép tính với chi phí thấp hơn. Khi AI thế hệ mới trở nên tiên tiến hơn, cả huấn luyện và suy luận đều yêu cầu khối lượng tính toán lớn hơn. Kết quả là, lợi ích của việc sử dụng các loại chip khác nhau đang mờ dần.
Ông Kulkarni nhấn mạnh, người dùng có thể đạt được cùng mức độ tối ưu hóa và lợi ích về hiệu suất chi phí bằng cách tập trung vào Trainium như một sản phẩm thống nhất duy nhất.
Ngày 3/12, trong một sự kiện công nghệ thường niên ở Las Vegas (Mỹ), Amazon thông báo rằng chip Trainium2 hiện đã có sẵn. Công ty cũng công bố kế hoạch phát hành chip Trainium3 thế hệ thứ ba vào nửa cuối năm 2025 và con chip này sẽ được sản xuất với quy trình chế tạo chip 3 nanomet tiên tiến, tăng gấp đôi hiệu năng tính toán của Trainium2.
Mục tiêu của Amazon là phá vỡ sự thống trị của “gã khổng lồ” Nvidia trên thị trường chip AI, nơi Nvidia chiếm khoảng 90% thị phần toàn cầu. Amazon đã tích cực quảng bá Trainium2 cho các khách hàng điện toán đám mây, nhấn mạnh rằng chip này có thể hoạt động với chi phí thấp hơn so với các sản phẩm của Nvidia.
Cùng ngày, hãng công nghệ Apple cho biết, họ sẽ sử dụng chip Trainium2 cho hoạt động phát triển công nghệ AI của mình. Trước đó, Anthropic, một công ty khởi nghiệp AI của Mỹ đang nhận được khoản đầu tư 8 tỷ USD từ Amazon, đã có hàng trăm nghìn chip Trainium2 để hỗ trợ phát triển mô hình AI thế hệ mới.