Trong thời gian qua, cuộc cạnh tranh trong lĩnh vực trí tuệ nhân tạo (AI) chủ yếu xoay quanh việc phát triển các mô hình ngôn ngữ lớn (LLM) mạnh hơn.
Tuy nhiên, khi công nghệ AI tạo sinh bước vào giai đoạn thương mại hóa quy mô lớn, trọng tâm của ngành đang dịch chuyển từ việc “huấn luyện mô hình” sang việc “vận hành mô hình” với chi phí thấp và hiệu quả cao. Đây cũng là hướng đi mới mà tập đoàn SK Telecom (SKT) đang theo đuổi khi tập trung vào hạ tầng AI, đặc biệt là các trung tâm dữ liệu và nền tảng suy luận.
Biểu tượng của SK Telecom, nhà mạng không dây lớn nhất Hàn Quốc. Ảnh: AFP/TTXVN
Theo ông Lee Jae-shin, Phó Chủ tịch phụ trách phát triển kinh doanh AI của SK Telecom, trọng tâm của ngành AI hiện nay không còn nằm ở việc xây dựng những mô hình lớn nhất mà ở khả năng triển khai và vận hành các mô hình đó trong thực tế. Theo chuyên gia này, lợi thế cạnh tranh trong tương lai sẽ thuộc về những doanh nghiệp có thể cung cấp hạ tầng AI ổn định, tiết kiệm điện năng và có chi phí vận hành thấp.
Từ cuộc đua mô hình sang cuộc đua hạ tầng
Trong giai đoạn bùng nổ của ChatGPT và các mô hình AI tạo sinh từ năm 2023, các tập đoàn công nghệ toàn cầu tập trung mạnh vào việc phát triển các mô hình có quy mô ngày càng lớn. Tuy nhiên, sau khi mô hình được huấn luyện hoàn tất, bài toán kinh tế tiếp theo xuất hiện đó là làm thế nào để phục vụ hàng triệu, thậm chí hàng tỷ yêu cầu của người dùng mỗi ngày.
Đây chính là lĩnh vực “AI suy luận” (AI inference) - quá trình mô hình đã được huấn luyện phản hồi các câu hỏi và yêu cầu của người dùng theo thời gian thực. Mặc dù mỗi phép tính suy luận có thể nhẹ hơn nhiều so với quá trình huấn luyện, nhưng số lượng yêu cầu khổng lồ khiến chi phí điện năng, độ trễ và khả năng mở rộng trở thành yếu tố quyết định.
SK Telecom đánh giá rằng thị trường AI đang bước vào giai đoạn mà hiệu quả vận hành sẽ quan trọng không kém, thậm chí quan trọng hơn việc sở hữu mô hình lớn nhất. Chính vì vậy, tập đoàn đang đẩy mạnh đầu tư vào các trung tâm dữ liệu AI và cơ sở hạ tầng phục vụ suy luận.
Một trong những điểm đáng chú ý trong chiến lược AI của SK Telecom là không phụ thuộc hoàn toàn vào GPU của Nvidia. Hiện nay, GPU vẫn là nền tảng chủ lực cho việc huấn luyện các mô hình AI lớn. Tuy nhiên, đối với các tác vụ suy luận lặp đi lặp lại trong thực tế, GPU không phải lúc nào cũng là lựa chọn tối ưu về mặt chi phí và điện năng.
Do đó, SK Telecom đang xây dựng mô hình điện toán lai (hybrid computing), kết hợp giữa GPU và NPU. NPU là một loại chip chuyên dụng được thiết kế để thực hiện các tác vụ AI và học máy hiệu quả hơn CPU hoặc GPU trong một số trường hợp nhất định. Trong mô hình này lai này, GPU đảm nhận các tác vụ huấn luyện và xử lý tính toán phức tạp, trong khi NPU sẽ phụ trách một phần đáng kể các tác vụ suy luận có tính lặp lại cao.
Đối tác quan trọng của SK Telecom trong chiến lược này là công ty thiết kế chip AI Hàn Quốc Rebellions. Theo ông Lee Jae-shin, NPU không nhằm thay thế GPU mà đóng vai trò bổ sung, giúp giảm chi phí vận hành và tăng hiệu quả năng lượng.
SK Telecom hiện đang hợp tác với Rebellions và Arm để phát triển các máy chủ AI thế hệ mới kết hợp CPU của Arm với bộ gia tốc suy luận AI của Rebellions. Các hệ thống này sẽ được thử nghiệm tại các trung tâm dữ liệu AI của SK Telecom trước khi triển khai thương mại.
Xây dựng hệ sinh thái AI toàn diện
Khác với nhiều doanh nghiệp chỉ tập trung vào một mắt xích của chuỗi giá trị AI, SK Telecom đang theo đuổi chiến lược “Full Stack AI” tức sở hữu đồng thời mô hình, dịch vụ và hạ tầng.
Ở tầng mô hình, công ty đã phát triển mô hình ngôn ngữ riêng mang tên A.X K1. Ở tầng dịch vụ, SKT vận hành trợ lý AI cá nhân A.Dot, được xem là sản phẩm chiến lược để tiếp cận người dùng cuối. Ở tầng hạ tầng, tập đoàn đang xây dựng các cụm GPU hiệu năng cao, trung tâm dữ liệu AI và các nền tảng suy luận quy mô lớn. Theo lãnh đạo SKT, rất ít doanh nghiệp viễn thông trên thế giới có thể đồng thời sở hữu đầy đủ cả ba lớp năng lực này. Đây được xem là lợi thế quan trọng giúp công ty chủ động trong việc tối ưu hóa chi phí cũng như phát triển các dịch vụ AI mới.
Dự án nổi bật nhất trong chiến lược đầu tư hạ tầng AI của SK Telecom hiện nay là trung tâm dữ liệu AI siêu quy mô đang được xây dựng tại Ulsan cùng Amazon Web Services (AWS). Đây được xem là một trong những dự án hạ tầng AI lớn nhất Hàn Quốc hiện nay. Không chỉ phục vụ nhu cầu trong nước, trung tâm dữ liệu này còn hướng tới việc cung cấp dịch vụ cho khách hàng quốc tế.
Một động lực khác thúc đẩy chiến lược hạ tầng của SK Telecom là nhu cầu ngày càng tăng đối với “AI chủ quyền” (Sovereign AI). Các cơ quan chính phủ, tổ chức tài chính và doanh nghiệp hạ tầng quan trọng ngày càng quan tâm đến việc dữ liệu được lưu trữ ở đâu, ai vận hành hệ thống và mức độ kiểm soát của quốc gia đối với hạ tầng AI.
SK Telecom nhận định những lĩnh vực như tài chính, viễn thông, nghiên cứu khoa học và khu vực công sẽ ưu tiên sử dụng các nền tảng AI được vận hành trong nước để bảo đảm an ninh dữ liệu và chủ quyền số. Điều này mở ra cơ hội lớn cho các nhà cung cấp hạ tầng AI nội địa.
Chiến lược AI mới của SK Telecom phản ánh sự chuyển dịch đang diễn ra trên toàn cầu: từ cuộc đua phát triển mô hình sang cuộc đua xây dựng hạ tầng vận hành AI. Trong bối cảnh chi phí suy luận ngày càng trở thành yếu tố quyết định khả năng thương mại hóa AI, các trung tâm dữ liệu, chip AI chuyên dụng và nền tảng điện toán hiệu quả sẽ trở thành tài sản chiến lược.