Google vừa lặng lẽ trình làng một ứng dụng Android thử nghiệm, cho phép người dùng chạy các mô hình trí tuệ nhân tạo (AI) phức tạp trực tiếp trên điện thoại thông minh (smartphone) mà không cần kết nối Internet.
Biểu tượng Google. Ảnh: AFP/TTXVN
Đây được coi là một bước tiến quan trọng trong chiến lược của Google nhằm đẩy mạnh điện toán biên (edge computing) và triển khai AI theo hướng tập trung vào quyền riêng tư.
Với tên gọi AI Edge Gallery, ứng dụng này cho phép người dùng tải xuống và vận hành các mô hình AI từ nền tảng Hugging Face ngay trên thiết bị của mình. Điều này mở ra khả năng thực hiện các tác vụ như phân tích hình ảnh, tạo văn bản, hỗ trợ lập trình và hội thoại đa chiều, trong khi toàn bộ quá trình xử lý dữ liệu được giữ kín đáo trên chính thiết bị của người dùng
Quy mô nhỏ, hiệu suất cao
Được phát hành theo giấy phép nguồn mở Apache 2.0 và có sẵn qua nền tảng lập trình GitHub thay vì các kho ứng dụng chính thức, AI Edge Gallery là nỗ lực mới nhất của Google nhằm mở rộng việc tiếp cận các tính năng AI tiên tiến, đồng thời giải quyết những lo ngại ngày càng tăng về quyền riêng tư đối với các dịch vụ AI dựa trên đám mây.
Điểm nhấn của ứng dụng này là mô hình Gemma 3 của Google, một mô hình ngôn ngữ nhỏ gọn (kích cỡ chỉ 529MB) có khả năng xử lý tới 2.585 token/giây trên chip xử lý đồ họa (GPU) của thiết bị di động. Hiệu suất này cho phép thời gian phản chưa tới 1 giây đối với các tác vụ như tạo văn bản và phân tích hình ảnh, mang lại trải nghiệm tương đương các giải pháp đám mây.
Ứng dụng cung cấp ba tính năng chính: AI Chat cho hội thoại đa chiều, Ask Image để trả lời câu hỏi bằng hình ảnh và Prompt Lab cho các tác vụ đơn giản như tóm tắt văn bản, tạo mã và viết lại nội dung. Người dùng có thể chuyển đổi giữa các mô hình để so sánh hiệu suất, với các chỉ số như thời gian phản hồi và tốc độ giải mã được hiển thị theo thời gian thực.
Google cũng nhấn mạnh các kỹ thuật tối ưu hóa như "lượng tử hóa Int4" giúp giảm kích thước mô hình đến 4 lần, tiết kiệm bộ nhớ và giảm độ trễ, giúp các mô hình lớn hơn có thể hoạt động trên phần cứng di động.
Cuộc cách mạng về quyền riêng tư và bảo mật
Việc xử lý dữ liệu ngay trên thiết bị giải quyết những lo ngại ngày càng tăng về quyền riêng tư trong các ứng dụng AI, đặc biệt trong các ngành xử lý thông tin nhạy cảm. Đây là một sự thay đổi cơ bản: quyền riêng tư không còn là rào cản mà trở thành lợi thế cạnh tranh. Các tổ chức không còn phải lựa chọn giữa mô hình AI mạnh mẽ và bảo vệ dữ liệu cá nhân. Việc loại bỏ sự phụ thuộc vào Internet cũng giúp các ứng dụng AI hoạt động ổn định ngay cả khi kết nối mạng chập chờn.
Cách tiếp cận này đặc biệt có giá trị cho các lĩnh vực như y tế và tài chính, nơi yêu cầu bảo mật dữ liệu cao thường hạn chế việc áp dụng AI đám mây. Các ứng dụng thực địa như chẩn đoán thiết bị và làm việc từ xa cũng hưởng lợi từ khả năng hoạt động ngoại tuyến.
Tuy nhiên, việc chuyển sang xử lý trên thiết bị cũng đặt ra những thách thức bảo mật mới. Dù dữ liệu an toàn hơn khi không rời khỏi thiết bị, trọng tâm bảo mật sẽ chuyển sang bảo vệ chính thiết bị và các mô hình AI. Điều này đòi hỏi các chiến lược bảo mật khác so với AI đám mây truyền thống, bao gồm quản lý thiết bị, xác minh tính toàn vẹn của mô hình và chống lại các cuộc tấn công đối nghịch.
Google và cuộc đua AI trên thiết bị di động
Động thái của Google diễn ra trong bối cảnh cuộc cạnh tranh tích hợp AI trên thiết bị di động ngày càng gay gắt. Neural Engine của Apple đã cung cấp khả năng xử lý ngôn ngữ và nhiếp ảnh điện toán trên thiết bị. AI Engine của Qualcomm cũng thúc đẩy nhận dạng giọng nói và trợ lý thông minh trên điện thoại chạy hệ Android, trong khi Samsung Electronics cũng tích hợp các đơn vị xử lý thông minh vào thiết bị dòng Galaxy.
Tuy nhiên, Google chọn một hướng đi khác biệt, tập trung vào cơ sở hạ tầng nền tảng thay vì các tính năng độc quyền. Google đang tự định vị mình là nền tảng cho mọi ứng dụng AI di động - một chiến lược tương tự những thành công trong lịch sử công nghệ, nơi việc kiểm soát cơ sở hạ tầng tỏ ra có giá trị hơn kiểm soát ứng dụng riêng lẻ.
Dù vậy, ứng dụng AI trên thiết bị di động vẫn còn một số hạn chế.
Hiệu suất của các mô hình phụ thuộc nhiều vào phần cứng, với các thiết bị cao cấp có khả năng xử lý mượt mà hơn các thiết bị tầm trung. Việc cài đặt cũng phức tạp, yêu cầu người dùng kích hoạt chế độ nhà phát triển, tự cài đặt thủ công ứng dụng và tạo tài khoản Hugging Face để tải mô hình.
Thử nghiệm cũng cho thấy vấn đề về độ chính xác ở một số tác vụ, như nhận dạng sai thông tin hoặc hình ảnh. Google thừa nhận những hạn chế này và khẳng định sẽ tiếp tục học hỏi để cải thiện ứng dụng.
Nhìn chung, những hạn chế nêu trên cũng cho thấy thách thức cơ bản của AI di động: cân bằng giữa độ phức tạp của mô hình và giới hạn của thiết bị, như dung lượng pin, mức độ chịu nhiệt và kích thước bộ nhớ.
AI Edge Gallery của Google không chỉ đơn thuần là một thử nghiệm. Đây có thể là phát súng mở đầu cho sự thay đổi lớn nhất trong ngành AI kể từ khi điện toán đám mây ra đời. Thay vì các trung tâm dữ liệu khổng lồ, Google đặt cược vào tương lai nằm trong hàng tỷ smartphone. Nếu thành công, mỗi chiếc smartphone sẽ trở thành một phần mạng lưới AI phân tán của Google, giúp ông lớn này củng cố vững chắc vị thế thống lĩnh trên một thị trường đang phát triển ngày một nhanh chóng.