Google và 'cuộc cách mạng' AI trên di động

06:08 28/06/2025

Google vừa lặng lẽ trình làng một ứng dụng Android thử nghiệm, cho phép người dùng chạy các mô hình trí tuệ nhân tạo (AI) phức tạp trực tiếp trên điện thoại thông minh (smartphone) mà không cần kết nối Internet.

Chú thích ảnh — Biểu tượng Google. Ảnh: AFP/TTXVN

Đây được coi là một bước tiến quan trọng trong chiến lược của Google nhằm đẩy mạnh điện toán biên (edge computing) và triển khai AI theo hướng tập trung vào quyền riêng tư.

Với tên gọi AI Edge Gallery, ứng dụng này cho phép người dùng tải xuống và vận hành các mô hình AI từ nền tảng Hugging Face ngay trên thiết bị của mình. Điều này mở ra khả năng thực hiện các tác vụ như phân tích hình ảnh, tạo văn bản, hỗ trợ lập trình và hội thoại đa chiều, trong khi toàn bộ quá trình xử lý dữ liệu được giữ kín đáo trên chính thiết bị của người dùng

Quy mô nhỏ, hiệu suất cao

Được phát hành theo giấy phép nguồn mở Apache 2.0 và có sẵn qua nền tảng lập trình GitHub thay vì các kho ứng dụng chính thức, AI Edge Gallery là nỗ lực mới nhất của Google nhằm mở rộng việc tiếp cận các tính năng AI tiên tiến, đồng thời giải quyết những lo ngại ngày càng tăng về quyền riêng tư đối với các dịch vụ AI dựa trên đám mây.

Điểm nhấn của ứng dụng này là mô hình Gemma 3 của Google, một mô hình ngôn ngữ nhỏ gọn (kích cỡ chỉ 529MB) có khả năng xử lý tới 2.585 token/giây trên chip xử lý đồ họa (GPU) của thiết bị di động. Hiệu suất này cho phép thời gian phản chưa tới 1 giây đối với các tác vụ như tạo văn bản và phân tích hình ảnh, mang lại trải nghiệm tương đương các giải pháp đám mây.

Ứng dụng cung cấp ba tính năng chính: AI Chat cho hội thoại đa chiều, Ask Image để trả lời câu hỏi bằng hình ảnh và Prompt Lab cho các tác vụ đơn giản như tóm tắt văn bản, tạo mã và viết lại nội dung. Người dùng có thể chuyển đổi giữa các mô hình để so sánh hiệu suất, với các chỉ số như thời gian phản hồi và tốc độ giải mã được hiển thị theo thời gian thực.

Google cũng nhấn mạnh các kỹ thuật tối ưu hóa như "lượng tử hóa Int4" giúp giảm kích thước mô hình đến 4 lần, tiết kiệm bộ nhớ và giảm độ trễ, giúp các mô hình lớn hơn có thể hoạt động trên phần cứng di động.

Cuộc cách mạng về quyền riêng tư và bảo mật

Việc xử lý dữ liệu ngay trên thiết bị giải quyết những lo ngại ngày càng tăng về quyền riêng tư trong các ứng dụng AI, đặc biệt trong các ngành xử lý thông tin nhạy cảm. Đây là một sự thay đổi cơ bản: quyền riêng tư không còn là rào cản mà trở thành lợi thế cạnh tranh. Các tổ chức không còn phải lựa chọn giữa mô hình AI mạnh mẽ và bảo vệ dữ liệu cá nhân. Việc loại bỏ sự phụ thuộc vào Internet cũng giúp các ứng dụng AI hoạt động ổn định ngay cả khi kết nối mạng chập chờn.

Cách tiếp cận này đặc biệt có giá trị cho các lĩnh vực như y tế và tài chính, nơi yêu cầu bảo mật dữ liệu cao thường hạn chế việc áp dụng AI đám mây. Các ứng dụng thực địa như chẩn đoán thiết bị và làm việc từ xa cũng hưởng lợi từ khả năng hoạt động ngoại tuyến.

Tuy nhiên, việc chuyển sang xử lý trên thiết bị cũng đặt ra những thách thức bảo mật mới. Dù dữ liệu an toàn hơn khi không rời khỏi thiết bị, trọng tâm bảo mật sẽ chuyển sang bảo vệ chính thiết bị và các mô hình AI. Điều này đòi hỏi các chiến lược bảo mật khác so với AI đám mây truyền thống, bao gồm quản lý thiết bị, xác minh tính toàn vẹn của mô hình và chống lại các cuộc tấn công đối nghịch.

Google và cuộc đua AI trên thiết bị di động

Động thái của Google diễn ra trong bối cảnh cuộc cạnh tranh tích hợp AI trên thiết bị di động ngày càng gay gắt. Neural Engine của Apple đã cung cấp khả năng xử lý ngôn ngữ và nhiếp ảnh điện toán trên thiết bị. AI Engine của Qualcomm cũng thúc đẩy nhận dạng giọng nói và trợ lý thông minh trên điện thoại chạy hệ Android, trong khi Samsung Electronics cũng tích hợp các đơn vị xử lý thông minh vào thiết bị dòng Galaxy.

Tuy nhiên, Google chọn một hướng đi khác biệt, tập trung vào cơ sở hạ tầng nền tảng thay vì các tính năng độc quyền. Google đang tự định vị mình là nền tảng cho mọi ứng dụng AI di động - một chiến lược tương tự những thành công trong lịch sử công nghệ, nơi việc kiểm soát cơ sở hạ tầng tỏ ra có giá trị hơn kiểm soát ứng dụng riêng lẻ.

Dù vậy, ứng dụng AI trên thiết bị di động vẫn còn một số hạn chế.

Hiệu suất của các mô hình phụ thuộc nhiều vào phần cứng, với các thiết bị cao cấp có khả năng xử lý mượt mà hơn các thiết bị tầm trung. Việc cài đặt cũng phức tạp, yêu cầu người dùng kích hoạt chế độ nhà phát triển, tự cài đặt thủ công ứng dụng và tạo tài khoản Hugging Face để tải mô hình.

Thử nghiệm cũng cho thấy vấn đề về độ chính xác ở một số tác vụ, như nhận dạng sai thông tin hoặc hình ảnh. Google thừa nhận những hạn chế này và khẳng định sẽ tiếp tục học hỏi để cải thiện ứng dụng.

Nhìn chung, những hạn chế nêu trên cũng cho thấy thách thức cơ bản của AI di động: cân bằng giữa độ phức tạp của mô hình và giới hạn của thiết bị, như dung lượng pin, mức độ chịu nhiệt và kích thước bộ nhớ.

AI Edge Gallery của Google không chỉ đơn thuần là một thử nghiệm. Đây có thể là phát súng mở đầu cho sự thay đổi lớn nhất trong ngành AI kể từ khi điện toán đám mây ra đời. Thay vì các trung tâm dữ liệu khổng lồ, Google đặt cược vào tương lai nằm trong hàng tỷ smartphone. Nếu thành công, mỗi chiếc smartphone sẽ trở thành một phần mạng lưới AI phân tán của Google, giúp ông lớn này củng cố vững chắc vị thế thống lĩnh trên một thị trường đang phát triển ngày một nhanh chóng.

Hương Thủy/TTXVN (Tổng hợp)

Copyright 2026 Giấy phép số 17/GP-BTTTT cấp ngày 16/1/2017. Tòa soạn: Số 5 Lý Thường Kiệt, Hà Nội. Điện thoại: 024-38267042, 024-38252931(2339,2208)- Fax: 024-38253753. Email:baotintuc@vnanet.vn – toasoantintuc@gmail.com. © Bản quyền thuộc về Báo Tin tức - TTXVN