Tokenmaxxing: Yếu tố quyết định sống còn của doanh nghiệp AI là gì?

Một bảng xếp hạng nội bộ tại Meta từng gây bão khi chấm điểm nhân viên dựa trên lượng token AI sử dụng.

Dù bảng này đã bị gỡ bỏ, tranh luận về “tokenmaxxing” - xu hướng tối đa hóa việc sử dụng AI trong doanh nghiệp - vẫn đang lan rộng, phản ánh cách các công ty toàn cầu vật lộn để thích nghi với kỷ nguyên trí tuệ nhân tạo.

Token là đơn vị dữ liệu mà các mô hình AI xử lý, với mỗi token tương đương khoảng bốn ký tự. Việc theo dõi và tối đa hóa token tiêu thụ đang trở thành một thước đo mới trong nhiều tổ chức, nhưng cũng gây tranh cãi gay gắt về hiệu quả thực sự.

Thước đo gây tranh cãi trong doanh nghiệp

Nhiều lãnh đạo công nghệ cho rằng việc chỉ tập trung vào số lượng token là sai lầm. Yamini Rangan, CEO của HubSpot, nhấn mạnh trên LinkedIn rằng tối đa hóa kết quả quan trọng hơn tối đa hóa token. Andrew Lau, đồng sáng lập Jellyfish, cũng cảnh báo một nhân viên có thể sử dụng AI cả ngày nhưng vẫn không đạt được kết quả mong muốn.

Brian Elliott, CEO của Blitzy, ví việc đo lường hiệu quả bằng token giống như đánh giá doanh thu dựa trên số cuộc gọi bán hàng, một cách tiếp cận thiếu chiều sâu. Theo họ, việc sử dụng AI cần gắn với giá trị thực tế thay vì chỉ là con số tiêu thụ.

Tuy nhiên, không phải doanh nghiệp nào cũng đồng tình. Theo The Wall Street Journal, nhiều công ty coi việc thúc đẩy nhân viên sử dụng AI ở quy mô lớn là vấn đề sống còn. Trong bối cảnh cạnh tranh khốc liệt, những doanh nghiệp không tận dụng AI có nguy cơ bị bỏ lại phía sau.

May Habib, CEO startup AI Writer, cho biết công ty của bà duy trì bảng xếp hạng tiêu thụ token nội bộ và theo dõi sát sao. Những nhân viên đứng đầu được vinh danh, thậm chí nhận thưởng, trong khi không có hình phạt cho người xếp cuối. Có nhân viên tại đây từng sử dụng gần 11 tỷ token chỉ trong một tháng, tương đương chi phí hơn 50.000 USD trên nền tảng nội bộ.

Habib thừa nhận đây là chỉ số dễ bị “lách luật” và không phải mọi token đều tạo ra giá trị, nhưng mục tiêu chính là thay đổi tư duy. Theo bà, nếu quá chú trọng vào hiệu quả của từng hành động AI riêng lẻ, doanh nghiệp sẽ không thể tiến xa trong việc ứng dụng AI ở quy mô lớn.

Tại Sendbird, bảng xếp hạng token được mô tả là có tác động mạnh, thúc đẩy nhân viên thử nghiệm nhiều ý tưởng AI hơn và xây dựng sản phẩm nhanh hơn. Một số nhân viên thậm chí phát triển công cụ theo dõi mạng xã hội hay quản lý dự án chỉ để cải thiện thứ hạng của mình.

Chi phí giảm mạnh, cuộc đua càng nóng

Trong khi tranh luận về hiệu quả vẫn tiếp diễn, chi phí AI lại đang giảm nhanh, càng thúc đẩy xu hướng “tokenmaxxing”. Theo Báo Bưu điện Hoa Nam buổi sáng, DeepSeek vừa cắt giảm giá API tới 90% cho mô hình V4-Pro, đưa chi phí mỗi triệu token xuống chỉ còn khoảng 0,036 USD.

Không chỉ giảm giá đầu vào, DeepSeek còn tối ưu chi phí cho các “cache hit” - khi dữ liệu đã tồn tại trong bộ nhớ và có thể tái sử dụng, giúp giảm đáng kể chi phí tính toán. Điều này mở ra khả năng tiếp cận các mô hình AI tiên tiến với chi phí thấp hơn nhiều cho doanh nghiệp.

Động thái này diễn ra trong bối cảnh mức sử dụng AI trong doanh nghiệp tăng vọt. Tại Disney, một số kỹ sư được cho là sử dụng công cụ AI Claude tới 51.000 lần mỗi ngày, buộc công ty phải triển khai bảng điều khiển để quản lý việc tiêu thụ token. Visa cũng đẩy mạnh “tokenmaxxing”, với mức tiêu thụ lên tới 1,9 nghìn tỷ token chỉ trong tháng 3.

Giá giảm mạnh khiến các doanh nghiệp chạy hàng chục nghìn tác vụ mỗi ngày có thể tiết kiệm đáng kể, đồng thời càng khuyến khích việc sử dụng AI ở quy mô lớn.

Cuộc đua không thể đảo ngược

Theo Val Bercovici, Giám đốc AI của Weka, các đối thủ khó có thể đứng ngoài cuộc đua giảm giá do DeepSeek khởi xướng. Ông cho rằng ngay cả khi giá token giảm sâu, tổng chi tiêu vẫn sẽ tăng do nhu cầu bùng nổ, khi hiệu quả tăng lại dẫn đến mức tiêu thụ cao hơn.

DeepSeek cũng nhanh chóng nổi lên như một đối thủ đáng gờm khi phát triển các mô hình hiệu năng cao bất chấp hạn chế phần cứng do lệnh kiểm soát chip của Mỹ. Cuối năm ngoái, hãng ra mắt DeepSeek V3.2 với hiệu năng tiệm cận GPT-5 trong một số bài kiểm tra, sử dụng GPU Nvidia H800 dành riêng cho thị trường Trung Quốc. Đầu năm nay, công ty tiếp tục giới thiệu Engram - công nghệ “bộ nhớ điều kiện” giúp giảm tải cho GPU bằng cách chuyển một phần dữ liệu sang RAM của CPU, từ đó cải thiện khả năng xử lý.

Trong bối cảnh công nghệ AI đang thay đổi cách làm việc, nhiều nhà đầu tư và lãnh đạo công nghệ cho rằng câu hỏi không còn là có nên “tokenmaxxing” hay không, mà là làm thế nào để toàn bộ tổ chức nhanh chóng thích nghi. Sonya Huang từ Sequoia Capital cho rằng điều quan trọng là nhân viên phải “ngấm” tư duy AI, và việc “trò chơi hoá” thông qua bảng xếp hạng có thể là cách hiệu quả để thúc đẩy quá trình này.

Dù còn gây tranh cãi, “tokenmaxxing” đang phản ánh một thực tế rõ ràng rằng AI không chỉ là công cụ hỗ trợ, mà đang trở thành yếu tố quyết định khả năng cạnh tranh và tồn tại của doanh nghiệp trong kỷ nguyên mới.

Bảo Hân/Báo Tin tức và Dân tộc

Lầu Năm Góc bắt tay 7 'ông lớn', gạt Anthropic khỏi cuộc chơi AI quân sự

Lầu Năm Góc đã ký thỏa thuận với loạt “ông lớn” công nghệ để đưa AI vào các hệ thống quân sự mật, trong khi Anthropic bị loại khỏi cuộc chơi do vướng bất đồng.

Chia sẻ:

Từ khóa: