Mô hình này cho phép các nhà phát triển khắc phục một trong những hạn chế chính trong học máy (machine learning) theo ngữ cảnh – theo nhóm chuyên gia tại Phòng thí nghiệm nghiên cứu AI của T-Bank (trước đây là Ngân hàng Tinkoff) và Viện nghiên cứu trí tuệ nhân tạo (AIRI) có trụ sở tại Moskva cho biết trong một bài báo trực tuyến.
Các nhà nghiên cứu giải thích, các mô hình hiện có cho đến nay, mặc dù có khả năng học cách thực hiện các nhiệm vụ mới khi được cung cấp đủ dữ liệu, nhưng vẫn bị giới hạn bởi một tập hợp hành động cố định và được xác định trước. Việc giới thiệu một “không gian hành động” mới sau đó sẽ đòi hỏi một bộ dữ liệu mới, thường khá mở rộng, cũng như việc học lại mô hình.
Họ cho biết, hạn chế này sẽ khiến việc tái thích ứng trở thành một nỗ lực tốn kém đối với một số ứng dụng.
Nhóm nghiên cứu người Nga đã sử dụng một mô hình học máy cụ thể có tên là “Chắt lọc thuật toán” (AD- Algorithm Distillation) và sửa đổi thêm để đáp ứng mục tiêu đã đặt ra.
Phương pháp AD huấn luyện AI thực hiện các nhiệm vụ bằng cách tự động dự đoán các hành động trong khi sử dụng tập dữ liệu lịch sử học tập của nó làm bối cảnh.
Mô hình của Nga được mệnh danh là ‘Headless-AD’ và đã được trình bày tại Hội nghị quốc tế về học máy ở Vienna trong tuần này.
Cách tiếp cận Headless-AD có nghĩa là mô hình có được khả năng học hỏi và triển khai các hành động mới để đáp ứng các nhiệm vụ mới mà không cần con người nhập thêm dữ liệu hoặc học lại.
Theo nhóm nghiên cứu trên, AI của họ có khả năng thực hiện nhiều hành động hơn năm lần so với những gì nó được dạy ban đầu.
Các nhà nghiên cứu cho biết điều này có thể đưa đến những ứng dụng rộng rãi từ công nghệ vũ trụ đến trợ lý nhà thông minh.
Theo báo cáo của nhóm, một mô hình như vậy có thể được dạy một số hành động cơ bản về dữ liệu tổng quát và sau đó thích ứng với các điều kiện cụ thể của bối cảnh cụ thể.
Một số phương tiện truyền thông Nga sau đó cho rằng mô hình AI mới có thể đủ thông minh để vượt qua cái gọi là 'thử nghiệm cà phê' được cho là đã thất bại bởi ChatGPT nổi tiếng hiện nay.
Lần đầu tiên được đưa ra bởi người đồng sáng lập Apple Steve Wozniak, thử nghiệm này yêu cầu một máy AI “đi vào một hộ gia đình bình thường ở Mỹ và tìm ra cách pha cà phê, bao gồm xác định máy pha cà phê, tìm ra chức năng của các nút bấm, tìm tủ đựng cà phê…”.
Vấn đề đối với hầu hết AI là mặc dù các hộ gia đình bình thường có nhiều điểm chung nhưng tất cả đều hơi khác nhau, điều này thường yêu cầu máy AI phải được dạy về một tập dữ liệu cụ thể liên quan đến một hộ gia đình cụ thể để có thể thực hiện nhiệm vụ ở đó.
Thực hiện cùng một nhiệm vụ trong một hộ gia đình mới sẽ yêu cầu phải học lại trên tập dữ liệu mới. Tuy nhiên, các báo cáo gợi ý rằng AI tự thích ứng của Nga có thể đáp ứng được nhiệm vụ này.
Hồi tháng 2 năm nay, nhà nghiên cứu Ruslan Yunusov, nhà đồng sáng lập Trung tâm Lượng tử Nga, dự báo, AI có thể tự nhận thức trong vòng 10 năm tới ngay cả khi không sử dụng máy tính lượng tử đặc biệt.
Máy tính lượng tử – vốn sử dụng các đặc tính của vật lý lượng tử để lưu trữ dữ liệu và thực hiện các hoạt động – vẫn đang trong giai đoạn phát triển ban đầu và hiện có khả năng hạn chế. Tuy nhiên, ông Yunusov giải thích rằng chúng “hơi giống với mô hình liên kết của bộ não con người”, điều này có thể khiến chúng trở thành ứng cử viên phù hợp để phát triển AI có ý thức.
Tuy nhiên, Yunusov đề xuất rằng việc phát triển AI tự nhận thức không nhất thiết cần đến máy tính lượng tử và cho rằng máy tính có bộ xử lý dựa trên silicon cũng có thể được sử dụng. Chuyên gia cho biết, để thực hiện được điều đó, cần phải có “sự gia tăng gấp nhiều lần về sức mạnh của hệ thống máy tính và sự gia tăng đáng kể về hiệu quả của các thuật toán toán học được sử dụng”. Ông kết luận rằng khả năng AI tự ý thức được tạo ra trong thập kỷ tới là có thể “thực sự xảy ra”.