CMC OpenAI (C-OpenAI), công ty thành viên của Tập đoàn Công nghệ CMC, vừa công bố hai cấu phần được xem là nền móng cho việc phát triển trợ lý ảo pháp lý tiếng Việt tại Việt Nam, gồm mô hình ngôn ngữ lớn (LLM) pháp lý tiếng Việt CMC-AI-Legal-32B và bộ chuẩn đánh giá pháp lý tiếng Việt VLegal-Bench. Đây được coi là bước đi cụ thể nhằm hiện thực hóa định hướng phát triển công nghệ chiến lược theo tinh thần Nghị quyết số 57-NQ/TW về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.
Bộ chuẩn đánh giá VLegal - Bench của nhóm nghiên cứu C-OpenAI đăng kí trên cổng arXiv của Trường Đại học Cornell- Mỹ phiên bản mới nhất cập nhật 22/12/2025.
Theo C-OpenAI, cách tiếp cận “làm chủ mô hình ngôn ngữ lớn và làm chủ thước đo đánh giá” có ý nghĩa đặc biệt quan trọng trong bối cảnh Việt Nam đang thúc đẩy phát triển các công nghệ nền tảng, sản phẩm AI chiến lược như LLM tiếng Việt, trợ lý ảo và các mô hình AI chuyên ngành. Việc đồng thời phát triển mô hình và bộ chuẩn đánh giá giúp đảm bảo chất lượng, độ tin cậy và khả năng kiểm chứng của các ứng dụng AI trong lĩnh vực pháp lý – một lĩnh vực có yêu cầu cao về tính chính xác và chuẩn mực.
Điểm nhấn trong công bố lần này là mô hình CMC-AI-Legal-32B – LLM pháp lý tiếng Việt được C-OpenAI xây dựng trên nền tảng kế thừa và tinh chỉnh chuyên sâu cho hệ thống pháp luật Việt Nam. Trên bộ chuẩn đánh giá VLegal-Bench, mô hình này đạt Top 1 về hiệu năng tổng thể, dẫn đầu 6/22 tác vụ và cho kết quả nổi bật ở các bài toán đòi hỏi suy luận và lập luận pháp lý nhiều lớp.
VLegal- Bench, bộ tiêu chuẩn đánh giá AI pháp lý hàng đầu Việt Nam do C-OpenAI phát triển.
Nhóm nghiên cứu cho biết, các mô hình thương mại tổng quát như GPT-4o, Claude hay Gemini vẫn thể hiện tốt ở các nhiệm vụ phổ thông như nhận diện và truy xuất thông tin. Tuy nhiên, khi chuyển sang các tác vụ yêu cầu suy luận pháp lý phức tạp hoặc tạo lập nội dung pháp lý có cấu trúc theo chuẩn viện dẫn của Việt Nam, hiệu quả của các mô hình này giảm rõ rệt. Trong khi đó, các mô hình chuyên biệt được huấn luyện theo ngữ cảnh và đặc thù pháp luật Việt Nam lại cho thấy ưu thế rõ ràng.
Song song với phát triển mô hình, C-OpenAI khẳng định sẽ công bố mã nguồn, dữ liệu và quy trình đánh giá theo hướng minh bạch, đồng thời kêu gọi sự tham gia của các chuyên gia trong và ngoài nước nhằm từng bước chuẩn hóa và hoàn thiện bộ công cụ. Theo ông Đặng Văn Tú, Tổng giám đốc C-OpenAI, doanh nghiệp theo đuổi tầm nhìn xây dựng nền tảng AI mở, an toàn do Việt Nam làm chủ, qua đó thúc đẩy cộng đồng doanh nghiệp và nhà phát triển cùng tham gia xây dựng và phân phối các ứng dụng AI trên nền tảng dùng chung.
Đáng chú ý, bộ chuẩn VLegal-Bench được đánh giá là yếu tố then chốt trong việc huấn luyện và thẩm định LLM pháp lý. Bộ chuẩn này gồm 10.450 mẫu dữ liệu có đáp án chuẩn, chia thành 22 tác vụ, thiết kế theo 5 cấp độ suy luận tăng dần, từ nhận diện – truy xuất điều khoản đến suy luận đa bước, diễn giải và tạo sinh nội dung pháp lý, cũng như đánh giá các yếu tố đạo đức, công bằng và thiên lệch.
VLegal-Bench được xây dựng phù hợp với đặc thù hệ thống dân luật của Việt Nam, bao gồm cấu trúc phân cấp quy phạm, hiệu lực văn bản, quan hệ sửa đổi – thay thế và yêu cầu viện dẫn điều luật cụ thể. Mỗi mẫu dữ liệu đều gắn với nguồn văn bản pháp luật cấp trung ương, bảo đảm khả năng kiểm chứng.
Trong thời gian tới, C-OpenAI dự kiến công bố kho mã nguồn và dữ liệu của VLegal-Bench, mở rộng website đối sánh các mô hình và phát hành các phiên bản mở theo từng giai đoạn trong năm 2026. Mục tiêu là hình thành một nền tảng dùng chung, có tiêu chuẩn kiểm chứng rõ ràng, phục vụ phát triển các ứng dụng AI chuyên ngành, qua đó đóng góp thiết thực cho hệ sinh thái AI Việt Nam.